栏目分类
twitter 反差

当前位置:草榴社区 > twitter 反差 >

热点资讯

情欲超市未删节版全集 机器学习十大算法!初学看这个就够了~

发布日期:2024-10-05 20:51    点击次数:131

情欲超市未删节版全集 机器学习十大算法!初学看这个就够了~

基本的机器学习算法:情欲超市未删节版全集

线性转头算法 Linear Regression

支撑向量机算法 (Support Vector Machine,SVM)

最隔邻居/k-隔邻算法 (K-Nearest Neighbors,KNN)

逻辑转头算法 Logistic Regression

决策树算法 Decision Tree

k-平均算法 K-Means

立时丛林算法 Random Forest

朴素贝叶斯算法 Naive Bayes

降维算法 Dimensional Reduction

梯度增强算法 Gradient Boosting

一、机器学习算法苟简不错分为三类:1、监督学习算法 (Supervised Algorithms)

在监督学习考试历程中,不错由考试数据集学到或栽种一个样式(函数 / learning model),并依此样式推测新的实例。该算法要求特定的输入/输出,最初需要决定使用哪种数据当作圭表。举例,笔墨识别应用中一个手写的字符,或一转手写笔墨。主要算法包括神经收集、支撑向量机、最隔邻居法、朴素贝叶斯法、决策树等。

2、无监督学习算法 (Unsupervised Algorithms)

这类算法莫得特定的规划输出,算法将数据集分为不同的组。

3、强化学习算法 (Reinforcement Algorithms)

强化学习普适性强,主要基于决策进行考试,算法左证输出末端(决策)的见效或诞妄来考试我方,通过无数教授考试优化后的算法将好像给出较好的展望。访佛有机体在环境赐与的奖励或处分的刺激下,逐渐酿成对刺激的预期,产生能得到最大利益的俗例性步履。在运筹学和贬抑论的语境下,强化学习被称作“近似动态策动”(approximate dynamic programming,ADP)。

二、基本的机器学习算法:1. 线性转头算法 Linear Regression

转头分析(Regression Analysis)是统计学的数据分析顺序,办法在于了解两个或多个变量间是否预计、预计标的与强度,并栽种数学模子以便不雅察特定变量来展望其它变量的变化情况。

线性转头算法(Linear Regression)的建模历程即是使用数据点来寻找最好拟合线。公式,y = mx + c,其中 y 是因变量,x 是自变量,运用给定的数据集求 m 和 c 的值。线性转头又分为两种类型,即简便线性转头(simple linear regression),唯有 1 个自变量;*多变量转头(multiple regression),至少两组以上自变量。

图片

底下是一个线性转头示例:基于 Python scikit-learn 器用包神态。

图片

2. 支撑向量机算法(Support Vector Machine,SVM)

支撑向量机/收集算法(SVM)属于分类型算法。SVM模子将实例示意为空间中的点,将使用一条直线分隔数据点。需要细心的是,支撑向量机需要对输入数据进行全齐标识,仅径直适用于两类任务,应用将多类任务需要减少到几个二元问题。

图片

图片

图片

3. 最隔邻居/k-隔邻算法 (K-Nearest Neighbors,KNN)

KNN算法是一种基于实例的学习,或者是局部近似和将统共蓄意推迟到分类之后的惰性学习。用最近的邻居(k)来展望未知数据点。k 值是展望精度的一个要道身分,岂论是分类也曾转头,量度邻居的权重齐相等灵验,较隔邻居的权重比拟远邻居的权症结。

国产色片

KNN 算法的时弊是对数据的局部结构相等明锐。蓄意量大,需要对数据进行设施化处理,使每个数据点齐在一样的范围。

图片

图片

图片

蔓延:KNN 的一个时弊是依赖于通盘考试数据集,学习向量量化(Learning Vector Quantization,LVQ)是一种监督学习的东说念主神经收集算法,允许你遴选考试实例。LVQ 由数据脱手,搜索距离它最近的两个神经元,关于同类神经元领受拉拢,异类神经元领受扼杀,最终得到数据的散布样式。淌若基于 KNN 不错得到较好的数据集分类后果,运用 LVQ 不错减少存储考试数据集存储范畴。典型的学习矢量量化算法有LVQ1、LVQ2和LVQ3,尤以LVQ2的应用最为庸俗。

图片

4. 逻辑转头算法 Logistic Regression

逻辑转头算法(Logistic Regression)一般用于需要明确输出的场景,如某些事件的发生(展望是否会发生降雨)。时时,逻辑转头使用某种函数将概率值压缩到某一特定范围。举例,Sigmoid 函数(S 函数)是一种具有 S 形弧线、用于二元分类的函数。它将发生某事件的概率值调度为 0, 1 的范围示意。

Y = E ^(b0+b1 x)/(1 + E ^(b0+b1x ))

以上是一个简便的逻辑转头方程,B0,B1是常数。这些常数值将被蓄意得到,以确保展望值和实质值之间的谬误最小。

图片

图片

5. 决策树算法 Decision Tree

决策树(Decision tree)是一种独特的树结构,由一个决策图和可能的末端(举例资本和风险)构成,用来援助决策。机器学习中,决策树是一个展望模子,树中每个节点示意某个对象,而每个分叉旅途则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所阅历的旅途所示意的对象的值。决策树仅有单一输出,时时该算法用于处理分类问题。

一个决策树包含三种类型的节点:

决策节点:时时用矩形框来示意

契机节点:时时用圆圈来示意

驱逐点:时时用三角形来示意

简便决策树算法案例,笃定东说念主群中谁心爱使用信用卡。筹商东说念主群的年齿和婚配景色,淌若年齿在30岁或是已婚,东说念主们更倾向于遴选信用卡,反之则更少。通过笃定妥当的属性来界说更多的类别,不错进一步扩张此决策树。在这个例子中,淌若一个东说念主成亲了,他跳跃30岁,他们更有可能领有信用卡(100% 偏好)。测试数据用于生成决策树。

图片

图片

细心:关于那些种种别样本数目不一致的数据,在决策树当中信息增益的末端偏向于那些具有更多数值的特征。

6. k-平均算法 K-Means

k-平均算法(K-Means)是一种无监督学习算法,为聚类问题提供了一种处理有规划。K-Means 算法把 n 个点(不错是样本的一次不雅察或一个实例)分歧到 k 个集群(cluster),使得每个点齐属于离他最近的均值(即聚类中心,centroid)对应的集群。重叠上述历程一直抓续到重点不转换。

图片

7. 立时丛林算法 Random Forest

立时丛林算法(Random Forest)的称号由 1995 年由贝尔践诺室提议的random decision forests 而来,正如它的名字所说的那样,立时丛林不错看作一个决策树的集合。立时丛林中每棵决策树揣测一个分类,这个历程称为“投票(vote)”。理念念情况下,咱们左证每棵决策树的每个投票,遴选最多投票的分类。

图片

图片

PaperRandom Forest |Leo Breiman | Statistics Department University of California Berkeley

8. 朴素贝叶斯算法 Naive Bayes

朴素贝叶斯算法(Naive Bayes)基于概率论的贝叶斯定理,应用相等庸俗,从文分内类、垃圾邮件过滤器、医疗会诊等等。朴素贝叶斯适用于特征之间的相互独处的场景,举例运用花瓣的长度和宽度来展望花的类型。“朴素”的内涵不错拯救为特征和特征之间独处性强。

与朴素贝叶斯算法密切预计的一个主张是最大似然揣测(Maximum likelihood estimation),历史上大部分的最大似然揣测表面也齐是在贝叶斯统计中得到大发展。举例,栽种东说念主口身高模子,很难有东说念主力与物力去统计寰宇每个东说念主的身高,然则不错通过采样,获取部分东说念主的身高,然后通过最大似然揣测来获取散布的均值与方差。

Naive Bayes is called naive because it assumes that each input variable is independent.

图片

9. 降维算法 Dimensional Reduction

在机器学习和统计学边界,降维是指在限制条目下,镌汰立时变量个数,得到一组“不预计”主变量的历程,并可进一步细分为特征遴选和特征索取两大顺序。

一些数据集可能包含好多难以处理的变量。卓著是资源丰富的情况下,系统中的数据将相等详备。在这种情况下,数据集可能包含数千个变量,其中大多数变量也可能是无谓要的。在这种情况下,实在不行能笃定对咱们的展望影响最大的变量。此时,咱们需要使用降维算法,降维的历程中也可能需要用到其他算法,举例借用立时丛林,决策树来识别最紧迫的变量。

10. 梯度增强算法 Gradient Boosting

梯度增强算法(Gradient Boosting)使用多个弱算法来创建更强大的精准算法。它与使用单个揣测量不同,而是使用多个揣测量创建一个更踏实和更健壮的算法。梯度增强算法有几种:

XGBoost  — 使用线性和树算法

LightGBM  — 只使用基于树的算法梯度增强算法的特色是精度较高。此外情欲超市未删节版全集,LightGBM 算法具有令东说念主难以置信的高性能。

本站仅提供存储处事,统共内容均由用户发布,如发现存害或侵权内容,请点击举报。

友情链接:

Powered by 草榴社区 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024