之间的区别是什么监督学习和监督学习?
题
在条款的人工智能和学习机,之间的区别是什么监督和非监督学习?你能提供一个基本的、简单的解释有一个例子吗?
解决方案
既然你问这个很基本的问题,它看起来像它的价值是什么指定机器学习本身。
机器学习是一类的算法,它是数据驱动的,即,不象“正常”的算法它是数据“告诉”什么“好答案”是。示例:对于图像的人脸检测一个假设的非机器学习算法会试图定义一个面对的是什么(圆皮样色盘,暗区,您所期望的眼睛等)。机器学习算法就不会有这样的编码定义,但将“学习按例子”:你会告诉面孔和不面孔和一个好的算法的几个图像最终将学习,能够预测是否一个看不见的图像是面部。
面部检测的这个特殊的例子是<强>监督下,这意味着你的实施例必须标记,或明确地说,哪些是面和哪些不是。
在无监督算法您的例子并不标记的,即你不说什么。当然,在这种情况下,算法本身不能“发明”面对的是什么,但可以尝试集群的数据分成不同的组,例如它可以区分面是从景观,其中从马非常不同有很大不同。
由于另一个答案提到它(虽然,在一个不正确的方式):有“中间”形式监管,即<强>半监督和有效的学习即可。从技术上讲,这些方法的监督,其中有一些“聪明”的方式,以避免大量的标识样本。在主动学习,算法本身决定你应该标注哪些东西(例如它可以是很肯定的一道风景和一匹马,但它可能会要求您确认是否大猩猩的确是脸的图片)。在半监督学习,有与标记的例子入手,然后“告诉”他们互相思考一些大量无标签数据的方法两种不同的算法。从这个“讨论”,他们学习。
其他提示
监督学习是当你的数据与饲料被“标记”或“标记”你的算法,来帮助你的逻辑做出决定。
例:贝叶斯垃圾邮件过滤,你必须标志的项为垃圾邮件来细化结果
<强>无监督学习强>是算法类型的尝试找到相关性不小于所述原始数据之外的任何外部输入。
例:数据挖掘聚类算法
监督学习
应用程序,其中所述训练数据包括与它们相应的目标矢量沿着输入载体的实例是称为监督学习的问题。
的无监督学习
在其它模式识别问题,训练数据包括没有任何相应的目标值的一组输入向量x的的。在这样的无监督学习问题目标可以是数据,其中它被称为聚类内发现的类似的例子组
模式识别和机器学习(毕晓普,2006)
在监督学习,输入 x
提供与预期成果 y
(即输出模型是应该产生时的输入是 x
),这通常被称为"类"(或者"标签")的相应输入 x
.
在无人监督学习,将"类别"的一个例子 x
是没有提供。因此,监督学习可以被认为是寻找"的隐藏结构"在未标记的数据集。
方法来监督学习包括:
分类(1R,天真的贝叶斯、决策树学习算法,这样的 作为ID3车,等等)
数值预测
方法来监督学习包括:
群集(K装置,分层群集)
协会规则学习
我可以告诉你一个例子。
假设你需要识别哪些车辆是一辆汽车,其中一个是摩托车。
在监督学习的情况下,你的输入(培训)的数据集,您需要在输入标记,也就是在每个输入单元(培训)的数据集,你应该指定它是否代表汽车或摩托车。
在无监督强>学习的情况下,不标记的输入。无监督聚类模型例如基于输入为簇上相似的特征/特性。所以,在这种情况下,有像“车”没有标签。
我一直觉得无监督之间的区别和监督学习是任意的,有点混乱。有两种情况之间没有真正的区别,而是存在一种算法可以有更多或更少的“监督”的一系列情况。半监督学习的存在是其中线是模糊的一个明显的例子。
我倾向于认为监管为提供反馈到什么解决办法应该是首选的算法。对于传统的监督环境,如垃圾邮件检测,你告诉算法的“不作训练集的任何错误” 的;对于传统的无监督的设置,如集群,你告诉算法的“是相互靠近的点应该是在同一个集群中的” 的。碰巧的是,反馈的第一种形式是很多比后者更具体。
在短期,当有人说“监督”,认为分类,当他们说“无人监管”想集群和尽量不要太担心它不止于此。
<强>机器学习:强> 它探讨的研究和可以借鉴,使算法建设上data.Such算法预测,通过建立从例如输入的模式,以使表述为输出数据驱动的预测或决定,而不是遵循严格的静态程序指令进行操作。
<强>受监督的学习:强> 距离标记的训练data.The推断功能的机器学习任务的训练数据由一组的训练实例。在监督学习,各实施例中是一对由一个输入的对象(通常是载体)和期望的输出值(也称为监督信号)。受监督的学习算法分析所述训练数据和产生的推断功能,其可以被用于映射新的例子。
的计算机呈现例如输入和它们的期望输出,由“老师”给出,并且目标是学习映射输入outputs.Specifically一般规则,受监督的学习算法将一组已知的输入数据和已知响应的数据(输出),以及训练模型来产生用于响应于新的数据合理预测。
<强>无监督学习:强> 这是学习无师自通。一个基本 你可能想用数据做的事情是对其进行可视化。这是推断功能无标签的数据描述隐藏结构的机器学习任务。由于提供给学习者的实例是未标记的,没有错误或报酬信号以评估潜在的解决方案。这区别于监督学习无监督学习。无监督学习使用试图找到天然的分区程序 图案。
随着无监督的学习没有基于预测结果的反馈,即,没有教师纠正you.Under没有设置标记的实施例中的无监督学习方法和有该学习过程中不输出的概念处理。其结果是,它是由学习方案/模型找到图案或发现输入数据的组
当你需要一个大的,您应该使用无监督的学习方法 数据量来训练你的模型,意愿和能力 试验和探索,当然这不是一个很好的挑战 通过以上建立methods.With监督学习解决它是 可能学习更大和更复杂的模型比监督 学习。这里是在其上一个很好的例子
监督学习
监督学习的基础是训练一个数据样本 从数据来源有正确的分类已经分配。这种技术被应用在前馈或多层 感知(MLP)的模型。这些MLP有三个不同的 特点:
- 一层或多层隐藏的神经元,不一部分输入 或者输出层网络,使该网络学习和 解决任何复杂的问题
- 非线性反映在神经元活动 微,
- 互连模式的网络表现出高度的 连接。
这些特性与学习,通过培训 解决困难和多样化的问题。通过学习 培训在监督安的模式也被称为反向传播错误的算法。该错误校-学习 算法列车的网络基础上的输入-输出 样本和发现的错误信号,这就是差的 输出计算和所需的输出和调整 突触权的神经元,这是成正比的 产品的错误信号与输入的实例 突触的重量。基于这项原则,错误回来 传播的学习发生在两个通行证:
向前通过:
在这里,输入矢量呈现的网络。这输入信号的传播进、神经的神经通过网络和现在的输出结束
该网络作为输出信号: y(n) = φ(v(n))
哪里 v(n)
是的诱当地的领域的一个定义的神经元 v(n) =Σ w(n)y(n).
输出,计算产出层o(n)与所需要的响应 d(n)
和发现的错误 e(n)
那的神经元。突触权的网络在这一通过是持相同。
向后通过:
错误信号,是起源于输出神经元的那一层的传播后通过网络。这一计算的本地梯度为每个神经元在各个层和允许的突触权的网络发生变化,在根据与三角洲的规则为:
Δw(n) = η * δ(n) * y(n).
这种递归算继续与前通过随后向通过对每个输入模式,直到该网络的融合。
监督学习模式的一个安的是高效率和找到解决方案的几个线性和非线性的问题,如分类、植物控制、预报、预测、机器人技术等。
监督学习
自组织的神经网络学习使用无人监督学习的算法来确定隐藏的模式在未标记输入数据。这种监督是指能够学习和组织的信息没有提供一个错误的信号,以评估潜在的解决方案。缺乏方向的学习算法在无人监督的学习可能有时是有利的,因为它可以让算法找回来的模式以前没有考虑。主要特点的自我组织的地图(索姆):
- 它把来电信号的模式的任意的方面纳入 一个或2个维地图和执行这种转变适应地
- 该网络代表前馈结构中与一个单一的 计算层组成的神经元排列成行, 列。在每个阶段表示,每个输入信号保持 在适当的背景下,
- 神经元处理密切相关的信息都是关闭 一起和他们通过的突触联接。
计算层也被称为竞争层由于神经元层相互竞争,成为活跃。因此,这个学习的算法被称为竞争法。无人监督的算法在SOM 工作在三个阶段:
竞争阶段:
每个输入模式 x
, 提交给网络内的产品的突触的重量 w
计算和神经在竞争层认定判别功能诱使竞争之间的神经元和突触量,是靠近输入的向量在欧几里德距离被宣布为获胜者的竞争。那的神经元是所谓最好的匹配的神经元
i.e. x = arg min ║x - w║.
合作的阶段:
获胜的神经确定了中心的拓扑附近 h
合作的神经元。这是通过横向交互作用 d
其中
合作的神经元。这拓邻里减少了它的大小在一定时间期限。
自适应阶段:
能够获胜的神经元及其附近的神经元,以增加他们的个人价值的鉴别功能有关的输入模式 通过适当的突触量的调整,
Δw = ηh(x)(x –w).
在重复介绍的培训模式,突触权矢量倾向于按照分配输入模式,由于该社区更新,并因此安学会没有监督员。
自组织模型的自然代表着的神经生物的行为,因而是用于许多现实世界的应用,例如集群、语音识别、质地分割,矢量的编码等。
<强>监督学习强>:你给不同地标记的例子的数据作为输入,与正确答案一起。此算法会从中吸取教训,并开始预测基于后面输入正确的结果。 实施例:垃圾电子邮件过滤器
无监督学习:你刚才给的数据,不告诉任何东西 - 如标签或正确的答案。算法自动分析数据中的模式。 实施例:谷歌新闻
我会尽量保持简单。
<强>监督学习:强>在学习的该技术中,我们给出一个数据集,并且系统已经知道所述数据集的正确的输出。所以在这里,我们的系统学习,通过预测其自身的价值。然后,通过使用成本函数来检查它的预测多么接近实际输出确实的精度检查。
无监督学习:在这种方法中,我们有什么我们的结果是很少或根本没有的知识。因此,相反,我们得到的地方,我们不知道变量的影响的数据结构。 我们通过聚类基于数据变量之间关系的数据作出结构。 在这里,我们并没有基于我们预测的反馈。
<强> 监督学习 强>
在此,被用于训练网络的每个输入模式是 与输出模式,其是所述靶标或所需的相关联的 图案。教师被认为是在学习过程中存在 过程中,当一个比较网络的之间进行计算 输出和正确的预期输出,判断错误。该 然后,可以使用误差来改变网络参数,其导致 性能的改进。
<强> 无监督学习 强>
在此学习方法中,目标输出不呈现给 网络。这是因为如果没有老师来呈现所需 模式,因此,该系统通过学习发现自身和 适应于结构特征在输入模式。
受监督的学习: 比方说一个孩子去金德花园。这里的老师表示他3个玩具内部,球车。现在老师给他10个玩具。 他会根据他以往的经验中的房子,球车3盒它们进行分类。 所以孩子最早是由教师获得正确答案为几套监督。随后他被不明玩具测试。
无监督学习: 再次幼儿园example.A儿童获得10个玩具。他被告知段类似的报告。 因此基于形状,大小,颜色,功能等特点,他将努力使3组说A,B,C组他们。
字监督意味着你是给监督/指令的机器帮它找到答案。一旦获悉指令,它可以很容易地预测新情况。
无监督意味着没有监督或指导如何找到答案/标签和设备将使用其情报发现在我们的数据中的一些模式。这不会使预测,它只是试图找到具有相似的数据集群。
监督学习:你已标记数据,并从学习。 e.g内部数据连同价格,然后学习预测价格
无指导的学习:你要找到趋势,进而预测,由于事先没有标签。 e.g不同的人在类,然后一个新的人来那么,这新来的学生属于什么组。
在监督学习:我们知道输入和输出应该是什么。例如,给定一组汽车。我们必须找出哪些红色,哪些蓝色。
然而,无指导的学习是我们必须找出一个很少或没有对输出应该如何任何想法的答案。例如,学习者或许能建当人们基于人脸的图案和文字等的相关性微笑检测模型“你在笑什么?”。
指导的学习可以标记一个新的项目为基础的培训期间学习训练的标签之一。您需要提供大量的训练数据集,确认数据集和测试数据集。如果您提供说出数字像素图像载体使用标签的训练数据一起,那么它可以识别的数字。
无监督学习不需要训练数据集。在无监督学习它可以商品组合成不同的簇基于在所述输入矢量的差。如果你提供的数字像素图像载体,并要求它分为10个大类,可能做到这一点。但它确实知道如何标记它,你没有提供培训的标签。
监督学习基本上是,你必须输入变量(x)和输出变量(y),并使用算法来学习从输入映射函数的输出。为什么我们叫这是监督的原因是因为算法从训练数据集学习,算法迭代使得训练数据的预测。 监督有两种类型,分类和回归。 分类是当输出变量是类象是/否,真/假。 回归是当输出是等人,温度等高度的实数值。
非监督式学习就是我们只有输入数据(X)和没有输出变量。 这就是所谓的无监督学习,因为不像监督学习上面有没有正确答案,也没有老师。算法被留给自己图谋发现并在数据呈现有趣的结构。
无监督学习类型是聚类和协会
监督学习基本上是在从其中机器学习训练数据已经标记的一种技术,其是假设,你已经在训练期间分类的数据的简单偶数奇数分类器。因此它使用“标记的”数据。
相反的无监督学习是其中所述机器通过自身的标签数据的技术。或当机器从头开始学习本身,你可以说,它的情况。
在简单 的监督学习强>是通过使用标签,我们实现算法,诸如回归和分类.Classification施加在那里我们输出类似的形式中,我们有一些标签机器学习问题的类型和 0或1,真/假,是/否。和回归应用于其中出把一个真实值价格的这样的房子
<强>无监督学习强>是一种机器学习问题的,其中我们没有任何标签意味着我们只有一些数据,非结构化数据,我们必须聚集的数据(数据的分组),使用各种无监督算法
监督机学习
"过程的一个算法从中学习培训和数据集 预测的产出。"
准确的预测输出直接成比例的培训数据(长)
监督学习的是那里你已经输入变量(x)(数据集培训)以及输出的可变(Y)(测试数据集)和使用算法的学习映功能从输入到输出。
Y = f(X)
主要类型:
- 分类(离散y-轴)
- 预测(续y-轴)
算法:
分类的算法:
Neural Networks Naïve Bayes classifiers Fisher linear discriminant KNN Decision Tree Super Vector Machines
预测算法:
Nearest neighbor Linear Regression,Multi Regression
应用领域:
- 分类电子邮件作为垃圾邮件
- 进行分类是否患者 疾病或者不
语音识别
预测的人力资源选择某候选人或者不是
预测的股票市场的价格
监督学习:
一个监督学习的算法分析的培训数据,并产生一个功能推断,其可以用于测绘新的例子。
- 我们提供的培训的数据,我们知道正确的输出一定输入
- 我们知道之间的关系的输入和输出
类别的问题:
回归: 预测结果的内连续输出=>地图,输入变量的一些连续的功能。
例如:
给出一张图片的人,预测他的年龄
分类: 预测结果,在一个离散的产出=>地图,输入变量为离散的类别
例如:
这是特纳癌?
监督学习:
监督学习的学习考试的数据没有被标记、分类或分类。监督学习识别共同之处的数据并作出反应基于存在或不存在此类共性中的每一块新的数据。
我们可以得出这种结构通过群集的数据的基础上之间的关系中的变量的数据。
没有任何反馈的基础上预测的结果。
类别的问题:
聚类: 是的任务组一组的对象,在这样一种方式,目的在同一组(称为一个集群)有更多类似的(在某种意义上说)彼此比对其他群体(集群)
例如:
采取收集1,000,000种不同的基因,并找到一种方法自动将这些基因组是某种程度上相似或相关的通过不同的变量,例如使用寿命、位置、角色,等等.
受欢迎的使用情况列出在这里。
参考文献:
在简单的话.. :)这是我的理解,随时纠正。 监督学习是,我们知道我们提供的数据基础上预测。因此,我们必须在一个需要为前提的数据集的一列。 无指导的学习是,我们尝试提取出来的意思所提供的数据集。我们没有关于被预测什么清晰度。那么问题是,为什么我们这样做.. :)答案是 - ?无监督学习的结果是组/集群(类似于数据一起)。因此,如果我们收到任何新的数据,那么我们该关联与所标识的集群/组,并了解它的功能。
我希望这会帮助你。
监督学习
监督学习是我们知道原始输入的输出,即数据被标记,使机器学习模型的训练过程中它会明白它需要在给定输出来检测,这将在引导系统训练以检测基础上的预标记的对象,将检测我们在训练所提供的相似的对象。
下面的算法将知道什么是结构和数据的图案。监督学习用于分类
作为一个例子,我们可以有一个不同的对象,其形状为正方形,圆形,trianle我们的任务是安排相同的类型的形状的 标记的数据集有一个标有所有的形状,我们将培训对数据集的机器学习模型,基于培训dateset将开始检测的形状。
取消监督学习
无监督学习是一个无导向学习,其中最终结果没有已知的,它会聚集数据集以及基于所述对象的相似的特性,将划分在不同的束中的对象和检测的对象。
下面的算法将搜索在原始数据中的不同的模式,并基于其将聚集的数据。未监督学习用于聚类。
作为一个例子,我们可以有多种形状方形,圆形,三角形的不同的对象,因此,将基于对象属性的束,如果对象具有四个侧面会考虑它方,并且如果它具有三个边三角形,并且如果没有边比圆形,这里的数据是没有被标记,其将学习本身来检测各种形状
机器学习是你正试图使机器模仿人类行为的一个字段。
您训练机就像一个baby.The方式人类学习,识别功能,识别模式和训练自己,同样的方式您可以通过各种功能把数据输入训练机。机算法识别所述数据内的图案,并将其分类到特定类别。
机器学习大致分为两大类,监督和无监督学习。
受监督的学习是,你必须概念输入矢量/与。另一方面无监督学习对应的目标值(输出)数据的概念是,在你只有输入矢量/没有任何对应的目标值的数据。
监督学习的一个例子是,你必须的数字图像与对应位[0-9]手写字符识别中,和无监督学习的一个例子是通过购买行为分组客户。