更新时间:2020年04月23日14时10分 来源:传智播客 浏览次数:
随着互联网的高速发展,被收集并应用于分析的数据量呈现出爆发式增长,面对如此量级的数据,以及常见的实时利用该数据的需求,仅依靠人工处理难免力不从心,这就催生了所谓的大数据和机器学习系统。
机器学习是一门多领域的交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。通俗地讲,传统计算机工作时需要接收指令,并按照指令逐步执行,最终得到计算结果;机器学习是通过某种算法,将历史数据进行训练得出某种模型,当有新的数据提供时,可以使用训练产生的模型对未来进行预测。机器学习是一种能够赋予机器进行自主学习,不依靠人工进行自主判断的技术,它和人类对历史经验归纳的过程有着相似之处,接下来,通过图1和图2对机器学习和人类思考过程进行对比。
图1
图2
图1是机器学习的过程,图2图则是人类思考的过程。人类在学习成长的过程中,积累了很多历史经验,将经验进行归纳总结,得到规律,因此当人类遇到些问题时,总能从事物的发展规律找到方向,进行推测;而机器学习中的训练和预测过程可以近似看作人类的归纳和推测的过程。从图1中可以发现,机器学习思想并不复杂,仅仅是对人类学习成长过程的一个模拟,由于机器学习不是通过编程的形式得出结果,因此它的处理过程不是因果的逻辑,而是通过归纳思想得出相关结论。这也可以联想到人类为什么要学习历史,历史实际上是人类对过往经验的总结,俗话说“历史总是惊人的相似”,通过学习历史,可以从中归纳出事物发展的规律,从而指导今后的工作。如根据数据类型和需求的不同,建模方式也会不同。在机器学习领域中,按照学习方式分类,可以让研究人员在建模和算法选择的时候,根据输入数据来选择合适的算法,从而得到更好的效果,通常机器学习可以分为下面两类。
(1)有监督学习。通过已有的训练样本(即已知数据以及其对应的输出)训练得到一个最优模型,再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的。如分类、回归和推荐算法都属于有监督学习。
(2)无监督学习。针对类别未知(没有被标记)的训练样本,需要直接对数据进行建模,人们无法知道要预测的答案。如聚类、降维和文本处理的某些特征提取都属于无监督学习。
以上我们介绍了“机器学习的相关知识”,希望对您有所帮助,如果想了解更多机器学习相关知识可以关注传智播客大数据课程。
猜你喜欢: