数据挖掘(data mining)和机器学习(machine learning)的区别
数据挖掘和机器学习是两个密切相关的领域。作为亲属,他们是相似的,但他们有不同的父母。但目前,两者的生长越来越相似,几乎与双胞胎相似。因此,有人将机器学习用于数据挖掘。然而,当您阅读本文时,您将了解到机器语言不同于数据挖掘。一个关键的区别在于,数据挖掘是用来从现有数据中获取规则,而机器学习则教会计算机学习和理解给定的规则。
什么是数据挖掘(data mining)?
数据挖掘是从数据中提取隐含的、先前未知的、潜在有用的信息的过程。尽管数据挖掘听起来很新,但技术却不是。数据挖掘是大型数据集中模式计算披露的主要方法。它还涉及机器学习、人工智能、统计和数据库系统的交叉点。数据挖掘领域包括数据库和数据管理、数据预处理、推理考虑、复杂性考虑、发现结构的后处理和在线更新。数据挖掘、数据钓鱼和数据窥探是数据挖掘中更常见的术语。
如今,公司多年来都在使用功能强大的计算机来检查大量数据和分析市场研究报告。数据挖掘帮助这些公司识别内部因素(如价格、员工技能)和外部因素(如竞争、经济状况和客户人口统计)之间的关系。
什么是机器学习(machine learning)?
机器学习是计算机科学的一部分,与数据挖掘非常相似。机器学习还用于在系统中搜索模式,探索算法的构造和学习。机器学习是一种人工智能,它为计算机提供学习的能力,而无需显式编程。机器学习的主要目标是开发计算机程序,这些程序能够教会自己根据新的情况成长和变化,它真正接近于计算统计学。它也与数学优化有很强的联系。机器学习的一些最常见的应用是垃圾邮件过滤、光学字符识别和搜索引擎。
机器学习有时与数据挖掘相冲突,因为两者都像骰子上的两张脸。机器学习任务通常分为三大类,如监督学习、无监督学习和强化学习。
数据挖掘(data mining)和机器学习(machine learning)的区别
它们的工作原理
数据挖掘:数据挖掘是一个从明显的非结构化数据开始寻找有趣模式的过程。
机器学习:机器学习使用很多算法。
数据
数据挖掘:数据挖掘用于从任何数据仓库中提取数据。
机器学习:机器学习是阅读与系统软件有关的机器。
应用
数据挖掘:数据挖掘主要利用来自特定领域的数据。
机器学习:机器学习技术是相当普遍的,可以应用于各种设置。
集中
数据挖掘:数据挖掘社区主要关注算法和应用程序。
机器学习:机器学习社区在理论上付出更多。
方**
数据挖掘:数据挖掘用于从数据中获取规则。
机器学习:机器学习教会计算机学习和理解给定的规则。
研究
数据挖掘:数据挖掘是一个使用机器学习等方法的研究领域。
机器学习:机器学习是一种让计算机完成智能任务的方法。
小结:
数据挖掘与机器学习
虽然机器学习与数据挖掘完全不同,但它们之间通常是相似的。数据挖掘是从大量数据中提取隐藏模式的过程,而机器学习是一种也可以用于此的工具。机器学习领域随着人工智能的发展而进一步发展。数据挖掘者通常对机器学习有强烈的兴趣。数据挖掘和机器学习,在人工智能的发展和研究领域都是平等合作的。
Image Courtesy:
1. "CRISP-DM Process Diagram" by Kenneth Jensen - Own work. [CC BY-SA 3.0] via Wikimedia Comm***
2. "Automated online assistant" by Bemidji State University [Public Domain] via Wikimedia Comm***