什么是数据挖掘过程?(the data mining process?)

数据挖掘过程是在大量数据中发现具有统计意义的模式的工具。它通常包括五个主要步骤,包括准备、数据探索、模型构建、部署和审查。过程中的每一步都涉及不同的技术,但大多数都使用某种形式的统计分析。...

数据挖掘过程是在大量数据中发现具有统计意义的模式的工具。它通常包括五个主要步骤,包括准备、数据探索、模型构建、部署和审查。过程中的每一步都涉及不同的技术,但大多数都使用某种形式的统计分析。

Data mining is the use of pattern recognition logic to identity trends within a sample data set and extrapolate this information against the larger data pool, while data warehousing is the process of extracting and storing data to allow easier reporting.

在数据挖掘过程开始之前,研究人员通常会设定研究目标。此准备步骤通常确定需要研究的数据类型、应使用的数据挖掘技术以及结果的形式。这一过程的初始步骤可能对收集有用信息至关重要。

The goal of using data mining tools is to uncover hidden patterns in information.

数据挖掘过程的下一步是探索。此步骤通常涉及从信息仓库或收集实体收集所需数据。然后,挖掘专家通常准备原始数据集进行分析。此步骤通常包括收集、清理、组织和检查所有数据是否存在错误。

这些准备好的数据通常会进入数据挖掘过程的第三步,即模型构建。为了实现这一点,研究人员通常会对数据进行小样本测试,并对其应用各种数据挖掘技术。建模步骤通常用于确定实现预期结果所需的最佳统计分析方法。

在数据挖掘过程中可以应用四种主要技术。第一种是分类,它将数据排列成预定义的组或类别。在第二种称为聚类的技术中,研究人员允许计算机根据自己的选择将数据分组。第三种数据挖掘技术寻求变量之间的关联。第四种方法通常在数据中寻找可用于预测未来趋势的序列模式。

数据挖掘过程的最后一步是部署。为此,将模型中选择的技术应用于更大的数据集,并对结果进行分析。来自此步骤的报告通常显示整个过程中发现的模式,包括数据集中存在的任何分类、集群、关联或顺序模式。

审查通常是重要的最后一步。该过程的这一阶段通常涉及使用新数据集重复挖掘模型,以确保主数据集代表整个数据群。如果数据样本不能准确表示,结果就无法预测更大人群的趋势。

  • 发表于 2021-12-15 10:09
  • 阅读 ( 181 )
  • 分类:互联网

你可能感兴趣的文章

数据挖掘(data mining)和机器学习(machine learning)的区别

数据挖掘(data mining)和机器学习(machine learning)的区别 数据挖掘和机器学习是两个密切相关的领域。作为亲属,他们是相似的,但他们有不同的父母。但目前,两者的生长越来越相似,几乎与双胞胎相似。因此,有人将机器学习...

  • 发布于 2020-10-29 00:13
  • 阅读 ( 237 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

数据挖掘和数据仓库的主要区别在于,数据挖掘是从大量数据中识别模式的过程,而数据仓库是将来自多个数据源的数据集成到一个中心位置的过程。 数据挖掘是在大型数据集中发现模式的过程。它使用各种技术,如分类、回...

  • 发布于 2021-06-30 17:39
  • 阅读 ( 507 )

数据挖掘(data mining)和预测分析(predictive analytics)的区别

数据挖掘和预测分析的主要区别在于,数据挖掘是使用算法和挖掘工具识别数据隐藏模式的过程,而预测分析是将业务知识应用于发现的模式以进行预测的过程。 数据挖掘是在大型数据集中发现模式的过程。它提取数据实体之...

  • 发布于 2021-07-01 00:14
  • 阅读 ( 435 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

关键区别:数据挖掘实际上是对数据的分析。它是一种计算机辅助的过程,通过挖掘和分析由计算机编译或输入计算机的大量数据集。数据仓库是将信息或数据编译到数据仓库中的过程。数据仓库是用来存储数据的数据库。 数...

  • 发布于 2021-07-13 06:43
  • 阅读 ( 169 )

什么是不同的数据挖掘方法?(the different data mining methods?)

... 在软件选项和理论概念中使用了各种不同的数据挖掘方法。这使得用户能够利用各种工具从个人和公司收集的数据中提取信息。大量数据可用于确定单个受试者或多个受试者的各种因素。这些数据挖掘方法最常用于...

  • 发布于 2021-12-08 14:44
  • 阅读 ( 169 )

什么是数据挖掘算法?(data mining algorithms?)

数据挖掘算法是用于识别数据集中的模式和趋势的编程查询和程序。数据挖掘的主要用途是根据客户的实际活动确定客户需求和偏好。尽管这些信息是基于过去的表现,但...

  • 发布于 2021-12-08 16:46
  • 阅读 ( 141 )

什么是数据挖掘工具?(data mining tools?)

数据挖掘工具是允许用户从数据中提取信息的软件组件和理论。这些工具使个人和公司能够收集大量数据,并使用这些数据确定特定用户或用户组。数据挖掘工具的一些最...

  • 发布于 2021-12-08 16:48
  • 阅读 ( 124 )

什么是不同类型的数据挖掘分析?(the different types of data mining analysis?)

数据挖掘分析是一个有用的过程,它根据用于数据评估的特定算法提供不同的结果。数据挖掘分析的常见类型包括探索性数据分析(EDA)、描述性建模、预测性建模以及发...

  • 发布于 2021-12-08 19:28
  • 阅读 ( 185 )

什么是不同类型的数据挖掘技术?(the different types of data mining techniques?)

数据挖掘通常指的是一种用于分析来自目标源的数据并将反馈合成有用信息的方法。此信息通常用于帮助组织降低特定领域的成本、增加收入或两者兼而有之。通常由数据...

  • 发布于 2021-12-08 19:29
  • 阅读 ( 172 )

什么是不同类型的数据挖掘技术?(the different types of data mining technology?)

...从原始数据中检索信息的过程中,使用了许多不同类型的数据挖掘技术。每种技术的使用都有多种原因,包括营销、安全和一般信息收集。数据挖掘技术通常用于测试数据样本,而不是整个内容样本,允许分析师验证和验证信息...

  • 发布于 2021-12-08 19:30
  • 阅读 ( 145 )
文欣忆鹿
文欣忆鹿

0 篇文章