流程挖掘是一种从信息系统事件日志中提取业务流程并进行分析的技术。它是一种业务流程管理实践,用于发现新流程、将现有流程与工作流模型进行比较并改进流程。事件日志的数据挖掘可以产生通过其他方法无法获得的有价值信息。
流程挖掘分为三类。第一个是发现模型,之所以这样命名是因为它涉及到发现以前未知或未记录的进程。这种类型的数据挖掘是在没有工作流的现有模型或已知现有文档存在错误时进行的。然后挖掘事件日志以获取信息,并对这些信息进行分析,以便能够重新创建流程。然后根据从事件日志中提取的数据为流程创建文档。。
流程挖掘的第二种类型是一致性模型。该名称源自其检查正在进行的工作流是否符合计划流程的目的。对事件日志进行数据挖掘,以定位现有流程和模型之间的差异。
一旦确定了这些差异,就会对其进行分析,看看它们是否改善了流程。如果此类变更证明对流程有利,则对模型进行修改,以包括这些偏差。审查在流程检查点做出的决策,以了解每个点的可用信息以及影响此类决策的数据。如果此类变更不利,则可在现有流程中进行变更,以使其更容易符合模型。
流程挖掘的第三类是扩展模型。这种类型的数据挖掘旨在通过改进扩展现有模型。对事件日志中的数据进行分析,以确定模型结构中可能存在的改进领域。例如,可以检查工作流中可能存在的备选路线的瓶颈。
过程采矿并非没有困难。某些任务总是隐藏在事件日志中,无法进行数据挖掘。可以通过仔细分析可视任务来重建这些任务,但并非总是如此。因此,仅基于从事件日志中提取的信息得出的结论可能质量有问题。
事件日志中的重复任务也会产生问题,因为在同一任务类别或名称下可能有不同的活动。因此,尽管任务具有不同的功能,但很难区分名称相同的任务。其他问题包括决策方面的充分数据、将时间纳入模型、不同的视角、错误记录的数据以及信息不足。在应用该技术时,工艺采矿必须经过经验和良好判断力的磨练,以克服此类问题。。
...展和研究领域都是平等合作的。 Image Courtesy: 1. "CRISP-DM Process Diagram" by Kenneth Jensen - Own work. [CC BY-SA 3.0] via Wikimedia Comm*** 2. "Automated online assistant" by Bemidji State University [Public Domain] via Wikimedia Comm*** img.centered,.aligncenter{display:blo...
...用于数据仓库,以发现有用的模式。 覆盖的关键领域 1.什么是数据挖掘–定义,功能2.什么是数据仓库–定义,功能3.数据挖掘和数据仓库的区别–关键区别的比较 关键术语 数据挖掘,数据仓库,数据仓库 什么是数据挖掘(data ...
...据挖掘、预测建模和机器学习。 Figure 2: Predictive Analytics Process 预测分析过程包括以下活动。 定义项目–定义项目结果、范围、业务目标并确定要使用的数据集。 数据收集–从多个来源收集数据。 数据分析–检查、建模数据以...
...数据挖掘实际上是对数据的分析。它是一种计算机辅助的过程,通过挖掘和分析由计算机编译或输入计算机的大量数据集。数据仓库是将信息或数据编译到数据仓库中的过程。数据仓库是用来存储数据的数据库。 数据挖掘实际...
...尽管它们可能在相同的物理空间中。必须提前决定将使用什么特征来分隔洗衣房和每堆衣服的大小。 ...
数据挖掘应用程序是能够从存储的数据中提取和识别模式的计算机软件程序或包。这类工具通常是一个软件接口,它与包含客户或其他重要数据的大型数据库进行交互。数...
数据挖掘工具是允许用户从数据中提取信息的软件组件和理论。这些工具使个人和公司能够收集大量数据,并使用这些数据确定特定用户或用户组。数据挖掘工具的一些最...
最重要的数据挖掘概念用于分析收集到的信息,尤其是在观察行为时。数据之间的未知交互以各种方式进行研究,以确定主题和聚合信息之间的关键关系。数据挖掘的一个...
数据挖掘分类是数据挖掘过程中的一个步骤。它用于根据某些关键特征对项目进行分组。有几种用于数据挖掘分类的技术,包括最近邻分类、决策树学习和支持向量机。 ...
数据挖掘描述了从大量信息中提取数据并以独特的方式呈现数据的过程。这一过程经常出现在商业智能研究中,在商业智能研究中,专家们挖掘有关市场或企业运营的大量...