【过程挖掘算法3】Heuristic Miner(启发式挖掘算法)

35 篇文章 67 订阅
订阅专栏

Heuristic Miner(启发式挖掘算法)是在2003年被A.J.M.M. Weijters 所提出来,并在2006年进行完善,是一种继α算法之后又一经典的过程发现算法,接下来,我们将详细地介绍这一算法。

1.背景介绍

现代的工作流管理系统是由显式的过程模型驱动的,也就是说,为了制定给定的工作流过程,需要一个完全指定的工作流设计。创建工作流设计是一个复杂的耗时的过程,通常,实际的工作流过程和管理层所感知的过程之间存在差异。因此,提出了一种可重新发现(rediscovering)工作流模型的技术。该技术使用工作流日志来发现实际执行的工作流过程。工作流日志包含有关发生事件的信息。我们假设这些事件是完全有序的,每个事件指的是单个案例中正在执行的一个任务。这些信息可以很容易地从业务信息系统(例如,企业资源规划系统,例如SAP)中提取出来。

已有提出的过程发现算法如α算法是不能够处理噪声的,对短循环和长循环也无法处理。为此,一种更为先进的算法Heuristic Miner被提出,用于解决这些问题。

2.算法介绍

算法大致分为四个步骤:(1)构造一个依赖/频次表(D/F表);(2)建立活动的依赖度量表; (3)根据依赖/频次表和活动的依赖度量表建立依赖图,(3)将依赖图转化为WF-Net。

2.1 构建一个依赖/频次表

这里使用了α算法中定义的四种基本关系:跟随,因果,并行,无关,这里使用了直接跟随关系,定义如下:

 比如,给定一个事件日志L = [<a,e>5 , <a,b,c,e>10 , <a,c,b,e>10 , <a,b,e>1 , <a,c,e>1 , <a,d,e>10 , <a,d,d,e>2 , <a,d,d,d,e>1]

注:<>里表示的是活动序列即轨迹,后面的数字表示轨迹的频次。

那么,在事件日志L中的直接跟随关系集合为>L={(a,e),(a,b),(b,c),(c,e),(a,c),(c,b),(b,e),(a,d),(d,e),(d,d)}

再根据直接跟随关系集合中对应的频次,建立一个依赖/频次表,如下所示。

 2.2 建立活动的依赖度量表

2.3 根据依赖/频次表和活动的依赖度量表建立依赖图

 2.4 将依赖图转化为WF-Net

对应图6.4的Petri网
对应图6.5的Petri网

  

以上为启发式挖掘算法如何从一个事件日志转化为Petri网过程模型的简单示例。下面我们具体来看看启发式挖掘算法是怎么解决之前过程发现算法存在的问题。

3.启发式挖掘算法解决的问题

一个Petri网

3.1 噪声的处理(相关阈值参数设置)

 从上图的Petri网生成一个日志L0=[<ABCD>9,<ACBD>,<AED>9,<ABCED>,<AECBD>,<AD>],其中有三条不正确(incorrect)的轨迹: <ABCED>,<AECBD>,<AD>.

注:<>里表示的是活动序列即轨迹,后面的数字表示轨迹的频次,没数字的表示频次为1。

通过第2节中的算法流程,我们可以完成对噪声处理。

但是,在实际业务过程中,我们不知道轨迹<AD>是否为真的噪声还是低频率模式,为了处理这个问题,Heuristic Miner中设置了三个阈值参数:

(i) 依赖阈值(the Dependency threshold);

(ii)积极观察阈值(the  Positive observations threshold);

  (iii)   相对最佳阈值(the Relative to best threshold).

通过这些阈值,我们认为(i)依赖性度量高于依赖性阈值,以及(ii)频次高于积极观察阈值的活动之间的依赖关系,以及(iii)具有依赖性度量,其与“最佳”依赖性度量的差值小于相对最佳阈值。

3.2 处理短循环

3.2.1 处理长度为1的短循环

使用下方公式:

3.2.2  处理长度为2的短循环 

 特别注意:一个长度为1的循环C与一个并发进程A相结合,可以很容易地生成类似CAC的模式。为了防止这个陷阱的启发,我们需要一个长度为2的依赖关系只有当A和C不是长度为1的回路时,A和C之间的WC才成立。简而言之,我们先计算方程式(1),然后再计算方程式(2)。这样,在搜索长度为2的循环之前,我们将捕获长度为1的循环构造中的所有任务。

3.3 处理AND/XOR-split/join 和不可观测任务

一个Petri网

   上图中所示的事件日志W=[ABCD,ABCD,ACBD,ACBD,AED]的过程模型是一个Petri网。活动由变迁来表示。

   在执行第一个任务A之后,可以选择是同时执行B和C(即并行或以任何顺序),或者只执行活动E。如果并行执行B和C,就需要添加了两个不可观测(non-observable)的活动(AND-split 和AND-join),注:不可观测变迁也可叫作无声变迁、静默变迁等,在Petri网可视化工具中通常以黑色方块形式出现。挖掘这些不可观测的活动很困难,因为它们不存在于事件日志中。为了避免对不可观测进行显式建模。

在HeuristicsMiner中,我们不使用Petri网来表示过程模型,而是使用所谓的因果矩阵(Causal Matrix)。作为一个例子,我们展示了上图的Petri网到因果矩阵表示的转换,下图为因果矩阵。

 使用下述公式计算:

 3.4 处理长距离依赖关系

一个非自由选择结构的过程模型

  上图显示了一个长距离依赖关系构造。在执行活动D之后,存在活动E和活动F之间的选择。然而,E和F之间的选择是由之前的B和C之间的选择“控制”的。显然,这种非局部行为是很难挖掘的,因为主要基于直接跟随关系(a>Wb)的挖掘方法。

使用的HeuristicsMiner挖掘图中的流程模型生成的事件日志,将生成一个没有B到E和C到F连接的依赖关系图。

4.工具插件

(1)使用prom6运行的插件svn下载地址:prom - Revision 46137: /Packages/HeuristicsMiner/Trunk (tue.nl)

运行插件界面图:

生成的是一个依赖图,要得到最后的Petri网,插件转化:

(2)使用pm4py调用Inductive Miner算法的链接地址:

PM4Py - Process Mining for Python (fraunhofer.de)

5.总结

Heuristic Miner算法将轨迹的频次考虑在内,存在以下优势:

(1)对噪声敏感;

(2)能够处理长度为1和长度为2的短循环;

(3)处理AND/XOR-split/join 和不可观测任务;

(4)处理长距离依赖关系。
 

参考文献:

1.《过程挖掘:业务过程的发现、合规和改进》,Wil van der Aalst著,王建民、闻立杰等译;

2.Weijters A, Van der Aalst W M P. Rediscovering workflow models from event-based data using little thumb[J]. Integrated Computer Aided Engineering, 2003, 10(2): 151-162.

3.Weijters A, van Der Aalst W M P, De Medeiros A K A. Process mining with the heuristics miner-algorithm[J]. Technische Universiteit Eindhoven, Tech. Rep. WP, 2006, 166(July 2017): 1-34.

下一讲将介绍最经典的过程挖掘算法α系列算法(包括α算法、α+算法、α++算法、α$算法等)。

如需进行相关的了解或者交流,欢迎私信或者加入QQ群:

过程挖掘算法
03-20
过程挖掘算法
启发式算法Python代码库——scikit-opt
sinat_22510827的博客
05-16 2984
一个封装了7种启发式算法的 Python 代码库——scikit-opt (差分进化算法、遗传算法、粒子群算法、模拟退火算法、蚁群算法、鱼群算法、免疫优化算法) scikit-opt应用代码 安装 pip install scikit-opt 1 特性 特性1:UDF(用户自定义算子) # step1: define your own operator: def selection_tournament(algorithm, tourn_size): FitV = algorithm.FitV ...
python代码实现-常用的启发式算法(不是最优但是合理)
2401_84585615的博客
04-29 369
启发式算法是一类基于直观或经验构造的算法,旨在在可接受的花费下为组合优化问题提供可行解。这些算法通常不能保证找到最优解,但可以在合理的时间内得到不错的答案。
第九讲-流程挖掘(Process Mining)学习日志之启发式挖掘
智潮先锋聚集地
04-25 2141
介绍流程挖掘种的启发式挖掘算法
过程挖掘(Process Mining)6——流程发现(Process Discovery)(2)α算法
hyhy12580的博客
01-24 2259
α算法是比较古老、原始和简单的流程发现算法,能够处理发现并发(concurrency)的能力,但在实践中不适用,因为存在一些问题(处理噪声、不频繁/不完整行为、复杂路由结构等)。这节介绍α算法,可以理解流程发现的内涵,并引出流程发现的挑战 一、α算法 1、基于日志的顺序关系 先引入基于日志的活动顺序关系。 定义1(基于日志的顺序关系,Log-based ordering relations)令是定义在活动集上的一个事件日志,即,令,那么 当且仅当存在一个行迹,有。 当且仅当且。 当且仅当且.
过程挖掘算法6】Split Miner
qq_40420514的博客
05-07 1389
Split Miner是继Inductive Miner又一先进的过程挖掘算法,是在2018年由Adriano Augusto提出来的。接下来,我们将详细地介绍这一算法。 1.背景介绍 从事件日志中自动发现流程模型的问题在过去二十年中得到了深入的研究。尽管有丰富的应用领域,但最先进的模型发现算法比如Inductive Miner,当应用于真实的业务流程时,会避免两种反复出现的缺陷:(i)产生大量的类似意大利面一样的模型;(ii)产生的流程模型要么不适合事件日志(低拟合度),要么过于...
过程挖掘算法4】Alpha Miner及其系列算法
qq_40420514的博客
04-23 4513
Alpha算法是最早应用于过程挖掘过程发现算法,在2002年被过程挖掘之父Wil van der Aalst提出,后续并被很多研究学者所完善,提出了一系列的扩展alpha算法,比如alpha+、Tsinghua-alpha、alpha++、alpha#、alpha$和alpha*。接下来,我们将详细地介绍这一系列算法。 1.背景介绍 在过去的十年(上世纪90年代)中,工作流管理的概念和技术已经应用于许多企业信息系统中。Staffware、IBM MQSeries、COSA等工作流管理系统为结构化业.
过程挖掘算法5】遗传挖掘算法
qq_40420514的博客
04-29 1320
遗传挖掘算法有两个,第一个是在2007年由A. K. A. de Medeiros提出(Genetic Miner,我们称之为遗传挖掘算法1.0),是在Petri网上进行的,第二个是在2014年J. C. A. M. Buijs提出(我们称之为遗传挖掘算法2.0,Evolutionary Tree Miner),在Process Tree上提出的。接下来,我们将详细地介绍这两种算法,并说明这两种算法的不同之处。 1.背景介绍 已有的过程发现算法挖掘包含非平凡结构(non-trivi...
matlab.zip_algorithm_heuristic algorithm_tsp_启发式MATLAB_启发式算法
07-15
用于解决TSP的启发式算法的matlab程序,包含模拟退火算法与遗传算法
"论流程挖掘算法:Inductive Miner及原理对比
算法基于启发式规则和优化策略,能够在处理大规模数据时快速发现其中的规律,并生成相应的过程模型。该算法特别适用于那些涉及大量重复操作和活动的业务流程。 除了上述算法,还有许多其他流程挖掘算法,如...
hmpp:实现 HeuristicsMiner++ 插件的 ProM 5.2 插件
06-25
启发式矿工++ 这个插件实现了 HeuristicsMiner++ 插件。 论文中给出了该算法的完整描述: A. Burattin 和 A. Sperduti。 “”。 在ESANN 2010 的会议记录中; 比利时布鲁日; 2010 年 4 月 28-30 日。 安装说明 要安装此插件,需要执行以下步骤: 从上面的链接中获取插件的最新版本(请参阅); 将文件 hmpp.jar 复制到当前 ProM 5.2 安装的lib/external/文件夹中; 将文件lib/framework/ProM.jar替换为下载的 zip 文件中包含的文件(为了运行插件,需要对框架稍作修改); 在文件mining.ini (在当前ProM安装的根目录中)的末尾添加一行: B5 =it.processmining.hmpp.HMPP 现在应该安装插件! 重要提示:请注意这个插件只是一个有一
基于次声波匹配显示的孔雀元启发式搜索算法_A Meta-Heuristic Search Algorithm based on
01-27
【基于次声波匹配显示的孔雀元启发式搜索算法】是一种新型的优化算法,它结合了自然界的孔雀求偶行为和引力搜索算法的原理。在计算机科学领域,启发式算法,特别是元启发式算法,是解决计算上难以处理的问题的重要...
启发式算法(Heuristic Algorithm)
最新发布
MrLi的博客
07-15 771
启发式算法(Heuristic Algorithm)是一类用于解决复杂问题的算法,通过利用问题的某些特征和经验规则,在可接受的时间范围内找到较好的近似解。启发式算法不保证找到最优解,但通常可以在合理的计算时间内获得可行且质量较高的解。
论文相关知识:启发式流程发现算法
Programmer Monkey的博客
04-26 1819
启发式挖掘算法(Heuristic Miner)   这两天属实是没大学习,跑去玩了玩新游戏深空之眼2333,下面补上今天学的启发式挖掘算法
数据挖掘过程及机器学习十大算法
weixin_41605837的博客
12-02 818
1、数据探索 主要基于pandas库,利用常见的:.head()、.value_counts()、.describe()、isnull()、.unique()等函数以及通过matplotlib作图对数据进行理解和探索。 2、特征工程 主要是通过从日期中提取年月日、季节、weekday,对年龄进行分段,计算相关特征之间的差值,根据用户id进行分组,从而统计一些特征变量的次数、平均值、标准差等,以及通...
过程挖掘(Process Mining Manifesto):从日志中挖掘知识
runfeel
02-26 2424
近年来,事件日志数据越来越多,也越来越容易获取。作为一个年轻的跨领域的交叉研究方向,过程挖掘发展迅速。什么是过程挖掘过程挖掘算法如何在各类学术和商业系统中得以实现,以及过程挖掘面临哪些技术挑战。本文将进行深入探讨。 IEEE过程挖掘工作组 过程挖掘(process mining),指从现代信息系统中常见的事件日志中获取过程知识,发现、监测和改进实际系统行为模式(...
【流程发现算法概述】
qq_40420514的博客
05-14 2659
在我们相继推出了其中6种代表性的流程挖掘算法之后,我们将其简单地进行总结,并从整体上对流程挖掘算法进行概述,从而去了解流程发现的历史进程。接下来,我们将详细地介绍流程发现算法。 1.背景介绍 在《过程挖掘:业务过程的发现、合规和改进》一书中,曾介绍过程挖掘的目标是从事件数据中提取过程相关的信息,比如,通过观察企业系统中的事件数据,自动地发现过程模型。 过程挖掘指的是从事件日志中提取有价值的过程相关信息,是对现有业务过程管理(BPM)方法的补充。BPM是一个学科,它结合了信息技术和管理科学的知识,并.
路径规划算法-启发算法Heuristic
m0_73535738的博客
09-08 1869
盲目搜索会浪费很多时间和空间, 所以我们在路径搜索时, 会首先选择最有希望的节点, 这种搜索称之为如何来界定"最有希望"?我们需要通过计算得到.对于网格地图来说, 如果只能四方向(上下左右)移动,是最合适的启发函数.// 在最简单的情况下, D 可以取 1, 返回值即 dx + dy如果网格地图可以八方向(包括斜对角)移动, 使用作为启发函数比较合适.// max(dx, dy) 保证了斜对角的距离计算如果地图中允许任意方向移动, 不太建议使用网格 (Grid) 来描述地图, 可以考虑使用。
写文章

热门文章

  • 【过程挖掘算法3】Heuristic Miner(启发式挖掘算法) 4831
  • 【过程挖掘算法4】Alpha Miner及其系列算法 4512
  • 【几种常见的流程模型介绍】 4230
  • 流程挖掘工具-ProM的安装与使用教程 3410
  • 【Pm4py第一讲】关于ProcessMining 3063

分类专栏

  • pm4py 1篇
  • Python 8篇
  • 流程挖掘知识 35篇
  • C语言初步学习 2篇
  • C++基础学习
  • Java学习笔记 9篇

最新评论

  • 流程挖掘工具-ProM的安装与使用教程

    m0_64715429: 大哥,还有什么办法装ivy吗?说那个网址不行,在marketplace里装 也说不行

  • 【Pm4py第七讲】关于visualization

    Nniha: 能可视化declare模型吗

  • 流程挖掘工具-ProM的安装与使用教程

    北冥有鱼zsp: 这个没试过,最好用低版本的

  • 流程挖掘工具-ProM的安装与使用教程

    ╰つ ℡。 Sebtimental丶释怀: eclispe2023可以正常使用吗

  • 【过程挖掘算法6】Split Miner

    悲惨小柱: Split Miner的缺点是啥呢,有什么不足之处吗

大家在看

  • C++——继承 1895
  • 活着就好20241024
  • js.水壶问题 831
  • ESP32 中断教程
  • 基于ssm+vue淮安城市开放大学实习实训管理系统(开题报告+源码+论文)

最新文章

  • 【Pm4py第八讲】关于Statistics
  • 【Pm4py第七讲】关于visualization
  • 【Pm4py第六讲】关于合规性检查
2023年16篇
2022年19篇
2018年12篇

目录

目录

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北冥有鱼zsp

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家玻璃钢仿铸铜雕塑泡沫玻璃钢卡通雕塑报价玻璃钢民俗雕塑设计报价常州商场商业美陈报价福建装饰商场美陈厂家直销玻璃钢雕塑卡通大全平江玻璃钢花盆花器五家渠玻璃钢雕塑造型贵溪玻璃钢伟人像雕塑上海周年庆典商场美陈生产厂家营口玻璃钢雕塑定制价格日照玻璃钢人物雕塑价格新疆玻璃钢广场雕塑中国澳门玻璃钢卡通雕塑图片玻璃钢雕塑公司批发玻璃钢花盆防水怎么做山东季节性商场美陈销售公司玻璃钢雕塑躺椅哈尔滨校园玻璃钢雕塑盐城荷花玻璃钢雕塑宜阳玻璃钢雕塑定制安阳泡沫玻璃钢卡通雕塑黄石玻璃钢考拉雕塑定制东营玻璃钢卡通雕塑厂家批发仿铜玻璃钢人物雕塑免费获取报价广州玻璃钢雕塑摆件厂家直销安徽艺点玻璃钢雕塑知名玻璃钢仿铜雕塑加工玻璃钢雕塑业务员好干嘛广州美陈商场香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化