Process Mining: Data science in Action https://www.coursera.org/course/procmin の第2週の講義とクイズ終わった。第一週がデータマイニング的な話だったのに対して、第二週はプロセスモデル(特にペトリネットとそのサブクラスであるワークフローネット)を中心とした話。

ペトリネットの定義、Reachability graph、Boundedness (k-boundedness, safeness)、デッドロック、Liveness、イベントログ(トレース)との関係、ワークフローネットの定義、ワークフローネットの健全性など。簡単だけど自明ではないペトリネットを例に、説明するのはなかなか良かった。

また、トレースからのペトリネットの発見のためのアルゴリズムの簡単な例として、αアルゴリズム http://en.wikipedia.org/wiki/Alpha_algorithm の導入と、その制限事項の説明。αアルゴリズムについては超ナイーブな実装を自分でもしてみた。 https://gist.github.com/msakai/d96d39b7356bc230715e

そのうえで、プロセスの抽出や、可視化、分析、シミュレーションなどに使えるツールとして ProM http://www.promtools.org/ と Disco https://fluxicon.com/disco/ を導入している。

毎週のクイズとは別に Tool Quiz というのが用意されており、それを一通り解くことで、ProMとDiscoの上記のような機能を一通り試すことができるようになっていて、細かい操作の説明を読みながらツールを動かすのは面倒くさいけれど、まあ一通りの使い方は身について良かったとは思う。

#procmin