GASTONで頻度よく現れる部分構造を探る

MCSは最大共通部分構造なので、頻度よく現れる部分構造を探したいときにはちょっと適切ではないのでGASTONを使うと良いのですが、GASTONは一般的なグラフに対して検索するようになっているので、化合物のデータはGASTONのファイル形式に変換してから計算を実行する必要があります。

また、実行結果もそのままでは解釈しにくいのでsdfやSMILESに変換しないといけません。

ちょっと面倒なので、そういったあたりをよろしく面倒みてくれるようにスクリプトを書いてみました。

http://gist.github.com/274906

OOな書き方にしたほうがテンポラリファイルの後処理とかちゃんとできるのでそのうち書き直す予定。