ham: ベイジアンフィルタ

手軽に使える二値分類器*1が急遽必要になったので、ベイジアンフィルタを用いたものを実装。

素性にはNグラムを採用。
対応文字コードUTF-8のみ。
多分実用程度には高速。


分類性能評価的なことはこれから行う予定。
それらしいデータを用意しないと...。

*1:要件:
日本語対応
学習結果をファイルに保存可能
コマンドインターフェース
そこそこ高速な分類速度
それなりの分類精度
依存パッケージなし