KHCoder
前から気になってたソフトを、ちょっとだけ試してみた。テキストマイニング用のフリーソフト。社会学や言語学で学術利用がされている。教育用途でも使われているもよう(学生さんのBlogで見たことがある)。
ロゴがきらきらしていてきれい。
Windows版の場合、ダウンロードして展開すると、茶筅からMySQLから、全部インストールしてくれるので超楽。コンピュータのことがあまりよくわかっていない学生にも薦めやすい。(ディスク占有は128MB程度。)
前処理のところで品詞分解などを茶筅でやって、分析する品詞の選定やその他の調整をかけ、抽出語の対応分析などまでボタンの操作だけで実行することができる。便利。
とはいえ、ただ単に文章入れてクリックだけでは、何のことかわからん結果しか得られない。単語の取捨選択などをきちんとする必要あり。
品詞の一覧を見ていたら、「HTMLのタグ」とかがあったので、Webページのソースの流し込みなども考慮しているのだろう。SQL文で書かれたプラグインによる拡張もできるらしい。
品詞分解の時などは、「時間がかかる処理をします」みたいな警告も出るが、今時のPCならあまり時間は気にしなくて大丈夫なはず。(386とかはわかりませんが……。)