ゲストさんログイン

統合検索

ソーシャルブックマーク

[PR]興奮vs感動 どちらが勝つか!

Ads by Google

ページ詳細

25
users

きまぐれ日記: Yahoo!の形態素解析をMeCabで無理やり再現してみる

MeCabで形態素解析器を作りたい場合は以下の二つの言語リソースが必要です。 1. 辞書 (単語と品詞のペアの集合) 2. 入力文と、それに対応する正解出力ペア(正解データ) 現在公開している mecab-ipadic は、ipadicとRWCPコーパスという正解データを使っています。 ここから分かるとおり、少なくともMeCabを使う場合は、コスト値を丹念にチューニング するといった職人芸は要りません。形態素解析への入力文とそれに対応する(理想)出力 があればコスト値を機械学習的なアプローチで構築する...


コメント

Ads by Google


クリップ(19+6)
きまぐれ日記: Yahoo!の形態素解析をMeCabで無理やり再現してみる
livedoor クリップのトップに戻る