ゲストさんログイン

ウェブ検索

ソーシャルブックマーク

[PR]今1番注目のネット証券会社は⇒

ページ詳細

9
users

Perl で日本語テキストを字種分割

Perl で日本語テキストを簡単に字種かたまりに分割できないかな、 と思い、perlunicode を読みながらサンプルプログラムを書いてみました。 対象テキストは UTF-8。 chunker.pl : #!/usr/bin/perl use strict; use warnings; use Encode; use utf8; use open ':utf8'; binmode STDIN, ":utf8"; binmode STDOUT, ":utf8"; while (<>) { chom...

Ads by Google


コメント

Ads by Google


クリップ(7+2)
Perl で日本語テキストを字種分割
livedoor クリップのトップに戻る