tsupoのクリップ (13164) / 日本語 (0)
-
Baidu.jp 不自然言語処理コンテスト
検索エンジンを提供するBaiduでは、ウェブ上で使われているネットスラングなど、不自然な言語の処理に取り組むコンテストを開催します / 2010年7月20日(火)正午: 作品応募締切
-
Google Japan Blog: 思いどおりの日本語入力 - Google 日本語入力
Google 日本語入力は、ソフトウェアエンジニアの工藤と小松の 20% プロジェクトからスタート / 自然言語処理や各種プラットフォームの開発経験者たちのノウハウが凝縮されたものとなっています
-
[学習][English] 英語圏の人に対する言語習得難易度表:日本語は最高難度
英語を母語とする者にとっては、日本語は最も習得が難しい言語のひとつ / 最難度の言語でも真剣に88週、2年間も勉強すれば不自由しないレベルまで習得することが可能であることを示している
-
「ふいんき」よりも気になる「定員さん」
ATOKでは「ふいんき」→「雰囲気」、「ていいん」→「店員」に(誤入力であることの注意と共に)変換される → 変換されちゃったら、「なぜか変換できない」ネタにならないよ! ATOKのいけず // 「週刊」を「週間」とか多すぎる
-
日本語版Twitterサイト開発ブログ: 日本語の文字化け障害について
FIreFoxの言語設定が日本語の場合、HTTPプロトコルヘッダは、"HTTP_ACCEPT_CHARSET" => "EUC-KR,utf-8;q=0.7,*;q=0.7"となっており、EUC-KRが優先、utf-8が2番目 → え゛っ? EUC-JPじゃなくてEUC-KRなの?
-
日本語版Twitterサイト開発ブログ: Twitter日本語版記者説明会
ustream(付属の IRC)のチャットログが載ってる! / 参加したかったなぁ
-
「Twitter」日本語版公開、日本独自で広告配信も
言語選択メニューから切り替えることも可能 / 日本語版はPCサイトのみで、携帯電話向けサイトは準備中。「近い将来対応する予定」
-
エノエノモエジィールとは - はてなダイアリー
「へのへのもへじ」がフランス語に入り込んでるんだ
-
日本語の源流を求めて
日本語タミル語起源説の大野晋が研究の集大成を一般人向けに平易にまとめた新書 / 五七五七七の韻律を持つ詩もタミル語に / 注連縄や門松まである / 偶然ここまで単語や文法、背景の文化が一致するとは考えにくい
-
実は…使い方を間違えていたコトバランキング - goo ランキング
そういえば、これから横道に反れることを宣言するのに「閑話休題」を使ってる人がいるなぁ。「煮詰まる」は主語次第で意味が変わる気がする。
-
辞書不要の形態素解析エンジン「マリモ」とは - @IT
「マリモ」と聞いて、人工無脳の「まりも」たんを連想してしまう。 // マリモは、あらかじめ動詞や形容詞の活用形についての知識を持たず、頻度情報と位置情報を使った統計処理だけで、どの音のつながりが単語で、そ
-
けだるい午後、しないべき
いや、「するべき」というのがそもそも変で、「すべき」と書くべきwwwww
-
asahi.com:「患者様」ちょっと違和感 「患者さん」に戻す病院も - 暮らし
患者様は神様です ><
-
機能変更、お知らせなど - はてなグループ日記 - はてなグループアップデート 4/6
表示位置につきましては若干唐突感がありますが → 「唐突感」 // 唐突感 の検索結果 約 32,400 件 → うわぁ。
-
KandaNewsNetwork: 日本語という参入障壁
すでに世界のブログの33%は日本語ということで、圧倒的に量的には他の言語を圧倒 / しかし、読めることのできる人数は最大でも1憶3000万人という母数は変わらない / ロングテールの果てしなく長いテール部分に存在
-
一本足の蛸 - 「違和感を感じる」表現
ぴったりの言葉はまだ見つかっていない → この記事から受けるニュアンスだと「違和感が漂う」という辺りがぴったりかもしれません
-
AquesTalk 日本語規則音声合成ライブラリ
AquesTalk は、テキスト情報を音声波形に変換出力するライブラリ / 営利、非営利にかかわらず無償で使用でき、製品に組み込んで販売することも可能 → これはおもしろそう
-
同音異義語への異議
日本語が確かに世界一のものがある。それは同音異義語の多さ / 室町時代までは区別していたが、江戸時代に合流してしまった / 既に読み替えが定着した語と同じように、他の同音異義語も徐々に読み替えていくべき

