Category Archives: nlp

不自然言語処理~枠に収まらない言語表現の処理(言語処理学会全国大会テーマセッション) を開催しました

先日 3月10日、豊橋技術科学大学にて言語処理学会全国大会テーマセッションの1つとして「不自然言語処理コンテスト第2弾」となる「不自然言語処理~枠に収まらない言語表現の処理」を開催した。本大会の3日目となる当日は、他に日本語入力等面白そうなセッションが目白押しの中、多数の方に聴講に来ていただき、テーマセッション提案側として嬉しい限りである。 不自然言語処理テーマセッションでの発表はいずれも興味深いもので、当日も、自分のもう1件の発表(機械翻訳セッションでの「原言語の起源に基づく潜在クラス翻字モデル」)で参加できない時間を除き全ての発表を聞かせてもらった。あまりに面白いので帰ってから予稿集も全部読んだ。自分の理解を深める目的も兼ねて、各発表のまとめとコメント等を下に書いてみた。 E3-1 文頭固定法による効率的な回文生成 ○鈴木啓輔, 佐藤理史, 駒谷和範 (名大) 「回文条件」頭から読んでも尻から読んでも同じ音 「通意条件」無理なく意味が通じること を満たすもの。回文候補を大量に生成、通意条件を満たす候補を選択。 1. 折り返し固定法 シード文節を折り返す文節とし、回文条件を満たすように左右に伸ばす 4文節では遅すぎて高速化が必要 2. 文頭固定法 シードを文頭に固定し、回文条件を満たすように残りの文節を埋める 候補の網羅率を保ったまま高速化 文節集合のスリム化 「雨」「委」などの語構成要素、「愛育されろ」などの実際にコーパスには出現しない活用を削除 (: 回文という言葉遊びに極めて工学的に取り組んだ、純粋に知的好奇心をくすぐる研究。 質問もしたが、結局は通意条件もチェックすることになるので、回文条件と一緒に効率よくチェックできるような手法が今後必要となるだろう) E3-2 日本語常用漢字熟語の選好変化と自然言語処理 ○砂岡和子 (早大), 羅鳳珠 (台湾元智大) 漢字の功罪 情報機器の普及により漢字の意味弁別機能の高さが好まれて積極的に使用されている 中国人の成語好き 小学生の作文にすら、80文字中に16種もの四字熟語や成句が使われている 日本人中国語学習者、在日中国人留学生に、「日本語の」常用慣用句や成語を認識しているかどうかチェック 「大所高所」「特筆大書」「多士済済」「衆議一決」などは中国語履修クラスの80%以上が認知できない 「粗製乱造」「薄利多売」「一利一害」を政治経済専攻の学生が理解できない 中国人留学生は、中国語伝来の成語の認識率が上がる (: … Continue reading

Posted in language, nlp, technology | Leave a comment
add to hatena hatena.comment (5) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 5

自然言語処理をやっている人なら必ず読むべき論文100

「自然言語処理をやっている人なら必ず読むべき論文 100 は何か」と言われたらどんな論文を挙げますか。 というテーマで、自然言語処理の研究者の方々に「この分野の学生が必ず読んでおくべき論文100」のリストを聞いて回ったら面白い企画になるなぁと前々から考えていた。 どの分野にも教養的に押さえておくべき重要な論文というものはあるものであり、そういうのを知らないと往々にして「モグリ」と呼ばれてしまう。 しかし、そういうのを尋ねてみたい対象の専門家や教授は、必ずしも twitter 等を活用していなかったり気軽に連絡を取れなかったりで、少し二の足を踏んでいたところだった。 ちょうどそのタイミングで、専門家による Q&Aサービス「Quora」 なるものをはてなブックマーク経由で知り、そこでこの質問を立ててしまえば簡単にこの企画が実現できることに気づいた。しかもワールドワイドで。そこで一つ立ててみた質問がこれ: Natural Language Processing: What are the most important research papers which all NLP students should definitely read? – Quora これまでに @nokuno さん、 @neubig さんをはじめ色々な方に回答をいただいた。そこで挙げていただいた論文をざっと貼ってみると、以下のようになる (ほとんどが @neubig さんに挙げていただいたものである) Parsing Klein … Continue reading

Posted in nlp | Leave a comment
add to hatena hatena.comment (173) add to del.icio.us (0) add to livedoor.clip (8) add to Yahoo!Bookmark (1) Total: 182

Unnatural Language Processing Contest 2nd will be held at NLP2011

I’m glad to announce that the second unnatural language processing contest will be held at 言語処理学会第17回年次大会(NLP2011) as a theme session, which is the sequel of Baidu.jp unnatural language processing contest: Baidu.jp 不自然言語処理コンテスト successfully held this summer. The “call for papers” … Continue reading

Posted in nlp | Leave a comment
add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1

「不自然言語処理コンテスト」第2弾 開催決定!

重要なので日本語で。 今夏に開催し、おかげさまで好評をいただいた Baidu.jp「不自然言語処理コンテスト」 ですが、第2弾の展開として、 言語処理学会第17回年次大会(NLP2011) のテーマセッション化が決定しました。開催要項は以下の通りで、ブログ・ミニブログ・SNS 等のウェブに散見される「不自然な言語現象」に関する研究発表を募集します。 今回は「コンテスト」という形式ではなく、テーマセッションの一つという位置づけですが、よりアカデミックに立脚し、セッション当日は、不自然言語に関する処理について、認識・議論を深められたらと思っています。提案者は自分 @mhagiwara に加え、荒牧さん@ARAMAKIさん, 橋本さん@taiichi84, 村上さん@kmura, 水野さん@mizuno_takaaki です。 また、アドバイザーとして、関根先生(楽天&NYU)と竹迫さん(サイボウズ・ラボ)@takesakoにもご協力いただいています。 不自然なことばの大好きな研究者・エンジニアの皆さまのご投稿・ご参加をお待ちしています。 テーマセッション2: 不自然言語処理 枠に収まらない言語表現の処理 ウェブの発展,およびそれに伴うブログ・ミニブログ・SNS等の一次情報の増加によって,口語表現,異表記・表記ゆれ,誤字脱字等々の「不自然な言語」に対する処理は実用上ますます重要性を増しています.その他にも,変則的な固有名詞,顔文字,未知語など,実データには様々な種類の「やっかいな」言語現象が見られます.従来の新聞記事や,教科書的な自然言語処理ではとらえ切れないこれらの言語現象をどのように処理するかは,実用的なシステムにとって大きな課題の一つです.本セッションでは,「不自然言語処理(UNLP; Unnatural language processing)」というテーマのもとに,不自然言語の処理に関する研究発表,システム,デモ等に関する発表・報告を募集し,また,ディスカッションを通じて理解を深める場を設けます. 具体的には以下のようなトピックに関する研究発表を募集しますが,これだけに限りません. * 変則的な固有表現・未知語の検出・分類 * 口語表現・オノマトペ・新語の解析・獲得 * 異表記・表記ゆれ・略語等の抽出・獲得・解消 * 顔文字・AA・絵文字の分析・抽出 * スパム検出,不正検出 * スペル訂正・文章校正(誤字脱字等の検出訂正)・可読性評価・難読化 * ブログ,ミニブログ,SNS,掲示板等を対象とした処理 * ことわざ・慣用句・回文・なぞなぞ・駄洒落等の処理・生成 * 上記各トピックに関するデモ,システム等

Posted in nlp | Leave a comment
add to hatena hatena.comment (19) add to del.icio.us (0) add to livedoor.clip (2) add to Yahoo!Bookmark (0) Total: 21

Will be presenting at Nagoya area NLP seminar

I’m going to be presenting at Nagoya area NLP seminar 名古屋地区NLPセミナー (Nagoya Area NLP Seminar) which my ex-advisor Prof. Toyama kindly invited me to talk at. The seminar is held on Wednesday, 24th Nov. The topic is going to be … Continue reading

Posted in nlp | Leave a comment
add to hatena hatena.comment (0) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 0

“Introduction to Natural Language Processing” published from O’Reilly Japan

I’m glad to introduce the book O’Reilly Japan – 入門 自然言語処理 which is the translation of the original English book: Natural Language Processing with Python – O’Reilly Media I’ve been working on translation of this book into Japanese with my … Continue reading

Posted in japanese, nlp | Leave a comment
add to hatena hatena.comment (0) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 0