重要なので日本語で。
今夏に開催し、おかげさまで好評をいただいた
ですが、第2弾の展開として、
のテーマセッション化が決定しました。開催要項は以下の通りで、ブログ・ミニブログ・SNS 等のウェブに散見される「不自然な言語現象」に関する研究発表を募集します。
今回は「コンテスト」という形式ではなく、テーマセッションの一つという位置づけですが、よりアカデミックに立脚し、セッション当日は、不自然言語に関する処理について、認識・議論を深められたらと思っています。提案者は自分 @mhagiwara に加え、荒牧さん@ARAMAKIさん, 橋本さん@taiichi84, 村上さん@kmura, 水野さん@mizuno_takaaki です。
また、アドバイザーとして、関根先生(楽天&NYU)と竹迫さん(サイボウズ・ラボ)@takesakoにもご協力いただいています。
不自然なことばの大好きな研究者・エンジニアの皆さまのご投稿・ご参加をお待ちしています。
テーマセッション2: 不自然言語処理 枠に収まらない言語表現の処理
ウェブの発展,およびそれに伴うブログ・ミニブログ・SNS等の一次情報の増加によって,口語表現,異表記・表記ゆれ,誤字脱字等々の「不自然な言語」に対する処理は実用上ますます重要性を増しています.その他にも,変則的な固有名詞,顔文字,未知語など,実データには様々な種類の「やっかいな」言語現象が見られます.従来の新聞記事や,教科書的な自然言語処理ではとらえ切れないこれらの言語現象をどのように処理するかは,実用的なシステムにとって大きな課題の一つです.本セッションでは,「不自然言語処理(UNLP; Unnatural language processing)」というテーマのもとに,不自然言語の処理に関する研究発表,システム,デモ等に関する発表・報告を募集し,また,ディスカッションを通じて理解を深める場を設けます.
具体的には以下のようなトピックに関する研究発表を募集しますが,これだけに限りません.
* 変則的な固有表現・未知語の検出・分類
* 口語表現・オノマトペ・新語の解析・獲得
* 異表記・表記ゆれ・略語等の抽出・獲得・解消
* 顔文字・AA・絵文字の分析・抽出
* スパム検出,不正検出
* スペル訂正・文章校正(誤字脱字等の検出訂正)・可読性評価・難読化
* ブログ,ミニブログ,SNS,掲示板等を対象とした処理
* ことわざ・慣用句・回文・なぞなぞ・駄洒落等の処理・生成
* 上記各トピックに関するデモ,システム等




