といっても先週末のことですが。

言語理解とコミュニケーション研究会(NLC) 究会言語理解のためのコーパスからの知識獲得
http://www.ieice.org/~nlc/jpn/kenkyukai/nlc0710.html

メインは、自分の研究分野(類義語自動獲得)の大先輩であるPatrick Pantel氏の招待講演です。講演は2部構成で、前半は類義語獲得の基礎技術のお話。分布仮定(distributional similarity)から始まって、文脈素性の取り方や、相互情報量(pointwise mutual information)など、知っている話がほとんどだったけど、話が整理されてて面白いし、何よりストーリーがあるな、と思いました。分野になじみの無い人でも興味深く聞けるのでは。声だけは録ってきたけど、講演のビデオか何か公開すればかなり有益なチュートリアルになりそうです。

後半は、前半の技術をちょっと応用してもっと面白いことをやってやろう、というお話。例えば、[”apple”, “banana”, “peach”]というクエリを投げると”pear”を返してくれる連想検索?システムや、「なぜこれらの単語は類似しているのか?」に答えてくれるシステム(これらは果物で、食べられて、甘くて...みたいに)。あとは、「仲間はずれ検出システム」等。どれもこれも、適度に応用がありそうで、適度に難しくて、自然言語的な解法が求められる問題ですね。特に連想検索については需要があると思うので、ちょっと自分でも日本語バージョンを手をつけてみようかなと思ったり。

質問したり、講演後に本人とお話できる機会があったので、PMIなどの重み指標と類似度指標についてうかがう。丁寧に答えてもらい感謝感謝です。参考文献を紹介してもらったのでちょっと調べてみよう。

他の4件の発表も、どれも面白い。NLC研に来たのは初めてですが、これぐらいの集まりならちょこちょこ覗いてみたいなと思います。ちなみに参加者の顔ぶれがこの前のNLP若手の会とかなりかぶってました。ポスター発表でお会いしたY社のK林さんとまたお会いできたり。実は同社の研究所には興味津々なので、時間をつくってゆっくり見学でもさせて頂ければなぁと思ったりしてます。でもインターン募集は今んところやってないそうなので(正社員only)、ちょっとしょんぼり。