- Rubyでワンライナーを書く方法のまとめ (349)
- 博士のための「けものみち」就職活動ガイド (266)
- ほぼ確実に内定をゲットできる意外な就活戦略 (231)
- 自然言語処理をやっている人なら必ず読むべき論文100 (185)
- 最強のメモツール Evernote の API を使ってみた (152)
- JavaScriptでマリオのテーマを演奏する (133)
- 英語論文執筆にも役立つ、技術翻訳用の環境を惜しげもなく紹介 (97)
- 今更ながらAutoHotKeyが便利すぎる (67)
- Amazon EC2を使ってみた (58)
- Rubyでメール受信+解析 (54)
Monthly Archives: April 2008
ほぼ確実に内定をゲットできる意外な就活戦略
先日、ふらっと立ち寄った書店で見つけた 山田 昌弘, 白河 桃子: 「婚活」時代 http://www.amazon.co.jp/dp/4887596235 が意外に面白かった。現在の結婚事情がうまくまとまっているし、就活のアナロジーも納得できる。合コンと面接が似ているということは前からけっこう言われてることだし、自分も激しく同意できる。そうすると結婚と就職も当然アナロジーで考えられるわけで。 この本自体「婚活」言いたかっただけなんちゃうか、という面も否定できないが、結婚の相手探しを「婚活」という一種の「プロジェクト」として捉えたところにこの本の功績があると思う。結婚について興味がある理系の人にこそオススメな本。理系には、仕事上のプロジェクトを推進するのは非常に上手なのに、恋愛になるとさっぱり、という人が少なからずいる。恋愛と仕事のプロジェクトが全く同じだなんて言う気はないけど、一つの考え方として興味深い。 そういえばこれに関連して、就活の話なんだけど、ちょっと前に読んだ Orville Pierson: The Unwritten Rules of Highly Effective Job Search http://www.amazon.com/Unwritten-Rules-Highly-Effective-Search/dp/0071464042 という本もまた面白い。日本で就活というと、履歴書の書き方とか面接の受け答えとかSPIとかそういうテクニック的なことが重視される傾向があると思うが、この本は就活自体を「プロジェクト」として捉えて、それを進捗管理しながら効率良く推進し、最終的にプロジェクトを完遂する(つまり内定ゲットする)にはどうしたら良いかという、大域的な目での考え方が書いてある。内容を全部解説しているとエントリが足らないので、その中でも一つ。非常に面白い「就活を絶対に成功させる方法」が書いてあったので紹介すると、 1. 1ページにマス目が25個ぐらい書いてある方眼紙を用意します 2. 応募した会社が不採用になるたびにマス目を「○」で埋めていきます 3. 紙全体が「○」で埋まる前には、ほぼ確実に内定をゲットしてるでしょう というもの。ただそれだけ。それだけなんだけど、これも最もシンプルなプロジェクトの進捗管理ツールとして考えられる。「本当に就職に必要なもの」という本質を突いていて、確率論的にも精神論的にも興味深い話だった。 上の話と関連させて、これを「婚活」に応用してみると、こうなる: 1. 1ページにマス目が25個ぐらい書いてある方眼紙を用意します 2. 異性にアプローチして、振られるたびにマス目を「○」で埋めていきます 3. 紙全体が「○」で埋まる前に、ほぼ確実に彼女/彼氏をゲットしているでしょう 出会いが無い、とか、縁が無い、とよく嘆いている人のなかで、本当に25個のマスを1個1個と埋めていける勇気(というか、そもそもマス目を1個でも埋められる勇気)を持つ人がどのくらいいるでしょうか。 ということで、「あなたにも絶対に彼女がゲットできるヒミツの方法!」とかうたって白いマス目が25個書いてあるだけのPDFファイルを情報商材として12,980円ぐらいでヤフオクで売ってみたら儲かるかもしれないので誰かやってみてはいかがでしょう。
(185)
(15)
(26)
(5)
Total: 231ブートストラップによる見出し語候補獲得と論文書き
COLINGに原稿を提出してほっとしたのもつかの間、人工知能学会全国大会の付属ワークショップJURISIN 2008 http://www.ntt.dis.titech.ac.jp/jurisin2008/ に出すための実験と原稿書きにとりかかる。なにせインターン出発前のこの忙しい時期で、もともと出すのはあんまり乗り気じゃなかったのだが、研究室の先生が委員で、「法律情報学+統計的自然言語処理」で一発殴り込みをかけたいという想いから、締め切りがExtendされてから!5日間で、アルゴリズム考えて実験やって論文出すという急行スケジュールで滑り込む。おかげでまた週末が一つ研究で潰れてしまった・・。 内容は、分かち書きされてない、長い日本語文書(今回は法律文書)から特定の意味カテゴリに属する単語群をブートストラップ的に獲得するにはどうしたら良いか?という話。具体的には、研究室で公開している法令翻訳用の標準対訳辞書に載せるような重要語を自動的に獲得するタスク。一部の重要語は既に分かっているので、それを種にしてブートストラップ的に増やしていきましょう、というアイデアに基づいている。 アルゴリズムは基本的にEspressoやTchaiに基づいていて、文脈パターンの作り方とreliabilityの計算のしかたがカギ。内容的には小粒な話なんだけど性能がものすごく良いので、法律情報処理の分野に殴り込みをかける目的としては十分だったと思う。日本の法律は、書かれている文体の定型性が非常に強く(というか、法制執務にかかわる人は、法律を書く際に過去の法律を参照して同じ定型表現を用いて書くように厳しく教育されるらしい)、自然言語処理技術がかなり適用しやすく、かつ良い結果が得られやすい傾向にある。なかなか面白い応用分野だと思う。 そういえば弾さんが、前ブログでプログラムを書くよりも文書を書くほうが頭を使う、とかいうことをちらっと書いていた気がするが、全く同感。プログラムは、調子に乗って一日に数百行~千数百行でも書けてしまうが、文章というのはなぜか時間に対して線形の量しか書けないんだよな。 自分が文書(この場合、英語論文に限るが)を書くスピードというのはこれまでの経験上、驚くほど均一的で、予想可能で、そして遅い。その平均スピードというのが、ACLの2段組フォーマットでぴったり1ページ/日で、だいたい国際学会は最大8ページぐらいが相場なので、締め切りの1週間前にはスタイルファイルをダウンロードして書き始めないと大変なことになる。もちろん、実験を進めたり、足らないデータを補足したりしながら書くので完全に一定ではないが、平均すると限りなくこのスピードに近い。今回のはLNCSのフォーマットだから1ページの分量がかなり少ないとは言え、10ページを4日ぐらいで書いたのでかなりはぁはぁな感じだった。文章書きは得意だし嫌いじゃないけど、プログラムとはまた別の頭の部分を使うので、筆が進まないときは一向に進まないし、書いた後の疲労感も文章のほうが圧倒的に強い。もっと会話をするようにすらすらと文章を書ける人になりたいものである。
(1)
(0)
(1)
(0)
Total: 2