like i loved you +

Microsoft Research@シアトルでのインターンから帰ってきました。コネ・社会経験ナシの情報系大学院生が、腕一本で「世界で一番アツい会社」に就職するまでの記録

Archive for the ‘技術’ Category

p1000233-r.jpg p1000264-r.jpg

EMNLP

MSRのインターンで取り組んだ成果は、論文などにまとめて外部で発表するのが普通。今回こちらに来てちょうど9週目に国際学会の締め切りがあるので、それに向けてのラストスパートがスタートする。思えば、締め切り1週前からテストセットを作り始めるという強行スケジュール。前書いたようにいくら MSRで仕事がはかどるといっても、今週はさすがに休日出勤をしてしまった。Googleのインターンのときは、たまに休日出勤して無料の食事やマッサージチェアーやビリヤードを楽しんでいたのだけど、今回はちょっとわけが違うな。でもドリンクが無料なだけでもやっぱり助かる。

実験環境もかなり強力なのを用意してもらって、少なくとも日本で自分の研究室で使える以上の資源をふんだんに使えるのではかどる(ウチの研究室はサーバーなど計算機資源はあまり充実していないけど、その分使う人も少ないので1人あたりで見たらけっこう贅沢だと思う)

自分がかなり早期(4月)に来たので、ほかのインターンで今回の会議に出す人は誰もいない。自分も、締め切りがあと1週間早かったらたぶん無理だったと思う。大学でやってる研究の内容で出すインターンは何人かいて、そういう人たちは昼間はMSRの仕事をしてアパートに帰ってから大学の論文書きを進めたりしているそうで大変そうではある。MSRの仕事だけに集中できる自分はそれだけでも恵まれてるのかも。

昼は、グループの人がランチに誘ってくれるのが多いのだけど、ここ数日は実験中でちょうどタイミングが悪かったりで、毎回断り続けなければいけないのがつらいところ。結局は後からインターンどうしで連れ添って行こうか、って感じになるんだけど。ミーティングを途中で抜けたりして、自分が必死にしているので、その話を知ってるほかのインターンに会うたびに心配されたり。大学で一人で実験やっているよりも孤独感が少ないのが救い。

EUROCUP

MSでは、基本的に各棟に1つずつカフェテリアがある。自分のオフィスがある棟にも1つあって、隣接している棟がいくつかあるので、少なくとも3か所はお昼食べるところのチョイスがある。車に乗せてもらって外のレストランに行くこともしばしば。

いつもグループの人と行くところはだいたい決まっているのだけど、同じ部屋のJasonがサッカーが好きで、EUROCUPの準決勝が見たいというので、今回は液晶テレビの設置してある別の棟のカフェテリアに足を向ける。MSには数えきれないぐらい建物があって(Building番号が3桁まで行ってる)違う建物に行くと雰囲気もカフェテリアのメニューも全然違って楽しい。

EUROCUPの試合はアメリカ時間のちょうど昼で、同じ目的の社員がたくさんカフェテリアに集まって、ランチもそこそこにテレビにくぎづけ。でも、なぜか衛星中継の調子が悪くて、映像が何度か途切れてスタジオの解説者に戻ってしまう。そのたびに周りはブーイングの嵐。映像が戻ったと思ったら点が入ってたり。どうやら油売ってないでさっさと仕事に戻れということらしい。

論文書き

郷に入っては郷に従え、MSで論文を書くといえば基本的にはWordを使う。別にTeXを使っても良いそうだけど、結局ライセンス関係とか環境設定などが面倒だし、回りの人もWordで慣れてたりして、最終的にはWordを使うことになった。

Wordで数式を書くなんて何の拷問だ!?と最初は思ったものの、実はWord 2007から数式環境が一新されたようで、あの悪名高い「数式エディタ」を使わなくても楽に数式が編集できるようになっている。しかもTeXスタイルのコマンド(\sumでシグマとか)がけっこうそのまま通るから、マウスでツールバーからポチポチ選択しなくても素早く書けるし、見た目もTeXで書いたのと同じぐらい綺麗なのでWordも捨てたもんじゃないとおもう。

Wordの利点は添削機能が使えるところで、自分の書いたところをhisami-sさんに直してもらうとその結果がすぐに見えて、Accept/Rejectするだけで反映されるのが良い感じ。特に便利だと思ったのが、
自分も添削機能をONにして書き進めると、どこを直したのか差分が一目瞭然なところ。大学で先生に見てもらうときは、わざわざTeXをコンパイルしたのを印刷して、差分にマーカー引いて持っていって、先生の添削は赤で紙に直接書かれて返ってくるので、それを見ながらソースをぽちぽち直して・・・ってやってるのがかなり非効率に思えてくる。

提出

そんなこんなでなんとか締切前に論文を提出。締め切り前1日だけ実験に苦戦して日付変更線を越えてしまったことがあったけど、それでも毎日必ずアパートに帰って睡眠を6時間は取れる実に健康的な生活ができた。というか、アパートに帰るための終電ならぬ終バスが12:30ぐらいだし、夜10時を過ぎると30分に1本とか不便になるのである程度の時間で切り上げて帰らざるをえない。メンターのhisamiさんも夜7時ぐらいでさっさと帰ってしまうのも逆に密度を上げる要因になっていて助かる(大学で締め切り前だと先生が夜中とかまで付き合ってくれて逆に申し訳ない)

ワシントン大学

EMNLP08の締切が終わると、翌日からIndependence Day(7/4)で3連休。明らかにこれを狙って締切が設定してあるのだけど、論文提出直後の3連休ということで気分は最高。

英語の先生伝えで友人Charlie(ワシントン大学(UW)の1年生)を紹介してもらったので、初日はUWよりも北にあるShoreline付近まで行ってランチ。UW、近いこともあって、インターンが多数来てたり、共同でシンポジウムがあったりしてマイクロソフトとも縁が深い。ここら辺の人は誰もUniversity of Washingtonなんて呼ばずにUW(you-double-youじゃなくてyou-dubと発音する)って呼んでる。大学は大きくて、キャンパス一帯University Districtと呼ばれていていかにも大学生街というとても雰囲気の良いところなので好き。そのあとはRichmond Beachの辺が景色が良いというので車で連れてってもらう。夕焼けが特に綺麗だそうで写真家の絶好スポットになっているそうな。

日本食

やっと時間も取れて今回は自分の番だということで、3連休2日目はルームメイトのAlexに日本食を振る舞ってあげる。最寄のスーパーでは日本食というと醤油と豆腐と寿司とキリンビールぐらいしか売ってないので、会社の南にあるUwajimaya(宇和島屋)というアジア食材屋までバスで出かける。ドイツ人に振る舞う日本食といえばやっぱり肉じゃがでしょう(前回Alexもじゃがいも料理を振る舞ってくれた)、とメニューは思い立った日から心に決めていたので、必要な食材をかき集めてバックパック一杯の材料をかかえてアパートに戻る。けっこう久し振りに真面目に料理すると割と楽しい。

結果は上出来で、ここまで喜んでもらえると作った甲斐があったなと思う。「こんなに美味しければGoogleでシェフとして働けるよ!」と本人談。「ソフトウェアエンジニアじゃないのかよ」と突っ込んでおく。肉じゃがに入れた糸こんにゃく(しらたき)に、”yam noodles”って書いてあって、おぉなんと的確な訳!と思ったのだけど、そのまま全部説明したら「じゃあこれは日本のじゃがいも・ヌードルだ」って納得してた。修正するのに必死。英語で「煮物」という概念を説明するのはけっこう難しい。

その後はしばしロシアン・ティー(紅茶にジャムを入れるんではなくて、ただ単にジャムをお湯で溶かしただけのもの)を2人で楽しむ。なぜかAlex と話てると戦争の話になることが多いのだけど(まぁドイツと日本だからね)、そのたびに子供のころに「はだしのゲン」の映画を無理やり見せられてトラウマになったので映画館から逃げ出してきた思い出を話してくれる。今だったらもう一度ちゃんと見たいそうだ。

ハイキング

3連休3日目は、インターン向けイベントで、Mt. Rainer(レッドモンドのはるか南にある富士山より高い火山)にハイキングに行ってくる。今回はバス1台分のインターンが参加。2時間ほどバスに揺られて現地に到着後、軽くハイキングをしたり、昼食を食べたりする。今年の異常気象のせいで山の大部分で雪がまだ残っていて、その後雪の上をぞろぞろと歩くハイキング(Snow Hikeというらしい)を楽しむ。途中で誰かが雪玉をつくって投げ始めて、みんなでいい年こいて雪合戦にヒートアップする。楽しかったのでまたやりたいな。

Microsoft Researchのインターンは平均年齢が高めで、中には既婚で家族持ちや、本国から母親や彼女が来て一緒に住んでる人たちなどもいる。最近オフィスに加わったAlan(from UW)も奥さんを連れてきてたので一緒にいろいろ話したり。こういう休日イベントには家族や友人を連れてきてもOKで、今回はそういう人たちがあまりにも多くてインターンどうしで交流を深めるというよりは軽いツアー旅行みたいな感じだった。バスの中では最近来たインターンのHoifungとずっと話してたのだけど、彼も本国に奥さん+子供がいるそうな。Mt. Rainerには何度か来たことがあるそうで色々教えてもらう。ここにずっと住んでても、きっとアウトドアでやるレジャーに関してはネタ切れの心配はなさそうだ。

add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1
  • 0 Comments
  • Filed under: インターン, 技術
  • 研究所の内部

    今週は、Ice Cream Social という、MSRのインターンで集まってアイスクリームを食べまくろうというイベントがあったのだけど、結局行かずに終わってしまった。というのも、同僚のchris-qと、たまたま興味があって読んでる論文が同じでそこに書いてある証明がどうしても納得いかなかったのでホワイトボードに書き殴りながら相談してたらいつのまにか終わってたという感じ。イベントも割と少なく平和な週。

    MSRの研究者には、基本的に個室が割り当てられる。てっきりキュービクルだと思ってた自分はまずそこでびっくりしたのだが(もちろんインターンはキュービクル)、それぞれの個室には必ずホワイトボードが壁に埋め込んであって、よく人の個室を訪ねたり訪ねられたりした時に議論がエキサイトするとそのホワイトボードに式や例文を書いたりし始める。自分のいるインターン部屋にも1つあって、ちょっと大きめの問題を解く時など、紙ではスペースが足らない時によく使わせてもらっているが、こういう小さいところがけっこう生産性に影響を与えるもんだなと思う。

    それに加え、マイクロキッチンの近くなど、3~4人で集まってダベることのできるスペースが研究所の内部には随所にあって、そのスペースの近くにも、マーカーで自由に書くことのできるガラスの仕切りが配置してあるので、証明やらモデルの式やらが落書きやらが自由に書き殴ってある。Σやら∫やらが踊っていかにも研究所、的な雰囲気を醸し出しているのが良い感じ。

    インターンシップ

    アメリカに来てから「アメリカは初めて?」とか「企業でインターンするのは初めて?」とか聞かれることが多いので、その度に、「いや実は前に一度・・・」といってGoogleのインターンの話を切り出すとたいてい興味を持ってもらえる(が、話すこっちは気を遣う)。プロジェクトの事は話せないので、たいていは無料の社食とか社内の遊び道具とかの話でお茶を濁すことになるんだけど、Googleのそういう部分はもうだいたい知られちゃってるので歯がゆい感じ。

    先日ランチでその話になったときに、3年前にlucy-vの下でインターンしていた Rion Snow (ACL2006でBest Paper受賞)の話題が出た。彼は3年前にMSRでインターンした後、翌年Googleで、その翌年Powersetで、というように毎年インターンを渡り歩いてるそうで、今年はどこ行くんだろうね?という話。学生が複数の企業でインターンするのが日本よりもポピュラーなアメリカでさえも、これだけ渡り歩いてるとネタになるみたい。

    MSRに来てからというもの、これだけ良い環境なら、Dを1年伸ばしてでも来る価値があるなと思っているので、少しでも興味のある人にはぜひオススメ。さらにMやDの最終学年に近づくほどインターンに来にくくなるので、動くなら早めのほうが吉ですよ。

    研究

    週の途中で、自分のやりたかった提案手法を、既に、しかもエレガントに実装して発表してしまってる論文を発見してしまう。研究につきものとはいえこの時の脱力感は何とも言えない。メンターのhisami-sさんも、逆によかった、さらに上を行く手法を考えよっか、みたいなスタンスでいるので、結局丸一日論文を読みまくってうんうん考えた挙げ句に異なるアプローチを思いつく。結果らしきものもぼちぼち出てきて、4週目でこれだけ進んでるのはけっこう早いほうらしいという話を聞いて少し安心。中にはインターン期間中にモデルを考えるところまでで期間が終わってしまって、後からメンターの人がしょうがなく実験を進めたりするケースもあるんだとか。

    まだインターンの少ない4月から始めるという時間差が功を奏したのだが、そろそろ5月なのでインターンも増えてきて、ひどい流量という噂のインターン用のメーリングリストに来るメールの量がハンパ無くなってきた。流量を増やしてるのはMSRではなく本社のほうのインターンなんだけど、毎週どこかで「ゲーム大会しよう」「週末遊びいこう」「サッカーチーム組もう」みたいな話で盛り上がってて、みんなちゃんと仕事してんのか不思議になるくらいだ。

    add to hatena hatena.comment (2) add to del.icio.us (0) add to livedoor.clip (1) add to Yahoo!Bookmark (0) Total: 3
  • 0 Comments
  • Filed under: インターン, 技術
  • インターンのプロジェクトに費やす時間が増えるにしたがって、日記に書くこと(というか書けること)が少なくなってくのがもどかしいところですね。

    今日はACL SRWのカメラレディに提出した原稿をアップロードしてみた。人に説明するときにリンク送るだけで良いので便利なことと、著作権関係がどうやら大丈夫らしいと聞いたので。アップした後に、Co-Chairから「サイズがUS Letterになってないよ!」というフォーマットに関するお叱りのメールが来ていたことに気づいたのでぽちぽちと直して再提出。数式がはみ出してたりする箇所とかけっこう事細かに指示される。上のリンクは直してないけど・・・。

    今日は同時に、インターンの中休みに日本に帰るためのシアトル→名古屋便を仕事が終わってからごそごそと予約。今回のACLの出張、日本からオハイオに行って、帰りはインターンの続きをやるためにシアトルに戻るという変則スケジュールなので、出張費が大学からも、マイクロソフトからももちろん出ずに困っていたのだが、ACL SRWには出張費補助の制度があるらしくて、学会参加費、ホテル代、航空券代など、かかった費用を領収書付きで申告すると、その一部を補助してくれるということだ。どうせ大した額ではないと期待してなかったのだが、どうやら自分の場合(というかひょっとして参加者全員?)ほぼ全額が返ってくるようなのでほっと胸をなで下ろす。ルームメイト紹介サービスといい、この費用負担制度といい、とても良いサービスなのでもっと大々的にCFPに書いて宣伝しても良いのでは?

    ところで、インターンでやることのテーマ、大学でやってることと良い具合に異なっているので、理論と実装の両面で色々と新しいことを覚えられてとても楽しい。人は適度なストレスがかかるときに最善のパフォーマンスを発揮できるとはよく言われたものだけど、良い具合にそのパフォーマンスカーブの極大点に乗っかってる気がする。

    同時に、ここでインターンしてると、企業ならではのパワー(規模の力)を実感することが多い。「こういうことやりたいんだけど誰か実装した人いないか」「こういうデータ使いたいんだけどどっかにないか」的なことをちょっと聞いたりすると、すぐさま何らかのモノが出てくるか、すぐにもっと詳しい人のところに繋がるのがすごい。大学でも、規模の大きい研究室では当たり前なのかもしれないけど、少なくとも自分の研究室ではそうではないし、大学では「力」よりも「頭」を使ってる(というか、頭もあまり使ってないかも・・・。)ほうが多いので新鮮だ。もちろん、ここでも頭はおそらく大学以上に使ってるんだけれども、それにパワー(力)が伴っていてとても良い環境だと思う。Googleでインターンしてた時にも思ったのだが、この環境をそのままごっそりと日本に持って帰って研究できたらどんなに良いことだろう。日本の研究室で、自然言語処理の研究をやるために、それではじゃあデータが必要だね、ってなって、じゃあクローラーを書き始めて、スクレイピングして、なんて一人やってる内にどんどんと追い抜かれていくのは目に見えてるな。

    add to hatena hatena.comment (2) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 2
  • 0 Comments
  • Filed under: インターン, 技術
  • なんか単なる「大学院生アメリカ生活日記」みたいになってきたけど気にしないまっとんですこんばんは。

    昨日、本当は「インターンのみんなでロッククライミングをして交流しよう!」的なイベントがあるはずだったのに、人数が少なかったのか突然中止になった。上司のhisami-sさんがロッククライミング好きで色々教えてくれたりしてちょっと楽しみにしてたのだが、次回待ち。ちなみに次回は「インターンのみんなでガラス細工を作って交流しよう!」的なイベントらしく、MSに限らずアメリカでは、こういう「小学生かおまえら」的なイベントを、親睦を深めるためにわざわざいい年こいた研究者とか大学院生にやらせるのはよくあることらしい。

    ということで時間ができたので銀行口座を作りに行ってくる。会社の近くの支店の窓口に行って、いろいろ個人情報を聞かれてすぐに完了。Visaのデビットカードも発行してもらえた。給料振込ももちろん重要だが、アメリカに口座を持ってると、外国の証券会社等に振り込んで、直接アメリカ株とかETFが買えたりするので楽しみ。もちろんインターン中はそんなお金を動かしているヒマなんて無いのだけれども。

    ところで行ってきた銀行とか不動産屋とかで対応してくれる人、「マイクロソフトで働いている」と言うと突然態度が良くなる気がする・・・。そもそもこの辺の会社の大部分がマイクロソフトに寄生(言葉は悪いが)しているようなもので、会社単位で斡旋とか契約してるためだろうと思うのだけれども、基本的に「無料のサービス精神」というものが店の人に無いアメリカではちょっと拍子抜けである。着いてから色々と交渉したり問い合わせたりしてばかりいたので、だんだんとそれを楽しみつつあったのに・・・。

    今日はもう少し時間があったので、街中まで出てプリペイド携帯を買ってくる。インターン中ほとんど使わないと思ったのだけれども、週末に人と会う用事があって、アメリカの携帯がどんなものか興味があったので試してみることにした。こちらはなんと個人情報は名前しか聞かれなかった。アメリカでプリペイド買うのは簡単だと聞いていたのだがこんなに簡単だとは。買ったのはT-MobileのNokia 2610。日本のと操作方法の勝手が違って分かりにくいのだが、確かに英文メールは若干入力しやすい。

    携帯で打つ英文メールって、いつも思うのだけれども、同じ内容を伝えるのに日本語よりも遙かに多いキーストロークが必要な気がする。それだから頭字語(acronym)とか略語(abbreviation)が発達したのだと思うが、ここはハードウェア的に(そしてソフトウェア的にも)なんとかすべきだと思った。それだからBlackBerryみたいなフルキーボードモデルが日本よりもポピュラーなのかもしれない。

    add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1
  • 0 Comments
  • Filed under: インターン, 技術
  • 今日からタイトルつけます。アーカイブに○○日目って数字だけが並んだら、初めてアクセスした人は、全部読むか全部読まないか、ランダムに読むかの選択肢しかないことに気づいたので。

    この日記は1日遅れで、つまり、平日家に帰ってから昨日のことを思い出しながら書いているのだが、(これにはちゃんとした理由があって、記憶力が極端に悪い自分は、昨日のことを思い出しながら書くと復習になるし脳トレにも良いから)日本は時差のせいでそもそも1日遅れみたいなもので、さらに昨日帰ってきて疲れて寝てしまったので日本から見たら3日遅れの日記を書いているまっとんですこんばんは。

    今日はミーティングに出させてもらう。一つはReading Groupというもので、日本で言うと輪講みたいなもの。誰か発表者がネタ(論文)を用意してきて発表して、参加者に解説した後(というか解説しているそばから)みんなで議論をするというもので、そこは大学でやってるのとそう変わりない。決定的に違うのは、そもそも時間が短いことと、内容が濃いこと。会議室の予約がそもそも1時間しか取ってないくて、終わると別のグループの人たちが来てしまうので、それまでに発表+議論を終えなければならない。ウチの研究室だと、ミーティングの開始時間だけが決めてあって、あとは雑談を交えながら(というか半分ぐらい雑談)だ~らだらやってるのだけれど、ここはMSRを見習ってせめて終わりの時間だけでも決めるべきかなと思った。あとは内容の濃さで、学会発表の後の質疑応答の時間を5倍ぐらいに濃縮したものを考えてもらうとわかりやすい。質疑応答の時間で、たまに質問者+発表者+別の質問者がエキサイトして議論を始めることがよくあるが、あれがずっと続いている状態。

    二つめに出させてもらったのは普通のミーティングなのだけれど、こちらも今回は外部グループの発表者がいて、NLPに関係ありそうなことを語りに来てくれるという感じ。こちらも発表しているそばから濃厚な議論が繰り広げられていく。

    正直、英語の問題もあって、この議論に「適切に」参加していくのはかなり難しいと思った。昔Googleインターン時の同期が、「日本で英語がダントツにできても、アメリカでは英語がダントツにできない部類に入るのでかなりつらい」ということを漏らしていたのだけれど、それをそのまま体感している。1対1で話している時には全然問題ないのだけれども。

    ということで、自分がGoogleでインターンしてたときよりも英語レベルはけっこう上達してるにもかかわらず、かなり大変だと感じているので、もうすこし参加者に求める英語レベルは高くしてもいいんじゃないかと思った。面接でグループディスカッションでもさせるとかも良いかもしれない(でもそうするとたぶん日本人は誰も通らないw)

    まあ、マーフィーの法則に「経験は、それを必要とした後ではじめて手に入るものである」という名言があって(初Hの時を思い出してもらうと分かりやすい)、自分はこの言葉が大好きで座右の銘としているのだが、それを心に留めながら精進する毎日である。

    add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1
  • 0 Comments
  • Filed under: インターン, 英語, 技術
  • マイクロソフトでの2日目

    この調子で「マイクロソフトでの84日目」まで毎日日記を書くのかと思うと怖くなってきたまっとんですこんばんは。ちなみにインターンは12週間+中休み2週間。

    今日はオリエンテーションの2日目。また朝から社員の人の話を聞いたりビデオを見たり。会社の知財関係の話なんだけど、この辺はGoogleの時に体にたたき込まれたせいかけっこう退屈。途中で意識が飛びそうになる・・・。

    オリエンテーション後は、建物に入るためのカードキーをもらい、他のインターンの人たちと合流してシャトルバスを頼んで自分らの建物へ。マイクロソフトのキャンバスはあまりにも巨大なため、建物から建物まで歩いたら平気で何十分もかかってしまう可能性があるので、受付に言うと専属のタクシーみたいなのをすぐに手配してくれる。あまりにも巨大なため、初日に空港からタクシーで高速下りたときに「マイクロソフトはどこなんですか?」って運ちゃんに聞いたら「いやいや、もうマイクロソフトのど真ん中にいるがな!」って言われたぐらい。名古屋大学の東山キャンパスを知ってる人なら、東山キャンパス(山の上を含む)~中京大学~南山大学をすべて含んでぐるっと囲むような領域を考えてもらえばその大きさがイメージしやすい。ローカルな例えでごめんなさい。東京ドームだと何個分だろう。

    自分の席に行ってPC等を簡単に確認した後に、hisami-sさんに連れられてラボの人たちに紹介してもらう。いろんな人がいてみんな気さくな感じで良かったのだが、MTに関わってる人が多い印象。自分の研究室では少なくともSMTやってる人(やってた人)が誰もいないので、話についていけるか心配だ。ちなみに自分は今年来た最初のインターンらしく、部屋も独占状態で使える。5月になったら少しずつ増えてくるそうな。

    Microsoftの社員の特典は実に色々ある(多すぎて覚えられない)のだけれど、一つはこのあたりからシアトルにかけてのバスに全て無料で乗れること。早速受付でフリーパスを発行してもらったので、バスにタダ乗りして帰ってくる。異国の地でバスに乗るのは苦手なんだけど(そもそも日本でもほとんど乗らない)、路線も割とわかりやすいしこれからお世話になりそう。

    本当はPCの環境(ハード+ソフト)とか、インターンのプロジェクトとか、肝心なことをものすごく語りたい(そしてたぶん読者の要望にも合ってる)んだが、NDAに抵触しそうでうかつに書けないのがもどかしいところ。でも、PC環境はすごくいいですよ。しかもインターンに割り当てられるPCのスペックが高いので、毎年インターンが去ってから社員の間で争奪戦になるそうな(笑)

    add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1
  • 0 Comments
  • Filed under: インターン, 技術
  • 昨日はACLのStudent Research Workshopのカメラレディを提出する。今回は本質的な改変はナシ(そもそも時間的にも6ページという分量的にも無理)で突っ込みのあった実験の部分だけ、パラメータ設定を見直して走らせ直す。無謀にも機械学習にかなり寄った話なので、査読者に実験設定について色々言われてしまったのだが、それだけでかなり糧になった感じ。SRWで良かった。

    提出したPDFでもここでコソーリ公開したかったのだが、あれだけあからさまにCopyright Transfer Formを書かされるとやっぱりやめといたほうがいいかな、と思う。しょうがなく個人ページのほうにエントリを追加するだけにしておく。

    そういえば、Googleのプログラマの給料についてのエントリを最近ちらほら見かける。

    Googleのプログラマの給料 | (仮)秋元@約束だゾ!!アッキー!!

    具体的な金額については、まぁそんなものかな、と思う一方で、だから何?という感じも否めない。Googleに行って分かったことの一つは、というか行く前からそもそも分かれよ、という話なのだが、一言にGoogleのプログラマといっても、たとえ肩書きが同じでもピンからキリまでいるということ。自分がインターンに行った2年前ですらそう感じたのだから、今ならもっと「能力のdiversity」は増えてる気がする。このエントリに載ってる数字が、最大値なのか最小値なのか平均なのか中央値かは定かではないが(というかそのいずれでも無い気がするが)、それに応じて給料のdiversityも大きいと仮定すればこの数字はほとんど意味がないんじゃないか。あくまで1つのケースとして楽しむに留めておきたい。

    add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1
  • 0 Comments
  • Filed under: 技術, 大学
  • COLINGに原稿を提出してほっとしたのもつかの間、人工知能学会全国大会の付属ワークショップJURISIN 2008


    http://www.ntt.dis.titech.ac.jp/jurisin2008/

    に出すための実験と原稿書きにとりかかる。なにせインターン出発前のこの忙しい時期で、もともと出すのはあんまり乗り気じゃなかったのだが、研究室の先生が委員で、「法律情報学+統計的自然言語処理」で一発殴り込みをかけたいという想いから、締め切りがExtendされてから!5日間で、アルゴリズム考えて実験やって論文出すという急行スケジュールで滑り込む。おかげでまた週末が一つ研究で潰れてしまった・・。

    内容は、分かち書きされてない、長い日本語文書(今回は法律文書)から特定の意味カテゴリに属する単語群をブートストラップ的に獲得するにはどうしたら良いか?という話。具体的には、研究室で公開している法令翻訳用の標準対訳辞書に載せるような重要語を自動的に獲得するタスク。一部の重要語は既に分かっているので、それを種にしてブートストラップ的に増やしていきましょう、というアイデアに基づいている。

    アルゴリズムは基本的にEspressoTchaiに基づいていて、文脈パターンの作り方とreliabilityの計算のしかたがカギ。内容的には小粒な話なんだけど性能がものすごく良いので、法律情報処理の分野に殴り込みをかける目的としては十分だったと思う。日本の法律は、書かれている文体の定型性が非常に強く(というか、法制執務にかかわる人は、法律を書く際に過去の法律を参照して同じ定型表現を用いて書くように厳しく教育されるらしい)、自然言語処理技術がかなり適用しやすく、かつ良い結果が得られやすい傾向にある。なかなか面白い応用分野だと思う。

    そういえば弾さんが、前ブログでプログラムを書くよりも文書を書くほうが頭を使う、とかいうことをちらっと書いていた気がするが、全く同感。プログラムは、調子に乗って一日に数百行~千数百行でも書けてしまうが、文章というのはなぜか時間に対して線形の量しか書けないんだよな。

    自分が文書(この場合、英語論文に限るが)を書くスピードというのはこれまでの経験上、驚くほど均一的で、予想可能で、そして遅い。その平均スピードというのが、ACLの2段組フォーマットでぴったり1ページ/日で、だいたい国際学会は最大8ページぐらいが相場なので、締め切りの1週間前にはスタイルファイルをダウンロードして書き始めないと大変なことになる。もちろん、実験を進めたり、足らないデータを補足したりしながら書くので完全に一定ではないが、平均すると限りなくこのスピードに近い。今回のはLNCSのフォーマットだから1ページの分量がかなり少ないとは言え、10ページを4日ぐらいで書いたのでかなりはぁはぁな感じだった。文章書きは得意だし嫌いじゃないけど、プログラムとはまた別の頭の部分を使うので、筆が進まないときは一向に進まないし、書いた後の疲労感も文章のほうが圧倒的に強い。もっと会話をするようにすらすらと文章を書ける人になりたいものである。

    add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1
  • 0 Comments
  • Filed under: 技術, 大学
  • ほぼ丸一日かけて、ようやくWindows Vista上での開発環境(軽い研究・開発+論文執筆ができる環境)がそろってきた。ついでなので、自分が今回インストールした「これはどうしてもはずせない!」っていうアプリをちょっと紹介してみます。みんなWindows上でどんなツール使って開発してるんだろうかちょっと気になります。Mac OSよりも選択肢は遙かに多い気がする・・・。

    xplorer2
    http://zabkat.com/

    エクスプローラーの代替。タブとマルチペインに対応。新バージョンではキーカスタマイズがけっこう自由にできて良い感じ。有料。

    XEmacs for Windows
    http://www.xemacs.org/Download/win32/

    メインエディタ。昔はMeadow使ってたけどこっちのほうが軽いのでしばらくこっち使ってます。

    XKeymacs
    http://www.cam.hi-ho.ne.jp/oishi/

    Windows上のあらゆる場面でEmacsライクなキーバインドを有効にしてくれる常駐ツール。C+f, C+b, C+p, C+n, C+a, C+e, C+d, C+kをシミュレートしてくれるだけでも、おそらく開発効率が2倍ぐらいになってると思う。「カーソルキーが許されるのは小学生までだよねー。」的な気持ちになることうけあい。

    Poderosa
    http://ja.poderosa.org/

    ターミナルエミュレータ。タブに対応していて、Mac OSのiTermとほぼ同じ感覚で使える。ローカルのCygwinにも接続可。

    Cygwin
    http://cygwin.com/

    Windowsで動く*nixライクな環境。今回、Cygwinだけには依存せずに開発環境をがんばって整えてやろうと思ってましたが、やっぱりだめでした・・・。というか、これ無しで、Windows上でどうやってコンソールベースの開発環境を整えるのかが全くもって謎です。後輩にはDOSプロンプトでポチポチやってるつわもの?もいるけど。自分はCygwinのbashをzshに置き換えてPoderosaから接続してつかってます。

    SftpDrive
    http://www.sftpdrive.com/

    Windows上でshfsを実現するツール。shfsは、ssh接続ができるサーバーに接続してホームディレクトリを一つのボリュームのように扱えるファイルシステム。サーバーがsshに対応さえしていればよく、それをWindowsのネットワークドライブとしてマウントしてくれる。昔はshfsを使いたいがため「だけ」に、VMWareでDebianを動かして、そこでshfs接続したのをSambaでWindowsと共有したりしてましたが、このSftpDriveなら1本で済みます(ただし有料)。shfs、ものすごく便利なのにいまいち普及してないんだよね。(まさかみんないまだにftpとかでしこしことやってるんだろうか・・。共有サーバーならしょうがないか。)

    Launchy
    http://www.launchy.net/

    アプリ名の先頭数文字を入力するだけで起動できるランチャ。Mac OSのQuickSilverとかSpotlightみたいな感じ。これなかったら死んじゃう。

    あとは、定番のFirefoxとか、Officeとか、Skypeとか、TeX書く環境一式とか。このあたりは使ってる人多そうなのであえて紹介はしません。ほかにもなにかオススメのツールがあれば教えてもらえればありがたいです。

    add to hatena hatena.comment (3) add to del.icio.us (2) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 5
  • 1 Comment
  • Filed under: 技術, 一般
  • 研究室紹介

    昨日は研究室紹介なるイベントがありました。

    学部3年生が各研究室をまわっていき、それに対して各研究室は、自分の研究室で取り組んでいる研究の紹介や、研究室の良いところなどをアピールするというもので、ようするに企業展の研究室版?みたいなものです。(でも全部で15個ぐらいある研究室に1日で全部まわってかなり疲れるので、ほとんどの学部3年生はこんなイベントどうでもいいから早く帰りたい、と思っている点で異なってる)

    とりあえずウチは研究室の日常生活の紹介をさらっとして無難に研究紹介。こんなスライド lab_intro-2008-mine.ppt を使ってやってました(宣伝になるし、公開してもいいよな・・・。)毎年使い回してるようで実は去年のとはけっこう差分があったりします。研究も1年でずいぶんと進みますからね。

    よく思うのだけれども、こういうふうに「話がわからない人に対してその研究のおもしろさや意義をいかに伝えるか」って難しいけど重要な能力だと思います。専門外の友達とかに「どんなことやってんの?」って聞かれたときに、(a)相手に引かれずに、(b)わかりやすく、しかも(c)「すごいことやってる感」を演出しつつ話すのってかなり難しい・・・。(ちょうど研究を始めた頃、付き合ってた子に研究内容のことについて聞かれて、「えっと、まず単語を約1万次元の実ベクトル空間上で表現するんだよ!」と順番に説明してドン引きさせた過去を思い出しますw)1日中見学に回って疲れが溜まって、いつ何時うたた寝を始めるかわからない3年生の眠気をバシーンとさますような話ができてればいいんですけどね。

    この研究室紹介のような「ツカミトーク」の対局にあるのが、論文執筆。話のおもしろさより内容の詳細さや厳密さが必要とされる。学会発表はさながらそのちょうど中間といったところでしょうか。ツカミは大事だよ、というお話でした。

    しかし、1日に15個も研究室を回るような過酷な環境?で研究室を見学しても、実際に研究室選びの参考になってるんだろうか、という点でかなり疑問です。研究室選びは、簡単なように見えて、その後の一生に影響を与えてしまうインパクトを持っているので(すくなくとも自分の場合はそうでした。良い意味でも悪い意味でも。選択自体は後悔していないんだけれども。)、研究職を目指していたり、たとえそうでなかったとしても、自分の将来を少しでもまじめに考えたいという学生は、研究室を直接訪問することをお勧めしますよ。

    add to hatena hatena.comment (1) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 1
  • 0 Comments
  • Filed under: 技術, 大学
  • 中の人 (Ustream)