like i loved you +

バイドゥ(百度)株式会社で働くR&Dエンジニアとして、世界一楽しい検索エンジンを作っています。情報系大学院生が、腕一本で「世界で一番アツい会社」に就職するまで&してからの記録。

Archive for 12月, 2008

個人的には、いわゆる「自己啓発本」「成功本」の類に書いてあることは、読み物としては面白くても、効果のほどについては話半分に聞かなければいけないと思っている。なぜかというと、ほとんどの本は「わたしはXXをしたから成功した、だからあなたもXXすれば成功する」というロジックで書いてあるから。ここで「XXは成功に対して効果があった」ということをちゃんと示すためには、「他の条件を全く同じにしつつ」、比較対照群として「わたしはXXをしなかったら成功していなかった」ということも同時に示さなければいけない。個人でこれを立証するのは不可能だから、こういうロジックで書いてあることを鵜呑みにするのはどうかと思う。

これは巷に溢れるいわゆる「英語学習本」「英語教材」に対しても同じで、ほとんどが「私はこういうメソッドを使ってTOEIC 990点を取った、だからあなたもやればTOEIC 990点を取れる」というロジックで書いてある。こういう本の著者に限ってだいたい留学したりMBAを取ったり外資系に勤めたりしていて、英語力向上の背景にある他の要因、例えば自分の内発的な動機とか外部環境とかを一切無視していたりする。だいたいそういう状態におかれた人のモチベーションの高さというのはすさまじくて、そういう人は実際、その主張するメソッドを使わなくても英語力が向上してTOEIC 990点を取っていた可能性が高い。つまり言ってるのは「必要に迫られたのでとにかく必死に勉強したら英語力が上がったよ」ということでしかない。そりゃそうだろうね。

そういった意味で、この本外国語学習の科学ー第二言語習得論とは何か(白井恭弘著)には好感が持てる。外国語学習(Second Language Acquisition)論のまとめとしても使えるように、との筆者のねらいから、「外国語を学習するとはどういうことか、どういう要因がその成果に影響を及ぼすか」ということについて、あらゆる側面についての研究が紹介されている。根拠となる参考文献も全て示されているので、必要に応じてソースに当たれるし、主張の信憑性はいわゆる「英語学習本」よりもはるかに高いとおもう。トピックは、ばっと列挙するだけでも「第2言語学習における母語の影響はどのくらいか」「学習開始時の年齢要因・臨界期は存在するか」「文法事項はどういう順番で学習されるか」「アウトプットは必要か」「効果的な教授法はどのようなものか」などなど多岐に渡っていて、それだけでもとても質の高い「まとめ」になってる。

もちろん、「効果的な外国語学習法」を求めてこの本を読みたい人もいると思うのだけど、それだけを目当てに読むと、途中では研究や基本概念の紹介などが続くので「ようするにどうすればいいの?」としびれを切らすかもしれない。でも、最後にちゃんと「効果的な外国語学習法」という章があって、ここでは研究成果を踏まえながら学習法についてのまとめが書いてあるので、最悪、邪道だけどここだけ読んでもエッセンスが分かるかもしれない。とりあえず下に、この本に書かれている外国語学習についての主張を、自分のバイアス付きでまとめてみるので、簡単に知りたい人は参考にしてみてください(各項目の最後の段落が、自分の意見で、それ以外は著者の主張もしくは紹介です)。

始めるならなるべく早く

どうやら年齢要因はかなり強いらしいので、外国語学習を始めるなら早いに超したことはない。ただし、いわゆる「臨界期(この年齢を超すと外国語学習が著しく困難になる年齢)」の存在については研究者間でも意見が大きく分かれている、とのこと。

個人的には、「始めるならなるべく早く」ということには、機会損失を防げるというメリットが一番大きいと思う。逆に言うと、英語を1年間勉強するのが遅れたら、その1年間に「もし英語ができていたら享受していたかもしれない恩恵」を失うデメリットが大きい。個人的な経験だけど、一度身につけた英語力は、使い続けているうちは簡単には減らない。そして不思議なことに、英語ができる人ほど英語を使い続けるためのコストは小さいし、使い続けられる環境に恵まれる確率も高くなる。これはロケットの慣性に似ている。

大人になってからネイティブ並みの発音を身につけるのは著しく困難

これは多くの人の経験とも一致すると思う。でも個人的には、「ほぼネイティブレベル」ならそんなに難しくないと感じるし、ほとんどの人にとって「ほぼネイティブレベル」で十分。むしろ「イントネーションとかリズムの方が個々の音の発音よりも重要」というのが知見だそうだ。

外国語学習に対する「適性」というのは確かに存在する

アメリカでは、どうしても外国語が学習できないという「外国語学習障害」というのが認められつつあり、これに認められると大学の外国語の単位を免除されるらしい。残念ながらこういう人はある割合で存在するが、大切なのは、適性を多様に捉えて、自分の適性(分析が得意か記憶が得意か)に合った学習法を使うことだという。

性格が外向的なほど良い

いわゆる「非コミュ」は外国語学習に対しても不利だそうだ。ただし、内向性というのは、学業成績とは正の相関があるそうで、こっちのほうが個人的には興味深い内容だった。

学習対象言語を話す人や文化に興味を持つ

これを「総合的動機付け」と言い、「TOEICが必要」「就職に有利」といった「道具的動機付け」よりも重要であるそうな。

「アメリカかぶれ」みたいなのも結構重要ということか。

インプットはものすごく大切

外国語学習には、意味の理解できる文を大量にインプットすることが欠かせない。これに反対する研究者はいない。「聞いても20パーセントしかわからないような教材を聞くより、80パーセント以上分かる教材を何度も聞いたほうが効果があります」とのこと。

これはまぁ、最近ではほとんどの英語学習本にも書かれていることなので大丈夫かと。もちろん、学校の授業や英会話学校だけでは圧倒的に足りない。

「アウトプットの必要性」

アウトプットそのものが言語能力の向上につながった、という結果はあまり出ていないそうだ。「それまでまったく話さなかったのに、突然完璧な文で言葉を発し始めた子供」が居ることから、必ずしも実際にアウトプットする必要は無いようだ。ただ、こういう子供らも、その前には必ず頭の中で無意識的にしろリハーサルをしていると考えられるから、キーとなるのは「アウトプットの必要性」だそうだ。

実際、頭の中でリハーサルしているときの脳の活動をfMRIで調べると、実際に話しているときに近い活動が観察されるとのこと。これは、英語を話している時間が何倍にも増えたようなもの。

「英語学習にはアウトプットが大事!」というのが最近の潮流だと思うけど、必ずしもそうでないかもしれない。英語学習本によく書いてある「英語で日記をつけてみる」「英語で独りごとを言ってみる」というのも重要かもしれないけど、実際に口に出す必要はなくて、頭の中でリハーサルするだけでも同じ効果が得られるということ。

スピーキングのしすぎも問題

ブロークンな表現が身に付いてしまう可能性があるので、あくまで「インプット>アウトプット」で。バランスを大事に。

そういえば勝間和代氏が、著書の中で「勉強においてはインプットとアウトプットは半々にしろ」という主旨のことを述べているけど、これは外国語学習には必ずしも当てはまらないので、特に初心者のうちは気をつけたほうがいいと思う。

三単現の-sができないからといって落ち込まない

多くの研究によって、三単現の-sが実際に使いこなせるようになるのはかなり後のことだということが示されているとのこと。

これは自分にとっても目からうろこだった。確かにそうだよなぁ。今でこそ、この三単現の-sとか、疑問文とか否定文では動詞が原形、現在完了では過去分詞形、といったことについて、話してるときにもほどんど間違えなくなったけど、けっこう最近(具体的には、TOEICで 800点台まで)は話していてもしょっちゅう間違えていた。この文法規則を学習するのは中学生なのだけど、「自分はこんな簡単なこともできないのか」と自分を責める必要は無いようだ。

言語を使ってメッセージを伝える、ことに学習活動の重点を置く

つまり、英語「を」学ぶのではなく英語「で」学ぶ、ということ。自分の興味のある分野を読んだり聞いたりすると良い。

単語は文脈の中で覚える

大人になると、九九のようにひたすら暗記する能力が下がるので、文脈と結びつけたり、必要であれば語呂あわせをつかったりして単語を覚えるのは大切。

結局内容をまとめると、最も大事なのは「インプット理解とアウトプットの必要性」であって、これは巷に溢れる「英語学習本」に書いてあることの最大公約数的なアイデアなのには少し拍子抜けしてしまうかも。でも、巷に溢れる「英語学習本」を何十冊も買ってきてその最大公約数を取るよりは、この本を1冊買ってそのエッセンスを理解した方がはるかに安上がりなんじゃないかな。

add to hatena hatena.comment (8) add to del.icio.us (0) add to livedoor.clip (0) add to Yahoo!Bookmark (0) Total: 8
  • 0 Comments
  • Filed under: 英語, 一般
  • 昔、個人の翻訳アシスタントをやっていたことがあって、医学・歯学系の論文を翻訳(日英・英日両方)したり、まとめたり、特許翻訳したり、あと外国からの電話・メール対応などをやらせてもらっていた。最近でも、翻訳は主にボランティアベースでちょくちょくやるので、そのために整えたツール群があるのだけど、実はこのツール群、英語で論文書いたりメール書いたりする機会が異様に増えた今になってもけっこう役に立っている。

    辞書引き

    辞書を引くのは基本的に Jamming という辞書ツールを使ってる。対応してる辞書形式が幅広いので、英辞郎、Collins COBUILDLDOCE、WordNet、Roget’s Thesaurus、ステッドマン医学大辞典など、持ってる辞書を片っ端から登録してる。英辞郎とか、シソーラスとか、今だとたいがいオンラインで引けるけど、遅いし(Webアクセスのオーバーヘッドは速度が要求される翻訳にとって致命的)、そもそもオフラインで使えないのでアウト。

    この中でもオススメはCollins COBUILDに入ってるThesaurus(類義語辞書)。論文とか書いてて同じ言い回ししか浮かばない時や、自分の選んだ言葉にどうもしっくり来ない時に類義語で置き換えてやるとちょっと英文がカッコよくなる。例えば use → utilize, employ, make the most of, みたいな置き換えってけっこうみんな無意識のうちにやってるのでは。

    ちなみに最近、Emacsから直接辞書引きができるステキなツールを見つけたので、そのうち使ってみたい。詳細は以下:

    Emacsで快適な翻訳環境を
    http://ubulog.blogspot.com/2007/08/emacs.html

    論文の表現

    (注意! このくだりについて、論文で受動態を使うのは論文の作文スタイル的に良くないというご指摘をコメントにて頂きました。元々の趣旨は、「たまには受動態を使って文が単調になるのを避ける」というぐらいのものですが、事実と意見を分けるのが重要な論文では十分注意しないといけません・・・。ご指摘ありがとうございました。)

    余談だけど、論文を書く際に英文をカッコよくする一つのコツは、無理矢理にでも「人」を主語に使わないようにする、というテクニック。こうすると、モノが主語になって受動態を使わざるを得ないというのがその理由。例えば、”We analyzed the corpus XXX” という代わりに “The corpus XXX was analyzed” とするとちょっとカッコイイですよね。英語だとけっこう自然に書けてしまうから不思議。

    いつも自然言語処理とか、情報系の論文ばっかり読んでると表現とか偏ってしまうので、一度医学とかバイオ系の論文を読んでみることをオススメする。実験の節なんか、”(物質の名前) was prepared” “(物質の名前) was synthesized” とかばっかりで、冷徹なほど淡々としていて視野が広がること間違いなし。

    ちょっとのぞき見するのなら、例えばこの辺の論文はどうでしょう?この論文、全長2ナノの「NanoPutians」という人間の形に見える分子を合成します、っていうオチャメで怪しい、でもれっきとした論文。PDFの1ページ目から吹くこと間違い無しw

    Synthesis of Anthropomorphic Molecules: The NanoPutians
    http://pubs.acs.org/doi/pdf/10.1021/jo0349227

    例文検索

    ちゃんと翻訳したいなら、特に日→英の場合、例文検索が欠かせない。Googleとか検索エンジンで調べてもいいのだけど、「例文」としての適切さと、Web検索結果としての適切さって違うので、検索エンジンの結果上位が例文として使えるとは限らない。それよりは汎用のコーパスを用意してその上で全文検索したほうがいい。(ただしたつをさん作EReKはそれ用なので使える。)

    自分が使ってるのは英辞郎収録の「例辞郎」と、朝日出版のE-DIC。汎用の英語例文集ならこれだけでけっこういける。

    全文検索エンジン

    上の例文検索について、例辞郎は英辞郎のCD買うとテキストファイルで入ってくる(ただし最新の第4版にはPDIC用の専用形式しか入ってないので注意!)ので、あとはそれを全文検索してやるだけ。自分はスクリプト使ってファイル分割してから、全文検索エンジンHyper Estraierにインデックス化させて自分用WebにBasic認証かけて置いてる。

    E-DICも、一応検索ツールが付いてくるのだけど、なんとなく使い勝手とかが気に入らないので、


    EdicConv.rb - 『E-DIC』JIS X4081変換スクリプト(ruby版)

    を使って読めるHTMLに変換して、Hyper Estraierに登録。Hyper Estraierの検索は異様に速いので、オンラインアクセスするオーバーヘッドを入れてもE-DICの専用ツール使うよりこっちのほうが速いかもしれない。

    翻訳メモリ

    翻訳メモリソフトの類は一切使わない。ひたすらEmacsでゴリゴリと対訳を書く。Emacsだとdabbrevが使えるので、どんなに長い単語でも1回でも訳したことがあればすぐ補完できる。昔Tradosを体験版で使ったのだけど、なんだか性に合わなかったのでそれ以来使ってない。もっと使いこなせば変わるかもしれないけど、なんだか巷に出回ってる翻訳メモリエンジンって、なんとなく「いいもの使ってる感」が無い感じがするんだけどぁ。

    その代わり、自分の過去の翻訳を参照する可能性はどうしてもあるので、これまた過去に訳したファイル(対訳になってる)をひたすらHyper Estraierに登録。こうすると過去の翻訳と、上に書いた例文が串刺し検索できてハンパ無く便利。

    ということで、翻訳メモリを使わない点なんてとくに時代錯誤のローテクな翻訳環境でした。自然言語処理研究してる人なら自分用翻訳メモリソフトぐらい数時間あれば作れるものだと思うので、必要にかられたらちょっと作ってみたい。

    add to hatena hatena.comment (71) add to del.icio.us (0) add to livedoor.clip (1) add to Yahoo!Bookmark (1) Total: 73
  • 6 Comments
  • Filed under: 英語, 技術
  • Recent Comments