昔、個人の翻訳アシスタントをやっていたことがあって、医学・歯学系の論文を翻訳(日英・英日両方)したり、まとめたり、特許翻訳したり、あと外国からの電話・メール対応などをやらせてもらっていた。最近でも、翻訳は主にボランティアベースでちょくちょくやるので、そのために整えたツール群があるのだけど、実はこのツール群、英語で論文書いたりメール書いたりする機会が異様に増えた今になってもけっこう役に立っている。
辞書引き
辞書を引くのは基本的に Jamming という辞書ツールを使ってる。対応してる辞書形式が幅広いので、英辞郎、Collins COBUILD、LDOCE、WordNet、Roget’s Thesaurus、ステッドマン医学大辞典など、持ってる辞書を片っ端から登録してる。英辞郎とか、シソーラスとか、今だとたいがいオンラインで引けるけど、遅いし(Webアクセスのオーバーヘッドは速度が要求される翻訳にとって致命的)、そもそもオフラインで使えないのでアウト。
この中でもオススメはCollins COBUILDに入ってるThesaurus(類義語辞書)。論文とか書いてて同じ言い回ししか浮かばない時や、自分の選んだ言葉にどうもしっくり来ない時に類義語で置き換えてやるとちょっと英文がカッコよくなる。例えば use → utilize, employ, make the most of, みたいな置き換えってけっこうみんな無意識のうちにやってるのでは。
ちなみに最近、Emacsから直接辞書引きができるステキなツールを見つけたので、そのうち使ってみたい。詳細は以下:
http://ubulog.blogspot.com/2007/08/emacs.html
論文の表現
(注意! このくだりについて、論文で受動態を使うのは論文の作文スタイル的に良くないというご指摘をコメントにて頂きました。元々の趣旨は、「たまには受動態を使って文が単調になるのを避ける」というぐらいのものですが、事実と意見を分けるのが重要な論文では十分注意しないといけません・・・。ご指摘ありがとうございました。)
余談だけど、論文を書く際に英文をカッコよくする一つのコツは、無理矢理にでも「人」を主語に使わないようにする、というテクニック。こうすると、モノが主語になって受動態を使わざるを得ないというのがその理由。例えば、”We analyzed the corpus XXX” という代わりに “The corpus XXX was analyzed” とするとちょっとカッコイイですよね。英語だとけっこう自然に書けてしまうから不思議。
いつも自然言語処理とか、情報系の論文ばっかり読んでると表現とか偏ってしまうので、一度医学とかバイオ系の論文を読んでみることをオススメする。実験の節なんか、”(物質の名前) was prepared” “(物質の名前) was synthesized” とかばっかりで、冷徹なほど淡々としていて視野が広がること間違いなし。
ちょっとのぞき見するのなら、例えばこの辺の論文はどうでしょう?この論文、全長2ナノの「NanoPutians」という人間の形に見える分子を合成します、っていうオチャメで怪しい、でもれっきとした論文。PDFの1ページ目から吹くこと間違い無しw
Synthesis of Anthropomorphic Molecules: The NanoPutians
http://pubs.acs.org/doi/pdf/10.1021/jo0349227
例文検索
ちゃんと翻訳したいなら、特に日→英の場合、例文検索が欠かせない。Googleとか検索エンジンで調べてもいいのだけど、「例文」としての適切さと、Web検索結果としての適切さって違うので、検索エンジンの結果上位が例文として使えるとは限らない。それよりは汎用のコーパスを用意してその上で全文検索したほうがいい。(ただしたつをさん作EReKはそれ用なので使える。)
自分が使ってるのは英辞郎収録の「例辞郎」と、朝日出版のE-DIC。汎用の英語例文集ならこれだけでけっこういける。
全文検索エンジン
上の例文検索について、例辞郎は英辞郎のCD買うとテキストファイルで入ってくる(ただし最新の第4版にはPDIC用の専用形式しか入ってないので注意!)ので、あとはそれを全文検索してやるだけ。自分はスクリプト使ってファイル分割してから、全文検索エンジンHyper Estraierにインデックス化させて自分用WebにBasic認証かけて置いてる。
E-DICも、一応検索ツールが付いてくるのだけど、なんとなく使い勝手とかが気に入らないので、
EdicConv.rb – 『E-DIC』JIS X4081変換スクリプト(ruby版)
を使って読めるHTMLに変換して、Hyper Estraierに登録。Hyper Estraierの検索は異様に速いので、オンラインアクセスするオーバーヘッドを入れてもE-DICの専用ツール使うよりこっちのほうが速いかもしれない。
翻訳メモリ
翻訳メモリソフトの類は一切使わない。ひたすらEmacsでゴリゴリと対訳を書く。Emacsだとdabbrevが使えるので、どんなに長い単語でも1回でも訳したことがあればすぐ補完できる。昔Tradosを体験版で使ったのだけど、なんだか性に合わなかったのでそれ以来使ってない。もっと使いこなせば変わるかもしれないけど、なんだか巷に出回ってる翻訳メモリエンジンって、なんとなく「いいもの使ってる感」が無い感じがするんだけどぁ。
その代わり、自分の過去の翻訳を参照する可能性はどうしてもあるので、これまた過去に訳したファイル(対訳になってる)をひたすらHyper Estraierに登録。こうすると過去の翻訳と、上に書いた例文が串刺し検索できてハンパ無く便利。
ということで、翻訳メモリを使わない点なんてとくに時代錯誤のローテクな翻訳環境でした。自然言語処理研究してる人なら自分用翻訳メモリソフトぐらい数時間あれば作れるものだと思うので、必要にかられたらちょっと作ってみたい。





はじめまして。同じ分野で学生をしているので、いつもブログ楽しみにしています。
私も翻訳のバイトをしていたことがありますが、今はJammingなんて便利なソフトがあるんですね。
ところで、論文の表現のところなんですが、実は英語のリサーチペーパーを書く上では人を主語にして能動態で書くのは鉄則になっています。これは論文用の作文トレーニングを受けないと気づかないですし、日本語では主語をあまり出してこないので日本人にとって陥りやすいのかもしれません。私もよくやってしまいネイティブに直されます。理由は仮に主語がわかりきっていたとしても、受身では表現があいまいで弱くなるからです。
詳しくはElement of Styleという本や、マイクロソフトリサーチのSimon Peyton Jones博士が書いたHow to write a great research paperという資料(以下URL参照)の44ページのUse the active voiceというスライドがご参考になると思います。
http://research.microsoft.com/~simonpj/papers/giving-a-talk/writing-a-paper-slides.pdf
We ~ の下りは、おかしいな?と思ったら、shimaさんが言及していてくれますね。active voiceを使うように、というのは、論文誌側がguidelineとして指示することもあります。
> shimaさん
はじめまして。shimaさんのブログはたびたび見させてもらってます。よろしくお願いします。
> ところで、論文の表現のところなんですが、実は英語のリサーチペーパーを書く上では人を主語にして能動態で書くのは鉄則になっています。これは論文用の作文トレーニングを受けないと気づかないですし、日本語では主語をあまり出してこないので日本人にとって陥りやすいのかもしれません。私もよくやってしまいネイティブに直されます。理由は仮に主語がわかりきっていたとしても、受身では表現があいまいで弱くなるからです。
確かに、自分は(特に英語の)テクニカル作文のトレーニングを受けたことが無いのでここは盲点でした。受動態ってついついカッコ良いので単調になるのを避けるのに使ってしまいがちですが、動作主が曖昧になって論文では致命的ですね。客観性 >>> カッコ良さ。
Elements of Styleはずっと昔に少し読んだのですが、これを機に作文技術の復習でもしてみようかという気になりました。紹介いただいたスライドも簡潔で良さそうですのでまた読んでみます。
ご指摘ありがとうございました。
> れおさん
なるほど、論文誌側に提示されることもあるんですね。ずっと国際会議と和文雑誌だったのでこの辺は無頓着になりがちです。ありがとうございます。
mattonさんおひさしぶりです。同研究科M研究室のsugiです。
毎回楽しみに拝見させていただいております。いつもmattonさんのパワフルさに驚かされます。
自分の場合も参考になればと思って書いてみます。
辞書引きは、オンライン英辞郎をよく使っています。
オンライン英辞郎は広告表示のレスポンスが遅いので、外部のjavascriptを遮断してこっそり使っています。
あと、Web上で英語の調べものをするときは、Greasemonkeyを使ってポップアップ表示しています。単語を選択するだけで訳が表示されるのでかなり便利です(これもこっそり)。
オフライン辞書の場合、DDWinを使ってEPWING辞書を串検索しています(英辞郎+WordNet+新英和辞典+日本語語彙体系+…)。
英辞郎はPDICだと前方一致しか検索できないので、
EBStudioという変換ソフトを使ってEPWING形式にしています。オンライン英辞郎と同等の機能ができる、クロス検索がかなり気に入っていて、各単語の前方一致による検索が可能になります。(例えば、「ma system」(make/made system))。
あと例文検索は、ACL Anthologyでググっています。
言語処理系の1万以上の論文PDFから用例をチェックでき、しかも、googleキャッシュ(View as HTML)からハイライト付きで文脈を確認できるのでかなり重宝します。
おお、sugi(ki)くん久しぶりです。力作コメントありがとう!
> オンライン英辞郎は広告表示のレスポンスが遅いので、外部のjavascriptを遮断してこっそり使っています。
なるほど、そうすればオフラインで辞書引きするのとあまり変わらないかも。それでも僕はずっとオフライン派ですが・・・。一覧性が良いからかな。
> EBStudioという変換ソフトを使ってEPWING形式にしています。オンライン英辞郎と同等の機能ができる、クロス検索がかなり気に入っていて、各単語の前方一致による検索が可能になります。(例えば、「ma system」(make/made system))。
自分もEBStudioを使って英辞郎を変換してたんだけど、フリー版だとたしか前方一致しかインデックスを作ってくれないとか何とかの話があったね。これはちょっと調べてみます。
> あと例文検索は、ACL Anthologyでググっています。
> 言語処理系の1万以上の論文PDFから用例をチェックでき、しかも、googleキャッシュ(View as HTML)からハイライト付きで文脈を確認できるのでかなり重宝します。
なるほど、その手があったかー。よくMedlineみたいに自分の分野の論文に特化したコーパスがあったら便利だなぁと思っていたのだけど、これで解決するなぁ。もちろん、「著者が日本人では無いこと」のチェックは必ずしましょう
Pingback: Jun Araki’s Blog » Emacs で翻訳環境を整える