Webコンテンツを世界に解き放つニューラル機械翻訳
(この記事は、2022年3月28日に公開された記事「Neural machine translation is unlocking website content and connecting the world」の日本語訳です。)
ニューラル機械翻訳という単語に「機械」が含まれる事実からも、コンピューターが機械として認知され、またその大きさがスプリンター(訳注:トヨタの車)のバンと同じサイズだった当時から、その技術が非常に長い時間をかけて進化を続けてきたことがわかります。
コンピュータの能力を活かし人間の発話を翻訳するという目標は昔からありましたが、最近まで達成することはありませんでした。
そして今、ニューラル機械翻訳(NMT:Neural Machine Translation)のおかげで、夢は実現に近づきつつあります。
2007年に私は、技術者が翻訳業界を崩壊させるだろうと書きました:
言語学者が翻訳において「芸術」に重きを置くのに対し、技術者は「科学」に重点を置いています。それこそは、機械翻訳が統計的機械翻訳(SMT:Statistical Machine Translation)として生まれ変わりつつある理由です。SMTは、機械翻訳のパイオニアたちが40年前に想像もしなかったような、力任せのコンピューティングパワーを翻訳にもたらします。
そして、崩壊が始まりました。第一に、世界で最も人気のある翻訳エンジンであり続けるGoogle 翻訳があります。
Google 翻訳は現在、100以上の言語を扱えます。選択する言語の組み合わせによって翻訳品質が大きく異なるのは事実です。しかし、よく用いられる組み合わせであれば、過去10年で品質は劇的に向上しています。
そしてGoogle 翻訳は、一般的な製品です。機械翻訳エンジンをあなたの業界なり製品構成、知識に合わせ最適化したらどうなるか、想像してみてください。翻訳品質は大いに向上するはずですし、実際それを実行に移した人たちはいます。Microsoftは、膨大な知見を含む記事を、人間による後編集なしに機械翻訳で読めるようにした開拓者でした。
2022年版Webグローバリゼーション・レポートカードでは、機械翻訳をユーザーの手に委ねることで、オンデマンドでコンテンツの翻訳を可能にした、数多くのWebサイトを取り上げています。
例えばAirbnbのサイトでは、デフォルトで機械翻訳が有効になっています:
Reinhard Rapp氏の書いた記事では、NMTについての素晴らしいまとめと、独自に機械翻訳エンジンを立ち上げる方法(私はまだ試したことがありません)が書かれています。独自の翻訳エンジンを立ち上げる単純な理由とは、翻訳を必要とする言語がまだまだたくさんあることです。
彼は、次のように記しています:
Google 翻訳、Microsoft Bing Translator、DeepLなどの優れた商用の翻訳システムに対し、それらが特化した分野、つまり一般言語の翻訳で対抗するのは、ほとんど不可能であることは指摘しておくべきでしょう。こうした企業は、翻訳に関して基礎技術だけでなくWeb検索にもかなり投資をしてきた結果、人気のある言語の組み合わせの膨大な学習データを自由に利用できるからです。しかし、人気のない言語の組み合わせについてはそうではなく、多くは大手企業によってさえカバーされていません。その場合、独自にシステムを開発する以外に選択肢はないかもしれません。
発話のリアルタイム翻訳について触れましょう。この分野では、あまりに多くの物事が進行中であり、そのすべてについて紹介することはできませんが、おそらくMicrosoftやGoogleのモバイルアプリをご存じのことでしょう。Microsoftの提供する、ツアーガイドの言葉を翻訳するアプリの例を以下に紹介します。
機械翻訳が開発され始めて40年以上になりますが、いろいろな意味でまだ始まったばかりです。翻訳、通訳、トランスクリプション、字幕など、機械翻訳はグローバルな商取引やコミュニケーションを支える多言語「スタック」の重要なレイヤーとなりつつあります。
大変興味深い時代を迎えていると言えるでしょう。
Webサイトでの機械翻訳の利用状況について詳しくは、2022年版Webグローバリゼーション・レポートカードをご覧ください。