新しいクラウドベースの機械翻訳プラットフォームに関するSYSTRAN社との一問一答
(この記事は、2016年5月31日に公開された記事「Q&A with SYSTRAN about its new cloud-based machine translation platform」の日本語訳です。)
未来の話であるかのように思われていた機械翻訳が、Google翻訳によって大衆化されて10年あまりが経ちました。
しかし企業の多くは、自身のサイトにあるコンテンツの翻訳を推進するにあたり、短期的にはGoogle翻訳を使わないでしょう。翻訳エンジンの一層のカスタマイズや、既存の翻訳メモリの活用、そのほかGoogleがまだ提供していない機能を、企業は必要としています。結果としてMicrosoftやSDL、そして機械翻訳のパイオニアとして長年の実績を持つSYSTRANといったベンダーが、頼られることとなります。
SYSTRANは、2014年に韓国の企業によって買収され、SYSTRAN.ioと呼ばれるオンラインの機械翻訳プラットフォームを今年初めに立ち上げました。このプラットフォームにおいて企業は、機械翻訳(とその他のサービス)をAPIを介して利用することができます。言い換えるなら、高価なエンタープライズ向けライセンスを購入したり、ソフトウェアを自前で運用する必要はありません。単に、SYSTRANのエンジンに接続すれば良いのです。そして、これが最も素晴らしい点なのですが、誰でも無料で1ヶ月あたり100万字まで利用することができます。
詳しくは、同社と最近行った以下の一問一答をお読みください。
SYSTRAN.ioの利点、解決してくれることは何ですか?
ソフトウェア開発者や顧客体験(CX)関連企業、多国籍なマーケティング部門、ソーシャルメディアやマーケティング技術を扱う企業、そしてオンラインゲームの開発者に対し、かつては一部の巨大な国際的企業でしか利用できなかったものと同程度の、多言語アプリケーション開発用ソフトウェアへのアクセスを可能にします。
何組の言語ペアをサポートしていますか?
特定のモジュールにも依りますが、最大50言語をサポートしています。
(これまでのところ)SYSTRAN.ioで最も人気のある用途は何ですか?
ユーザークエリの量という点で言えば、これまでのところ最も人気のある用途は、モバイルデバイス向けの翻訳です。
作られたソリューションの数で言えば、サポートフォーラムの翻訳に人気があります。顧客をサポートする必要のある、ソフトウェアをサービスとして提供する企業では、FAQのデータベースにある膨大な量の文書を翻訳することができるからです。これは、着信する電話の数(顧客サポートに必要とされるで最も高価な運用コスト)を削減し、必要とする答えをより早く見つけられるようにすることで、顧客満足度を高めます。
SYSTRAN.ioにおいて、消費者生成コンテンツにおける「感情分析」は、どのように提供しているのですか?
ユーザー体験の一環として利用可能なメディア(ソーシャルメディア、レビューサイト、ブログ、サポートフォーラム)の数は、日々増加しています。それらのメディアから横断的に、構造化されていないコメントを多言語で、企業は受け取ることになります。それらのコンテンツの中から、SYSTRAN.ioのモジュールを利用する開発者は何語で書かれていようとも、肯定的であれ否定的であれ、コメントを取り出せるようにします。そしてコメントを分類のうえ、コメントの書き手が使う言語で返信を生成するのです。5万あるコメントのうち、2万が否定的で、特に500のコメントが極めて否定的かつ破滅的なものであったと想像してみてください。それらは、優先的に対処すべきものです。
例えばオリンピックが近づいていますが、ある企業の後援しているスポーツ選手が大きなレースの前夜、ドラッグを使ったか妻を騙したかで捕まったとしましょう。ソーシャルメディア上で、これはすぐ拡散します。しかし、それに対する言及がさまざまな言語で書かれているが故に、何が起こっているか分からないとすれば、一体どう対処すれば良いでしょうか。あるいは、全く別のたとえ話として、あるスポーツ選手が履いている靴や着ているウェアをどこで手に入れられるか、多くのファンが知りたがっていて、彼らがTwitterで質問しているとします。今や多くのeコマースサイトなりマーケティング企業が、多言語に対応してツイートに「聞き耳を立てて」おり、オンライン販売をしています。SYSTRAN.ioを使えば、多言語に対応した自動応答のためのアプリケーションを、開発者が容易に作ることができます。
より詳しくはhttps://platform.systran.netをご覧ください。
「匿名化」という機能について説明してください。
セーフハーバー協定のような法律に基づき、法律事務所や金融系出版社、その他の多くの多国籍企業では、海外の支店や支社に送る情報から氏名や住所、社会保障番号といった「個人情報」の削除が求められます。このシナリオにおいて、企業は膨大なデータセットの中から個人情報を削除するか「匿名化」をする必要があります。個人情報と異なるパケットないしコードを送ることで、同僚は安心してデータを受信しアセンブルすることができます。
SYSTRAN.ioは、SYSTRANのエンタープライズ向けプラットフォームとどう違うのですか?
SYSTRAN.ioは、SYSTRANのエンタープライズ向け製品と同じ言語翻訳およびNLP技術に基づいています。SymantecやCisco、Airbus、Ford、Toyota、BNP Paribas、Daimler、Barclays、米国インテリジェンス・コミュニティーのような防衛・セキュリティ関連組織、NATO、国際刑事警察機構、さまざまな言語サービスのプロバイダーが、私たちのエンタープライズ向け製品を利用しています。堅牢性の点で両者は遜色ありませんが、SYSTRAN.ioに実装済み以上のセキュリティを求めるならば、それは開発者次第ということになります。一方、エンタープライズ向けのサーバーは、組織内にあるファイアーウォールの裏側にインストール可能であることからもお分かりのように、より高いセキュリティを提供します。加えてエンタープライズ向けのサーバーは、130組の言語ペアを提供します。
SYSTRAN.ioは、競合が提供する既存のWebサービスに対し、どのように対抗するのでしょう?
多言語開発のためのAPIを開発者に対し無料で提供する、純粋に言語技術に特化した企業を他に知らないのですが、ご存知ですか? 技術系企業が、言語翻訳の分野へ参入しようとするのをこれまで見てきましたが、しかし彼らは成功を見込める翻訳を実現するに足るコンテンツを持っていません。言語翻訳技術について語るのは簡単ですが、実現するのは極めて難しいでしょう。
SYSTRANは、ほぼ半世紀にわたって100パーセント、言語翻訳技術にフォーカスしてきました。そして今、私たちはその数十年にわたる言語翻訳のコンテンツを、開発者にオープンにしました。そのデータベースは、言語や知識の専門家達が貢献してきたものであり、彼らは無数の翻訳から学習と最適化をコンパイルしてきました。その翻訳のうち最古のものは、冷戦の最中の1968年、私たちの最初の顧客である米国空軍からもたらされたものです。私たちの翻訳データベースは、ディープかつ堅牢です。
SYSTRAN.ioは無料で1ヶ月あたり100万字まで利用できると私は理解していますが、これは正しい理解ですか?いつまでその無料提供は続くのでしょう?
はい、それは正しい理解です。サインアップすれば、1ヶ月あたり100万字まで無料で利用(プラス、その他のAPIの無料レベルも利用)できます。私たちは、私たちのツールを皆さんに積極的に使っていただきたいと願う一方、開発ステージにおいて皆さんをコスト面で苦しめたくないとも考えているのです。期限は目下、定めていません。