▲デイープラーニングという手法が、翻訳に利用できるということが分かって、例えばスマホで簡単に日 → 英 逆に 英 → 日 と翻訳できるようになりそうだ。
人口知能というものが、広範囲に影響を及ぼす最初のジャンルとなるかもしれない。
記事から抜粋してみよう。
総務省は人工知能(AI)による同時通訳システムを活用した企業の製品開発を後押しする。
同省所管の情報通信研究機構(NICT)が持つ同時通訳の基幹技術の民間開放を進め、初期投資を抑えて実用化に乗り出しやすくする。
製品化した各企業から蓄積データを集め、グーグルなど米IT(情報技術)大手企業も開発を急ぐAi通訳技術を官民で育てる狙いがある。
同時通訳システムの普及を促すことで、2020年の東京五輪・パラリンピックに向けて訪日外国人との「言葉の壁」をなくす。 NICTの翻訳技術は観光に重点を置いているのが特徴だ。
17年6月から深層学習(ディープラーニング)を活用して改善し、防災や買い物などの特定分野では9割前後の精度を誇る。グーグル翻訳よりも自然な表現になる。
すでに実用化したアプリ「ボイストラ」では31言語の文字の翻訳に対応し、英語や中国語など16言語では音声の出入力の両方ができる。
同時通訳は、話しているスピーチの文の切れ目などを自動で判断し、1つの文を話し終えてから数単語後には通訳を始める技術を開発済みだ。
画像認識を使って表情から適切な文字データに変える技術開発も進めている。
総務省はこうした技術を使った製品開発を企業に促す。
試作する製品端末との間で、通訳する音声データをやり取りする 「AIサーバー」を国が用意。
同サーバーにはNICTの通訳技術を搭載して企業が自由に使えるようにし、試作段階ではライセンス料も不要にする方針。
今後、制度の詳細を詰めて18年度にも実施する。
今は試作のために企業はサーバー構築やライセンス料などの初期投資に数百万円かかるケースがある。
総務省はこれらの費用やライセンス契約の手間がなくなれば、開発のハードルが下がるとみる。
富士通が医療現場向けのクリップ型の通訳端末を18年度中に実用化をめざすなど、徐々に出始めた製品開発の動きを加速させる。
NICTの基幹技術を開放することで、製品化のアイデアを持つ様々な企業が事業を展開できるようになる。
端末の形を名札型にするかイヤホン型にするかといった製品設計や、対応言語、一度に利用できる人数などで、企業が活用分野や場面などに合わせた様々な製品を開発することを想定する。
居酒屋などの席に備え付けるタッチパネル式の注文端末に同時通訳の技術を組み込むなど、既存端末と組み合わせる製品開発も普及のカギだ。
基幹技術を民間に広く開放するのは翻訳の精度向上にもつながるとの判断がある。
翻訳の精度を高めるには、深層学習を活用するのに加え、様々な翻訳データを学習することが不可欠。
企業から使用した専門用語の翻訳データなどを随時提供してもらい、より幅広い用途に対応するとともに、翻訳できる言語も増やせるようになる。
深層学習を使った多言語翻訳の開発は、米グーグルや米マイクロソフトなど海外企業も力を入れている。こうした企業では育成・蓄積した技術は外部と共有しないのが一般的だが、データの蓄稽で出遅れる日本は官民がオープンな形で開発を進めて追撃を狙う。
NICTは技術向上の研究や実用化をめぐって、富士通や日立製作所をはじめ日本の約180の企業や研究機関と連携。昨年9月からは実際の翻訳事例を企業などから提供してもらう「翻訳バンク」も始めた。
▲補足、感想など
かなりのスピード感を感ずる。
細かいことは分からないが、2,020年のオリンピックの時点が、一つのハードルを超えた時点くらいかな。
こういうブログを日 → 英 に翻訳して、英語で表記するということも、意外に早くくるのかもしれないな。