
外国の方に道を聞かれて、頭が真っ白になった経験はありませんか。わたしはあります。
その「会話の壁」がまた一段低くなりそうです。Googleが6月9日、Gemini 3.5を土台にした音声翻訳「Live Translate」を公式ブログで発表しました。スマホのGoogle翻訳アプリにはもう入っていて、Android・iOSの全ユーザーが使えるようになっています。
これまでの音声翻訳は、相手が一文話し終えるのを待って、それから訳を読み上げる方式がほとんどでした。一往復ごとに会話が止まるので、どうしても「翻訳機を挟んだやりとり」になってしまうんですね。
Live Translateは、聞きながら訳し始めます。continuous stream translation(連続ストリーム翻訳)という方式で、話の途中から訳出を進めていく。これ、人間の同時通訳の方々がやっていることと同じ進め方なんです。国際会議で同時通訳のイヤホンを着けると会話が流れたまま進む、あの感覚がスマホに降りてきた、と考えると近いと思います。
しかも訳された声は、元の話し手の声の高さや抑揚、話すテンポを保ったまま出てくるとのこと。誰の発言かが声で分かるのは、複数人の会話では地味に助かるやつです。言語は70超を自動で聞き分けます。
わたしが講師をしていた頃、外国にルーツのある子の保護者面談は、いつも通訳ボランティアさんの都合待ちでした。学校、病院の受付、自治体の窓口、観光地のお店。「言葉が通じないから諦める」場面は、日本の現場のあちこちにあります。
会議ツールのGoogle Meetにも入ります。こちらは今月から一部の法人向けにプレビューが始まる段階ですが、これまで5言語・英語経由だった音声翻訳が、70超の言語、2,000超の言語の組み合わせまで広がる計画とのこと。海外拠点とのやりとりがある職場の方にとっては、楽しみな話ですね。
気をつけたい点もあります。機械翻訳ですから、誤訳はゼロにはなりません。病院の問診や契約ごとのような、間違いが許されない場面で人の通訳に代わるものではない、という線引きは持っておきたいところです。Meetでの本格展開もこれから段階的に進む途中です。
それから、生成された音声にはSynthIDという耳には聞こえない透かしが埋め込まれます。AIが作った声だと後から確かめられる仕組みで、声の偽物が心配されるいま、こういう備えが最初から入っているのは安心材料だと思います。
完璧な通訳ではなく、「諦めていた会話を始められる道具」。そう捉えると、これはかなり多くの人の日常に効く更新です。次に道を聞かれたら、今度はポケットのスマホに頼ってみようと思います。
情報元: Fluid, natural voice translation with Gemini 3.5 Live Translate (Google公式ブログ)
※この記事の本文は生成AIが執筆しています。事実関係は公式一次情報で確認しています。