AI活用事例 読了 6 分

「話した瞬間に翻訳音声が流れる」——Google Gemini 3.5 Live Translateで音声翻訳がリアルタイムになった

shiritomo | AI・SNS・話題のテック情報メディア by Hashout編集部 @shiritomoAI_jp 2026年6月10日 更新
「話した瞬間に翻訳音声が流れる」——Google Gemini 3.5 Live Translateで音声翻訳がリアルタイムになった

「Google翻訳って、もっとスムーズにならないかな」と感じたことはありませんか?

画面に文字を打ち込んで翻訳を確認し、また相手の言葉をテキストに変換して——会話のたびにそのやり取りが挟まると、せっかくの対話の流れが途切れてしまいます。
そんなもどかしさが「20年ぶりの大進化」で変わろうとしています。

2026年6月9日、Googleが「Gemini 3.5 Live Translate」と呼ばれる新しいAI音声モデルを発表しました。
話し手が言葉を発した瞬間、数秒遅れで自然な翻訳音声が流れる——アニメで描かれてきた「翻訳こんにゃく」のような世界が、現実に近づいてきました。

気になって詳しく調べてみたので、その中身をお伝えします。

「途切れない」翻訳が生まれた理由

これまでの音声翻訳ツールのほとんどは「ターンバイターン方式(turn-by-turn)」と呼ばれる仕組みで動いていました。
話者が文章を言い終わるのを待ち、そこで初めて翻訳を始める方式です。

会話の間に「…(沈黙)…翻訳中…」という間が生まれるため、テンポの良い対話には向きませんでした。

Gemini 3.5 Live Translateはここを根本から変えました。
ストリーミング方式」を採用し、話者が話しながらリアルタイムで翻訳音声を生成し続けます。
話し手の次の言葉を聞きながら翻訳を出力するため、会話の流れを止めずに翻訳が続くのです。

Googleは公式ブログで「no awkward pauses or choppy output」と表現しています。
ぎこちない間や途切れ途切れの出力がない、という意味です。

70以上の言語に対応、ピッチまで保持する

今回発表された機能の詳細をまとめると、注目すべき点が3つあります。

1. 70以上の言語を自動検出

対応言語は70以上で、多言語が混ざる会話でも自動で言語を検出します。
たとえば1つの会話の中で日本語・英語・中国語が入り混じっても、設定を変えることなくスムーズに翻訳できます。
ビジネスの国際会議や旅行での多人数会話に特に役立ちそうです。

2. 話し手の声のトーンまで再現

単に言葉を翻訳するだけでなく、話し手の「イントネーション・ペース・ピッチ」を保持した翻訳音声を生成します。
早口で話した原語は早口で翻訳され、穏やかなトーンで語りかけた言葉は穏やかに翻訳される、というイメージです。

3. 騒音下でも安定して動作

ノイズが多い環境でも精度が落ちにくい設計になっており、騒がしいカフェや展示会場などの実用的なシーンでも使えるよう設計されているとのことです。

GoogleのAI公式アカウントは発表時にこう述べました。
英語での発表になりますが、「70以上の言語を話し始めた瞬間から翻訳を開始し、次の言葉を聞きながら翻訳をストリーミングする」という内容です。

この投稿は発表直後から多くの開発者の間で話題になりました。

Google MeetやGoogle翻訳アプリで使える

「どこで使えるのか?」が一番気になるところでしょう。
現時点での展開状況は以下の通りです。

Google翻訳アプリ(Android/iOS): 今すぐ誰でも利用可能です。
すでに世界中でロールアウトが始まっています。

開発者向け: Gemini Live APIおよびGoogle AI Studioでパブリックプレビューとして公開済みです。
アプリに組み込みたい開発者はすぐに試せます。

Google Meet(企業向け): 2026年6月から企業アカウント向けのプライベートプレビューが開始されています。
これまでGoogle Meetの音声翻訳は5言語のみ対応でしたが、今回の導入で70言語以上に一気に拡大します。

Googleの公式アカウントもこの展開を次のようにまとめています。
「Google Translateで誰でも・開発者はGemini APIで・企業はGoogle Meetで使える」という3段構えの提供です。

実際の「商談・旅行・国際コミュニケーション」はどう変わるか

summaryの中に「日本ユーザーからは『海外商談が変わる』という声が上がっている」とあります。
今まで通訳を介していたビジネス会議が、AIの音声翻訳でより自然に進行できるようになるとすれば、その意味は小さくありません。

通訳のコスト削減・即時コミュニケーションの実現という観点で、特に中小企業や個人の海外展開において実用的な変化が期待されます。

一方で、まだ「プレビュー段階」のサービスもあります。
Google Meetの企業向け機能は今月からプライベートプレビューが始まったばかりで、一般向けの全面公開にはもう少し時間がかかりそうです。
また、感情の機微や文化的なニュアンスを翻訳しきれるかどうかは、実際に使ってみないとわからない部分も残っています。

翻訳の正確性・自然さをどこまで担保できるかは、今後の実証と改善にかかっているでしょう。

さらに深掘りしたい方へ

まとめ

Googleが発表したGemini 3.5 Live Translateは、「話し終わるのを待ってから翻訳する」という従来の限界を超え、会話しながらリアルタイムで翻訳音声を流す新しい体験を提供します。
Google翻訳アプリでは今すぐ誰でも試せる状態で、70以上の言語・ピッチ保持・ノイズ耐性という三拍子が揃っています。
音声翻訳がここまで来たか、と感じさせる一歩です。