AIアナウンサーが51万回再生——「噛まないし24時間働ける」は本当か?
ゴールデンウィーク中のX(旧Twitter)に、ちょっと不思議な動画が流れてきました。
リアルな女性アバターが交通情報を読み上げる55秒の映像です。
声はなめらかで、表情も自然。
「誰かの配信?」と思ってよく見ると、それはAIが生成した映像でした。
投稿から1日で51万回以上の再生を集め、「人間アナウンサーの仕事はどうなるのか」という議論を呼んでいます。
どうやって作ったのか
この動画を投稿したのは、AI動画制作者のGENEL(ジェネル)氏です。
2026年5月3日に投稿したこの映像は、以下のツールを組み合わせて作られています。
- ChatGPT Images 2.0でリアルな女性アバターを生成
- ElevenLabs(イレブンラブス:AI音声生成サービス)で音声を合成
- HeyGen(ヘイジェン:リップシンク動画生成サービス)でアバターの口の動きを音声に合わせる
ChatGPT Images 2.0が2026年4月に公開されてから、AIが生成する人物画像のリアリティは一段と向上しました。
テキスト描画の精度が上がり、「AIっぽい不自然さ」が大きく減っています。

この3つのツールを組み合わせると、交通情報を流暢に読み上げるAIニュースキャスターが完成する——そんな時代になっているわけです。
「噛まないし24時間働ける」への反応
この動画に対して、著名人からも反応がありました。
元テレビキャスターの長谷川豊氏は「噛まないし24時間働けるし、これが進化すれば…」とユーモアを交えながら好意的に言及。
元NHKアナウンサーの国山ハセン氏も似たトーンで反応し、「AIがここまで来たか」という感覚を率直に発信しました。
NHKがすでに気象情報などでAI音声を活用していることを引き合いに出す声もあり、「これは遠い未来の話ではない」という見方が広がっています。
一方で慎重な意見もあります。
島田洋一氏(福井県立大学名誉教授)は国会議員を例に出しながら、「中身のない発言者ならAIで十分だが、本当に伝えるべき内容がある現場では人間の強みが際立つ」というニュアンスで疑問を呈しました。
「災害時の速報では、緊張と誠実さが伝わる人間の顔が必要だ」という声もあります。
確かに、情報の正確さだけでなく「信頼を伝える」という機能は、まだ人間アナウンサーに求められているのかもしれません。

「制作コスト・時間」のインパクト
今回話題になった動画が示しているのは、技術の進歩だけではありません。
より重要なのは、3つの一般公開サービスを組み合わせるだけで作れるという点です。
高価な撮影スタジオも、プロのアナウンサーも、スタッフも必要ない。
ChatGPT・ElevenLabs・HeyGenへのサブスクリプションがあれば、個人でも同じクオリティの映像が作れます。
これは「AIがアナウンサーを置き換える」よりも先に、「コンテンツ制作のハードルが劇的に下がる」という意味で影響が大きいかもしれません。
ローカルニュース・企業の広報動画・学習コンテンツなど、「映像の中の人」が必要だった場面でAIアバターが選択肢になってくるとすれば、メディア産業の外側でも変化が起きていきます。
NHKはすでにAI音声を使っている
「これが本当にAIのアナウンサーが使われる未来なのか?」という問いに対して、実は現実はすでにそこまで来ています。
NHKは気象情報や速報などの一部でAI音声を活用しており、視聴者もそれに慣れてきています。
民放でも、テロップ読み上げや簡易ナレーションへのAI活用が広がっています。
今回のGENEL氏の動画が話題を呼んだのは、「AIがここまでリアルになった」という驚きだけでなく、「これを個人が一人で作れるようになった」という事実でもあります。
AIアバター・AI音声・AI口パクを組み合わせる技術は、もはや放送局だけのものではありません。
さらに深掘りしたい方へ
- ChatGPT Images 2.0公式発表(OpenAI)
- GENELのAI動画制作解説(note)
- ElevenLabs公式サイト:AI音声合成の現状
- HeyGen公式サイト:AIリップシンク動画の技術
まとめ
AIアナウンサー動画が51万回再生された背景には、技術の進化と制作コストの劇的な低下があります。
「人間にしかできないこと」の定義が問われる時代に入りました。
「噛まない24時間AIアナ」が本当の脅威なのか、それとも人間の強みを際立たせる鏡なのか——答えはまだ出ていません。