グーグルは文章に加えて、音声や動画などにも対応した新たな対話型AI「Gemini 1.5 Pro」を発表した。競合他社のAIに比べてより多くの情報量を処理することが可能になったという。今回、グーグルが強く打ち出したのが、これまで単語ごとに区切っていた検索を複雑な長文をそのまま打ち込めるようになるほか、電化製品の不具合の原因をスマホで撮影した動画と音声でAIに尋ねることも可能になるという。一方、文書や音声、動画など、あらゆる情報を駆使したAIとの対話はライバルも性能を向上させている。グーグルの発表の前日には生成AIの分野で先行するChatGPTの開発元、オープンAIが最新のAI「GPT−4o」を発表。音声対話の速度を人間と同等に高めた。これに対抗するようにグーグルも今回、音声や動画によるAIアシスタントの新たなプロジェクトを発表した。