オープンAIはChatGPTの新モデル「GPT−4o」を発表し、翌日、グーグルも文章で動画を生成するAIの「Veo」を発表した。GPT−4oによる画像生成の例を紹介。従来のAIは、人間が文書を打ち込み、AIが持つ脳が解析し、文書で返事をする。しかし今回は脳の加えて、目と口、感情を手に入れることが出来たという。従来のChatGPTでも出来たが返答までに3~5秒かかっていた。スタジオで実演。今回発表した「GPT−4o」では人間味あふれたお喋りをするかと思えば、歌を歌うことも。0.3秒で回答して、話に抑揚があり、声のトーンを聞き取って気分に合わせた返事をする。今回発表されたGPT−4oは約2週間後にサービスが開始される。おやじギャグに笑ったり、驚いたリアクション、ツッコミを入れるようなコミュニケーションもすることができる。
文章から画像を生成する様子をスタジオで実演。画像を貼り付けてこの問題を解いてと入れると、問題を整理して解き方を教えてくれる。カメラ機能を利用すると、じゃんけんの勝敗をジャッジしたり、目の前の状況を詳しく描写したりすることもできる。目の不自由な人が出かけた先でスマホをかざすと、目の前の状況を説明したり、タクシーを捕まえたい時などリアルタイムで応答するので視覚障害者へのサポートとして期待が寄せられている。次はGoogleの最新AIを紹介。
文章から画像を生成する様子をスタジオで実演。画像を貼り付けてこの問題を解いてと入れると、問題を整理して解き方を教えてくれる。カメラ機能を利用すると、じゃんけんの勝敗をジャッジしたり、目の前の状況を詳しく描写したりすることもできる。目の不自由な人が出かけた先でスマホをかざすと、目の前の状況を説明したり、タクシーを捕まえたい時などリアルタイムで応答するので視覚障害者へのサポートとして期待が寄せられている。次はGoogleの最新AIを紹介。