OpenAI推出ChatGPT4o谷歌展示新的AI摄像头功能

导读 Google 将于今晚 10:30 举办年度活动 Google I/O。预计该活动将包含一些与人工智能相关的令人兴奋的公告。在活动之前,该公司展示了一...

Google 将于今晚 10:30 举办年度活动 Google I/O。预计该活动将包含一些与人工智能相关的令人兴奋的公告。在活动之前,该公司展示了一种新的人工智能摄像头功能。在 X 上的一段短视频中,该功能的功能可以被视为 Pixel 手机实时识别物体。谷歌在 X 上分享了该功能的一瞥​​,并配上标题:“距离 #GoogleIO 还有一天!我们感觉很好。明天见,了解有关人工智能、搜索等的最新消息。”

X 上的短视频展示了一种基于摄像头的先进人工智能工具,能够实时识别物体和事件。 “原型”视频展示了 Pixel 设备的摄像头瞄准 I/O 主题演讲舞台。当摄像机持有人提问时,“嘿,你认为这里发生了什么?”一个声音将场景识别为“大型活动,也许是会议或演示”的准备工作。 AI 还识别出了“IO”字母,将其与谷歌开发者大会联系起来,并评论了“人工智能的新进展”。随着对话的展开,设备屏幕上显示了文本记录。

这一功能虽然让人想起谷歌的视觉搜索工具 Google Lens,但它展示了类似于 Meta 智能眼镜中的多模式人工智能的实时功能和语音交互。 Pixel 设备上的演示暗示,这可能是 Google Pixel 产品中通常首次推出的人工智能驱动新功能的早期尝试。

有趣的是,谷歌在 OpenAI 推出 ChatGPT 4o 的同时展示了这一功能。新的法学硕士可以通过图像来分析数据并给出相应的响应。 ChatGPT 4o 用户可以上传屏幕截图和文档(包含文本和图像),并与 AI 工具进行文本对话。OpenAI 首席技术官 Mira Murati在活动中也表示,GPT 4o 在理解语音音调、降噪和减少对话延迟方面拥有改进。她补充说,GPT 4o将在跨模式推理方面表现出色,无缝集成语音、文本和视觉功能。

回到谷歌,由于这家科技巨头在 Google I/O 大会前一天预告了其新的人工智能功能,因此我们很有可能在活动期间了解更多有关它的信息。

谈到 Google I/O,该活动将在 Google 的 YouTube 频道上进行直播,并于今天晚上 10:30 在印度开始。预计该活动将发布几项公告,包括与其 Gemini AI 聊天机器人相关的公告。此次活动还可能会重点关注谷歌产品中更广泛的人工智能集成,其中可能包括 Gemini 系统的增强以及 Pixel 设备的新人工智能功能。

Google I/O 2024 的另一个亮点预计将是深入探讨 Google 操作系统的最新版本 Android 15。最后,我们可能还会听说 Pixel 9 系列设备。不过,目前这些都还只是猜测,具体情况如何,还需要等待现场揭晓。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章

<