Google推出Project Astra作为新ChatGPT的多模态回应

2024-05-14 科技汇总

Source: Slashdot

谷歌在Google I/O大会上介绍了名为Project Astra的“下一代AI助手”，可以“理解手机摄像头看到的内容。据Wired报道，昨天OpenAI发布了一款名为GPT-4o的新AI模型，可以通过语音快速回应提示，并谈论通过智能手机摄像头或计算机屏幕看到的内容。Wired指出，Astra还使用了更人性化的语音和富有情绪的语调，模拟了惊讶甚至调情等情绪。

在回应口头指令时，Astra能够理解设备摄像头看到的对象和场景，并用自然语言进行交流。它识别了计算机音箱，并回答了有关其组件的问题，从办公室窗户外面的视野中识别了伦敦街区，从计算机屏幕上读取并分析了代码，写了一首关于铅笔的打油诗，并回忆起某人放下眼镜的位置。谷歌表示，Project Astra将通过名为Gemini Live的新界面于今年晚些时候推出。

负责公司AI领导工作的Demis Hassabis表示，公司仍在测试几款原型智能眼镜，并尚未决定是否推出其中任何一款。Hassabis认为，赋予AI模型对物理世界的更深刻理解将是AI进一步发展的关键，也将使Project Astra等系统更加稳健。他表示，包括谷歌DeepMind在游戏AI程序上的工作在内的其他AI领域前沿工作可能有助于此。

Hassabis和其他人希望这样的工作对机器人技术可能是革命性的，而谷歌也在该领域进行投资。多模态通用代理助手正处于通往人工通用智能的轨道上，”Hassabis提到了一种希望但基本上没有定义的未来时刻，那时机器可以像人类头脑一样做任何事。这不是AGI或任何东西，但这是一切开始的地方。

希望人工智能对物理世界的理解能够进一步推动AI技术的发展，开创出人类想象不到的新可能。" } ```

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://tech.slashdot.org/story/24/05/14/2343256/project-astra-is-googles-multimodal-answer-to-the-new-chatgpt?utm_source=rss1.0mainlinkanon&utm_medium=feed

更多阅读

Google推出Project Astra作为新ChatGPT的多模态回应

Threads延长帖子编辑时间至15分钟，提升用户体验

夏威夷航空全机队机型引入Starlink高速免费Wi-Fi服务

OpenAI董事长Bret Taylor谈人工智能代理、监管及科技热潮

以色列摩萨德如何策划其爆炸呼叫器行动：渗透真相让真主党付出惨重代价

FEMA将虚假信息列为灾害管理新挑战

从 AOL Time Warner 到 DirecTV 与 Dish：20 年的媒体合并历史

智能家居的前门锁：便捷与安全的新选择（音频）

Grabango因未能获得资金而关闭，退出无人收银技术竞争（音频）

加州通过法律以保护消费者的“精神数据”隐私（音频）

美国南区检察官办公室揭露碳信用市场的多年欺诈计划

Spotify服务故障，用户在社交媒体上报告问题

前骑师迈克尔·斯特雷特因制造商拒绝维修外骨骼失去行走能力

金·多特科姆抵制逮捕，阴谋论与现实交汇（音频）

育碧股价跌至十年低位投资者呼吁出售公司（音频）

Ripple推出针对银行的加密资产保管服务以实现多元化发展

Google推出Project Astra作为新ChatGPT的多模态回应

Threads延长帖子编辑时间至15分钟，提升用户体验

夏威夷航空全机队机型引入Starlink高速免费Wi-Fi服务

OpenAI董事长Bret Taylor谈人工智能代理、监管及科技热潮

以色列摩萨德如何策划其爆炸呼叫器行动：渗透真相让真主党付出惨重代价

FEMA将虚假信息列为灾害管理新挑战

从 AOL Time Warner 到 DirecTV 与 Dish：20 年的媒体合并历史

智能家居的前门锁：便捷与安全的新选择（音频）

Grabango因未能获得资金而关闭，退出无人收银技术竞争（音频）

加州通过法律以保护消费者的“精神数据”隐私（音频）

美国南区检察官办公室揭露碳信用市场的多年欺诈计划

Spotify服务故障，用户在社交媒体上报告问题

前骑师迈克尔·斯特雷特因制造商拒绝维修外骨骼失去行走能力

金·多特科姆抵制逮捕，阴谋论与现实交汇（音频）

育碧股价跌至十年低位 投资者呼吁出售公司（音频）

Ripple推出针对银行的加密资产保管服务以实现多元化发展

育碧股价跌至十年低位投资者呼吁出售公司（音频）