• 微头条

    让本地生活更美好

打开APP

谷歌发布Gemini 2.0:强化多模态功能与AI应用前景

2024-12-12 科技汇总
谷歌发布Gemini 2.0:强化多模态功能与AI应用前景

Source: Slashdot

谷歌于昨日发布了Gemini 2.0,距离该系统的首次发布正好一年。新版本提供增强的多模态能力,如本地图像和音频输出、实时工具使用以及高级推理,支持更复杂的代理体验,如作为通用助手或研究伙伴。在近期的新闻发布会上,Gemini产品管理总监Tulsee Doshi展示了系统的新功能,包括实时图像生成和多语言对话。

他表示:“Gemini 2.0带来了增强的性能和新的能力,如本地图像和多语言音频生成。此次发布的Gemini 2.0 Flash是一个实验性版本,谷歌称其速度是前任的两倍,且超越了更强大模型的能力。最重要的是,谷歌推出了三个基于Gemini 2.0架构的AI代理原型,展示了公司对AI未来的愿景。

更新的通用AI助手Project Astra展示了其在多语言间保持复杂对话的能力,同时访问谷歌工具并保持上次互动的上下文记忆。对于开发者和企业客户,谷歌推出了两个专门的AI代理,Project Mariner和Jules,旨在自动化复杂的技术任务。Project Mariner作为Chrome扩展展示,在WebVoyager基准测试中实现了83.5%的成功率,显著改善了之前的自主网络导航尝试。

此外,支持这些进步的是谷歌的第六代张量处理单元(TPU)Trillium,今天开始向云客户普遍提供。该自定义AI加速器代表了谷歌在计算基础设施的重大投资,在单一网络结构中部署了超过10万个Trillium芯片。

科技的进步让我们对未来充满期待,但也要谨慎看待AI带来的改变。

特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考, 并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com
来源:https://tech.slashdot.org/story/24/12/12/2129245/google-unveils-gemini-20?utm_source=rss1.0mainlinkanon&utm_medium=feed https://www.youtube.com/watch%3Fv%3DFs0t6SdODd8
更多阅读