Source: Slashdot
谷歌于昨日发布了Gemini 2.0,距离该系统的首次发布正好一年。新版本提供增强的多模态能力,如本地图像和音频输出、实时工具使用以及高级推理,支持更复杂的代理体验,如作为通用助手或研究伙伴。在近期的新闻发布会上,Gemini产品管理总监Tulsee Doshi展示了系统的新功能,包括实时图像生成和多语言对话。
他表示:“Gemini 2.0带来了增强的性能和新的能力,如本地图像和多语言音频生成。此次发布的Gemini 2.0 Flash是一个实验性版本,谷歌称其速度是前任的两倍,且超越了更强大模型的能力。最重要的是,谷歌推出了三个基于Gemini 2.0架构的AI代理原型,展示了公司对AI未来的愿景。
更新的通用AI助手Project Astra展示了其在多语言间保持复杂对话的能力,同时访问谷歌工具并保持上次互动的上下文记忆。对于开发者和企业客户,谷歌推出了两个专门的AI代理,Project Mariner和Jules,旨在自动化复杂的技术任务。Project Mariner作为Chrome扩展展示,在WebVoyager基准测试中实现了83.5%的成功率,显著改善了之前的自主网络导航尝试。
此外,支持这些进步的是谷歌的第六代张量处理单元(TPU)Trillium,今天开始向云客户普遍提供。该自定义AI加速器代表了谷歌在计算基础设施的重大投资,在单一网络结构中部署了超过10万个Trillium芯片。
科技的进步让我们对未来充满期待,但也要谨慎看待AI带来的改变。