谷歌于周三推出了Gemini 2.0系列人工智能模型的第一个版本,名为Gemini 2.0 Flash。该模型提供用户全球通用的聊天版本,同时面向开发者提供带有语音生成和图像生成功能的实验性多模态版本。谷歌首席执行官Sundar Pichai表示,Gemini 2.0致力于使信息更为实用。 与前一代产品相比,最新的大型语言模型在代码生成和准确响应方面表现更佳,但在评估较长上下文方面却不如Gemini 1.5 Pro。用户可以在桌面和移动网页中选择聊天优化版本,而多模态版本将很快在谷歌的AI工作室和Vertex AI开发平台上面向开发者发布。Gemini 2.0的多模态版本将于明年一月正式推出,届时还将有更多模型尺寸可供选择。 谷歌计划在2025年初将Gemini 2.0扩展到更多谷歌产品中。此举代表了谷歌在竞争日益激烈的科技行业中,继续追赶微软、Meta和OpenAI等对手的新努力。 此外,谷歌还发布了其他研究原型,旨在开发更具“代理性”的人工智能模型,能够更好地理解周围世界、提前思考多步并在用户监督下采取行动。上周,Pichai在The New York Times的DealBook峰会上挑战微软的AI进展,表示愿意随时进行两家公司模型的对比。