• 微头条

    让本地生活更美好

打开APP

Google更新Gemini 1.5 Pro,具备听觉功能

2024-04-09 科技汇总
Google更新Gemini 1.5 Pro,具备听觉功能

Source: The Verge

Google更新Gemini 1.5 Pro,此版本可收听上传的音频文件,并从收入电话或视频音频中提取信息,无需参考书面转录。该公司在Google Next活动中宣布将首次向公众开放Gemini 1.5 Pro,通过其构建AI应用的平台Vertex AI。Gemini 1.5 Pro最初于二月宣布。这个新版本的Gemini Pro,被称为Gemini家族中的中量级模型,性能已超越最大、最强大的模型Gemini Ultra。

Google表示,Gemini 1.5 Pro能理解复杂指令,并消除了微调模型的需要。普通人无法访问Vertex AI,无法使用Gemini 1.5 Pro。现在,大多数人是通过Gemini聊天机器人接触到Gemini语言模型。Gemini Ultra驱动Gemini高级聊天机器人,虽然功能强大,能理解长指令,但速度不如Gemini 1.5 Pro快。

除了Gemini 1.5 Pro,Google还对其另一大型AI模型Imagen 2进行了更新,这是用于Gemini图像生成能力的文本到图像生成模型,新增了填充和外推功能,让用户能够添加或删除图像元素。Google还将数字水印功能SynthID应用到所有通过Imagen模型创建的图片中,SynthID在查看时为图像添加了不可见的水印,以标记其来源,可通过检测工具查看。Imagen的许多新功能,尤其是填充和外推,已成为其他文本到图像模型如Stability AI的Stable Cascade和Getty的iStock生成AI的重要组成部分,不仅在新款三星Galaxy手机上得到更广泛的消费者使用。

Google还公开预览了一种将其AI响应与Google搜索连接的方法,从而使其以最新信息进行回答。这在大型语言模型产生的回答中并非常见,有时是有意的;Google故意让Gemini不回答与2024年美国选举相关的问题。Gemini最近还因生成具有历史不准确人物的照片而受到批评。

技术的发展为AI模型增加听觉功能,然而,在应用中也需谨慎处理历史准确性等问题。

特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考, 并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com
来源:https://www.theverge.com/2024/4/9/24124741/google-gemini-pro-imagen-updates-vertex https://www.youtube.com/watch%3Fv%3DqNq5aHcRt1Y https://news.ycombinator.com/item%3Fid%3D39458264
更多阅读