Elon Musk's xAI致力于推出Grok多模态

2024-05-21 科技汇总

Source: The Verge

Elon Musk的人工智能公司xAI正在努力为其Grok聊天机器人添加多模态输入，根据公开的开发者文件。这意味着很快，用户可能能够上传照片到Grok并收到基于文本的回答。开发者文件中，示例Python脚本演示了开发人员如何使用xAI软件开发工具包库生成基于文本和图像的响应。该脚本读取图像文件，设置文本提示，并使用xAI SDK生成响应。

对于xAI于2023年3月创立的AI模型Grok来说，这是一个重大更新，该模型于2023年11月首次发布，供购买X高级会员订阅的用户使用。最后一次更新是2023年3月的Grok 1.5，该版本改进了推理能力。根据X的博客文章，“该模型经过来自公开来源的各种文本数据（截至2023年第三季度）和人工评审员审查和整理的数据集”的训练。X的博客补充说，Grok-1没有接受X数据（包括公开的X帖子）的训练。

不过，Grok确实拥有“对世界的实时了解”，包括X上的帖子。xAI由Elon Musk于2023年3月创立，相对于OpenAI的ChatGPT等竞争对手，xAI在人工智能领域相对较新。但是，根据xAI的博客文章，他们的模型Grok 1.5正在以多项竞赛问题为基准缩小与GPT-4之间的差距，这些问题覆盖了从小学到高中的各种竞赛。

值得注意的是，大型语言模型的基准测试经常受到批评，因为如果这些基准测试包含在其训练数据中，那么模型在基准测试上表现良好。这有点类似于死记硬背答案，而不是真正学习材料。多模态对话机器人似乎是人工智能的下一个前沿，谷歌I/O宣布了多项进展，OpenAI发布了GPT-4o，因此Grok缺乏多模态功能使其落后于潮流，直到现在。

多模态对话机器人是人工智能的新前沿，我们应该审慎对待基准测试的结果，避免死记硬背而非真正的学习。

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com

来源：https://www.theverge.com/2024/5/21/24161764/elon-musk-xai-grok-multimodal-ai https://interestingengineering.com/innovation/elon-musk-xai-grok https://readwrite.com/elon-musks-xai-previews-grok-1-5v-its-first-multimodal-model/

更多阅读

Elon Musk's xAI致力于推出Grok多模态

飞利浦Hue应用程序新增AR功能，预览智能灯具如何点亮房间

Persona制作人谈美丽菜单的制作过程：其实很麻烦

WP Engine起诉WordPress联合创始人Matt Mullenweg及Automattic，指控诽谤与敲诈

加州禁止私立非营利大学的遗产招生（音频）

徕卡推出第二款Q3相机，配备新镜头和更高价格（音频）

火星失踪的气氛或许潜藏在其表面泥土中

Reddit实施新政策，限制社区可见性设置的修改

戴尔要求全球销售团队每周五天在办公室工作（音频）

哈勃望远镜揭示黑洞喷流导致恒星爆炸现象（音频）

Meta为Ray-Ban智能眼镜推出新功能，包括提醒和语音信息（音频）

印度将在两年内制造首个芯片，Nvidia、AMD和Micron承诺扩大在印投资（音频）

Nvidia将在2025年CES发表主题演讲，RTX 5090传闻不断

PayPal首席执行官Alex Chriss执掌一年获华尔街赞誉，但公司面临更大挑战（音频）

智能电视被指为家庭中的数字特洛伊木马

禽流感担忧促使mRNA流感疫苗研发加速