Source: CNBC
OpenAI于周四发布了一款新的人工智能模型“GPT-4o mini”,这家人工智能初创公司最新努力是扩大其流行聊天机器人的使用。公司称这一新版本为“当今最有能力且成本效率高的小型模型”,并计划稍后将图像、视频和音频整合到其中。GPT-4o mini是OpenAI最快、最强大的模型GPT-4o的分支,该公司在5月份的一次直播活动中推出了该模型,并且计划提升其音频、视频和文本功能,能够处理50种不同语言,并且速度和质量得到提高。
OpenAI由微软支持,投资者对其估值超过800亿美元,成立于2015年,正面临着在生产和训练模型上花费巨资的同时,保持生成式人工智能市场领先地位,同时寻找盈利方式的压力。周四宣布的迷你人工智能模型是OpenAI推动“多模态”技术的一部分,即提供多类型的AI生成媒体,如文本、图像、音频和视频,融合到一个工具ChatGPT中。
去年,OpenAI首席运营官布拉德·莱特卡普告诉CNBC:“世界是多模态的。如果想想我们作为人类如何处理和与世界交互,我们看到事物,听到事物,说出事物-世界远不止于文本。
所以对我们来说,文本和代码作为独立模态,作为我们对这些模型功能的强大性和能力的单一接口,总感觉不够完整。GPT-4o mini从周四开始对ChatGPT的免费用户、以及ChatGPT Plus和Team订阅者开放,下周将对ChatGPT Enterprise用户开放,公司在新闻发布中表示。
人类的世界是多元的,AI技术也在不断演进,让我们期待未来人工智能与多媒体的更加丰富融合