Source: The Verge
OpenAI 推出 ChatGPT 的新高级声音模式已经几天了,少数获得访问权限的 ChatGPT Plus 用户似乎对此印象深刻。在线出现了各种功能演示视频,展示其歌唱、模仿口音、更正发音以及叙述故事的能力。某个视频展示了 X 用户 @nickfloats 请求 ChatGPT“用航空飞行员的口吻给飞机乘客讲故事”的情景。
聊天机器人几乎在一秒钟内便开始行动,甚至调整音频效果,让声音更像来自对讲机。ChatGPT 在处理用户打断时表现良好,尽管在处理复杂请求(如模拟引擎声)时遇到困难,但声音本身清晰动人。一个上传到 YouTube 的对话展示了 ChatGPT 可以处理“数十种语言”的输入,但具体数量因“方言和地区差异如何计算”而变化。
一段视频展示了聊天机器人纠正法语单词发音的能力,并给出了调整语调的具体提示。另一个语言演示展示了 ChatGPT 根据详细请求讲述感情故事时会说土耳其语的情况。尽管一些土耳其用户指出口音听起来不像母语音,但 ChatGPT 能够完成讲故事的请求,并在特定点笑或哭。
该机器人对美国地区口音表现不错,展示了不同风格的演唱,从蓝调版的“生日快乐”到尝试模仿动物(如青蛙和猫)演唱同一曲调。这些展示中有一些男声和女声,但没有包括类似于“Sky”声音的斯嘉丽·约翰逊风格,在五月份已被移除。对于感到错过这些有趣展示的人,OpenAI 发言人 Taya Christianson 告诉 The Verge,高级声音模式将在今年秋季向所有 ChatGPT Plus 用户(每月20美元)开放。
AI 的语音合成技术越来越逼真,未来的人机交互体验将会更加丰富多彩。" } ```