Source: Slashdot
谷歌Deepmind开发的Gemini LLMs可以处理更多的信息,包括图像、视频和音频。因此,谷歌的一个团队提出使用人工智能来创建用户人生的“鸟瞰图”,报道CNBC称,使用手机数据如照片和搜索。该项目被命名为“Ellmann计划”,以传记作家、文学批评家Richard David Ellmann命名,据CNBC查阅的演示文稿显示,计划使用Gemini等LLMs来摄入搜索结果,发现用户照片中的模式,创建聊天机器人,并“回答以前不可能的问题。该文稿称,Ellmann旨在成为“您的人生故事讲述者。
目前尚不清楚该公司是否计划在Google Photos或任何其他产品中推出这些功能。根据谷歌的一篇博客文章,Google Photos拥有超过10亿用户和4万亿张照片和视频。根据CNBC查阅的文件,Google Photos的产品经理与Gemini团队在最近的内部峰会上展示了Ellmann计划。
他们写道,几个月来,团队一直在确定大型语言模型是实现这种“鸟瞰式”人生故事的理想技术。Ellmann可以使用传记、之前的时刻和随后的照片来提供背景信息,以比“只是具有标签和元数据的像素”更深入的方式描述用户的照片。一张演示文稿的幻灯片写道:“我们翻阅您的照片,查看它们的标签和位置,以确定有意义的时刻。
当我们退后一步,从整体上了解您的生活,您的主要故事变得清晰……”该团队还展示了“Ellmann聊天”,其中描述为:“想象一下打开ChatGPT,它已经了解你的整个生活。你会问它什么?”在回应评论请求时,谷歌的一位发言人告诉CNBC称,谷歌Photos“一直使用AI来帮助人们搜索他们的照片和视频,我们对LLMs实现更多有益体验的潜力感到兴奋。这只是一个早期的内部探索,如同往常一样,如果我们决定推出新功能,我们将花费足够的时间来确保它们对人们有帮助,并设计以保护用户的隐私和安全为首要任务。
这个项目运用人工智能技术创建用户的人生故事,中途可能遇到的隐私和安全问题需慎重对待。