哈佛发布大型免费AI训练数据集由OpenAI和微软资助（音频）

科技汇总

哈佛发布大型免费AI训练数据集由OpenAI和微软资助（音频）

哈佛大学周四宣布推出近一百万本公共领域书籍的高质量数据集，任何人均可使用此数据集来训练大型语言模型和其他AI工具。该数据集由哈佛新成立的机构数据倡议创建，并获得微软和OpenAI的资助。数据集包含自谷歌图书项目中扫描的无版权保护书籍，内容涵盖各种体裁、年代和语言，包括莎士比亚、查尔斯·狄更斯和但丁的经典作品，以及一些冷门的捷克教材和威尔士口袋词典。机构数据倡议执行主任Greg Leppert表示，此项目旨在“平衡竞争环境”，使公众，包括AI行业的小公司和独立研究人员，能够获得通常仅有大型科技公司才能组建的高质量内容库。他认为，这个公共领域数据库可以与其他许可材料一起使用，构建人工智能模型，还提到它可能会像Linux一样成为世界各地的基础操作系统。

打开APP收听

哈佛发布大型免费AI训练数据集由OpenAI和微软资助（音频）

苹果用户如何摆脱应用主页的束缚（音频）

OpenAI的新人工智能项目GPT-5进

科学家研发出核钻石电池可为设备提供数千

路易吉·曼吉奥内的幽灵枪仅部分为3D打印

T2 Linux SDE 24.12发布

新泽西州立法机构对无人机目击事件的反应引

氢氯喹促进COVID研究在发表四年后被撤

开源软件资金报告显示86%的企业贡献为员

Axiom公司的私人空间站可能最早于20

马来西亚将重启MH370航班失踪10周年

Pegasus监控软件制造商NSO集团对

欧盟要求苹果开放AirDrop和AirP

高通在与Arm芯片授权的法律战中获胜（音

美国司法部对涉嫌LockBit开发者提出

美国指控涉嫌开发LockBit勒索软件的

哈佛发布大型免费AI训练数据集 由OpenAI和微软资助（音频）

哈佛发布大型免费AI训练数据集由OpenAI和微软资助（音频）