Source: CNBC
根据《金融时报》的报道,中国的AI公司正在接受政府对其大型语言模型的审查,旨在确保其“体现核心社会主义价值观。这一审查由中国国家互联网信息办公室(CAC)进行,涉及从字节跳动和阿里巴巴等科技巨头到小型初创公司的各方。据悉,AI模型将受到当地CAC官员的测试,测试内容涵盖众多与政治敏感话题以及中国国家主席习近平有关的问题。除了测试AI模型的回答外,还将审查其训练数据和安全流程。
一位匿名的杭州AI公司消息人士告诉FT称,他们的模型在第一轮测试中由于原因不明未能通过,经过数月的“猜测和调整”后才在第二次测试中通过。CAC此举彰显了北京在追赶美国在GenAI领域的同时,密切关注技术发展,确保AI生成内容符合严格的互联网审查政策。去年中国已是第一批制定了关于生成式人工智能的规定,其中包括AI服务需遵循“社会主义核心价值观”,不得生成“违法”内容。要符合审查政策需进行“安全过滤”,但由于中国的LLM仍在较多英语内容上进行训练,这变得复杂,多位工程师和行业内部人士告诉FT。
报道称,过滤是通过从AI模型的训练数据中删除“有问题的信息”,然后创建一个敏感词汇和短语数据库来实现的。据称,这些规定导致中国最受欢迎的聊天机器人在很多时候拒绝回答关于敏感话题的问题,比如1989年天安门广场抗议活动。然而,在CAC测试过程中,LLM拒绝回答问题的次数是有限的,因此模型需要能够就敏感问题产生“政治正确的答案。一位在中国从事聊天机器人研发的AI专家告诉FT,防止LLM生成所有潜在有害内容是困难的,因此他们在系统上构建了一个额外层,以实时替换问题答案。
由于监管政策以及限制了用于训练LLM的芯片的美国制裁,中国公司很难推出自己类似ChatGPT的服务。然而,中国在生成AI专利领域占据全球领先地位。请从FT阅读完整报告。
技术发展的同时,如何在互联网审查政策下平衡创新与合规,值得深思。" } ```