长期关注技术的读者samj指出,新的‘开源人工智能定义’引发了争议。他称此定义为一个分叉,可能会削弱原始的开源定义,后者源自Debian的自由软件指南。他提到,有人发起请愿,要求坚持‘开源定义第1.9版’,任何修订或新定义必须经过明确的社区共识和透明的过程。 他还提到,允许‘开源人工智能’隐藏训练数据只是为垄断设立了一个‘数据障碍’,使得除了第一方之外,其他人几乎不可能重现或复制人工智能。此外,TechCrunch的研究表明许多被称为‘开源’的模型实际上只是名义上的开源。研究者们指出,训练这些模型所需的数据被保密,而运行这些模型所需的计算能力往往超出了许多开发者的能力范围。 samj担心这种新定义会对FOSS生态系统造成历史性的错误,并构成对他所在非营利组织Kwaai Open Source Lab项目的生存威胁。他强调训练数据的重要性,认为它是源代码,并提出,如果Debian拒绝OSI的开源人工智能定义,可能会在开源社区内部造成分裂,从而推动更严格遵循软件自由传统原则的替代定义和运动的产生。 不过,官方的FAQ回应称训练数据并不等同于软件源代码,并指出一些领域如医疗AI是无法合法共享数据的,法律限制了不同人对相同数据的重用,以保护版权和隐私。。