“‘开源’人工智能的神话”

The Myth of 'Open Source' Artificial Intelligence

ChatGPT使任何人都能够与强大的人工智能互动,但这个世界著名的聊天机器人的内部运作仍然是一个严密保密的秘密。

然而,近几个月来,使人工智能更加“开放”的努力似乎已经获得了势头。今年5月,有人泄露了Meta的一个模型,名为Llama,使外部人员可以访问其基础代码以及决定其行为方式的“权重”。然后,今年7月,Meta选择提供一个更强大的模型,名为Llama 2,供任何人下载、修改和重复使用。自此以后,Meta的模型已成为许多公司、研究人员和爱好者构建具有ChatGPT类似功能的工具和应用的极受欢迎的基础。

“我们在全球范围内有广泛的支持者,他们相信我们对当今人工智能的开放方式…研究人员致力于与该模型进行研究,以及科技、学术和政策领域的人士,他们像我们一样看到了Llama和开放平台的好处,”Meta在宣布Llama 2时表示。今天早上,Meta发布了另一个专门用于编码的模型,名为Llama 2 Code。

看起来开源方法已经使软件的访问民主化、确保透明度并提高安全性数十年,现在似乎准备对人工智能产生类似的影响。

然而,一份研究论文背后的一个研究团队表示,被描述为“开放”的Llama 2和其他人工智能模型可能会有一些限制。这些研究人员来自卡内基梅隆大学、AI Now研究所和Signal基金会,他们表示,被标记为“开放”的模型可能存在限制条件。

Llama 2可以免费下载、修改和部署,但它不受传统开源许可证的覆盖。Meta的许可证禁止使用Llama 2来训练其他语言模型,并且如果开发人员在拥有超过7亿日活用户的应用程序或服务中部署它,需要特殊许可证。

这种控制水平意味着Llama 2可能为Meta提供重要的技术和战略优势,例如,当Meta在自己的应用程序中使用模型时,它可以从外部开发人员进行的有用调整中受益。

研究人员表示,按照正常开源许可证发布的模型(如非营利组织EleutherAI的GPT Neo)更加开放。但是,这样的项目很难达到平等的地位。

首先,训练先进模型所需的数据通常是保密的。其次,构建这种模型所需的软件框架通常由大型公司控制。其中最受欢迎的两个框架,TensorFlow和Pytorch,分别由Google和Meta维护。第三,训练大型模型所需的计算能力也超出了任何普通开发人员或公司的能力,通常需要数千万或数亿美元进行一次训练。最后,改进这些模型所需的人力也是大多数只有实力雄厚的大公司才能获得的资源。

事情的发展方向是,几十年来最重要的技术之一可能只会使少数几家公司受益和赋权,包括OpenAI、Microsoft、Meta和Google。如果人工智能确实是一项具有改变世界意义的技术,那么如果能够使其更广泛可用和可访问,可能会带来最大的益处。

“我们的分析表明,开放不仅不能‘民主化’人工智能,”Signal基金会主席之一、该研究报告背后的研究人员之一Meredith Whittaker告诉我,“事实上,我们表明公司和机构可以利用‘开放’技术来巩固和扩大中央集权的权力。”

Whittaker补充说,开放的神话应该成为急需的人工智能监管的一个因素。“我们确实迫切需要大型垄断公司定义和主导的科技之外的有意义的替代品,尤其是在人工智能系统被整合到在医疗保健、金融、教育和工作场所等高度敏感领域中产生特定公共影响的情况下,”她说。“创造使这样的替代品成为可能的条件是一个可以与反垄断改革等监管运动并行甚至受其支持的项目。”

除了检查大公司的权力,使人工智能更加开放对于释放其最佳潜力并避免其最坏倾向可能是至关重要的。

如果我们想要了解最先进的人工智能模型的能力,并降低部署和进一步进展可能带来的风险,将它们开放给全球的科学家可能会更好。

就像通过深奥性来保证代码安全性从来不能真正保证代码能够安全运行一样,保护强大的人工智能模型的工作方式可能不是最明智的方式去进行。