《深度学习发现,人工智能能够实时复制人类的社交学习技能》

《深度学习揭示,人工智能可以即时获得人类社交学习能力》

人类的智慧严重依赖于从其他人那里获取知识-这些知识在时间上积累,作为我们文化演化的一部分。这种社会学习,在文献中被称为文化传播,使我们能够实时模仿行动和行为。但是,AI能否以同样的方式开发社会学习技能呢?

模仿学习长期以来一直是人工智能的训练方法之一,它指导算法观察人类完成任务,然后尝试模仿他们。但通常,AI工具需要多个示例和大量的数据才能成功复制它们的训练者。

现在,DeepMind研究人员的一项突破性研究声称,AI代理也可以在实时模仿人类的情境下展示社会学习技能,而无需使用任何预先收集的人类数据。

具体来说,团队专注于一种称为观察学习或少样本模仿的特殊文化传播形式,它是指对身体动作的复制。

DeepMind在一个名为GoalCycle3D的模拟环境中进行了实验,这是一个带有不规则地形、小径和障碍物的虚拟世界,AI代理必须在其中导航。

为了帮助AI学习,研究人员使用了强化学习。对于那些不熟悉巴甫洛夫在该领域的工作的人来说,这种方法基于对每个有助于学习和期望结果的行为提供奖励-在这种情况下,找到正确的路线。

在下一个阶段,团队添加了专家代理人(硬编码或由人控制),他们已经知道如何在模拟环境中导航。AI代理很快就明白,达到目的地的最佳方式是向专家学习。

研究人员的观察结果有两个方面。首先,他们发现AI在模仿专家时不仅学得更快,还将所获知识应用于其他虚拟路径。其次,DeepMind发现,即使在没有专家的情况下,AI代理仍然可以使用其新技能,这在研究作者看来,构成了社会学习的一个例子。

尽管作者指出还需要更多的研究,他们认为他们的方法可以为“文化演化在发展人工通用智能的算法角色中起到铺路作用”。他们还期待AI和文化进化心理学领域之间的进一步跨学科合作。

尽管DeepMind的突破还处于早期阶段,但它可能对人工智能行业产生重大影响。这样的进步有可能减少算法传统的资源密集型培训,同时增加它们的问题解决能力。这也引发了一个问题,即人工智能是否能够学会获取人类思维中的社会和文化要素。

完整的研究发表在期刊《自然通讯》上。