ChatGPT术语表:41个每个人都应该了解的AI术语

ChatGPT Glossary 41 AI terms everyone should know

ChatGPT是OpenAI开发的AI聊天机器人,它具有惊人的能力,能够回答任何问题,很可能是你对AI的第一次了解。从写诗、简历到融合菜谱,ChatGPT的功能被比作了超级版的自动完成。

但是,AI聊天机器人只是AI领域中的一部分。当然,让ChatGPT帮你做作业,或者让Midjourney根据原产国创造迷人的机甲图像很酷,但它的潜力完全可以重塑经济。根据麦肯锡全球研究院的数据,这个潜力每年对全球经济价值达到4.4万亿美元,这就是为什么你应该预计会听到越来越多关于人工智能的消息。

随着人们对与AI交织在一起的世界变得越来越习以为常,新的术语随处可见。所以无论你是想在酒会上显得聪明,还是在面试中给人留下深刻印象,这里有一些你应该了解的重要AI术语。

本词汇表将持续更新。

——

人工通用智能(Artificial general intelligence,AGI):这个概念指的是比我们今天所知的AI更先进的版本,它可以比人类更好地执行任务,同时教授和推进自己的能力。

AI伦理:旨在防止AI对人类造成伤害的原则,通过决定AI系统应该如何收集数据或处理偏见来实现。

AI安全:一个跨学科领域,关注AI的长期影响以及它如何突然进展到可能对人类具有敌意的超级智能。

算法:一系列指令,允许计算机程序以特定方式学习和分析数据,例如识别模式,然后从中学习并完成任务。

对齐:调整AI以更好地产生期望的结果。这可以涉及从内容的调节到与人类的积极互动的维护。

拟人化:当人类倾向于赋予非人类对象人类特征时的现象。在AI领域,这可能包括相信聊天机器人比实际上更具人类特征和意识,比如相信它快乐、悲伤,甚至是有知觉。

人工智能(Artificial intelligence,AI):利用技术模拟人类智能,无论是在计算机程序还是机器人中。这是计算机科学的一个领域,旨在构建能够执行人类任务的系统。

偏见:在大型语言模型中,由于训练数据造成的错误。这可能会导致根据刻板印象错误地将某些特征归因于某些种族或群体。

聊天机器人:通过文本与人类进行交流的程序,模拟人类语言。

ChatGPT:OpenAI开发的一种使用大型语言模型技术的AI聊天机器人。

认知计算:人工智能的另一个术语。

数据增强:重组现有数据或添加更多种类的数据来训练AI。

深度学习:一种AI方法,也是机器学习的一个子领域,它使用多个参数来识别图片、声音和文本中的复杂模式。这个过程受到人脑的启发,使用人工神经网络来创建模式。

扩散:一种机器学习方法,将现有的数据(例如照片)添加随机噪声。扩散模型训练它们的网络以重新设计或恢复该照片。

新兴行为:当AI模型表现出意外的能力时。

端到端学习(End-to-end learning,E2E):一种深度学习过程,模型被指示从头到尾执行任务。它不是按顺序训练完成任务,而是从输入中学习并一次性解决它。

伦理考虑:对AI的伦理影响和与隐私、数据使用、公平性、滥用以及其他安全问题相关的问题的意识。

Foom:也称为快速起飞或硬起飞。这个概念是,如果有人建立了一个AGI,拯救人类可能已经太迟了。

生成对抗网络(Generative adversarial networks,GANs):由两个神经网络组成的生成型AI模型,用于生成新的数据:一个生成器和一个鉴别器。生成器创建新内容,鉴别器检查其是否真实。

生成式人工智能:一种使用人工智能来创建文本、视频、计算机代码或图像的内容生成技术。人工智能被输入大量的训练数据,找到模式以生成自己的新颖响应,有时会与源材料相似。

Google Bard:谷歌的一种人工智能聊天机器人,功能类似于ChatGPT,但从当前网络中获取信息,而ChatGPT只限于2021年以前的数据,并且与互联网没有连接。

监管措施:对人工智能模型施加的政策和限制,以确保数据得到负责任的处理,模型不会生成令人不安的内容。

幻觉:人工智能产生的错误响应。可以包括生成式人工智能产生的答案是错误的,但表现出自信地错误地陈述。这其中的原因并不完全清楚。例如,当向一个人工智能聊天机器人询问“列奥纳多·达·芬奇何时画了《蒙娜丽莎》?”时,它可能会回答一个错误的陈述,比如说“列奥纳多·达·芬奇于1815年画了《蒙娜丽莎》”,而实际上它是在300年前画的。

大型语言模型,或LLM:一种在大量文本数据上进行训练的人工智能模型,以理解语言并以类似人类的语言生成新内容。

机器学习,或ML:人工智能的一个组成部分,使计算机能够通过学习而获得更好的预测结果,而无需明确编程。可以与训练集结合使用来生成新内容。

微软必应:微软的一个搜索引擎,现在可以使用为ChatGPT提供动力的技术来提供由人工智能驱动的搜索结果。它与Google Bard类似,可以连接到互联网。

多模态人工智能:一种可以处理多种类型输入(包括文本、图像、视频和语音)的人工智能。

自然语言处理:人工智能的一个分支,利用机器学习和深度学习来赋予计算机理解人类语言的能力,通常使用学习算法、统计模型和语言规则。

神经网络:一种计算模型,类似于人脑的结构,旨在识别数据中的模式。由相互连接的节点(或神经元)组成,可以识别模式并随时间学习。

过拟合:机器学习中的错误,它过于接近训练数据,可能只能识别特定示例数据,而不能识别新数据。

参数:为LLMs提供结构和行为的数值,使其能够进行预测。

提示链:人工智能利用以前的交互信息来影响未来的响应的能力。

随机鹦鹉:对LLMs的类比,说明软件没有对语言背后的含义或周围世界有更深的理解,无论输出听起来多么令人信服。这个短语指的是鹦鹉可以模仿人类的话语,却不理解其背后的含义。

风格迁移:将一个图像的风格调整为另一个图像的内容的能力,使得人工智能能够解释一个图像的视觉属性并将其应用于另一个图像。例如,将伦勃朗的自画像以毕加索的风格重新创作。

温度:设置参数以控制语言模型输出的随机程度。较高的温度意味着模型更加冒险。

文本到图像生成:根据文本描述创建图像。

训练数据:用于帮助人工智能模型学习的数据集,包括文本、图像、代码或数据。

Transformer模型:一种神经网络架构和深度学习模型,通过跟踪数据中的关系(如句子或图像的部分)来学习上下文。因此,它不是逐个单词地分析句子,而是可以整体地看待句子并理解上下文。

图灵测试:以著名数学家和计算机科学家艾伦·图灵命名的测试,用于测试机器像人类一样行为的能力。如果一个人无法将机器的回答与另一个人的回答区分开,那么机器通过了测试。

弱人工智能,又称窄人工智能:专注于特定任务的人工智能,无法超越其技能范围进行学习。大部分现今的人工智能都属于弱人工智能。

零样本学习:一种测试模型在没有提供必要的训练数据的情况下完成任务的能力。一个例子是只通过训练虎来识别狮子。

编辑注:ENBLE正在使用人工智能引擎来帮助创作一些故事。详情请参见此篇文章