2022年尾OpenAI发表了ChatGPT这款聊天机器人后,它理解文字和产出内容的能力颠覆了人们的想象,发布后短短5天内就有超过100万人注册使用,在全球各家新闻以及社群媒体上引发轩然大波。 ChatGPT 究竟是什么? 背后的技术「生成式 AI」又是什么? 一次带你读懂:
ChatGPT 顾名思义是指可以「对话」的 GPT 版本,GPT 的全名为「生成型预训练变换模型(Generative Pre-trained Transformer)」,是由 OpenAI 所开发的一种语言模型,能使用深度学习技术让它学习字词之间的关联,以此来生成类似人类产出的文本,ChatGPT 背后采用的的模型是 GPT-3.5。
ChatGPT 可以针对用户问题给予相应的长篇回复,写电脑代码、翻译文章,甚至是撰写论文、剧本、小说等,在对谈上也相当自然流畅,比起 Google 助理以及 Siri 基于预先设定的数据库和算法,执行预先设计好的固定功能,ChatGPT 可谓是更加强大的「超级智能助理」。
GPT如何运作?
《都问 AI 吧》一书提到,GPT 就像一个向量网络,在这里每个词或语言元素都被分配一个独特的矢量或数字,并使用「Self-Attention」(编注:电脑程序理解句子或文本的背景和意义的一种方式)的机制判断不同词语的相关性与重要性。 也就是说,GPT 的运作原理如下:
用户输入句子 → 透过Self-Attention 拆解转换为向量→ GPT 利用这些矢量找到内容 → 重新生成有意义的内容
我们可以这样想: 训练 GPT 如同我们在阅读书籍,透过大脑拆解书以及其中的句子,分别划上重点、做成笔记后收录起来,当未来被问到相关的问题时,我们的脑子就会拆解这个问题,并从这些整理过的库里找到最相近的答案后,重新生成有意义的回答。
ChatGPT 的演进
第一代的GPT模型GPT-1在2018年6月问世,能做到语意判断、文本分类、问答与常识推理等任务,而2019年所推出的GPT-2版本则能根据既有的文章接续生成新的且有意义的内容,并执行翻译或是总结等语言任务。
在2020年,OpenAI发表了GPT-3,它相比上一代GPT-2具有更大的模型参数,包括1750亿个参数,而GPT-2只有15亿个参数。 这使得GPT-3能够处理更大、更复杂的数据,并生成更具多类型的文本。 然而,由于全球当时正面临新冠肺炎疫情问题,导致人们对于人工智能领域的关注大幅降低,此外GPT-3无法进行智能对话也被视为一大缺陷,这代表它只能执行单向的任务,在实际应用上存在诸多不便。
这也是为什么使用GPT-3.5模型的ChatGPT在推出后能受到大量关注与热议,因为对许多人来说,评估一个人工智能模型的好坏是在于「沟通能力」,模型能否在一次来回的对话中听懂用户的问题,并给予令人满意的答案,这比模型背后的知识量更受到关注。 ChatGPT 主打对话模式,甚至可以承认错误、且拒绝不恰当的请求,更接近人类对话与思考方式的特点也吸引了全球的目光。
而在2023年3月,OpenAI发表了GPT-4,根据官网介绍,新一代的GPT-4重点在于提升利用现有数据的能力,除了能够处理多达2.5万字的长篇内容,和ChatGPT相比提升8倍之多,还可以支持图片输入以及图像识别,懂得「看图说故事」。
ChatGPT 的出现,也让机器是否会取代人类的相关讨论不断涌现,毕竟过去是由人类创造机器,机器只会根据指令完成任务,不会自行「创造」。 直到可以从现有数据中生成新内容的「生成式 AI」(Generative AI)此一研究领域获得长足发展。
生成式 AI 产出的内容可以是图像、文本甚至音乐,不过它生成的内容可能是错误的,却因为设计使然,可能乍看很有说服力; 生成式 AI 也可能会产出带有偏见的内容,因为它被「喂食」的内容可能本身就包含性别、种族等普遍存在的偏见。
生成式 AI 技术对于各个行业的影响
《AI 生成时代》中提到,生成式 AI 可以自动化处理繁琐且耗时的任务,快速并准确地分析大量数据、提升任务的效率和准确性,并提高组织的速度与敏捷性,改善组织内部的协作和沟通。 可以想见未来 AI 工具将在各行各业更为普及。
例如对新闻媒体工作者而言,可透过 AI 语音转文字工具实时取得访谈文本,也可透过生成式 AI 生成新闻稿或是自动撰写摘要、协助整理二手资讯。 《经理人》近期就透过ChatGPT、Bing等生成式AI工具,协助收集资料、外部情报,借此缩短特定类型文章的写作时间、电子报的制作时间,或协助优化文章的SEO。
而对于影视产业而言,生成式 AI 可以提供剧本创作的灵感,在动画或是特效片的制作上也能透过 AI 解决重复性较高的工作环节,提升生产流程,或是实现一些难以在现实中呈现,甚至是打破自然规律的场景。
电商产业则可以利用生成式 AI 结合 VR、AR 等技术建立虚拟卖场或虚拟主播,达成沉浸式购物体验,PChome 执行长张瑜珊在《AI进行式:技术展望与产业论坛》便分享,电商产业能应用 AI 生成文案、图片等营销素材,帮助商家解决商品上架、管理与销售的工作时间,或是导入配送、客服环节,让货物寄到消费者的手中更顺利。
她举例,销售保养品的商家,或许能透过生成式 AI 让商品自动生成在化妆台、梳妆台的情境图片上,减少制作商品上架素材的时间,强化贩售商品的服务,「有 AI 这样新的工具,可能就多了很多新的途径来解决(既有)问题。」
生成式 AI 在金融业的应用主要则聚焦在智能客服与智能顾问服务两个方面,透过自然语言处理技术,让机器人立即回应客人的需求,减少客人等待的时间,也减轻真人客服的压力。
不过,考量到法规、企业机密与资安等问题,目前许多金融业对于生成式AI的导入格外小心,这也是许多产业导入新数字工具的担忧。
AI 的未来发展
《AI生成时代》指出,人工智能的发展在未来将趋于通用化与专业化,通过训练与微调,模型将能在各类任务场景中都能通用,并且在接受海量的数据训练后,能胜任更加复杂的专业任务。
此外「仿人」一直是 AI 相关研究的技术推动力,也是人类发展人工智能最直接的想法,包含模仿人类的学习过程、认知方式,科学家不断尝试用各种维度仿造人脑,一旦人类更了解自身的智能是如何产生,人工智能的发展势必将迎来新的突破。
但生成式 AI 是否会生成不符合人类社会的规范与伦理的内容,亦或是被有心人士拿去用于有害或是非法目的,甚至是在未来若人工智能让机器拥有独立思考的能力,是否将完全脱离人类的控制,这些都是技术发展当中须要被解决的问题。