新“复仇者联盟”:人工智能如何赋予我们超能力

作者:duke 日期: 分类:网络转载 浏览:208

人工智能就是21世纪的电力。
打开凤凰新闻,查看更多高清图片

编者按:对于比尔·盖茨来说,能给他带来震撼感受的技术体验并不多,至今只有过两次。第一次是他看到 GUI(图形用户界面)的时候,第二次则是在看到 AI 高分通过了高级生物考试的时候。他宣称,我们已经进入人工智能时代。但我们想好了如何应对了吗?本文思考了如何让人工智能赋予我们超能力,而不是担心被它取代我们的工作。文章来自编译。

为了开启 2023 年,我写了一篇深入探讨 AI 及其新兴应用层的文章(参见2023年的人工智能:应用层已经到来)。三个月之后,情况已经有了很大的变化。我在一月份的预测以及市场版图看起来很古怪;事情的进展比大多数人预想的要快得多。光是在 3 月这个一个月,OpenAI 就推出了 GPT-4,ChatGPT 获得了插件,比尔·盖茨宣布“人工智能时代”已经到来。他认为,人工智能会变得像个人电脑、互联网以及手机的发明一样重要。

一图胜千言,同样的提示:“唐纳德·特朗普与巴拉克·奥巴马一起打篮球”,这里是 Midjourney 在 2022 年 3 月(左)以及 2023 年 3 月(右)给出的输出对比。

同样的提示下,Midjourney在22年与23年的输出

对比不可谓不强烈。

听到盖茨宣布新的科技时代的到来,我不禁想起了上一次他对另一个新兴技术——互联网——的兴奋。1995 年,盖茨在大卫·莱特曼秀(The David Letterman Show)上解释什么是 web。那次采访遭到了嘲笑,莱特曼用讽刺回应了盖茨对直播棒球比赛的兴奋(“收音机会响铃吗?”)或者对即使比赛结束后也能在线体验的兴奋(“录音机会响铃吗?”)。他根本就不明白。

1995 年比尔·盖茨向大卫·莱特曼解释什么是互联网

今非昔比。这次大家都很关注,即便只是因为在过去半个世纪互联网让生活发生了如此巨大的变化。在我父亲小时候,电视上只有三个频道,他得去翻皮革封面的百科全书去找信息。自从盖茨出现在莱特曼的节目之后,我们已经习惯了谷歌的搜索,亚马逊的万货商店,以及 Facebook 的社交图谱。科技公司已经变成支配我们生活的动词——我们在 Instagram 上度过特别时刻,在 Snap 上给我们的朋友拍照,上班的时候用 Uber,旅行的时候用 Airbnb。

变化的节奏一直很快,但我们只是站在数字革命的风口浪尖。计算机曾经非常擅长一件事:计算(computing)。换句话说,算数(doing calculations)。而现在它们变得善于学习(“机器学习”一词由此而来),运作机制变得更像人脑。计算机的行动速度比我们的大脑要快得多——大脑电信号的移动速度是硅芯片信号传输速度的 1/100000。

本周和下周,我们将重新审视 AI 的应用层。鉴于创业世界正出现寒武纪大爆发,这样的思考是很应景的:在 Y Combinator 的 2023 年冬季训练营当中,大约有二分之一的创业公司都是在围绕 OpenAI API 开发产品。这篇文章将深入探讨 1) 现在正在发生的事情,以及 2) 未来可能发生的事情。

这篇文章将结构性地研究让我兴奋的三个主题:

面向每个人的个人助理

扩大人类知识

增强人类创造力

下周,我们将研究人工智能革命带来的三个重要问题:

生成式 AI 世界里的现实是什么?

人工智能会抢走我们的工作吗?

谁将捕捉到所创造的价值?

让我们开始吧。

面向每个人的个人助理

今年一月份时,我写过一篇文章,里面谈到了一部上世纪 90 年代鲜为人知的电影:《超国度》(Hyperland)。这部电影的导演是道格拉斯·亚当斯(Douglas Adams),他更出名的身份是《银河系搭车客指南》的作者。影片的背景是道格拉斯·亚当斯受够了被动的线性电视——电影称就是“那种发生在你身上,而你就像一个沙发土豆一样坐在它面前的电视。”

为了寻找更具互动性的媒体形式,亚当斯把他的电视带到了一个垃圾场,在那里他遇到了汤姆(由汤姆·贝克饰演)。汤姆是一位软件代理——本质上属于一个数字管家,能够根据你的特定兴趣为你提供个性化的信息和娱乐饮食。

汤姆让我想到了现代人工智能。

上周,OpenAI 发布了 ChatGPT 插件。插件基本上意味着 ChatGPT 用户现在可以与 OPenAI的那 11 家合作伙伴(包括 Instacart、Expedia 以及 OpenTable)进行交互,所有这些交互都是通过 ChatGPT 界面完成的。跟汤姆一样,ChatGPT 插件就像你的数字管家。

ChatGPT插件市场

插件的机制最好可以用一个例子来说明:

Ben Thompson 让 ChatGPT 提供一份包含猪肉和卷心菜的食谱。在下面的屏幕截图可以看到,ChatGPT 在响应结束后,又开始问 Ben要不要这份食谱的食材清单。Ben 答应了,然后 ChatGPT 就调出 Instacart 的购物车,里面已经把这份食谱的所有必要食材给准备好了。

当然,这是利用了 Instacart 的插件。但你也可以有其他选择:借助插件,ChatGPT 可以替你预订餐厅 (OpenTable)、帮你购买产品 (Shopify),或拼接应用 (Zapier)。每个人都有自己的私人助理。

想象一下给 ChatGPT 提供如下提示:

“我要去巴黎住七个晚上。请帮我预订 3 月 30 日早上出发的航班,4 月 6 日准时送我回家吃晚餐。我想住在卢浮宫旁边,每晚住宿费不能超过 500 美元,我还希望帮我预订每晚在酒店附近走路就能到的餐厅吃晚餐。”

不再需要跟 Expedia、Google Flights 以及 OpenTable 进行费力、乏味的交互。2000 年代,Priceline 与 Expedia 等 OTA (在线旅游)重置了旅游,令旅行社变得过时;AI 模型可以对当今行业做一些类似的事情(尽管目前预订仍然要通过 Expedia 等与 OpenAI 合作的 OTA)。

插件的新还在于它们可以让 ChatGPT 连接上互联网。之前,ChatGPT 受制于训练的数据集,导致它无视了发生在 2021 年以后的事件。比方说, ChatGPT 一度不知道埃隆·马斯克是 Twitter 的首席执行官。现在,ChatGPT 可以实时访问 web 的信息并提供最新的响应。这可不得了。

每当我想到 AI 应用时,就会想到助手和放大器。这两者之间的界限很模糊,但这个思维框架可以帮助我思考用例:

放大器关乎的是增强人类的能力;它们赋予我们超人的超能力。接下来两部分我会详细介绍放大器。

助手不是为了增强人类能力,而是通过替我们完成任务来节省我们的时间和精力。助手是汤姆,是数字管家。或者用更现代一点的参照——继续用超能力的类比——助手是《钢铁侠》里面的贾维斯(J.A.R.V.I.S.),他是替托尼·斯塔克效劳的电脑伙伴。我们都想成为超级英雄,人工智能帮助我们实现了这一目标,但我们也需要值得信赖的数字伙伴来让我们的生活变得更轻松。有了 AI 之后,我们现在每个人都拥有了自己的贾维斯(一个有趣的知识:J.A.R.V.I.S.是 Just A Rather Very Intelligent System,不过是一个相当智能的系统罢了)。

在《钢铁侠》里面,托尼·斯塔克离不开贾维斯,他事实上的管家

我们看到,ChatGPT 插件的私人助理为我们预订酒店,为我们订购日杂百货。在其他令人兴奋的新创业公司那里我们也能看到它们的身影。比方说,Harvey 就扮演了律师的私人助理的角色,帮助做合同分析、尽职调查、起诉以及监管合规方面的工作。这就像自己的律师助理,但费用只是后者的一小部分。这是个有趣趋势,我们会看到更多垂直化的助手出现。下周,我们将探讨这对颠覆劳动力市场意味着什么——比方说,律师助理这个职业可能会面临风险。

插件之所以如此吸引人还有一个原因:这是 ChatGPT 成为平台的标志。很快,可能会有成千上万的公司跑来与 OpenAI 合作。本周,Packy McCormick(参见OpenAI无意间发现了一个有史以来最赚钱的商业模式)与 Ben Thompson (参见ChatGPT接入插件的意义:get√了一台计算机)对未来可能的样子提出了一些很好的想法。很多聪明人把这个新兴平台比作苹果的应用商店。

关于未来可能会如何展开的一些想法:

ChatGPT 刚推出时,我以为它的增长会受到分发的限制。ChatGPT 甚至都没有 app;用户是通过 web 来访问这一工具的。但这显然并没有阻碍 ChatGPT 成为史上增长最快的产品,只用了两个月时间就收获了 1 亿用户。

看看我的 TikTok 就知道了。上面的动态消息展示了 ChatGPT 对主流的吸引力:一个接一个的视频,一条接一条的评论,大家在谈如何用 ChatGPT 做作业、制定课程计划、撰写电子邮件。这已经成为现象,而且经过了验证。

让我感到惊讶的是,ChatGPT 正在成为一个新的接口,插件巩固了这一点。我原以为既有的发行渠道会是赢家——比方说,月活用户有 7.5 亿的 Snap 将 ChatGPT 集成到其自己的 My AI 功能里。但结果是大家通过 ChatGPT 本身与各个企业互动。

观察企业会如何适应这一新现实将是一件很有趣的事情。2000 年代,当谷歌搜索了占据市场主导地位时,企业开始利用 SEO(搜索引擎优化)关键字来优化自己的网站。当 Instagram 在 2010 年代占据主导地位时,企业通过研究 Instagram 上面展示的照片来优化自己的咖啡馆、餐馆和酒店。到了 2020 年代,当每家公司都需要确保自己吸收了生成式 AI 时会发生什么?当用户只需要给 ChatGPT 发条命令“帮我打车,我要去机场”时,Uber 又该如何与 Lyft 争夺乘客?

在过去,用户一般是直接访问网站(Expedia.com、OpenTable.com)的,或者通过下载使用 app(如 Instacart 的 app)的。现在,视插件将被如何应用,ChatGPT 可能会变成用户与这些网站和 app 交互的接口。插件距离变革用户体验仅一步之遥——如果我是手头有 Chrome 的谷歌或控制着应用商店的苹果的话,我会非常认真地思考下一步该怎么办。

扩大人类的知识

在思考人工智能的崛起时,比尔·盖茨解释说他一生当中有两次技术体验是决定性的:

第一次出现在 1980 年,那是盖茨首次用上了图形用户界面(GUI)。 GUI 是你我与计算机的交互方式——指针、图标、窗口、滚动条,以及屏幕上我们都习以为常的菜单。但现在很难想象,在 GUI 出现之前,你得输入 C:> 提示符才能与计算机交互。

1984 年出现的第一个 Macintosh GUI。其中引入了窗口、图标、文件以及文件夹等组件,所有这些都由鼠标控制

盖茨经历第二次决定性的体验发生在去年,那是 OpenAI 团队展示了 ChatGPT 如何在 AP Bio (高级生物学教程)考试取得优异成绩的那一刻。盖茨说明了要以生物考试作为挑战目标的原因:“我之所以选择 AP Bio,因为这门考试不仅仅要求掌握基本的科学事实——还要求你对生物学进行批判性思考。”最后 AI 模型的考试取得了优异成绩,总共 60 道多项选择题中答对了 59 道,对于论文问题也给出了一流的回答。一位外部专家给考试结果打出了最高分, 5 分。

人工智能会让我们变得更加聪明。几十年来,技术让我们在数学方面表现得更好了——因为有了计算器、Excel 电子表格、计算机程序这些。我们获得了计算的超能力。不妨推演一下同样的类比,运用到一切人类知识上。我们从 Hebbia(企业的神经搜索)、Rewind(“为你生活量身打造的搜索引擎”——本质上属于更好的记忆)以及 Kumo(预测智能)等新兴初创公司身上看到了这一点,它们扩展了我们的脑力以及能力。我们在 Notion 和 Google Workspace 等成熟的生产力工具中看到了这一点——这些工具正在集成生成式人工智能,帮你总结会议记录并撰写深思熟虑的电子邮件。

ChatGPT 获得的荣誉还在不断堆积:ChatGPT 通过了沃顿商学院的 MBA 考试;ChatGPT 通过了律师资格考试;ChatGPT 通过了医学职业资格考试。

人工智能模型的能力只会越来越厉害。不妨看一下这张GPT-4 与 GPT-3.5 考试表现的对比。资料来源:OpenAI

在短短时间内,模型的 LSAT (法学院入学考试)成绩从 40% 跃升至 88%,AP Chemistry(高级化学课)从 20% 跃升至 70%。

增强人类的创造力

有一些规律在支配着宇宙。其中一条规律是:人接近 30 岁时,对室内设计的兴趣会呈指数增长。我也不例外:我的 Instagram Explore Feed 上面充斥着各种家居装饰内容,而我的 YouTube 主页几乎全是 Architectural Digest 的房屋展示。

最近,我求助于 Midjourney 来给我们的公寓寻找设计灵感。作为一个艺术天赋完全是零的人,我其实还算成功。这是提示的输出:

Architectural Digest 风格照片,纽约公寓,现代风格,主卧室,壁炉,深色图案壁纸,动物图案,皮革,黑色地毯,修复硬件,黄色灯光,夜间,舒适氛围,独特 --ar 16:9

这就是生成式 AI 令人兴奋之处;它可以让任何人(甚至我!)变得更有创意。人工智能艺术智能。

如果你看到了生成式图像的保真度,脑子里一定会开始思考各种可能性。在上周与红杉资本的谈话中,NVIDIA 首席执行官黄仁勋表示:“很快每一个像素都会是生成的。未渲染:则生成。”如果应用到电影和游戏等富媒体格式上会很有趣。在 Midjourney 创作的改进上我们已经可以看到这一点(回想一下之前生成的奥巴马跟特朗普打篮球的质量改进),这种直线上升只会继续:很快,我们将可以生成丰富的视频以及沉浸式的 3D 世界。

Nick St. Pierre 做的 Midjourney v5 的样例让我想起了 HBO 的《白莲花度假村》(White Lotus)。这是提示的输出:

1960 年代街头风格的照片,一群年轻女性站在帆船甲板上,身穿迪奥丝绸连衣裙,戴着珍珠项链,夕阳西下,用 Agfa Vista 200 拍摄,4k --ar 16:9

这就是生成式 AI 令人兴奋之处;它可以让任何人(甚至我!)变得更有创意。人工智能艺术智能。

如果你看到了生成式图像的保真度,脑子里一定会开始思考各种可能性。在上周与红杉资本的谈话中,NVIDIA 首席执行官黄仁勋表示:“很快每一个像素都会是生成的。未渲染:则生成。”如果应用到电影和游戏等富媒体格式上会很有趣。在 Midjourney 创作的改进上我们已经可以看到这一点(回想一下之前生成的奥巴马跟特朗普打篮球的质量改进),这种直线上升只会继续:很快,我们将可以生成丰富的视频以及沉浸式的 3D 世界。

Nick St. Pierre 做的 Midjourney v5 的样例让我想起了 HBO 的《白莲花度假村》(White Lotus)。这是提示的输出:

1960 年代街头风格的照片,一群年轻女性站在帆船甲板上,身穿迪奥丝绸连衣裙,戴着珍珠项链,夕阳西下,用 Agfa Vista 200 拍摄,4k --ar 16:9

想象一下,一旦你有了一个故事的想法,然后可以按照你的剧本制作出一整部电视节目。 我们讨论很多的一个主题是创意工具的趋势正在朝着更实惠、更容易获得以及更高质量转移。生成式人工智能可以让任何人都可以成为制片人。当然,这可能会对就业产生重大影响,这一点我们以后再谈。

我们已经看到现在有了用户生成的生成式内容 (UGGC?) 的味道。上周,Runway 展示了 AI 生成短片电影节的 10 部决赛入围作品。你可以在此处(https://aiff.runwayml.com/#winners)观看那 10 个视频。这些电影制作很吸引人,给人留下了很深刻的印象(从演职员表可以看出,拍摄仍需要雇了不少人)。思考吸收了生成式人工智能的下一代内容平台、社交网络以及游戏的样子会很有趣——想象一下,你的 2023 版 Minecraft 或 Roblox 或 Rec Room 会是什么样的呢?

关于 Midjourney v5 在创意方面的运用,最后再举个 St. Pierre 的例子——产品设计。这是 Nike Air Force 1 与 Slytherin 联名款运动鞋的输出。提示如下:

街头风格照片,特写镜头,Nike Air Force 1 slytherin 联名款,独特配色,蛇皮,霍格沃茨,自然光,原创,独特,4k --ar 16:9

相当精美。耐克目前的定制工具还很简陋,但这一点今后势必会改变;你可以想象生成式 AI 扩大了谁可以成为设计师的范围。就在过去几周的时间里,Adobe 与 Canva 都推出了 AI 产品:Adobe 推出了 Firefly,里面包括了一个文本生成图像工具,Canva 则推出了 Magic Design,可以根据输入创建设计模板。但有个问题仍悬而未决,那就是谁能捕捉到创造出来的价值:是像 Adobe 和 Canva 这样的老牌企业呢?还是最近刚成立的初创公司?下周我们会进一步探讨这方面的话题。

大家都在寻找在创造性工作当中使用 AI 的创新方法。YouTuber MKBHD(有 1700 万订阅者)一直在用 ChatGPT 来撰写视频脚本;Isaiah Photo(有900 万订阅)让 AI 替他管理频道,而且持续了一周;人们甚至用 ChatGPT 来制作 DJ 混音歌单:

当然,关于 AI 的创造性会有一些反乌托邦元素;到了什么时候人工智能就不再能够增强我们的创造力并开始对我们的创造力产生负面影响?但人工智能无疑证明了它的创造力已经达到了人类的水平。在一项研究中,研究人员将六个聊天机器人生成的想法与人类产生的想法进行了比较,并报告说:“我们发现人工智能生成的创意与人类产生的创意之间没有质的区别。”

在创意工作方面,思考新技术将如何塑造艺术是一件很有趣的事情。我的朋友 Trung Phan 最近写了一篇关于摄影如何改变绘画的文章。简而言之,在照相机出现之前,大多数绘画都是超写实的;艺术家试图捕捉现实。但是当摄影成为可能时,艺术家们不再觉得有模仿现实世界的必要,开始自由地绘制抽象的、有创意的作品。比方说,莫奈在那副著名的《睡莲》里用上了自然界不存在的颜色。而梵高的《星空》的开创性在于它并没有去表现现实的夜空,而是附加了梵高自己对它的诠释。

看看生成式 AI 如何扩展我们对艺术的定义将会很有趣。正如相机改变了绘画一样,生成式 AI 将会改变写作、音乐、电影与设计。这一技术必将成为创意库里面有争议的变革性工具。不管好坏,它必将影响我们创作的艺术以及讲述的故事,同时通过让更多人更容易获得创造力来吸引更多的创造力。

最后思考:人工智能就是电力

上周在《大西洋月刊》上,关于对社会的影响这个问题,Jacob Stern 就人工智能与哪种技术最相似进行了讨论。在我看来,最好的类比是电力。正如 Stern 所指出的那样,很多“技术”作为工具其实相当有限:用来切割的锯、用来书写的笔、用来敲钉子的锤子。与此同时,电力没有特定功能,与其说电是种工具,不如说是一种已渗透到生活各个方面的力量。

我们将看到人工智能以意想不到的方式渗透到生活的方方面面。我们都会有数字管家、私人助理,让平凡的生活任务变得更轻松;我们的知识会获得显著扩张(再说一遍,硅芯片的信号的传输速度比我们的大脑快 100000 倍);我们会变得更有创造力,会释放新的艺术能力。或者说得更简单一些:我们将获得超能力,我们也会得到一位值得信赖的伙伴。

关键词: