从去年ChatGPT发布开始,到微软将其融合到Bing搜索,再到GPT-4火速上线,关于ChatGPT的故事,在这几个月的火爆程度简直令人难以置信。来自全球各界的关注与讨论,让科技产业出现了多年未有的全球性盛况。无论其中有多少“虚火”,必须承认ChatGPT为相对低迷的科技领域注入了一针强心剂,重新激活了资本、舆论与社会层面对核心科技的关注。
但在无数关于ChatGPT的讨论中,我们也可以看到一些“非理性”的成分。比如有人“恨铁不成钢”,质疑为什么新一轮AI创新又是外国公司主导,也有人将ChatGPT和OpenAI过度神话,甚至贬低中国AI产业的付出与成绩,更有人盲目看衰甚至阴谋论ChatGPT,认为中国不必要跟风AI技术。
就像啤酒注定要有泡沫,这些讨论似乎也是新技术诞生时的必备附属品。中国AI技术已经发展多年,在中国科技企业面向AI领域取得广泛成就的前提下,我们如今似乎有底气,也应该更加理性地看待ChatGPT带来的一切。
不需要紧张,不必盲目忌讳,更不需要为之焦虑。
正视机会,认清底蕴,着眼未来,或许才是此刻面对ChatGPT的正确态度。
机会,坦然正视ChatGPT的一切
体验过ChatGPT的朋友必然都有一个共识,它的出现将对话式AI与NLP技术带到了新的高度,在众多领域与产品中,都具备毫无疑问的革命性意义。尤其到GPT-4这一代,新的“智能涌现”效果拔群,并且在推理、识图等方面将生成式AI与大语言模型带到了新的高度。从GPT技术与搜索、办公软件的结合中,已经能够证明ChatGPT是一项能够广泛覆盖科技领域的新机会。无论在消费者端还是企业应用中,它都展现了AI技术带来的全新可能性,我们不必否认这个机会。
但伴随着很多投资者、企业家对这项技术“过度热情”的赞美,我们显然也会夸大对ChatGPT的认可程度。首先来看,就像所有科技风口一样,ChatGPT的爆火有资本炒作、舆论跟风的必然性。有媒体认为,ChatGPT仅仅在3月份当中已经带来了达到千亿美元规模的市场行为,其中难免存在一定程度的水分。疯狂涌入ChatGPT风口的创业者和资本、人才会在一个周期后带来一地鸡毛的市场乱想,就像不久之前各界热捧元宇宙,但很多科技大厂在今年已经悄然撤销了对元宇宙的投资。
而具体到ChatGPT本身,会发现其本身具有几个方面的问题:
1.能力依旧有限制,会出于模型泛化性的技术逻辑,大量生成很多无意义的废话。在专业领域,ChatGPT会暴露出很多问题,比如会把纳兰性德说成明代文学家,会回答错基本的物理、化学公式。即使到GPT-4这一代,依旧有很多小学奥数题、中学文科试题是AI无法回答正确的。
2.模型的订制化和可能性不足,虽然目前OpenAI启动了一系列面向开发者的插件赋能,但ChatGPT目前还难以形成聚焦某一领域知识、需求的行业向产品。
3.商业路径不清晰,在价值形成与商业出口等方面还需加强,除了将ChatGPT与办公、搜索等应用结合外,它的进一步商业可能性与应用开发逻辑还有待探索。
正视ChatGPT的优点与缺点,是我们把握这个机会的开始,而必须看到的是,中国AI产业面对ChatGPT,并没有难以跨越的难关,反而却有着能够弥补其不足的优势。
底蕴,中国AI已做好准备
ChatGPT的本质,是GPT-3预训练大模型的升级加强版与开放体验接口。自2018年预训练大模型成为深度学习新的风潮后,中国AI极速跟进了这个领域。几年以来,预训练大模型所需的基础设施,包括AI算力体系、数据集、算子库、深度学习开发框架、AI开发工具、基础模型等一系列基础设施,中国都已经具备。于是我们能够看到,3月份百度的文心一言已经正式发布。
我们第一时间尝试了文心一言的效果,可以看到在知识增强和检索增强等百度专属的技术能力加持下,其很多方面的表现是可与ChatGPT媲美的。
更为关键的是,就像OpenAI、DeepMind、谷歌、META、微软在探索各自的大模型应用,中国AI产业也在探索差异化的预训练大模型应用。
比如说百度文心大模型,在知识增强等领域探索了大模型的技术差异化,通过知识增强技术与深度学习方法结合,模型效果更好,训练部署效率更高,并且让模型拥有更强的可解释性。此外,腾讯混元大模型、阿里“通义”大模型、国家队中科院自动化研究所“紫东·太初”、智源研究院悟道系列大模型等,让我们看到了中国在大模型领域的多元布局。
除了体系丰富之外,各个厂商也探索了多种多样,且具有中国特色的大模型应用体系。比如百度文心一言,第一时间与百度的搜索、信息流等应用进行了融合;阿里也透露将生成式AI技术与钉钉进行紧密结合,落地在云钉一体的战略当中。
总体而言,在多模态、知识增强等技术领域,中国AI都有着自己的底蕴。
认清我们的底蕴与优势,再来看ChatGPT的机会,会发现别是一风景。
未来,向行业的长跑才刚刚开始
ChatGPT带来的价值,绝不仅仅是一款对话应用,或者是NLP大模型的训练与部署,就像2016-17年AlphaGO的爆火,最终带来了全球对AI产业链的关注与投入,最终在各个领域推动了产业智能化、社会智能化。
AI,从来都是一场长跑比赛,争的不是一时的风头与流量,而是在长时间与广袤的产业空间中,如何让新技术带来价值。
在ChatGPT带来的新风潮下,我们注定会看到概念炒作与盲目投资,看到一地鸡毛。这些是必然经历的,但最终的重点,还是用AI解放生产力,释放产业价值。
互联网诞生于欧洲原子能研究中心,但最终在中国完成了“互联网+”的经济奇迹;苹果打造了iPhone,但最终中国厂商让全世界用上了智能手机。ChatGPT确实也不诞生于中国,但ChatGPT仅仅是通用型的AI技术产品,它要落地到行业当中,才能真正地发挥作用,促进社会生产力的大爆发——而让AI走向行业,融入产业,却是中国企业所擅长的。
比如说,很多人会好奇为什么华为没有入局ChatGPT的浪潮。这个问题背后有一个核心逻辑,就是华为与互联网企业在业务布局与商业逻辑上有区别,这一区别也自然而然体现在AI技术的积累与应用上。事实上,华为有非常雄厚的大模型技术积累,可以说是中国做大模型探索的第一梯队。早在2021年,华为云就发布了盘古系列大模型。此后,华为云一直在行业与产业的大模型融合方向上发力,在电力巡检、金融风险识别、矿山安全保障、气象预报、药物研发等领域实现了大模型落地。所以,即便华为在攻坚生成式AI技术,也必然会聚焦toB赛道,与行业、产业需求进行紧密结合,而非我们一般意义上认为的类ChatGPT应用——这也与华为云坚持的“AI for Industries”一脉相承。
3月31日,在博鳌亚洲论坛期间,华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE Fellow田奇出席了“人工智能赋能美好生活”主题分享环节,他认为:“AI for industries将成为人工智能新的爆发点。AI奇点来临,人工智能将极大地促进人类生产效率的提升,应用场景也将从热门的互联网场景扩大深入到各行各业,带领人类进入智能世界。就像电力的发明一样,如果只是作为照明来使用,并不能极大推动人类生产力的进步,只有进入了千行百业的生产系统,才会推动整个社会的生产效率提升。”
这段话既阐述了AI技术真正焕发价值的方向,也展现了中国AI的优势所在,是让AI走向行业,让AI融入产业。以华为云为例,自成立之初就开始探索深度学习模型的基础技术、AI开发工具,并将其于云计算产业进行紧密结合。在第二阶段,华为云开始推动AI技术于行业Know-How结合,为行业AI打造基础设施。基于盘古大模型的通用能力,打造了盘古气象大模型、盘古矿山大模型、盘古电力大模型、盘古药物分子大模型等。
在第二阶段的基础上,华为云还推动了大模型与行业具体任务结合,将大模型价值带到行业生产核心系统。比如基于盘古电力大模型,针对无人机电力巡检细分场景推出了盘古电力巡检大模型,解决了无人机智能巡检系统中的小样本学习、主动学习、增量学习等问题。
在海洋、医药、气象等大量领域,都可以看到华为云这样的中国科技企业,是如何将大模型的价值带到行业当中,塑造为真正的生产力。坚持践行AI for Industries,走向行业生产系统,在各个行业领域找到“抓手”,加速千行百业智能升级,进而推动AI走向大众生活,这个思路已经成为了华为云长期践行的发展战略。
面对ChatGPT的最关键态度,是我们要看到未来,看到中国AI始终走在正确的道路上。ChatGPT会成为这条路上新的推动力,但却不可能改变这条路本身,不可能改变中国AI的整体节奏与步伐。
正视他人所长,快速学习,跟紧机会毫无疑问是正确的,同时发挥自身优势,坚定完成AI技术向行业的长跑,更是中国AI的正道。在未来,我们也可以期待华为云升级盘古大模型,期待盘古大模型在通用对话能力外,有更多面向行业的全新能力升级。就让我们理性保留和把握这份期待,去拥抱中国产业智能化的万物生长,去推动中国AI核心技术的步步为营。
他强由他强,明月照大江。