周期,是人类社会最朴素的内核规律之一。直至18世纪中叶亚当·斯密以《国富论》开启古典经济学以降,人们愈渐掌握现代经济学理论工具用以解构这个世界,这一过程里,社会经济领域“长中短波”式的峰谷变幻,不断强化人类对于经济周期的敬畏与宿命感。
这种宿命感,换做当代人最为熟识的经济现象便是:第一至第三次产业革命。此刻仍处于上一轮以“电子计算机—移动互联网”技术为基石的创新康波周期的末端,我们仍正在为开创新一个60年的产业革命新周期不断求索。
(资料图片)
如今,新周期的时点或许已经到来。一个最直接的信号,面向C端市场的ChatGPT迅速蹿红。上线两月,ChatGPT的月活用户就超过1亿,成为互联网历史上用户增长最快的应用。
正因为如此,科大讯飞、百度等国内科技公司开始纷纷入局跟进。以此为时点,一场关于未来AI产业地位的竞争就此拉开了帷幕。
/ 01 /ChatGPT,第四次工业革命的开始
过去相当时间里,AI落地的探索更多体现在垂直领域,比如智慧医疗、智慧城市等等。但ChatGPT的出现却为我们提供了另外一个可能:跑通AI通用范式,再落地到具体场景里。
于AI产业来说,ChatGPT的最大意义在于,它向在技术短缺状态中停留了大半个世纪的AI研发者们,传达了这样的信号:走出实验室,到了与人类开展有效互动的时候了。
作为一款建立在大语言模型之上的文字聊天产品,ChatGPT比迄今人类出现过的任何智能聊天类产品都要强大,这其中也包括苹果的Siri。这也让ChatGPT变成了一个名副其实的现象级产品。作为互联网历史上用户增长最快的应用,ChatGPT上线两月,月活用户就超过1亿。
从整个社会发展角度来说,作为标志性机器智能生产力工具,ChatGPT的出现与蒸汽机有着类似的意义。体现在三个方面:对部分传统行业的颠覆性、对各个产业效率的提升、开启新一轮长波经济周期。
对部分传统行业的颠覆性,最直接的体现是谷歌的股价。在谷歌加持的类ChatGPT产品Bard回答问题出错后,它的市值在两天内跌掉了12%,损失超过1500亿美元,被称为史上代价最大的错误之一。
原因在于,ChatGPT可能将改变人类生产和获取知识的方式。因为它可能让知识生产的门槛大幅降低,并借此占据新的人类探索和学习的中心位置,进而颠覆搜索引擎的价值。
如果说,ChatGPT对搜索引擎的颠覆尚未发生,但其对各个产业效率提升的价值正在显现。从目前看,ChatGPT在很多场景已经足以承担部分人类的脑力劳动,比如按照指定的要求收集整理信息,撰写新闻、特定主题的文章,编写程序等等。
以ChatGPT为起点,生成式AI基于生产效率优势将衍生出更多先进的商业模式,带动生产关系的范式变革,进而开启新一轮经济增长周期。
AI的范式变革究竟会如何演绎到何种程度尚不清楚。但可以明确的是,ChatGPT的出现为所有AI公司都打开了一扇新的大门。近期,科大讯飞、网易、360、浪潮、昆仑万维等公司,纷纷宣布下场ChatGPT。其中,科大讯飞更是表示,在今年5月率先落地AI学习机产品中,就会搭载类ChatGPT技术。
作为AI行业龙头,科大讯飞为何能够领跑ChatGPT追赶赛?其拥抱ChatGPT的可能性又有多大呢?
/ 02 /拥抱ChatGPT的可能性
OpenAI给出了AI产业化的一条新路径,后来者想复现ChatGPT,算法、算力、数据三方面缺一不可。
在三者中,算法比较好理解,如同人类大脑,决定了AI的学习能力。算力,则更多意味着一种资源,决定了算法的运行效率。在实际过程中,超大模型由于参数规模大、数据体量大,因此需要更大的算力支持。
据了解,ChatGPT单次模型训练耗时1个月,训练成本达1200万美元。考虑到超大模型的训练需要大规模计算集群以及对应的模型并行算法框架的支撑,中间算力需求巨大。根据科大讯飞副总裁、研究院执行院长刘聪判断,1000张主流卡容量的独立计算集群是完成该类任务的门槛之一。
在数据方面,对于预训练模型来说,数据的质量和数量直接影响模型的质量。数据之于算法,更像是一本本优质教材,能够决定AI会学到哪些知识。比如,ChatGPT的成功,就很大程度上依赖于互联网上海量的高质量英文文本数据。在全球最大的百科网站维基百科上,拥有最多百科文章的语言正是英文。
以上三方维度,恰恰也为我们评估科大讯飞能否推出ChatGPT类产品提供了参考。
先说算法,一个业内主流观点是,尽管没有率先做出来Transformer、GPT-3,但国内企业在大模型上的技术,距离ChatGPT的差距其实也仅在半年到两年之间。
对于像科大讯飞的AI龙头企业来说,实际差距可能更短。在算法领域,科大讯飞在Transformer深度神经网络算法方面拥有丰富经验,目前已经广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平。
同时,科大讯飞还创新提出了知识与大模型融合统一的理解框架X-Reasoner,并在认知智能技术领域,2022年累计获得了常识阅读理解挑战赛OpenBookQA等13项世界冠军。在AI算法领域深厚积累,也是科大讯飞能够迅速跟进ChatGPT类产品的重要原因。
除了算法领域具备深厚的积累外,科大讯飞在算力上也有着扎实的支撑。比如,公司在总部建有业界一流的数据中心,为大模型训练平台建设奠定了很好的硬件基石。
不仅如此,科大讯飞在工程实现方面也有着很多积极的探索。比如,科大讯飞实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。工程实现技术对大模型走向规模化应用中至关重要。
在数据积累上,凭借多年的消费场景开拓,科大讯飞在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据,也为基于大模型的创新应用研发和试点推广提供了场景保障。
在领先的AI算法、扎实的算力支撑以及丰富的文本语料三者叠加之下,科大讯飞成为国内为数不多有能力复制ChatGPT产品的AI公司。
当然,ChatGPT对科大讯飞的意义并不止如此。帮助投资人重新认知科大讯飞根据地战略的护城河以及大模型路径与产业深度的融合机会,才是ChatGPT之于科大讯飞最大意义所在。
/ 03 /ChatGPT扎根产业化的启示
ChatGPT跑通AI通用范式,让很多人产生一个疑问:ChatGPT这样通用型产品进一步完善后,是否会进入专业领域对科大讯飞这样专业打法的AI公司产生冲击?
从目前看,这种看法可能有些多虑。由于专业领域数据的封闭性,通用型的AI产品往往很难发挥实际作用。举个例子,ChatGPT的信息输出很大程度上依赖于海量的数据学习,但对很多特定的领域来说,数据相对封闭,通用模型很难获取,典型的就是医疗数据。在这样的领域,专业性的AI模型仍然处于明显的优势。
也就是说,ChatGPT通用型AI产品的出现,不仅不会对科大讯飞的业务产生冲击,相反再次证明公司业务的护城河,及其AI根据地战略的有效性。
考虑到科大讯飞在行业应用方面有着诸多的案例,大模型路径的跑通也让科大讯飞在很多行业场景中有了更大的用武之地。
从目前看,针对各个行业不同的需求,未来大模型会向各层级的个性化模型不断延伸,形成更符合行业需求的产品。只有在上述技术演化的基础上,以自然语言处理为代表的人工智能算法才有可能重构互联网和移动互联网的产品形态。
与绝大部分AI公司不同,科大讯飞恰好在技术和行业应用方面都有着深厚的积累。为了进一步提高大模型在细分行业的实用性,科大讯飞计划采用“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业、汽车等多个行业领域的专用大模型版本。
例如,通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式AI系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。
长远来看,以通用型产品优化细分行业的AI解决方案,科大讯飞有机会为AI产业开辟新的路径,实现自身指数级的扩张,进而加速全社会经济领域的创新进步。也许十年后再回过头来看,你可能发现,ChatGPT的出现是科技大停滞的分水岭,一个崭新周期即将开启。此后:大海航行靠AI。