大模型的春天,与百度的答卷

2023年,国内大模型领域人声鼎沸。不过外行看热闹,内行看门道,面对大模型的诱惑,许多创业者持谨慎态度,比如零假设科技CEO顾飞。

“大概三个月前,我们还是不太信任国内大模型。但是差不多在两个月之前,我们又试了一次百度的大模型,比想象要好很多。”顾飞回忆道。

零假设科技主要是为医疗专业人士,提供自动化的医学内容检索、分析和生成工具。此前,医学领域的产品的准确性和易用性很难两全,大模型出现后,顾飞看到了两者平衡的可能性。

“我们是不可能从基础大模型开始做,所以必须寻求基础设施。”顾飞开始和大模型企业沟通。

“第一个接触的是GPT,但客观的说GPT不太适合中国人的思维或者阐述方式。我们也考察过行业的其他大模型,有的一旦提到开放API的时候就不愿意了,我们认为这是不自信的表现;有的可能是效果看起来好,但是实际真的API不会那么好。”

在一次次的沟通下,顾飞开始对大模型的信任感逐渐降低。众里寻TA千百度,今年5月,百度启动了“文心杯”创业大赛(以下称为“文心杯”),试图寻找基于文心大模型开发的应用demo潜力股,零假设科技深度参与其中。

“百度愿意开放API接口。”顾飞重拾信任的理由很简单。自身拥有专业的医学知识库及相关检索推荐能力,他认为文心大模型可以发挥强大的语言能力,帮助解决易用性的问题,二者一拍即合。“文心一言出来的文献总结在意思上和GPT差异不是那么大,会更流畅,符合中国人的语言习惯。”

经历了喧嚣的百团大战,大模型开始进入“亮剑”阶段。如何平衡技术成本与可持续发展的天平,如何融合技术能力与实际应用的缝隙,大模型企业更要“面面俱到”。

韬光养晦,深耕AI十余年的百度,是否有望成为中国大模型领域的“六边形战士”?

01 十年磨一剑,AI基础能力沉淀

每一个时代风口都不缺乏前赴后继的挑战者,但往往成功的机会是留给有准备的人。做为中国大模型探索的先行者,百度的厚积薄发主要源于十余年的沉淀以及投入。

诞生之初,百度就和自然语言处理、信息检索等AI技术有着密切联系。2010年,百度开始探索更丰富的AI技术,包括机器学习、深度学习、自然语言处理等技术。2013年,百度成立了世界上第一个深度学习研究院(IDL)。

在AI发展轨迹中,百度始终坚持长期主义,持续性投入。公开数据显示,百度近十年累计研发投入超1400亿元,核心研发投入曾连续7个季度占百度核心收入比例超过20%。

压强式研发投入让百度实现厚积薄发,李彦宏曾提到,人类进入AI时代,IT技术的技术栈从过去的三层:芯片层、操作系统层和应用层,变为现在的四层:芯片层、框架层、模型层和应用层。百度如今在芯片层拥有昆仑芯,框架层有飞桨平台,模型层以文心大模型为代表,应用则有智能驾驶等场景。

根据李彦宏介绍,全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。比如:飞桨与文心协同,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

基于深厚的技术优势以及生态开放,百度四层技术栈独立作战时也展现了强劲的表现力。

截至2022年12月,通信通院最新报告显示,飞桨已经成为中国深度学习市场应用规模第一的深度学习框架和赋能平台。最新数据显示,已凝聚800万名开发者,服务22万家企事业单位并基于飞桨创建了80万个模型。

只有身临其中,才能对百度的AI能力拥有更直观的感受以及客观的评价。

AI平面设计及创意生成平台Nolibox的CEO 徐作彪分享道:“文心大模型在语料库、细分场景的定制化,以及合规等方面都是挺好的。而且对于我们而言,百度除了大模型也可以提供更底层的服务,比如说百度智能云的算力、飞桨的框架,我们会用场景自研大模型、再加上百度文心大模型做一个整合帮助打造更好的产品去服务细分场景和客户。”

“其实百度在过去十几年中持续在AI研发上坚持投入,文心大模型第一个版本2019年就发布了,此后的每一年都发布一个新版本,从这个意义上说,文心一言的发布只是我们过去多年努力的一个自然延续。”在上半年的文心一言发布会上,李彦宏说道。低调平和的话语背后,是多年沉淀的技术底蕴。

02 数据、用户、场景,大模型落地三件套

实践是淘汰裸泳者的唯一标准,酷炫的大模型只有真正渗透到商业应用中才能去除泡沫。顺利过渡到商业化阶段,数据、用户、场景是大模型落地必不可少的三件套。近期,百度率先面向全社会开放服务,这一举动正是颇有说服力的论证:公众社会可以提供真实用户,海量数据以及丰富的应用场景,这些元素均是当前大模型可持续发展的必要条件。

正如中国国家创新与发展战略研究会副会长吕本富所言:“自带场景、数据和用户的平台企业可以有效填补基础模型和场景之间的认知鸿沟,因此成为从平台经济过渡到智能经济的中枢。”

数据层面,量和质都是关键。

数据的量对于百度而言并非难事。此前朱啸虎曾称:在大模型行业,模型、算力和数据,三大支柱都向大厂集中。基于广泛的数据量,在数据的利用率上,作为搜索引擎,百度平台本身就有数据标注以及逻辑关系建立的天然优势,可以大幅度提升数据的利用率。

ChatDOC,一家基于文档智能的专业知识问答助手及阅读平台企业。该公司CEO林得苗用一个实际的场景案例分享了百度大模型在数据利用率方面的优势,“以前我们在一段内容里找出结构化数据,通常只能找出那些训练过的内容,比如说训练过财务的数据,但如果涉及到一些业务知识、产品信息,没有训练过的数据搜索效果就一般。但大模型有这个能力,因为他可以包括了更丰富的行业数据训练。”

真实的用户反馈也是大模型实际落地的重要环节,百度的搜索引擎是天然的交互型生成式AI应用。李彦宏曾表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。

大模型的生存最终还是回到解决什么问题上,即找到合适的应用场景。如前文所述,百度AI技术栈本身就建立了丰富的应用层,且在近年的新基建中百度已经有丰富的场景服务能力,无论是to B还是to C,其均有大量经验。

“每一个产品都值得重做一遍。但谁真正重新做了一遍呢?百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!”李彦宏的一句话中透露了百度公司内自上而下的新技术重构策略,这给大模型应用前景提供了足够的发展空间,技术与业务互相反馈。

如今,新技术重构业务策略的正确性与前瞻性已经被逐渐验证。

分析机构麦格理表示,今年百度在大模型领域的新探索或将推动公司实现发展新高度。据百度官方数据显示,文心一言开放首日战报:共回复网友超过 3342 万个问题,开放下载 19 小时之内日活跃用户突破 100 万。随着文心一言的开放,百度搜索业务将有望进一步增长,取得用户留存率增长,也或将推动广告业务增长。

基于AI技术能力沉淀,以及大企业的庞大商业版图优势,百度新技术可以先在集团内部实现快速验证。而综合实力加持下的百度大模型落地能力表现几何?其业务增长数据就是答案。

03 做中国大模型的挖井人

有数据显示,目前,国内已推出超100款大模型产品,且同质化严重。热潮过后,商业价值大考令许多大模型创业者绞尽脑汁。

据IDC《AI大模型技术能力评估报告,2023》显示:百度获算法模型、行业覆盖唯一满分,报告指出,百度AI大模型整体竞争力位于领先水平,在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。

基于李彦宏提出的“重构”战略,百度大模型已经悄然进入到具体的应用解决方案。在9月5日,百度智能云千帆大模型平台首次公布月活企业数已近万家,覆盖金融、制造、能源、政务、交通等行业的400多个业务场景。推出了四个升级版的行业解决方案:数字政府解决方案九州、金融解决方案开元、工业解决方案开物、智能交通解决方案ACE3.0。

据显示,文心大模型包含数 30 多个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系,可以全面满足产业应用需求,应用延展性较强,商业价值空间大。

大模型产业能否常青,生态发展很重要。从更庞大的价值潜力来看,就像安卓系统于移动端应用的关系,做裁判优过做选手。而百度做大模型的挖井人,再适合不过。

“我们希望创业者在文心大模型之上,可以做出AI时代的爆款应用。”李彦宏称。为此,百度在发布文心一言后不久,便启动了百度“文心杯”创业大赛,召集全球最优秀的AI创业者。

如同李彦宏所言,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,“卷大模型没有意义,卷应用机会更大”。

“大语言模型本身就是一个工具。我们核心其实不在于大语言模型本身,而是如何让AI能够胜任人类导购的一个角色。”Buysmart.AI是一个基于大模型的智能电商购物助手,类似AI买手,主要面向海外,该公司创始人陈历飞在赛后采访时分享道。

对于创业企业而言,如何借力大企业的底层技术能力,搭建自身的核心护城河才是竞争关键,这即是“卷应用”。

在历史的公开演讲中,李彦宏在解释百度做大模型生态的用意时,更多是站在宏观的视角,比如产业持续发展和生产效率变革:

一方面,从行业发展来看,有在大模型基础上产生足够多的AI原生应用,才是一个健康的生态环境;

另一方面,从产生的生产力价值上,他认为新的国际竞争战略关键点不是一个国家有多少个大模型,而是大模型上有多少原生的AI应用,这些应用又在多大程度上提升了生产效率。

据介绍,自5月31日“文心杯”启动以来,大赛吸引了近 1000 个项目报名,带来生产力工具、营销、文娱、社交、电商等领域的大量AI原生应用;其中30多个具有创新性的潜力项目入围Demo开发环节,接入百度智能云千帆大模型平台、进行基于文心大模型的Demo开发。

在模型落地过渡时,百度此次“文心杯”的举办对于行业发展有推动意义:一方面提高产业整体对大模型的认知度;另一方面,积极的参赛团队也能够获得的大量珍贵且具有实际意义价值的反馈,促进文心一言迭代,创造更好的用户体验。

结语

前不久,朱啸虎和傅盛在朋友圈关于大模型创业机会的一次“battle”在行业中引发热议:二人针对大模型中的创业机会进行激烈讨论。朱啸虎认为创业公司直接在大模型上做应用护城河太低。傅盛认为大模型催生了很多新的架构在大模型之上的垂直创业机会。

对于创业公司来说,烧钱从零到一做大模型的确是不理想,无论是互联网还是AI时代,基于投入产出比,许多新兴企业的机会点都在于垂直领域。且对于许多企业而言,大模型是生产力工具的迭代优化,而非是炫技,最终还是要体现在产品的优化体验上。

朱啸虎的“不要迷恋通用大模型“是一个非常理性的提醒,回归到一个新前沿技术的健康发展轨迹,不同规模的企业需要有自己的定位和担当,有效的通力合作才能成功突破人类过去没有突破过的极限。

大模型能力,百度,已然证明了自己。激活生态,百度正在影响中国大模型行业的未来。