(原标题:腾讯汤道生:最接近诞生AIGC国民级应用的或许是搜索)
图片来源:企业官方
南方电网广东广州黄埔供电局首创工业园区转供电改造“三统一”模式,即统一计量、统一收费规则、统一平台的园区升级模式,合力推动园区向用电管理规范化、供电服务优质化升级迭代。
蓝鲸新闻9月7日讯(记者 朱俊熹)经历了两年的狂飙后,生成式AI的热潮开始出现放缓的迹象。然而,对AI的巨额投入未能换来可观的回报,过去的一个多月里,谷歌、微软等巨头都陷入了要如何提振投资者信心的难题。就连一路高歌的“AI卖铲人”英伟达本周股价也遭重挫,一度创下美国公司市值单日跌幅最大纪录。
这些企业的领导者们反复强调对AI投资不足的风险会远大于投资过度,大家频频提起的口号变成了耐心、坚持与长期主义。
在9月5日举办的腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,大家过去对AI大模型可能存在一些误区,不少人起初认为大模型可以快速改变世界,对此非常乐观。最近又有一些悲观,觉得大模型好看却不好用。
“其实,短期高估进度、长期低估效果都不可取。AI大模型一定是一场长跑,一定要有信心和耐心,同时坚持去做投入。”汤道生强调。
90分的大模型应用需要时间
AI泡沫论者常常会将当下的情形与二十多年前的互联网泡沫相比,认为这波AI浪潮极有可能重蹈覆辙。
腾讯正是经历过那场泡沫后生存下来的一家公司,而如今它已成巨头。汤道生2005年加入腾讯,2018年开始带领CSIG(腾讯云与智慧产业事业群),他认为技术发展并非那么简单,而所谓泡沫也并非没有价值。汤道生在接受媒体采访时提到,虽然最早一代的互联网企业可能大部分都垮了,但是在今天来看,互联网绝对是一个创造巨大价值的技术,很多早期互联网科技企业如今仍然在社会上享有重要的影响力。
汤道生表示,很多新技术都会经历密集投资,甚至引发泡沫的周期,新技术的变革需要时间去沉淀和积累。在这个过程中,不够专业的参与者会被淘汰,剩下的人能够回归理性、务实的态度,探索实际的场景和痛点并加以打磨。
作为腾讯总办的一员,工程师出身的汤道生自身经历过几个周期,对技术发展和技术管理也已有足够的经验。他尤其强调的是“时间”。
“今天的AI技术也许在某些场景,可能觉得只做到了50分或者60分,要到90分必须要靠时间去磨的。”汤道生称。他认为,在探索的过程中,企业会找到一些新的场景和机会,或是避开那些设想美好但实际落地受限的场景。
推动大模型应用落地已成为AI行业共识,过去一年来腾讯反复重申以实用为目标,要“构建离产业最近的AI”。在此次活动演讲中,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声指出,大模型的发展已呈现出两个明显趋势:模型性能不断提升、落地场景不断丰富。
在模型方面,腾讯于9月5日正式推出新一代大模型“混元Turbo”。据腾讯介绍,混元Turbo采用了自研的万亿级层间异构MoE结构,能够用更多的专家数、更少的激活参数量实现更好的效果。相较于前代模型,混元Turbo的训练效率提升108%,推理效率提升100%,推理成本降低50%,输入和输出价格仅为其一半。该模型的中文场景效果可对标OpenAI的GPT-4o。
做AI大模型,由于OpenAI已经探明了一条技术路线,后发者追上领先者的技术水平并不难,难的是将不断飞速迭代发展的技术真正落地,无论是To C还是To B。
当业界开始将发展重心转向应用层面时,在什么场景下将出现AI杀手级应用备受瞩目。对此,汤道生表示,AIGC国民级应用可能首先诞生于C端,最接近的领域或许是信息搜索。他提到,行业内一些企业也在探索情感陪伴、角色扮演等领域,但都没有达到国民级应用的程度。很大程度上是因为消费互联网发展至今已非常成熟,目前能够想到的需求和场景都有服务厂商在里面深耕已久。
至于在B端的应用,汤道生指出虽然落地场景多,但仍有较大的探索空间,目前还处于早期阶段。这个过程既需要时间,也需要数据。为改善大模型的“幻觉”问题,腾讯会基于RAG(检索增强)的模式,利用企业内部数据作为回答问题的事实基础。而很多企业的专有数据涵盖文本、图片、视频等多模态,这一方向的探索还需要算力的投入和技术的迭代。
腾讯集团副总裁、政企业务总裁李强在接受采访时也直言,“大模型在To B侧的商业化远没有大家想的这么欣欣向荣,还有较长的路要走。”
李强解释称,首先B端一些行业壁垒较深。其次,不少企业对于自有行业化数据的保密性要求较高,更愿意通过私有化部署的形态处理核心业务,但这也影响了大模型在行业内的复制与推广,形成目前的瓶颈。此外,当应用于低容错率的工业等传统行业时,大模型可能还无法达到一些复杂的应用要求。
深度捆绑的云与AI
得益于与AI大模型的深度结合,云市场迎来了新的增长机会。腾讯集团副总裁、腾讯云与智慧产业事业群COO、腾讯云总裁邱跃鹏在发言时阐述道,大模型在云上训练,同时云又成为大模型对外输出能力的重要出口,云产品借助大模型的智能化能力得以提升。
腾讯8月公布的二季度财报显示,其金融科技及企业服务业务收入同比增长4%至504亿元。其中,企业服务业务收入实现十几个点的增长率,主要受惠于云服务业务及企业微信等SaaS服务商业化收入增长等因素。汤道生在此次活动中也提及,腾讯云正在逐步向盈利目标靠近,预计“这不会是一个太遥远的时间”。
汤道生称,这一轮AI热潮对于云的收入肯定是有提升的,例如很多自动驾驶厂商等客户需要GPU芯片进行大模型的训练和推理。对于AI收入的具体占比,他表示“数据现在可能很难量化,但肯定是不断增加的”。
根据国内其他几家云厂商的最新财报,阿里云同样未公布AI相关产品收入的占比,仅表示二季度该项收入实现三位数增长,推动阿里云营收增长6%至265亿元。百度在财报中明确指出,智能云业务Q2营收录得51亿元,同比增长14%,当期AI收入占比提升至9%,高于上一季度的6.9%。
在腾讯全球数字生态大会现场,一位AI企业的算法工程师告诉蓝鲸新闻记者,在国内的云厂商中,其公司会使用腾讯云的算力和存储服务,并通过API调用混元大模型。除此之外,他们也会使用阿里云、百度智能云、华为云等厂商的云服务,采用多云策略。
“作为一家公司,我们不可能完全绑定在一家云厂商的产品上。每个厂商有自己的优势,但也有其短板。”该算法工程师称。从其使用经历来看,腾讯云能够用于提供所需的算力资源,如果要把大模型托管在云端运行和管理,则会选用百度智能云。
李强在接受群访时提到,如果要对腾讯云业务中AI相关的收入进行拆解,“大头还是GPU算力”,来自头部创业公司或其他企业对私有化模型的训练需求。而来自于大模型自身的商业化产出在整体市场中的占比相对较低。
据李强介绍,腾讯一方面会做算力的支撑,另一方面也致力于建设一套稳定、高性能的AI基础设施。他强调,即使拥有了AI芯片,也不代表着就有很强的运算效率来支持训练。因为在进行大规模计算时,千卡万卡的联调需要极强的技术基座,而腾讯在这一方面投入了大量研发。
在9月5日的活动上,腾讯还发布了“腾讯云智算”品牌,集计算、储存和网络解决方案于一体。邱跃鹏提到,训练集群的稳定、卡的互联、数据读写效率等多个环节都会影响大模型的训练效率,并关系到整体训练成本。腾讯云智算能够提供稳定高效的AI infra服务,在稳定性、数据读写效率、网络交换效率等方面均领先于业界水平。
在大模型之战中,比起早早宣布All in AI的对手们而言互联网炒股放大平台,腾讯向来显得有些不紧不慢。汤道生曾表示,在起得早和熬得久之中,他认为后者更重要。如今面对大模型带来的云机会,不急着养家糊口的腾讯又一次摆出耐心的态度,等待这轮新技术的发展周期。