“每天压力都非常大,模型训练每天都很烧钱,但自己的孩子怎么看都顺眼。”4月20日,出门问问“序列猴子”大模型发布现场,创始人李志飞语气既兴奋又紧张地进行大模型对话实时演示。
相对于中国参与者的关注与动作,本轮AI热潮的“发起人”OpenAI CEO山姆·奥特曼此前公开表示,“我认为我们正处于巨型模型时代的末尾。”
对于该观点,李志飞对第一财经记者表示,这种观点大家听听就好了,每个人的发言都带着当时那一刻的认知。但大模型时代肯定是刚刚开始,未来模型规模也将发生很大的变化。
(资料图片仅供参考)
无论如何,国内AI从业者积极涌入这难得一现的AI机遇,并呈现出明确的分界线——凭借外接大模型接口升级自有产品的“借道者”有之,选择凭借资源与技术优势从事大模型研发的“自研派”有之,一步到位地瞄准底层算力与服务供给的“卖水人”有之。杂乱纷呈,路径渐明。
垂类行业产品相继诞生
2019年,红杉资本沈南鹏、字节跳动创始人张一鸣、和Apus创始人李涛在硅谷见到了OpenAI创始人Sam Altman。他通过视频demo演示了自家人工智能GPT2 操作游戏DOTA2的过程。
但当时在场的,没有一个人投资OpenAI。“当时所有的人都没有意识到这是一个非常巨大的划时代的机会。”李涛在接受第一财经等媒体采访时说。他表示,自己赞同王小川的观点,国内的人工智能恐怕无论是比OpenAI还是比Google Bard,落后绝对不是两三个月的问题,可能起码要两年以上,但是不用太担心,因为人工智能今天还处在非常早期的阶段,伴随着人工智能架构以及技术路线的迭代,可能会帮助中国在这个过程中快速大踏步地追赶上。
从百度文心一言、阿里通义千问到商汤、昆仑万维等科技公司的大模型,再到李涛天燕大模型AiLMe、王小川的百川智能、王慧文的光年之外、李志飞的序列猴子,“中国版ChatGPT”在一个月里几乎迎来扎堆发布的热潮。
在大模型的应用层,文档类产品在微软Copilot系列的带动下率先突围,国内包括钉钉、WPS等办公产品先后公布在大模型领域进展。李志飞表示,做人类的Copilot会是大模型最好的“工作”,未来Copilot将无处不在。
18日,金山办公发布具备大语言模型能力的生成式人工智能应用,暂定代号“WPS AI”,官方表示今后还将持续向AIGC、阅读理解和问答、人机交互三个方向深耕。金山办公CEO章庆元透露,接入的大模型非OpenAI,而是由国内合作伙伴MiniMax提供。
同一天,钉钉总裁叶军展示了接入阿里通义千问大模型后的钉钉样貌,现场演示的四个场景为群聊、文档、视频会议及应用开发。他表示,未来一年所有场景都将进行智能化布局。“这只是我们工作智能化探索的一小步,AI对生产力工具的改造才刚刚开始。”
内容领域,此前知乎发布与面壁智能合作自研的“知海图AI”中文大模型。知乎创始人、董事长兼CEO周源表示,目前“知海图AI”中文大模型已运用进知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测,利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
针对算力与数据问题,采访中,知乎CTO李大海对第一财经记者表示,目前知乎与面壁深度合作,但在算力方面,知乎有自己的算力储备,目前公司有很多A100芯片,未来也会上线更多功能进行算力支撑。
至于繁冗的标注与清洗、安全与工程化等数据问题,李大海对记者表示,这方面是算法问题也是工程问题。知乎在内容安全方面有积累,未来也会开放给搜索引擎做内容抓取,在这个情况下知乎能够收集获取很多开放的语料。另外,所谓的“中文语料局限性”问题,李大海称,它也是一个具体的技术问题,可以通过标注、生产、挖掘更深度数据、从英文数据里进行语言对齐等方式去得到好的结果。
相对于C端产品的相继落地,B端产业在大模型方面的进展缓慢而低调。此前,创新奇智在2022年财报业绩说明会上表示,在AI2.0时代,会基于在1.0时代积累的实践经验,推进AIGC技术在制造业场景中的落地应用,做适合制造业落地的工业大模型。如针对工业领域有效样本少的问题,会基于小样本学习和AI数据生成技术,通过对已有样本的学习产生新样本,从而大幅提升了工业领域样本信息不足情况下模型的精度,用于缺陷图像质量提升。
创新奇智CTO张发恩对第一财经记者表示,本轮AI热潮与上一波始于2012年的卷积神经网络深度学习AI热潮略有类似。但此次的AI应用场景会进一步扩大。
包括上述落地行业与场景在内,峰瑞资本投资合伙人陈石表示,目前看到了五大类创业投资机会——基础设施、内容生产、语言模型、思考机器、赋能各行各业。云启资本董事总经理冯瑶表示目前看到两种思维模式:一种是从惯性模式下寻找优化空间,比如如何用AI分别去提升销售、供应链、交付等每个环节的效率;另一种是完全抛开已有的框架,从技术能如何颠覆的角度寻找全新的架构方式。接下来,这两种模式一定会经常碰撞,也希望创业者能兼具用这两种模式思考的能力
投入底层基础设施建设
海外云巨头的密集动作昭示了作为技术底座的利好趋势与竞争态势。继微软与谷歌各自的大模型产品后,近期,亚马逊云科技提供Amazon Titan家族以及第三方的模型帮助用户训练模型,并用新推出的Serverless服务Amazon Bedrock帮用户快速构建和扩展各种生成式AI应用。
兴业证券研报分析认为,短期来看,云计算厂商受益于训练需求大增。由于大模型训练与调用需要庞大的算力资源,而千亿参数的模型需要一个面向AI 高度优化的云计算平台才可训练。因此,随着大模型训练需求量以及未来 AIGC 应用的增加,云计算厂商将迎来增量的需求。
目前可视的应急需求主要聚焦于算力与服务层面。18日,火山引擎宣布为大模型公司提供算力与服务支持。另外,腾讯发布高性能计算集群,缓解大模型趋势下的算力压力。阿里巴巴集团董事会主席兼首席执行官张勇表示,阿里巴巴将全力抓住市场机遇,为市场上风起云涌的模型和应用提供好算力的支撑。
峰瑞陈石分析目前大模型创业结构:底层首先是硬件和云服务,这是提供技术的基础设施。底层之上是模型层与应用层。底层主要是大厂的机会;模型层作为基础大模型,创业机会不是那么多,可能部分会有一些垂类模型;主要的创业方向主要在应用层。
作为自研大模型的创业公司,MiniMax拥有三大模态基础模型架构,MiniMax联合创始人杨斌表示,做AI大模型的系统优化,创业公司的方式更容易实现最高的效率。如果是大厂来做,当然具有非常多资源优势,不过也有很多不可避免的商业和技术包袱。
目前的大模型在技术层面,杨斌认为AGI时代的研发模式与上一代AI有本质不同,上一代AI追求如何高效地做模型的定制化,因此模型变得越来越多,算法也变得越来越复杂。但AGI时代算法会越来越简单,模型也会越来越收敛,尽可能享受到数据和算力增长背后的复利。在产品层面坚持做AGI原生应用,公司和用户一起组成正向循环来实现持续迭代。算力层面,杨斌认为中国的公有云市场已经积累了大量的算力和经过验证的基础设施。
目前“自研派”密集涌入大模型赛道,李志飞认为当下同质化问题是不可避免的,他对记者表示,随着技术的发展,未来行业内参与者都会找到自己独特的定位,否则长久下来也难以坚持。
至于创业公司与巨头之间的竞争,李志飞认为,以今天中国巨头公司的努力程度,他们的地位很难被颠覆,但他们的AGI方向可能主要是对原有业务的升级,这大概率是巨头的机会。对创业者来说,要可关注新的硬件载体机会。
创业公司如何突出重围?陈石认为应用层创业的要点是技术为先,场景为重。团队首先要懂AI技术,准确地把握技术发展的路径,并将其恰当地应用到场景里。但这只是起点,长期来说,陈石认为一家公司的壁垒是无法靠AI建立的。AI是大模型的能力、大数据集的能力,公司最多掌握了局部的、微调的数据。将对行业纵深的理解和思考形成场景层面的业务闭环,才是建立壁垒的好机会。
关键词: