今年6月份,红杉资本合伙人 David Cahn(大卫·卡恩)曾提出的“AI 支出6000亿美元难题”,即 AI 基础设施的巨额投资,和实际的AI生态系统实际收入之间的巨大差距,一度成为整个 AI 领域都非常关注的话题。
在刚刚过去的 RTE2024 主论坛圆桌讨论环节,Lepton AI 创始人兼 CEO 贾扬清、面壁智能联合创始人&CTO 曾国洋、MiniMax 合伙人魏伟、Hugging Face 工程师王铁震、Agora 联合创始人 Tony Wang五位嘉宾围绕“AI 的6000亿美元难题:从基础设施到商业化落地”主题展开了探讨。
以下为圆桌论坛精彩观点整理,与大家分享:
Q1:如何看待商用大模型和开源大模型未来的发展趋势、以及各自的优势和挑战?
贾扬清:我认为,大模型在未来会有两个趋势。其一,同等质量模型的Size会越来越小,计算效率会越来越高,模型架构也会变得更加开放和标准。其二,除了极少数头部公司外,越来越多的企业会采用开源架构来做下一代模型。因此,开源架构的应用会变的越来越普遍,通过开源架构训练出来的模型也会有不同的风格。
王铁震:开源模型会变得越来越强,同样性能下模型 Size 正在逐渐下降。未来,我们将看到越来越多 Infra 和 Realtime 的工作。除了开源模型本身需要之外,开源模型的基础设施和数据闭环也应逐渐被重视。因为只有如此,开源模型才能跑得更好、更快。Realtime 需要TTS、也需要大模型,如果能够通过一些方式放在一起,放在边缘侧、离用户更近的地方,才能产生更好的效果。
曾国洋:未来大家可能会比较少提到商业模型,因为最终商业化的都是产品。相比商业模型,开源模型一个最大的优势就是有社区,社区迭代速度更快,周边生态也更容易建设起来,这也是面壁智能做开源模型的原因。从应用的角度来说,现在很多人都是网上找开源模型,再结合业务微调一下就可以使用了。但从更长远来看,模型要做的事情很多,目前还没达到用开源模型解决所有事情的状态。
Tony Wang:这个问题可以类比互联网早期, Linux 的开源版本也很多,但实际的应用支持情况并不能完全满足需求。大模型同样如此,大部分的开源社区都倾向于学术和研究突破,而并非服务于商业化落地。所以我认为商业大模型在未来还是会有很强的竞争力。
Q2:如何看待音视频大模型的应用潜力、以及安全挑战?
魏伟:随着多模态的出现,生成式人工智能的应用边界会被继续拓展,大模型一定会从单一的文本模型向多模态进化,并加速产业的变革。MiniMax 在产品研发和用户服务过程中有一个很明显的感受是,文本、语音、音乐、视频等模型可以很好的帮助艺术、影视、音乐等领域的创作者们极大地提高效率,并为他们提供新的思路和方法。
当然,音视频大模型在应用过程中所面临的挑战也不少。相比单一的文本模型,数据量将出现指数级增长,模型训练推理成本也会随之增加。除此之外,算法和技术架构的选择、多模态的安全合规问题,可能都需要付出更高的代价。
贾扬清:关于多模态大模型的安全合规问题,我认为 AI 安全并没有跳出传统数据安全的藩篱,至少目前还未在应用层面带来困扰。
王铁震:现在担心 AI 会取代人类还为时过早,虽然目前出现了一些像视频上以假乱真这类的现象,但业内还是可以采用强制性地在服务端加上水印等方法去避免,未来也可能会形成行业标准或者法律。这个维度的商业化机会还是非常多的。
Q3:OpenAI 推出 Realtime API 之后,大部分终端用户都想拥抱,但成本是一个巨大的问题。如何看待大模型应用过程中的成本问题?
贾扬清:今天如果去做 7 X 24 小时的实时语音识别、内容理解等,成本确实还很贵。我认为Token 推理的成本在未来一年可能还会降低10倍,模型在优化,硬件也在不断进化,当应用上量以后,一定会出现各种 Specialized Hardware(专业硬件),到时候成本可能还会成几十倍、甚至百倍地降低。对于一个以应为中心的公司来说,我觉得成本在未来不太会成为主要阻碍,更多的可能还是关注用户活跃度、用户对于产品的喜爱程度、用户量等一系列传统的应用指标。
魏伟:目前国内的情况是,文本模型的成本从去年到今年降了差不多100倍,我们认为未来还会有10倍甚至更多的空间,从模型参数量、算法和技术架构角度都会有很大空间。MiniMax 的主要方向还是偏模型+应用,所以我们更加关注模型的效果,先把效果做上去再来优化成本。Realtime API 也是如此,我们先看场景和效果能不能解决问题,再谈成本优化会好一些。
曾国洋:随着技术的发展,算力一定会变得越来越便宜,相同能力的模型规模也会越来越小,但算力成本优化会最终转化为训练更强大的模型。在真正达到 AGI 水平之前,我们只能感受到模型在变得越来越强,很难感受到成本的变化。由于面壁智能是做端侧模型的,所以很关注如何让模型在端上跑得更快,在实际部署过程中,我们会用各种量化压缩甚至是稀疏化方法去优化实际部署的开销。
王铁震:我们不能只关注成本,还要看客户的需求。很多场景价值是不一样的,以视频生成场景为例,如果效果上超过电影级别、且不需要多次生成,我相信也会有很多人愿意做。我们并非需要等到模型成本足够低的时候再去找用户愿意付费的市场,聚光灯下都是红海,但一些还未被 AI 照耀到的领域,或许还有很多潜在的机会。
Q4:大模型的商业化选择很多,到底应该To B 还是 To C?如何克服To B 、To C 中的难点?
魏伟:不管To C 和To B 都是我们触达用户的手段。在 C 端,我们做了包括星野、海螺在内的娱乐和生产力工具,我们每天跟全球用户有30亿次的大模型请求,能拿到很多反馈和场景能力的提升。在 B 端,我们提供了一整套工程方案,用工程化的思路去做 prompt 的优化,例如培育 Agent 建设,以及产品与Agent结合的体系等等,从而拿到更多的反馈。对 MiniMax 来说,当下最关键的还是不断探寻模型边界,拿到更多的反馈,用技术驱动模型效果的提升。
曾国洋:To B 和 To C 的选择其实和每个公司自身发展阶段有一定关系,在 To C 上面,目前大模型确实也有一些像AI搜索、代码 Copilot 和类似陪伴应用这样跑得比较好的商业模式。站在面壁的角度来看,To C 对于创业公司的机会,不如巨头的机会大。但是随着模型能力的发展,未来能做的事一定会越来越多,例如引入更多的模态,做To C的探索空间也会越来越大。
王铁震:我觉得对于很多公司来讲, 如何抓住核心用户,抓到流量是很重要的,例如如何拿到一些 KOL 的转发,还是很值得研究的。另外,做开源的本质诉求就是获得知名度,把蛋糕做大,哪怕只切其中一点小的份额,也比不开源,自己闷头做,什么都拿不到要强的多。所以肯定需要容忍一些客户,不需要商业服务就转化,这要看面向的开发者群体是什么,如果是互联网公司,可能就赚不到实际的收入。但如果是面向传统的公司,他们自己不愿意投入更多精力,更愿意买一个有质量保障的服务,更愿意跟小的创业公司去合作,拿到一些市场份额。
贾扬清:Lepton AI 是一个平台公司,我们希望所有的客户都成功。在我看来,To B 和To C会有不同的挑战,To C 的挑战很简单,一方面是需要有新颖的产品能力和过硬的产品质量,另一方面需要找到attention和流量。To B 这一块大家可以关注一些小B,例如小红书上的一些大 V,他们很多都愿意为了效率而付费。这些 AI 所带来的新机会,其实并非需要多大的团队,10-20人的小团队,加上 AI 算法,再加上非常新颖和深入的产品理解就可以做起来。
Tony Wang:To B 和 To C 其实没那么重要,更多的其实还是靠技术驱动、技术领先去赋能现有的实际场景。真正想要推动 GPU 到 AI Infra 到模型、再到商业化落地,技术驱动和成本是最核心的两个点。
Q5:未来两年 AI 行业会有什么变化?
贾扬清:未来两年,成本的下降会让大家忘掉GPU、忘掉AI Infrastructure,选择直接把 AI 标准件嵌入到自己的应用。也确实只有将把90%的精力花在构建好的 APP 和产品上,效率才真正有可能成倍提升。
魏伟:第一,随着模型的错误率被持续优化和下降,未来会有越来越多的场景出现。第二,成本这一块可以更乐观,但更大的应用场景也会倒逼底层基础设施进化。最后是,多模态的生成和反向理解都会越来越普遍,从技术、产品到运营都会更方便的使用大模型。
曾国洋:关于未来是不是一个模型就 good enough 的问题。暂时不能确定两年后有没有什么路径可以把模型的效果堆上去,但从长远来看,模型的能力肯定会越来越强,后面应该只需要一个模型就确实够了。这个问题我们可以参考“人”来看,人有不同的职业分工,也有不同领域的专家,也许到时候大家的认知就是我要做某件事应该找这个领域的专家,以后大模型的发展也会朝着这个方向进化。
这是最卷的时代,也是最好的时代,作为第三次工业革命,我们很有幸 Be part of it,Tony Wang总结到。
1、本站所展示的图文内容仅为品牌方对外宣传的广告信息,品牌方对其合规性负责。
2、任何机构不得将本站所展示的图文内容用于其他用途,取的授权的情况除外。
3、本站所展示内容如有错误的情况,品牌方可联系管理员删除。