凯发k8国际首页登录科技
微信号:UnionScience
扫描关注,更多最新动态
今天✿✿ღ,面壁智能宣布完成新一轮数亿元融资✿✿ღ。面壁智能CEO李大海在公开信中表示✿✿ღ,将进一步提速以端侧AI为代表的高效大模型商业化布局✿✿ღ。
云端大模型市场卷生卷死✿✿ღ,端侧逐渐成为大模型公司的新战场✿✿ღ,已经有国内AI公司开始转向端侧✿✿ღ,李大海感受到了水温的变化——“2024年下半年✿✿ღ,行业突然形成新共识✿✿ღ,更高知识密度的小模型和端侧智能✿✿ღ,成为大模型发展的新阶段”
从2023年末✿✿ღ,面壁智能就聚焦端侧大模型的研发✿✿ღ,“不追热点✿✿ღ,不浪费人才与算力”✿✿ღ,这让它与同期专注通用大模型的公司相比✿✿ღ,显得有些另类✿✿ღ。
另类还体现在面壁的很多细枝末节✿✿ღ,面壁智能告诉虎嗅✿✿ღ,不同于其他公司✿✿ღ,他们有一个独立的数据团队✿✿ღ,专门处理高质量数据来源和数据配比✿✿ღ。因为对于端侧模型来说✿✿ღ,对高质量数据要求更高——他们的判断是“密度定律推论✿✿ღ,大模型随着时间不断增长✿✿ღ,模型的能力密度每3.3个月翻一倍”✿✿ღ。
这种另类从它的名字来历也可见一斑✿✿ღ,《三体》中面壁者通过独立思考来抵御三体人的入侵✿✿ღ,承担的是人类历史上最艰难的使命✿✿ღ,肩负着拯救人类的责任凯发k8官网✿✿ღ。
这是在加入面壁智能前✿✿ღ,李大海向每个核心成员发问的问题✿✿ღ。在得到肯定答复后✿✿ღ,他才决定加入面壁智能✿✿ღ。
对面壁智能来说凯发k8官网✿✿ღ,商业化与实现AGI同样重要✿✿ღ。他们的策略是✿✿ღ:一方面✿✿ღ,他们依托面壁智能创始人✿✿ღ、清华NLP实验室刘知远教授团队来进行前沿技术的探索✿✿ღ;另一方面✿✿ღ,他们通过商业化落地保持资源竞争力与长期生存✿✿ღ。
李大海认为“不管是端侧模型还是云端模型✿✿ღ,都需要尽快去把商业闭环先做起来✿✿ღ,让大家看到预期通路是通的✿✿ღ,这是最重要的事情✿✿ღ。”
这体现在面壁的组织架构上——其中研发团队分为两部分✿✿ღ:一部分负责迭代基础模型✿✿ღ,比如优化MiniCPM的文本和多模态功能✿✿ღ;另一部分形成了一个以技术专家为主导的交付团队✿✿ღ。
面壁智能告诉虎嗅✿✿ღ,不同于销售型为导向的To B交付团队✿✿ღ,面壁的交付团队是工程师文化浓厚的专家型团队✿✿ღ。这意味着✿✿ღ,他们能够更高效率地做出针对性决策凯发k8官网✿✿ღ,内耗更少✿✿ღ。
效率是面壁在组织和商业化落地上一直强调的关键词✿✿ღ,这显然是吸取了大模型To B的一些教训✿✿ღ:为企业提供定制化服务的大模型公司凯发k8官网凯发k8官网✿✿ღ,很难去有效压缩成本✿✿ღ。
大模型的“To B”生意难以压缩成本✿✿ღ,是因为为了满足不同企业的定制化需求时✿✿ღ,大模型公司甚至需要派团队入驻企业✿✿ღ,这种商业模式很难控制人员与工程成本✿✿ღ。
相对而言✿✿ღ,面壁的优势则在于标准化——他们的每个行业都有相对标准化的流程✿✿ღ。端侧终端行业的标准化✿✿ღ,使得他们可以针对性地快速适配✿✿ღ,不需要从0到1去做研发✿✿ღ。
面壁智能向虎嗅举了这样一个例子✿✿ღ:首先他们会按照终端客户需求选择适合的模型与功能川原洋子✿✿ღ,其次根据终端的芯片与配置✿✿ღ,去做模型的适配与优化✿✿ღ。
这意味着✿✿ღ,在搭载这些芯片的终端上✿✿ღ,可以直接复用之前的模型参数配置✿✿ღ,只需要针对终端厂商的要求去做应用层的功能开发✿✿ღ,而不需要再次进行底层的开发✿✿ღ,能够快速落地✿✿ღ。
“端侧模型的参数量更小川原洋子✿✿ღ,因此对模型的能力密度要求更高川原洋子✿✿ღ。并不是说原来大模型做得很好✿✿ღ,能力就可以直接迁移到小模型✿✿ღ。还需要丰富化的实验手段积累✿✿ღ,做一些有意思的洞察凯发k8官网✿✿ღ,然后慢慢做起来✿✿ღ。”
因此✿✿ღ,刘知远教授团队近期也在聚焦探索模型的能力密度的提升✿✿ღ。他们提出了大模型的密度定律(densing law)✿✿ღ,引入了衡量大模型性价比的新指标——能力密度(capability density)✿✿ღ。
面壁这样像虎嗅解释这项工作的重要性✿✿ღ:“模型能力密度提升意味着——如果一个4B的模型能实现40B模型的效果川原洋子✿✿ღ,那么它能搭载运行的终端范围会大大拓宽✿✿ღ,比如原来服务器上的模型✿✿ღ,就可以直接在手机上运行✿✿ღ,它的应用范围也就拓宽了✿✿ღ。”
不止一家大模型公司✿✿ღ,以及跟大模型有接触的机构✿✿ღ,都提出了一个相似观点✿✿ღ:目前行业的转向部分原因在于✿✿ღ,云端模型同质化严重✿✿ღ,用户看不到明显的差异化✿✿ღ,价格战✿✿ღ、刷榜等乱象横生✿✿ღ。
“云端模型的故事已经没有太多可以讲的了✿✿ღ,卷价格✿✿ღ、卷服务✿✿ღ,卷到最后谁都没钱赚✿✿ღ。而终端落地更快✿✿ღ、出货量稳定的手机✿✿ღ、PC✿✿ღ、智能座舱硬件仍存在很大的市场增量空间✿✿ღ。”
在一年前✿✿ღ,面壁预判到了这一问题趋势✿✿ღ,也看到了沿Scaling Law卷大规模外的其他方向川原洋子✿✿ღ,因此从2023年底✿✿ღ,他们开始聚焦端侧模型✿✿ღ。
大模型正在开始进入真刀真枪的比拼阶段✿✿ღ,从大跃进转向持久战✿✿ღ。通往AGI道路仍然漫长✿✿ღ,面壁也开始加快步伐✿✿ღ。智慧生活✿✿ღ。ChatGPT✿✿ღ。云端计算✿✿ღ,凯发k8凯发国际K8官网✿✿ღ,凯发k8国际✿✿ღ。k8凯发✿✿ღ,
0871-63302133 63302233
昆明市盘龙区新兴路霖岚国际凯发k8国际首页登录
http://www.jinfupenquan.com