凯发·K8国际- (中国)登录首页

关于凯发国际K8官网 核心技术 云计算 大数据 物联网 人工智能 产品中心 基础软件 综合数据采集平台 数据交互传输平台 交通地理信息基础平台 专业软件 视频联网监控平台 监控组态平台 数字紧急电话及广播系统 应用软件 (区域、中心级) 高速公路省(区)应急救援管理平台 数字化路网综合监控管理平台 交通物联网运行监测平台 综合交通出行服务平台 应用软件 (路段级) 隧道(群)综合监控管理平台 隧道消防联动及应急处置系统 桥梁监测管理系统 公路治超管理系统 绿通车稽查分析平台 路视通 硬件产品 可编程逻辑控制器(PLC) 分布式可编程电机控制器 US-ISC智能信号控制机 US-ATS智能交通信号机 IP紧急电话及广播终端 超高频RFID射频识别 解决方案 智慧交通 智慧警务 智慧工厂 智慧司法 智慧住建 智慧医疗 智慧城市 智慧教育 智慧林草 联诚云 智慧烟草 凯发k8国际首页登录 凯发k8国际动态 最新消息 媒体报导 行业动态 加入我们
最新消息
———凯发k8国际首页登录
凯发k8官网|川原洋子|热钱仍在涌入大模型圈
2025-03-11最新消息分享

  今天✿✿ღ,面壁智能宣布完成新一轮数亿元融资✿✿ღ。面壁智能CEO李大海在公开信中表示✿✿ღ,将进一步提速以端侧AI为代表的高效大模型商业化布局✿✿ღ。

  云端大模型市场卷生卷死✿✿ღ,端侧逐渐成为大模型公司的新战场✿✿ღ,已经有国内AI公司开始转向端侧✿✿ღ,李大海感受到了水温的变化——“2024年下半年✿✿ღ,行业突然形成新共识✿✿ღ,更高知识密度的小模型和端侧智能✿✿ღ,成为大模型发展的新阶段”

  从2023年末✿✿ღ,面壁智能就聚焦端侧大模型的研发✿✿ღ,“不追热点✿✿ღ,不浪费人才与算力”✿✿ღ,这让它与同期专注通用大模型的公司相比✿✿ღ,显得有些另类✿✿ღ。

  另类还体现在面壁的很多细枝末节✿✿ღ,面壁智能告诉虎嗅✿✿ღ,不同于其他公司✿✿ღ,他们有一个独立的数据团队✿✿ღ,专门处理高质量数据来源和数据配比✿✿ღ。因为对于端侧模型来说✿✿ღ,对高质量数据要求更高——他们的判断是“密度定律推论✿✿ღ,大模型随着时间不断增长✿✿ღ,模型的能力密度每3.3个月翻一倍”✿✿ღ。

  这种另类从它的名字来历也可见一斑✿✿ღ,《三体》中面壁者通过独立思考来抵御三体人的入侵✿✿ღ,承担的是人类历史上最艰难的使命✿✿ღ,肩负着拯救人类的责任凯发k8官网✿✿ღ。

  这是在加入面壁智能前✿✿ღ,李大海向每个核心成员发问的问题✿✿ღ。在得到肯定答复后✿✿ღ,他才决定加入面壁智能✿✿ღ。

  对面壁智能来说凯发k8官网✿✿ღ,商业化与实现AGI同样重要✿✿ღ。他们的策略是✿✿ღ:一方面✿✿ღ,他们依托面壁智能创始人✿✿ღ、清华NLP实验室刘知远教授团队来进行前沿技术的探索✿✿ღ;另一方面✿✿ღ,他们通过商业化落地保持资源竞争力与长期生存✿✿ღ。

  李大海认为“不管是端侧模型还是云端模型✿✿ღ,都需要尽快去把商业闭环先做起来✿✿ღ,让大家看到预期通路是通的✿✿ღ,这是最重要的事情✿✿ღ。”

  这体现在面壁的组织架构上——其中研发团队分为两部分✿✿ღ:一部分负责迭代基础模型✿✿ღ,比如优化MiniCPM的文本和多模态功能✿✿ღ;另一部分形成了一个以技术专家为主导的交付团队✿✿ღ。

  面壁智能告诉虎嗅✿✿ღ,不同于销售型为导向的To B交付团队✿✿ღ,面壁的交付团队是工程师文化浓厚的专家型团队✿✿ღ。这意味着✿✿ღ,他们能够更高效率地做出针对性决策凯发k8官网✿✿ღ,内耗更少✿✿ღ。

  效率是面壁在组织和商业化落地上一直强调的关键词✿✿ღ,这显然是吸取了大模型To B的一些教训✿✿ღ:为企业提供定制化服务的大模型公司凯发k8官网凯发k8官网✿✿ღ,很难去有效压缩成本✿✿ღ。

  大模型的“To B”生意难以压缩成本✿✿ღ,是因为为了满足不同企业的定制化需求时✿✿ღ,大模型公司甚至需要派团队入驻企业✿✿ღ,这种商业模式很难控制人员与工程成本✿✿ღ。

  相对而言✿✿ღ,面壁的优势则在于标准化——他们的每个行业都有相对标准化的流程✿✿ღ。端侧终端行业的标准化✿✿ღ,使得他们可以针对性地快速适配✿✿ღ,不需要从0到1去做研发✿✿ღ。

  面壁智能向虎嗅举了这样一个例子✿✿ღ:首先他们会按照终端客户需求选择适合的模型与功能川原洋子✿✿ღ,其次根据终端的芯片与配置✿✿ღ,去做模型的适配与优化✿✿ღ。

  这意味着✿✿ღ,在搭载这些芯片的终端上✿✿ღ,可以直接复用之前的模型参数配置✿✿ღ,只需要针对终端厂商的要求去做应用层的功能开发✿✿ღ,而不需要再次进行底层的开发✿✿ღ,能够快速落地✿✿ღ。

  “端侧模型的参数量更小川原洋子✿✿ღ,因此对模型的能力密度要求更高川原洋子✿✿ღ。并不是说原来大模型做得很好✿✿ღ,能力就可以直接迁移到小模型✿✿ღ。还需要丰富化的实验手段积累✿✿ღ,做一些有意思的洞察凯发k8官网✿✿ღ,然后慢慢做起来✿✿ღ。”

  因此✿✿ღ,刘知远教授团队近期也在聚焦探索模型的能力密度的提升✿✿ღ。他们提出了大模型的密度定律(densing law)✿✿ღ,引入了衡量大模型性价比的新指标——能力密度(capability density)✿✿ღ。

  面壁这样像虎嗅解释这项工作的重要性✿✿ღ:“模型能力密度提升意味着——如果一个4B的模型能实现40B模型的效果川原洋子✿✿ღ,那么它能搭载运行的终端范围会大大拓宽✿✿ღ,比如原来服务器上的模型✿✿ღ,就可以直接在手机上运行✿✿ღ,它的应用范围也就拓宽了✿✿ღ。”

  不止一家大模型公司✿✿ღ,以及跟大模型有接触的机构✿✿ღ,都提出了一个相似观点✿✿ღ:目前行业的转向部分原因在于✿✿ღ,云端模型同质化严重✿✿ღ,用户看不到明显的差异化✿✿ღ,价格战✿✿ღ、刷榜等乱象横生✿✿ღ。

  “云端模型的故事已经没有太多可以讲的了✿✿ღ,卷价格✿✿ღ、卷服务✿✿ღ,卷到最后谁都没钱赚✿✿ღ。而终端落地更快✿✿ღ、出货量稳定的手机✿✿ღ、PC✿✿ღ、智能座舱硬件仍存在很大的市场增量空间✿✿ღ。”

  在一年前✿✿ღ,面壁预判到了这一问题趋势✿✿ღ,也看到了沿Scaling Law卷大规模外的其他方向川原洋子✿✿ღ,因此从2023年底✿✿ღ,他们开始聚焦端侧模型✿✿ღ。

  大模型正在开始进入真刀真枪的比拼阶段✿✿ღ,从大跃进转向持久战✿✿ღ。通往AGI道路仍然漫长✿✿ღ,面壁也开始加快步伐✿✿ღ。智慧生活✿✿ღ。ChatGPT✿✿ღ。云端计算✿✿ღ,凯发k8凯发国际K8官网✿✿ღ,凯发k8国际✿✿ღ。k8凯发✿✿ღ,

微信公众号

凯发k8国际首页登录科技

微信号:UnionScience

扫描关注,更多最新动态



凯发k8国际首页登录 | 凯发k8国际首页登录 | 凯发k8国际首页登录 | 凯发k8国际首页登录 | 凯发k8国际首页登录 | 网站地图 | 网站地图_m |

0871-63302133 63302233

昆明市盘龙区新兴路霖岚国际凯发k8国际首页登录

http://www.jinfupenquan.com

版权所有 © 2013-2023 凯发k8国际首页登录科技集团股份有限公司 All Rights Reserved 滇ICP备09007384号-1

分享