凯发k8国际首页登录科技
微信号:UnionScience
扫描关注,更多最新动态
智慧生活✿✿,人工智慧✿✿。凯发天生赢家一触即发✿✿。凯发k8国际首页登录✿✿,云端计算✿✿,凯发k8娱乐官网app下载✿✿!ChatGPT✿✿,凯发k8国际随着信息技术迅猛发展✿✿,人工智能成为科技与产业变革的关键力量✿✿。2024 年以来✿✿,AI 基础大模型的能力在多个方面上均有显著提升✿✿:在模型架构与参数规模方面✿✿,一是优化 Transformer 架构并探寻新架构✿✿;二是扩充模型参数量✿✿,强化数据处理与理解能力✿✿,优化运算成本与时间延迟hg0088现金✿✿, 并且大模型的输入和输出均能实现多模态化✿✿。推理与理解能力借助强化学习改进思维链的策略✿✿,使复杂推理任务完成度不断提高✿✿,对自然语言理解更精确✿✿,幻觉现象有所减少✿✿。在合成数据与训练策略上✿✿,部分大模型启用合成数据训练✿✿,利用高效预训练与微调手段✿✿,降低对大规模高质量数据的依赖✿✿,提升整体性能✿✿。与此同时✿✿,基础大模型应用驱动产业创新也正在快速推进✿✿,大模型在社会治理✿✿、智慧城市建设✿✿、公共安全保障等诸多领域为产业创新创造新契机✿✿,正深度融入并重塑行业生态✿✿,开启智能化发展的崭新局面✿✿。
商汤科技在计算机视觉和大模型领域有多年的技术布局和行业应用实践经验✿✿,本期《前沿技术》栏目专访到商汤科技智慧城市与商业事业群副总裁朴元奎✿✿,请他分享多模态大模型在视觉领域带来的技术突破✿✿、发展前景✿✿,以及多模态大模型在智慧城市✿✿、公共安全等行业落地过程中遇到的技术挑战和解决方案✿✿,以飨读者✿✿。
朴元奎✿✿:自ChatGPT 发布以来✿✿, AI 大模型展现出了强大的语言理解和生成能力✿✿,推动了自然语言处理技术的快速发展✿✿。它们能够更准确地理解用户的问题✿✿,生成高质量✿✿、逻辑连贯的回答✿✿,在文本生成✿✿、机器翻译✿✿、问答系统等领域取得了显著的技术突破✿✿,为人们提供了更便捷✿✿、高效的语言交互服务✿✿。同时hg0088现金hg0088现金凯发k8官网下载✿✿,AI 大模型的发展不仅局限于文本领域✿✿,还逐渐向多模态方向延伸✿✿。最新的技术研究开始探索✿✿, 如何将语言模型与图像✿✿、音频✿✿、视频等多模态数据相结合✿✿,实现更全面的智能感知和理解hg0088现金✿✿。例如✿✿,一些大模型可以根据文本描述生成相应的图像或视频✿✿, 或者对多模态数据进行综合分析和处理✿✿,这为人工智能技术范式的升级和应用开辟了新的道路✿✿。
在行业落地方面✿✿,大模型在通用性和灵活性上的表现非常出色✿✿,面对不同行业的通用场景✿✿,例如客户服务✿✿、数据分析✿✿、代码生成等✿✿,通用大模型比传统 AI 技术展现出了更高的智能水平及更大的发展潜力✿✿。
同时✿✿,AI 大模型的出现催生了新的商业模式和产业生态✿✿。一方面✿✿,许多企业开始基于大模型开发各种应用和服务✿✿,为客户提供定制化的解决方案✿✿, 从而获得商业价值✿✿;另一方面✿✿,大模型的训练和部署需要大量的计算资源和数据✿✿,这推动了云计算✿✿、数据中心✿✿、芯片等相关产业的发展✿✿,形成了一个庞大的人工智能产业链✿✿。
最后✿✿,还有一个不可忽视的趋势✿✿,由于大模型无论是训练还是推理都需要大量算力✿✿,大模型的发展实际上让全世界对算力基础设施的关注度大大提升✿✿,也推动了算力的蓬勃发展✿✿,其中包括国内的许多科技公司都纷纷在算力层面加大投入✿✿,以应对大模型的持续迭代和落地✿✿。
朴元奎✿✿:业界把AI 的发展划分为两个阶段✿✿:大模型热潮以前hg0088现金✿✿,以计算机视觉技术为代表的 AI 1.0 时代✿✿,以及大模型横空出世后的 AI 2.0 时代✿✿。
商汤科技在 AI 1.0 时代以出色的计算机视觉能力稳居国内 AI 企业龙头✿✿,面向城市✿✿、医疗✿✿、交通✿✿、金融✿✿、消费✿✿、工业✿✿、物流✿✿、泛互联网等行业提供全面的 AI 解决方案✿✿,深耕各大领域应用场景✿✿,积累了丰富的行业数据和落地经验✿✿。进入 AI 2.0 时代✿✿,商汤科技通过“大模型 + 大装置”战略✿✿,推出“日日新 SenseNova”大模型体系✿✿,致力于低成本实现通用人工智能✿✿,并快速迭代升级至日日新 5.5 版本✿✿。与日日新5.0 相比✿✿,该版本采用混合端云协同专家架构✿✿,有效降低推理成本✿✿,同时基于超过 10TB 的高质量训练数据进行模型训练✿✿,显著提升了推理思维能力✿✿。模型能力平均提升了 30%✿✿,在数学推理✿✿、英文能力和指令遵循等方面表现尤为突出✿✿。
目前✿✿,商汤的日日新大模型体系已服务超过3000 家政府和企业用户✿✿,覆盖互联网凯发k8官网下载✿✿、医疗✿✿、金融和编程等多个垂直行业✿✿。
同时✿✿,商汤科技作为亚洲领先的智能算法供应商和大模型头部企业✿✿,已在算力和算法模型领域建立了亚洲领先优势✿✿。早在大模型热潮兴起之前✿✿,商汤就已前瞻性地认识到算力的重要性✿✿,并着手构建算力平台✿✿。2019 年✿✿,商汤启动了亚洲最大的智算中心建设✿✿,通过技术实践积累了一整套使先进芯片在产业中发挥作用的软件体系和能力✿✿。至今✿✿,商汤已在深圳✿✿、广州✿✿、上海✿✿、重庆等地扩展了新的计算节点✿✿,总算力规模达到 23000petaFLOPS✿✿,能够支持 20 多个千亿级超大模型的并行训练✿✿。
商汤基于十年视觉技术在各行业的深厚积累✿✿, 加入大模型能力✿✿,再结合生态和数据层面的优势✿✿, 如同飞轮般快速运转✿✿,不断扩大竞争优势✿✿,持续迭代✿✿, 以保持行业领先地位✿✿。
《中国安防》✿✿:目前 AI 大模型在智慧城市领域和公共安全领域有怎样的进展?商汤在此细分领域做了哪些实践?
朴元奎✿✿:在过去两年的探索实践中✿✿,商汤将 AI 大模型应用于智慧城市领域和公共安全领域都取得了不错的进展✿✿。
一是政务服务的效率提升与模式创新✿✿。在政务场景中✿✿,AI 大模型能够精准理解市民咨询意图✿✿,将口头咨询自动转化为与之对应的政务事项和流程✿✿, 改变传统的政务办事模式✿✿,提高政务服务的效率和便捷性✿✿。
例如商汤在华南某一线 公共服务便民热线场景中✿✿,实现了对来电信息的信息理解和分类分拨✿✿,并统一了分类标准✿✿。仅在试用期间✿✿,短短一个月内便完成了超 30 万次分拨诉求✿✿,平均每天处理一万余次✿✿,换言之✿✿,大模型让单个分拨员原本一个月的工作量现在仅需一天即可完成✿✿,经过二次复核✿✿,准确率更高达 90% 以上✿✿,助力工单分类分拨速度提升了 10 倍✿✿,大大减少接线员及执行部门的重复工作✿✿,显著提升了工作效率✿✿。
二是城市事件监测与处理效率提升✿✿。结合视频采集设备✿✿,AI 大模型可以对公共区域进行更有效地监控和管理✿✿。不仅可以识别可疑行为和人员✿✿,还能对人群聚集✿✿、交通流量等情况进行分析✿✿,为公共安全管理提供决策依据✿✿。商汤利用多模态大模型的泛场景识别能力✿✿,可以对各类城市异常风险✿✿、隐患✿✿、苗头进行主动识别✿✿。推动了城市管理从“被动巡查” 到“主动处置”✿✿,从“人工倒班”到“AI 智能巡检 - 协同 - 处置”的范式变革✿✿。
城市中还存在着愈加丰富场景中细碎的长尾问题✿✿,传统的计算机视觉技术并不能完全满足城市智能化需求✿✿。而大语言模型的变革✿✿、多模态模型的探索✿✿,为智慧城市的发展打开了新的格局 ✿✿,城市治理hg0088现金✿✿、公共安全✿✿、交通等各个 AI 业务都迎来了新的机遇✿✿。
朴元奎✿✿:我认为多模态大模型在公共安全和智慧城市等场景中可以解决的技术问题主要是以下几个方面✿✿:
1.复杂场景理解✿✿:传统视觉模型通常只能提取图像的底层视觉特征✿✿,对于高层次的语义理解和逻辑推理能力有限✿✿。在复杂场景下✿✿,可能会出现误判或无法准确理解的情况✿✿。比如对于一些伪装或遮挡的物体识别准确率较低✿✿,多模态大模型能够更好地理解复杂的行为和事件✿✿,对于准确识别打架✿✿、盗窃等异常行为✿✿, 即使在人群密集✿✿、光线昏暗等复杂环境下✿✿,也能通过多模态信息的融合提高识别准确率✿✿。在智慧城市中✿✿, 可以对复杂的交通场景进行分析✿✿,如判断交通事故的发生原因✿✿、预测交通流量的变化等✿✿。
2.智能检索与分析✿✿:实现基于跨模态信息的智能检索和分析✿✿。在公共安全领域✿✿,能够根据文本描述或图像特征快速检索相关的监控视频片段✿✿;在智慧城市中✿✿,方便城市管理者快速查找和分析特定事件或现象的相关信息✿✿,提高工作效率✿✿。
3.模型优化与自适应✿✿:通过多模态数据的反馈✿✿, 不断优化模型的性能和参数✿✿,提高模型的自适应能力✿✿。例如✿✿,在治安系统中✿✿,根据新的监控数据和用户反馈✿✿,自动调整模型的识别策略✿✿;在智慧城市应用中✿✿,根据城市的发展变化和新的需求✿✿,实时优化模型的分析和预测能力✿✿。
4.跨模态推理与协作✿✿:进行跨模态的推理和预测✿✿,例如根据图像信息预测相关的文本描述✿✿,或者根据文本信息生成对应的图像内容✿✿。这在公共安全中的案件分析✿✿、智慧城市中的规划设计等方面具有重要的应用价值✿✿,可以帮助相关人员更好地理解和预测各种情况✿✿。同时可以通过AI 智能体技术✿✿,将传统UI 的界面方式✿✿,转化为更人性化的对话式的人际交互能力✿✿, 利用大模型的对话能力✿✿,高效完成人机协作和系统调用✿✿,提高事件处置环节的执行效率和质量✿✿。
《中国安防》✿✿:AI 大模型在公共安全✿✿、智慧城市领域的实际应用过程中✿✿,还有哪些需要突破的技术挑战?商汤应对这些挑战做了哪些工作?
朴元奎✿✿:我认为 AI 大模型在公共安全和智慧城市领域的实际应用过程中面临的技术挑战✿✿,可以从以下几个方面来理解✿✿。
首先✿✿,高质量专业数据的匮乏✿✿。要将 AI 大模型的应用深入到城市各委办局的日常工作任务✿✿,需要具备相关专业知识✿✿,必将经历从 L0 通识模型到 L1 领域模型的过程✿✿。然而✿✿,公共安全和智慧城市领域的专业数据企业不能直接获得✿✿,同时数据的标注工作复杂且耗时✿✿。例如✿✿,对犯罪行为的视频数据进行标注✿✿,需要专业人员准确判断行为的性质和类别✿✿, 稍有偏差可能导致模型跑偏✿✿。对于城市管理中的事件分类标注✿✿,如区分不同类型的城市违规行为✿✿,也需要精确的标注才能让模型准确理解和识别✿✿。提高数据标注的精准性和效率是 AI 大模型应用的关键挑战之一✿✿,需要 AI 企业与政府相关部门通力合作✿✿,共同推动 L1 和 L2 专业模型的训练和生产✿✿。
其次✿✿,模型性能与适应性挑战✿✿。公共安全和智慧城市领域对 AI 大模型的实时性和效率要求较高✿✿。例如在应急响应等场景中✿✿,需要模型能够快速地处理大量的数据并给出准确的预测结果✿✿。然而✿✿,AI 大模型的计算复杂度较高✿✿,训练和推理过程需要消耗大量的计算资源和时间✿✿,难以满足实时性和效率的要求✿✿。因此✿✿,需要研究更高效的计算算法和硬件架构hg0088现金✿✿, 降低模型对计算资源的需求✿✿,提高模型的运行效率✿✿。同时✿✿,充分利用大小模型融合的工程化架构和技术路径✿✿,实现端到端推理成本的有效降低✿✿。
再者✿✿,AI 大模型与现有业务系统集成有难度✿✿。AI 大模型的应用需要与现有的公共安全和智慧城市系统进行集成✿✿,如城市的视频采集系统✿✿、应急指挥系统✿✿、政务管理系统等✿✿。然而✿✿,现有系统的架构和数据格式可能与 AI 大模型不兼容✿✿,需要进行系统改造和升级✿✿。此外✿✿,不同系统之间的数据交互和协同工作也存在挑战✿✿,需要建立统一的数据标准和接口规范✿✿,确保 AI 大模型与现有系统的无缝集成和协同工作✿✿。同时现有城市服务的业务流程也需要适当的改造来适应新的 AI 智能体等应用的协作模式✿✿,实现业务“处置 - 复盘 - 反馈”的闭环✿✿,从而充分发挥 AI 大模型技术下的城市服务的新智生产力✿✿。
针对上述技术挑战✿✿,商汤科技对方舟城市开放平台(SenseFoundry)进行了全面技术升级✿✿,推出了基于“日日新 5.5”大模型体系的方舟多模态新智平台(SenseFoundry VL)✿✿。该平台集成了商汤最新的多模态大模型能力✿✿,具备强大的信息处理和理解能力✿✿,有效应对城市服务场景中的复杂数据和需求✿✿。在国际评测中✿✿,SenseFoundry VL 位列国产化大模型第一梯队✿✿,采用大小模型融合架构✿✿,充分利用现有视频 AI 系统的算力资源✿✿,避免重复建设✿✿,并全面适配主流国产芯片和服务器✿✿,为大模型国产化提供算力保障✿✿。同时✿✿,平台提供定制化开发服务✿✿,支持预置行业知识库和开放应用框架✿✿,满足多元化需求✿✿。商汤算力储备✿✿、大模型迭代效率和视觉技术积累共同支撑了 SenseFoundry VL 的发展✿✿。未来✿✿,商汤将继续投入研发✿✿,推动 AI 大模型与智慧城市建设的深度融合✿✿,激活城市服务新质生产力✿✿。
《中国安防》✿✿:您认为大模型还在哪些领域展现出了强大的应用潜力✿✿,商汤科技在这些领域有什么实践?
朴元奎✿✿:大模型的突破掀起了人工智能的新一轮技术革命hg0088现金✿✿,随之而来的是产业需求呈现爆炸式增长✿✿,全新的应用场景和应用模式正迅速涌现✿✿。
在金融领域✿✿,商汤与金融机构合作✿✿,通过数字人实现智能客服和营销✿✿,同时利用大语言模型提供投研分析和研报撰写✿✿,推出金融智脑Agent✿✿,提升合规✿✿、营销辅助等方面的效率✿✿。在医疗健康领域✿✿,商汤打造了“大医”医疗大模型✿✿,覆盖 20 余个医疗场景✿✿,成为医生和患者的智能助手✿✿。在智能汽车领域✿✿, 商汤绝影融合 AI 技术✿✿,构建了“驾 - 舱 - 云”三位一体的 AGI 技术架构✿✿,推动智能汽车向超级智能体进化✿✿。在文旅领域✿✿,商汤文旅大模型大幅提升旅行规划和票务预定效率✿✿,同时提供AR凯发k8官网下载✿✿、VR 等技术✿✿,提升文旅服务质量✿✿。在能源领域✿✿,商汤能源行业大模型助力电网智能化升级✿✿,构建智慧虚拟电厂系统✿✿, 提高运维效率✿✿,并开发基于大语言模型的智能办公应用✿✿,实现知识管理和智能问答✿✿。
《中国安防》✿✿:针对未来 AI 行业的发展趋势✿✿,商汤科技有哪些前瞻性的技术布局✿✿,以保持行业领先地位?
朴元奎✿✿:当下正处在 AGI 的转折点✿✿,全人类对AI 和算力的需求正在飞速跃升✿✿,在人工智能2.0 时代✿✿,商汤的核心战略是无缝集成数字基础设施✿✿、人工智能模型和应用✿✿,商汤将以此为基础✿✿,推动新一轮创新✿✿。这意味着商汤未来的目标是成为全面了解人工智能模型的领先基础设施服务商✿✿,同时也是以最有效的方式利用最佳基础设施的人工智能模型服务商✿✿。基于“算力基建– 大模型– 应用”三位一体的战略✿✿, 商汤正在建设中国最大的 AI 云服务之一✿✿。
此外凯发k8官网下载✿✿,强大的基础模型是大模型时代竞争的另一个关键点✿✿,它为下游行业应用的落地提供了竞争力基础✿✿。构建强大的基础模型与以下几点密不可分✿✿:
第一个是加强我们的基础设施✿✿,用于大模型训练和推理服务✿✿。我们的大装置支持几千卡并行✿✿,进行大规模模型的训练✿✿,并且也能够在线上提供非常高效的大模型推理服务凯发k8官网下载✿✿。在过去几年✿✿,我们整体基础设施的效率和稳定性都有了长足提升✿✿,这为我们商业服务在基础设施层面提供了非常好的能力基础✿✿。
第二✿✿,要训练强的基础模型✿✿,关键在于数据✿✿。其实数据的总量不一定是最主要的壁垒✿✿,更重要是有没有一个足够强的高吞吐量的数据清洗能力✿✿。过去一段时间✿✿,我们花费很大力气进行数据清洗✿✿、技术打磨✿✿, 在这个过程中我们也会监测每一版清洗技术给模型各方面能力所带来的提升✿✿。在这样的支撑下✿✿,我们也形成了一套非常高效的闭环进行模型的训练✿✿。
第三✿✿,是行业落地✿✿。大模型需要在行业落地✿✿, 给应用赋能✿✿,给客户赋能✿✿。对此✿✿,商汤也投入了很多的研发团队✿✿,依托基础能力✿✿、基础模型✿✿,快速迭代我们在行业落地的产品和方案✿✿。
另外✿✿,我们的推理计算效率也得到了显著改进✿✿。在大模型与具体场景结合的过程中✿✿,我们拥有深厚的技术储备✿✿,特别是在工具和插件调用等方面✿✿,商汤科技的体系已经完全成熟✿✿。当面对一个新客户的 API 时✿✿, 我们可以与他的系统快速连接✿✿,发挥实际价值✿✿。
总之✿✿,商汤科技领先的人工智能技术在过去十年的商业化实践中历经了长期的探索和验证✿✿。在未来 AI 行业发展浪潮中✿✿,商汤将围绕“算力基建 – 大模型 – 应用”三位一体战略全面布局✿✿,持续发力✿✿, 为客户带来长远价值✿✿,赋能千行百业✿✿。
0871-63302133 63302233
昆明市盘龙区新兴路霖岚国际凯发k8国际首页登录
http://www.jinfupenquan.com