商汤大模型

商汤科技作为中国人工智能领域的领军企业,其大模型技术以“日日新SenseNova”体系为核心,展现出多模态能力、高效算力支撑和广泛的应用场景。

商汤科技作为中国人工智能领域的领军企业,其大模型技术以“日日新SenseNova”体系为核心,展现出多模态能力、高效算力支撑和广泛的应用场景。

商汤大模型 - SenseTime AI引领人进步

商汤大模型的技术创新

商汤的“日日新SenseNova”大模型体系包含语言、图像、多模态等多种模型。例如:

  • 语言模型:如“商量”(1800亿参数)支持编程助手、问诊助手等场景,编程效率提升62%,医疗场景已在多家医院落地。
  • 多模态模型:2024年发布的“日日新5.5”是国内首个流式多模态交互大模型,性能对标GPT-4o,支持跨模态信息整合与动态推理。其升级版“日日新5.5 Lite”优化了端侧部署,推理效率提升15%,成本低至每年9.9元/台。
  • 生成式工具:如文生图工具“秒画”、数字人生成工具“如影”、3D建模工具“格物”等,覆盖创意设计、游戏、直播等领域。

SenseCore AI大装置

商汤通过自研的AI基础设施SenseCore整合算力、算法与数据,支持大模型高效训练与部署:

  • 算力规模:AI计算中心(AIDC)拥有27000张GPU卡,支持20个千亿级参数模型同时训练,推理效率提升100%,增量微调成本降低90%。
  • 数据支撑:多模态数据集OmniObject3D包含6000+物体扫描数据,为3D生成、点云识别等任务提供高质量数据。

商汤大模型的应用场景

  • 医疗:智能陪诊助手辅助新华医院等机构,提升诊疗效率。
  • 办公与终端:PDF阅读助手、端侧写作/总结工具等覆盖智能手机、车载设备等IoT场景。
  • 工业与创意:3D物品生成工具“格物”实现低成本精准建模,适用于家居设计与广告投放。
  • 商业化表现:2024年上半年生成式AI收入占比超60%,2023年相关收入增长200%。

商汤大模型的生态

商汤坚持开放生态,支持第三方模型(如DeepSeek、Llama)与自研模型协同,通过模型定制和端到端服务降低企业应用门槛。计划进一步融合语言与多模态模型,打造一体化AGI系统。