100

商汤日日新

商汤科技推出的“日日新SenseNova”大模型体系是面向通用人工智能(AGI)开发的多模态深度学习平台,其核心特点包括持续迭代的技术架构、多模态融合能力以及广泛的应用场景。

商汤科技推出的“日日新SenseNova”大模型体系是面向通用人工智能(AGI)开发的多模态深度学习平台,其核心特点包括持续迭代的技术架构、多模态融合能力以及广泛的应用场景

商汤日日新 - 大模型应用矩阵

日日新SenseNova的技术架构

大模型体系自2023年4月首次发布后持续升级,采用混合专家(MoE)架构、10TB tokens的高质量训练数据,并引入云边端协同优化技术。

  • 2023年初版:包含1800亿参数的中文语言模型“商量SenseChat”(支持编程、医疗等场景)和全球最大320亿参数通用视觉模型。
  • 2024年版本:推出“日日新5.0”对标GPT-4 Turbo,综合推理、代码生成等能力接近或超越GPT-4;同年7月发布的“日日新5.5”进一步降低推理成本,端侧模型效率提升15%。

日日新的多模态能力

模型原生融合文本、图像、视频、语音等多模态处理能力,支持复杂任务分析。

  • 文生图工具“秒画”可生成6K高清图,数字人生成工具“如影”和3D建模工具“琼宇”覆盖游戏、直播等领域。
  • 金融场景中实现监管问答、文档摘要生成;编程助手提升效率62%,医疗问诊助手已落地医院。

日日新大模型的应用

通过“大模型即服务(MaaS)”模式,提供自动化数据标注、模型训练部署等工具链,显著降低客户开发成本。2023年生成式AI业务收入达12亿元,同比增长200%,占集团营收35%。合作案例包括越秀集团AI中台建设,实现多业务场景降本增效。

日日新的算力基础

依托商汤AI大装置SenseCore,拥有27000块GPU芯片和5.0 exaFLOPS总算力,支持万亿参数模型训练。

商汤“日日新”大模型是国内AGI领域的重要参与者,覆盖金融、医疗、制造等多元化场景。