联系销售:中国:4009-606-596
海外:(+86)19926675216
立即咨询

鲲云科技CAISA 430适配DeepSeek R1推理,开启高效AI应用新时代

作者:鲲云小编
发布时间:2025-02-08 03:38:48
阅读量:250
鲲云科技全新一代的可重构数据流 AI 芯片 CAISA 430 成功适配 DeepSeek R1 蒸馏模型推理,这一创新举措为大模型应用的高效部署带来了全新的解决方案,标志着可重构数据流 AI 技术与大模型融合发展的又一重要里程碑,也展示了鲲云科技的可重构数据流技术的技术通用性和生态友好。

全新一代可重构数据流 AI 芯片 CAISA 430
此次适配的 CAISA 430 芯片是鲲云科技基于第四代可重构数据流架构技术研发,于 2023 年底回片,并于 2024 年实现量产,相较于上一代产品,其实测性能、通用性等关键指标实现了跨越性提升。该芯片采用国内成熟的 12nm 制程工艺生产,端到端芯片利用率最高可达 90%,有效算力指标表现突出。此外,凭借鲲云自主研发的 RainBuilder 编译工具链,CAISA 430 支持所有常用的 AI 算子和算法模型,展现出强大的通用性,可以满足不同深度学习算法的推理需求。
 Rainbuilder 编译工具链
鲲云科技基于 CAISA 芯片推出了一系列 AI 算力产品,包括面向边缘端、数据中心进行深度学习推断的 AI 专用计算加速的星空加速卡 X3、X3A、N460H,面向低算力场景的星空 X6A、N430S/P/E 边缘小站,以及基于星空加速卡系列推出的智能计算服务器等,为计算机视觉、语音语义及大模型应用提供高性能、低延时、高算力性价比的 AI 算力支持。
高效适配,为 DeepSeek R1 推理提供底层 AI 算力支持
DeepSeek R1 作为一款先进的推理模型,基于 Transformer 架构,其参数规模庞大,对硬件的计算能力和内存容量提出了极高要求。CAISA 430 芯片凭借其高算力性价比和强大的通用性,能够为 DeepSeek R1 推理提供有力支持。CAISA 430 的高芯片利用率确保了在处理大规模模型时能够充分利用硬件资源,减少计算资源的浪费,从而提高推理效率。同时,CAISA 430 的可重构数据流架构能够根据 DeepSeek R1模型的特点进行动态配置,生成面向该模型的高性能定制化流水线,进一步优化推理性能。
  DeepSeek R1 Llama 8B模型在RainBuilder上编译过程图示
鉴于 CAISA 430 强大的通用性,原生支持 DeepSeek R1 蒸馏模型的开源基础模型,DeepSeek R1 的QWen和 Llama 模型可直接在 CAISA 430 上运行,不需要复杂的适配工作,技术团队主要进行了精度验证和性能优化,适配模型包括已发布的 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Llama-70B。

  DeepSeek R1 Llama 8B模型运行图示
大模型友好:助力 AI 应用高效部署,加速人工智能落地
在大模型时代,如何高效地部署和运行这些模型成为了一个关键问题。CAISA 430 芯片的适配为 DeepSeek R1 推理提供了更加灵活和高效的解决方案,能够为不同规模和需求的 AI 项目提供底层算力支持。

  • 对高精度和强大推理能力的应用场景,CAISA 430 能够充分发挥其高实测性能的优势,满足 DeepSeek R1 模型的计算需求。

  • 对资源有限的应用场景,CAISA 430 的通用性和可重构性让用户可以根据实际情况对模型进行优化和调整,降低硬件资源的消耗。

基于可重构数据流架构底层优势,适配后的CAISA430芯片算力产品的优势主要体现在:

  • 产品形态多样:支持边缘盒子、一体机、AI 服务器、算力中心服务器集群等边缘至中心不同产品形态,适配不客户不同场景的AI推理需求;

  • 适配算法丰富:配套的星云 AI 开发平台支持超过 400 种视觉模型、视觉大模型、大语言模型等算法模型,可灵活搭配按需使用,无论是复杂的视觉识别任务还是大规模的语言处理应用,都能高效运行;

  • 行业方案落地:配套的星空系列算力平台,提供深入行业、满足行业需求的 AI 解决方案,当前已落地覆盖超过 30 个行业,帮助客户加速落地智能化项目。

截止到目前,CAISA 系列芯片产品已服务上千客户,落地 5000+项目,实现规模化的业务落地,充分验证了商业可行性。
CAISA 芯片在短时间内快速完成DeepSeek R1 大模型适配,充分展示了 CAISA 系列可重构数据流架构芯片在高算力利用率的同时,可以做到对于深度学习算法的通用、便捷、快速支持,体现了 CAISA 芯片与工具链经过 4 代架构迭代后的深厚积累。未来,鲲云科技将沿着 CAISA 创新架构的全新技术路线,提供下一代计算平台基座,加速千行百业人工智能产品落地。


分享:

提供下一代计算平台 加速人工智能落地

中国:4009-606-596
海外:(+86)19926675216

联系我们:contact@corerain.com

销售联络:sales@corerain.com

媒体合作:media@corerain.com

展会合作:events@corerain.com

深圳 | 深圳市福田保税区市花路长富金茂大厦14层(总部)

上海 | 上海市闵行区龙湖虹桥天街A栋608A

济南 | 山东省济南市济南市高新区旅游路8661号高科技创新园 5 号楼 9 层

北京 | 北京市海淀区知春路23号4层406A室

西安 | 陕西省西安市碑林区大差市十字西南角1幢1单元10503室 (万达新天地)

广州 | 广东省广州市番禺区钟村街钟二村钟汉路13号星光荟直播小镇508A

重庆 | 重庆市九龙坡区渝州路121号A区D207

杭州 | 杭州市江干区钱江新城城星路98号迪凯城星国际A座27楼

南京 | 江苏省南京市鼓楼区汉中路2号亚太商务楼31层

武汉 | 湖北省武汉市武昌区中南路街街道武珞路与丁字桥交汇路口中南国际汇18楼OVU创客星(理想国际站)

在线咨询
电话咨询
中国:4009-606-596
海外:(+86)19926675216
商务合作
回到顶部
  • *您的姓名

  • *您的电话

  • *邮箱地址

  • *公司名称

  • *

  • *

  • *

  • 验证码

  • 我已阅读并同意《使用服务协议》《隐私政策声明》