长江计算 G440K V2 服务器成功实现 DeepSeek 系列模型推理适配和性能优化
长江计算 G440K V2 服务器:实现深度学习模型推理的性能革命
2月7日,烽火通信科技股份有限公司发布消息称,旗下长江计算近日与昇腾、华为云团队合作,成功帮助某国有大型银行完成了DeepSeek-V3大模型的本地化推理服务部署。 这一成就不仅标志着中国在人工智能领域的技术实力再次得到验证,也展示了国内企业在推动金融行业数字化转型方面的强大能力。通过本地化部署,该国有大行不仅能更好地控制数据安全和隐私保护,还能够更灵活地根据自身业务需求进行定制化调整,从而提升整体运营效率和服务质量。
本次部署采用长江计算G440KV2服务器,借助MindIR推理引擎,在华为云AI开发平台ModelArts上完成。
据介绍,G440KV2服务器由长江计算自主设计,已成功实现对DeepSeek系列模型的推理适配与优化。该服务器采用高效的八模组推理架构,能够提供强大的AI推理性能,以满足DeepSeek大模型的算力需求。
从烽火通信了解到,该公司推出的服务器在内存带宽和网络连接方面表现出色。在DeepSeek系列模型的应用中,该服务器能够提升模型的推理速度、响应效率以及数据处理能力,满足多机集群推理的需求。目前,它已被应用于智能客服、文本生成和知识管理等大模型推理场景,并且在部署过程中保障了数据的安全性和自主可控性。