DeepSeek开启国产GPU适配之路,摆脱对英伟达CUDA的依赖
中国芯,破英卡:DeepSeek引领国产GPU新风潮
据报道,DeepSeek正在努力适配国产GPU,这无疑是一个重大的好消息。在开发大型模型的过程中,DeepSeek选择了避开英伟达的CUDA系统,这样可以直接利用GPU的驱动函数进行创新开发,从而实现更精细的操作。
例如,DeepSeek在进行多节点通信时选择绕过CUDA,直接采用PTX(Parallel Thread Execution)。这种方式最多只能通过算法高效利用硬件层面的加速。
一旦速度变得更快,这意味着其他公司的模型可能需要十天才能完成训练,而DeepSeek只需五天。这不仅节省了时间,还让DeepSeek能够向模型中输入更多的数据,在相同的时间内使模型接触到更多样化的信息,从而间接提升模型的整体效果。这样的效率提升对于加速人工智能技术的发展具有重要意义,也表明了DeepSeek在优化算法和计算资源利用方面已经取得了显著的进步。
据消息人士透露,DeepSeek公司内部拥有一批精通PTX语言的开发者。 在我看来,这表明DeepSeek在技术开发方面具备一定的实力,特别是在PTX语言的应用上。这不仅有助于公司在相关技术领域保持竞争优势,也可能为其未来的产品创新提供强有力的技术支持。然而,要保持这种优势,公司还需要持续投入资源培养和吸引人才。
那么,如果以后采用国产GPU,在硬件适配上将会更为顺畅。只需熟悉这些硬件驱动提供的基础函数接口,就可以参照英伟达GPU的编程接口来编写相关代码,从而使自家的大模型更容易适配国产硬件。