如下: 大浪资讯:AMD全新开源3B参数语言模型Instella亮相,性能直追Llama-3.2-3B与Qwen2.5-3B

admin252025-03-06 14:34:45

最新资讯:AMD开源Radeon RX 9070 Linux驱动及Instella语言模型

3月6日,大浪资讯报道—— AMD公司今日传来重磅消息,宣布对Radeon RX 9070系列显卡的Linux驱动程序进行开源,同时,一款名为Instella的全新开源3B参数语言模型也同步亮相。

Instella:完全开源的尖端语言模型

AMD的Instella被定义为“完全开源的尖端30亿参数语言模型(LMs)”。该模型在AMD的Instinct MI300X GPU上进行了深度训练。据AMD官方发布的数据显示,Instella的性能表现可与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等知名模型相媲美。

Instella模型的训练与开源

Instella模型是在Instinct MI300X硬件上从头开始训练的,并且AMD承诺其将保持完全开源。以下是AMD对Instella开源承诺的详细说明:

完全开源和可访问:Instella的模型权重、训练超参数、数据集和代码将全部开源发布,旨在促进人工智能社区内的创新与合作。

获取Instella开源地址

为了方便广大开发者获取Instella的开源资源,大浪资讯特此提供以下开源地址:

访问Instella开源地址


通过这样的排版,不仅保持了原文的信息,还提升了阅读体验,使得内容更加易于理解和浏览。