Meta成立四个小组,研究DeepSeek以提升Llama的创新力
引领未来:Meta成立研究小组,探索DeepSeek技术,助力Llama创新飞跃
1月27日的消息称,据Information网站报道,Facebook母公司Meta已经组建了四个专门的研究团队,旨在深入分析巨头幻方量化旗下的国产大模型DeepSeek的工作机制。Meta希望通过这一系列研究,能够汲取DeepSeek的优点,进而优化和完善自家的大模型Llama。 这样的举措表明,Meta对于提升自身技术实力有着极高的追求,同时也反映出当前人工智能领域竞争的激烈程度。通过借鉴其他公司的研究成果,Meta希望能够在大模型的研发上取得更大的突破,从而在未来的市场竞争中占据更有利的地位。
有两个小组正在努力探究幻方量化如何减少训练和运行DeepSeek的成本;第三个研究团队在调查幻方量化可能采用了哪些数据来训练其模型;第四个团队则在思考如何利用DeepSeek模型的特点来开发重构Meta模型的新技术。
1月20日,DeepSeek-R1推理大模型现已正式推出。根据官方描述,DeepSeek-R在后期训练过程中广泛采用了强化学习技术,在标注数据极为有限的情况下,显著增强了模型的推理能力。在数学、编程和自然语言理解等任务上,其表现可与OpenAI的GPT-1正式版相媲美。
注意到,今日,Deepseek应用已经登上苹果中国区和美国区应用商店免费App下载排行榜首位,在美国地区的下载榜上甚至超过了ChatGPT。