力压GPT-4.5新里程碑,DeepSeek-V3-0324版官方深度剖析报告发布,揭秘系统提示与最优温度设置!

admin172025-03-26 16:14:56

最新突破!DeepSeek-V3-0324模型惊艳亮相,推理能力大幅跃升,参数仅660B

新智元报道
编辑:英智 好困

【新智元深度解读】
一款仅有660亿参数的开源模型,在数学和编程性能上已超越GPT-4.5和Claude 3.7。DeepSeek-V3-0324的最新版本一经发布,便在全球范围内引发了热烈的讨论和关注,其推理能力提升了近20%,而且模型权重也已全面开源!

DeepSeek-V3-0324新版本发布,性能飙升,数学和编程能力超越GPT-4.5

网友们纷纷表示,这无疑是OpenAI的一个噩梦。尽管模型参数量仅660B,但其开源的特性使得它成为了业界的焦点。

体验DeepSeek-V3-0324:轻松关闭深度思考,享受全新推理能力

想要体验DeepSeek-V3-0324的强大能力,只需访问官网、APP或小程序,关闭“深度思考”功能即可。官方建议,对于非复杂推理任务,使用V3新版本将更加高效。

模型权重全面开源,访问链接如下:DeepSeek-V3-0324模型权重

性能全面升级,中文能力更上一层楼

DeepSeek-V3-0324在性能上实现了全面提升,特别是在中文处理能力上更加出色。

DeepSeek-V3-0324全面超越Claude 3.7

新版本在数学和代码评测集上超过了Claude 3.7,展现出其在这些领域的强大实力。

强化学习技术助力,推理能力大幅提升

DeepSeek-V3-0324借鉴了DeepSeek-R1中的强化学习技术,在数学和代码评测集上超过了GPT-4.5。

推理能力显著提升,准确率最高提高近20%

在推理能力方面,DeepSeek-V3-0324相较于第一代V3,基准测试的准确率最高提升了近20%。具体如下:

  • MMLU-Pro:75.9 → 81.2 (+5.3)
  • GPQA:59.1 → 68.4 (+9.3)
  • AIME:39.6 → 59.4 (+19.8)
  • LiveCodeBench:39.2 → 49.2 (+10.0)

前端开发任务更上一层楼,代码执行效率与设计感双重提升

在HTML等前端开发任务上,DeepSeek-V3-0324生成的代码不仅可用性更高,视觉上也更具设计感。

  • 提升了代码的执行效率
  • 网页和游戏前端界面更美观

中文写作能力显著增强,风格和内容质量双提升

在中文写作任务上,DeepSeek-V3-0324基于R1进行了优化,提升了中长篇文本的创作风格和内容质量。

  • 符合R1写作规范
  • 提高中长篇写作的质量
  • 改进多轮交互式内容重写
  • 优化翻译质量和信函写作

中文搜索场景下,分析能力提升,输出内容更详实、准确

在中文搜索场景下,DeepSeek-V3-0324提升了对报告的分析能力,输出内容更详实、准确,排版更清晰美观。

  • 增强报告分析请求功能,提供更详细的输出结果

API函数调用准确性提高,修复V3版本问题

除此之外,DeepSeek-V3-0324还提高了API函数调用的准确性,并修复了之前V3版本中的问题。

国外网友已玩嗨,赞其为最强大的免费AI

国外网友对DeepSeek-V3-0324的反应热烈,有网友「Haider」表示,新的DeepSeek V3更新比预期要大得多,尤其是在编程方面,赞其为目前最强大的完全免费的AI。

官方使用指南

  • 系统提示:在官方网页/应用中,DeepSeek使用带有特定日期的统一系统提示词。 该助手为DeepSeek Chat,由深度求索公司创造。 今天是{current date}。
  • 采样温度:在网页和应用环境中,模型温度参数T_model设置为0.3。
  • API温度映射机制:DeepSeek贴心地设置了一个API温度T_api映射机制,自动将输入的API温度1.0调整为模型最优温度0.3。

文件上传和网络搜索

  • 文件上传:请按照模板创建提示词,其中{file_name}、{file_content}和{question}是参数。 file_template = \ """[file name]: {file_name} [file content begin] {file_content} [file content end] {question}"""
  • 网络搜索:在进行网络搜索时,{search_results}、{cur_date}和{question}是参数。 ``` search_answer_zh_template = \ '''# 以下内容是基于用户发送的消息的搜索结果: {search_results} 在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文,请列出所有相关的引用编号,例如[citation:3][citation:5],切记不要将引用集中在最后返回引用编号,而是在答案对应部分列出。 在回答时,请注意以下几点:
  • 今天是{cur_date}。
  • 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
  • 对于列举类的问题(如列举所有航班信息),尽量将答案控制在10个要点以内,并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项;如非必要,不要主动告诉用户搜索结果未提供的内容。
  • 对于创作类的问题(如写论文),请务必在正文的段落中引用对应的参考编号,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解读并概括用户的题目要求,选择合适的格式,充分利用搜索结果并抽取重要信息,生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长,对于每一个要点的论述要推测用户的意图,给出尽可能多角度的回答要点,且务必信息量大、论述详尽。
  • 如果回答很长,请尽量结构化、分段落总结。如果需要分点作答,尽量控制在5个点以内,并合并相关的内容。
  • 对于客观类的问答,如果问题的答案非常简短,可以适当补充一到两句相关信息,以丰富内容。
  • 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
  • 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
  • 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。

# 用户消息为: {question}''' ```

本地运行

DeepSeek-V3-0324的模型结构与DeepSeek-V3完全相同,支持函数调用、JSON输出和FIM(填充中间)完成等功能。

参考资料

注意:以上内容为改写版本,旨在提供更流畅自然的阅读体验,同时保持原意不变。