豆包大模型震撼发布,300万长文本能力首次曝光,技术进展引领领域革新
大幅提升文本处理能力,豆包大模型引领人工智能新风向
数界探索
12月30日消息,字节跳动旗下的豆包大模型今日发布了2024年全领域的技术进展报告,宣布自5月15日首次亮相至今的7个月里,在通用语言处理、视频生成、语音对话和视觉理解等方面,其模型能力已跻身国际领先行列。
据介绍,截至2024年12月,最新版豆包通用模型Doubao-pro-1215综合能力较5月提升了32%,现已全面对标GPT-4o。在数学和专业知识等某些复杂任务中,其表现甚至更优。同时,其推理服务的价格仅为GPT-4o的八分之一。该模型通过海量数据优化及创新的模型架构,包括提高模型稀疏度和引入强化学习等方法,显著提升了理解精度和生成质量。
豆包在最新发布中展示了其大模型在处理长达300万字的长文本方面的强大能力。据透露,该系统可以轻松处理“上百篇”学术报告,且处理每百万tokens的延迟仅为15秒。这项技术的背后运用了STRING等上下文关联数据算法,显著增强了大型语言模型(LLM)利用海量外部知识的能力。通过采用稀疏化及分布式方案,系统的响应时间已经优化到十秒级以内。 这种技术进步不仅令人印象深刻,也预示着在处理复杂信息和大量数据方面,人工智能正逐步达到新的高度。它不仅能够帮助研究人员更高效地分析和理解大量的学术资料,而且可能在多个领域内开启全新的应用可能性。例如,在教育、科研和企业决策支持等方面,这样的技术进步无疑会带来深远的影响。