震撼发布!阶跃星辰联合吉利首次开源 Step 系列多模态大模型,颠覆视频与语音领域
开创多模态先河,Step 系列大模型引领视频语音革新
2月18日,阶跃星辰与吉利汽车集团共同宣布,将合作开发的阶跃两款Step系列多模态大模型对外开放给全球开发者。其中包括目前全球规模最大的开源视频生成模型——阶跃Step-Video-T2V,以及首个达到产品级标准的开源语音交互大模型——阶跃Step-Audio。
据了解,阶跃Step-Video-T2V模型的参数量已达到300亿,能够直接生成包含204帧、分辨率为540P的高质量视频。阶跃星辰表示,根据其测评结果,这是当前全球范围内参数量最大且性能最优的开源视频生成大模型。
阶跃 Step-Audio 是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻。用户即日起可在跃问 App 内体验新功能。
阶跃星辰作为吉利汽车集团的科技生态战略合作伙伴,在两款大模型的研发过程中,双方展开了深入合作。在算力算法、场景训练等领域的优势互补,显著提升了多模态大模型的性能。阶跃星辰表示,他们深知实现通用人工智能(AGI)需要全球开发者的共同努力。因此,开源计划的初衷是与全球开发者分享最新的多模态大模型技术成果,为中国乃至全球的开源社区贡献力量。 这种开放的合作态度不仅有助于加速技术创新,也为全球技术社群带来了更多的可能性。通过与吉利集团的强强联合,阶跃星辰展示了如何在不同领域间搭建桥梁,共同推动前沿科技的发展。开源模式的采用更是体现了企业对全球科技生态系统的责任感和贡献精神。
阶跃星辰(上海阶跃星辰智能科技有限公司)成立于2023年,总部设在中国上海。该公司由前微软全球副总裁姜大昕创立,主要致力于人工智能大模型的研发与应用。阶跃星辰于2024年3月推出了其Step系列大模型,并且还发布了一款名为跃问和冒泡鸭的AI应用产品。