科技资讯快报 - 2023年3月4日,知名科技媒体Tom's Hardware今日发布了一篇深入分析文章,揭示了英伟达最新推出的GeForce RTX 5090、RTX 5080和RTX 5070 Ti显卡在计算性能上表现欠佳的幕后原因。据悉,英伟达在“Blackwell”架构中悄然放弃了32位OpenCL和CUDA的支持,这一决定直接导致了新显卡与现有测试工具和应用程序的兼容性问题。
文章指出,PassMark Software在为英伟达RTX 50系列显卡进行Direct Compute基准测试时遇到了麻烦。测试结果显示,系统返回了错误代码“CL_OUT_OF_RESOURCES (-5)”,并且含有32位代码的模块运行效率低下。
进一步的调查发现,RTX 50系列GPU上的32位CUDA应用程序无法直接在GPU上运行,而是被迫依赖CPU处理,从而导致了性能的显著下降。
在基准测试中,尽管主要应用程序长期以来都是64位,但一些计算子测试依然依赖32位代码,而这些代码在RTX 4000及更早的显卡上表现良好。
NVIDIA并非突然间终止了对32位CUDA的支持,而是通过一系列更新逐步淘汰这一技术。PassMark团队推测,通过一个32位到64位的翻译层或许可以解决这个问题,但目前英伟达尚未提供官方的解决方案。
PassMark还指出,这一变化并不能完全解释DirectX9性能不佳的原因,暗示可能有其他架构上的调整影响了旧版渲染路径。尽管PassMark已经更新了其软件,但旧版基准测试可能仍会受到一定影响。
对于开发者来说,将旧版代码迁移到64位环境可能需要大量对底层操作和内存管理的修改。不过,大多数开发者已经逐步开始转向64位代码。
目前,PassMark正在将受影响的OpenCL代码移植到64位,以便正确评估新显卡的计算能力。不过,该团队也提醒,在修改源代码之前,许多包含32位OpenCL组件的现有应用程序可能无法在RTX 5000系列显卡上正常运行。
总结:英伟达新显卡的性能瓶颈,揭示了在硬件和软件兼容性方面的挑战。对于追求高性能计算的用户和开发者来说,这可能意味着需要重新评估他们的工具和策略。随着技术的不断进步,兼容性问题可能会逐步得到解决,但这也提醒我们,在追求技术突破的同时,保持向后兼容性至关重要。