AMD现已正式发布了其ROCm软件栈的新迭代版本ROCm 6.3,引入了先进的工具和优化功能,以提升AMD Instinct GPU加速器上的AI、ML和HPC工作负载。
AMD现已正式发布了其ROCm软件栈的新迭代版本ROCm 6.3,带来了多项新功能。AMD表示ROCm 6.3是开源平台的一个重要里程碑,它引入了先进的工具和优化功能,以提升AMD Instinct GPU加速器上的AI、ML和HPC工作负载。ROCm 6.3旨在通过提高开发人员的工作效率,为从创新型人工智能初创企业到高性能计算驱动型行业的广大客户赋能。
ROCm 6.3共有五大核心功能提升,包括:
ROCm 6.3中的SGLang - 生成式AI(GenAI)模型的超快速推理,专为优化AMD Instinct GPU上的LLM和VLM等尖端生成模型的推理而构建。
更高水平的Transformer优化 - 在AMD Instinct上重新设计FlashAttention-2,实现了更快、更高效的训练和推理。
AMD Fortran编译器 - 将传统代码桥接到GPU加速,运行基于Fortran的传统HPC应用程序的企业现在可以通过AMD Instinct加速器释放现代GPU加速的强大功能。
rocFFT中的新多节点FFT - HPC工作流的游戏规则改变者,在rocFFT中引入了多节点FFT支持,可实现高性能分布式FFT计算。
增强的计算机视觉库 - AV1、rocJPEG等, 使企业能够处理从视频分析到数据集增强的各种工作负载。
此外,AMD将ROCm 6.2中引入的Omnitrace和Omniperf更名为ROCm System Profiler和ROCm Compute Profiler。AMD称,此次品牌重塑将有助于增强可用性、稳定性,并无缝集成到当前的ROCm分析生态系统中。
网友评论