黄仁勋、苏姿丰点赞:英伟达、AMD 力挺 InferenceMAX 开源新基准
IT之家 10 月 11 日消息,黄仁科技媒体 Tom's Hardware 昨日(10 月 10 日)发布博文,勋苏新基报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的姿丰准潜江市某某系统技术维修站开源 AI 基准测试套件,专注于衡量在真实 AI 推理(模型实际运行)场景下,点赞达由驱动、英伟内核、力挺框架等组成的开源整个软件堆栈的综合效率。
IT之家援引博文介绍,黄仁人工智能领域的勋苏新基焦点几乎完全集中在芯片交易和 GPU 等硬件发展上,现有的姿丰准基准测试也大多只关注硬件性能,因此 InferenceMax 希望提供一个开源且厂商中立的点赞达 AI 基准测试套件。该项目以滚动发布的英伟方式,每晚更新测试结果,力挺从而能够动态追踪软件更新对性能的开源持续影响。
![]()
InferenceMax 引入了两个相互制约的黄仁潜江市某某系统技术维修站关键性能指标。其一是“吞吐量”,指在单位时间内处理更多并发请求的能力,这有利于最大化 GPU 利用率;其二是“交互性”,指为单个用户提供更快响应速度的能力,例如在聊天机器人场景中。
![]()
在两者之间取得理想平衡(即帕累托前沿曲线上的最佳点)至关重要。最终,对于服务提供商而言,衡量投资回报的终极标准是“总拥有成本”(TCO),即处理每百万 token 所需花费的美元。InferenceMax 致力于估算不同硬件采购或租赁方案下的 TCO,为用户提供最具经济效益的选择依据。
InferenceMax 的初步测试提供了一些颠覆性的见解。例如,尽管英伟达的 B200 在原始速度上遥遥领先,但在综合考量 TCO 后,AMD 的 MI335X 在特定场景下展现出了极强的竞争力,这表明,最快的芯片不一定是最经济高效的选择。
同时,测试也暴露了 AMD 在 FP4(4 位浮点格式)内核方面尚有改进空间,目前依赖该数学格式的场景仍由英伟达芯片主导。这些发现凸显了单纯比较硬件参数的局限性,软件优化与成本效益正成为评估 AI 性能的关键。
InferenceMax 的开发过程得到了英伟达、AMD 及多家云服务商的深度协作。这种合作不仅帮助项目获取了真实的硬件与软件配置方案,还意外地发现了两大巨头软件堆栈中的多个错误。
例如,项目组协助 AMD 修复了其 ROCm 软件中的问题,并建议 AMD 提供更优的默认配置以简化性能调优。对于英伟达,测试则暴露了其新款 Blackwell 驱动在快速启停实例时存在初始化相关的障碍。
英伟达首席执行官黄仁勋表示:
在长上下文推理的推动下,推理需求呈指数级增长。NVIDIA Grace Blackwell NVL72 正是为这个充满思考力的 AI 新时代而生。NVIDIA 通过持续的硬件和软件创新来满足这一需求,从而赋能 AI 的未来发展。 通过频繁的基准测试,InferenceMax 让业界能够清晰地了解 LLM 推理在实际工作负载下的性能。结果显而易见:搭载 TRT-LLM 和 Dynamo 的 Grace Blackwell NVL72 可提供无与伦比的单位成本和单位兆瓦性能,为全球生产力最高、成本效益最高的 AI 工厂提供支持。
AMD 首席执行官苏姿丰表示:
开放式协作正在推动人工智能创新的新时代。开源 InferenceMax 基准测试为社区提供透明的每日结果,从而激发信任并加速进步。 它凸显了我们的 AMD Instinct MI300、MI325X 和 MI355X GPU 在不同工作负载下具有竞争力的 TCO 性能,彰显了我们平台的强大实力以及我们致力于让开发人员实时了解软件进度的承诺。
IT之家附上参考地址
(责任编辑:娱乐)
- 普京与阿利耶夫举行会谈 讨论阿航客机失事事件
- 最高续航740km 精灵#5量产版将于8月28日发布
- 中国电动汽车发展太快,日企高管坐不住了
- 券商卖方研究在降费之下压力有多大?
- 抢劫事件后 法国卢浮宫重新开门
- 加强防范!甘肃多地暴雨预警信号升级为红色
- 诺如病毒感染高发,学校幼托机构需关注 views+
- 华为P70系列渲染图曝光 不规则矩阵绝无撞机 views+
- 哈欠连天?缓解春困,请试试这些方法 views+
- 新片|刘和平电影《援军明日到达》定档,于和伟、杨洋主演 views+
- 奥运会资格赛周四正式开幕,上海准备好了 views+
- 中新健康丨“贵人语迟”?专家:孩子言语不清应及时接受正规系统检查 views+
- 低密社区“恒都云璟”示范区对外开放 views+
- 找回专注轻取大坂直美,郑钦文连续两年福地闯入八强 views+
- 呈现上海百年市井记忆,口述式家庭纪录片《七家乐》将播 views+
- 设计赋能城市焕新,2024天津家居设计周启幕在即 views+
