NVIDIA Blackwell 在金融AI基准测试中以3.2倍速度提升创下佳绩
Iris Coleman 2026年3月6日 02:17
NVIDIA的GB200 NVL72在金融交易的LLM推理中创下新的STAC-AI记录,性能比Hopper架构提升高达3.2倍。
NVIDIA的Blackwell架构刚刚在金融LLM推理的STAC-AI基准测试中创下有史以来最快的成绩,GB200 NVL72相比上一代Hopper提供高达3.2倍的单GPU性能提升。2026年3月5日的测试结果对于竞相从非结构化数据分析中提取超额收益的交易公司而言意义重大。
战略技术分析中心已对金融科技工作负载进行了超过15年的基准测试,他们使用EDGAR 10-K文件(量化基金用来解析投资信号的密集年度报告)针对实际场景测试了Blackwell。运行Meta的Llama 3.1模型时,GB200 NVL72在中等长度的金融提示下达到每秒37,480个单词,相比之下双GH200系统为每秒8,237个单词。
原始数据说明一切
在使用EDGAR4数据的Llama 3.1 8B模型上,Blackwell处理每秒224个请求,而Hopper为每秒51.5个请求——在系统层面提升了4.3倍。在计算量更大的任务上差距进一步扩大:70B参数模型在长上下文EDGAR5文件上的吞吐量从每秒41.4个单词跃升至每秒150个单词。
是什么让这些提升成为可能?NVIDIA专为Blackwell设计的新NVFP4量化格式,在不牺牲准确性的情况下将模型压缩到更小的内存占用。Hopper运行FP8量化;Blackwell在架构上飞跃至四位精度,释放了吞吐量差距。
交互性能对交易至关重要
批处理是一回事。实时交易决策需要快速响应。在这方面,即使在推向最大吞吐量时,Blackwell仍保持较低的反应时间(类似于首个标记时间)和更好的词间延迟。在匹配的利用率水平下,GB200 NVL72在大多数测试场景中的响应性指标上始终优于GH200。
对于在财报电话会议上运行情绪分析或解析突发新闻的交易台而言,这种延迟优势直接转化为更快的决策制定。该基准测试明确测试了包括标记化在内的完整推理流程——这是实际部署无法跳过的工作。
市场背景
3月5日,NVIDIA股价交易于181.41美元,当日上涨1.1%,公司市值达到4.42万亿美元。在GTC 2024上宣布的Blackwell架构专门为生成式AI工作负载设计。首席执行官黄仁勋将其定位为推动"新工业革命"的动力,这些基准测试结果为该说法在金融领域提供了具体证据。
GB200 Grace Blackwell超级芯片将两个B200 GPU与一个Grace CPU结合,配备重新设计的AI Tensor核心和第五代NVLink,可扩展至576个GPU。之前的MLPerf结果显示在Llama 3.1 405B上有2.2倍的训练提升;这些STAC-AI数据证实类似优势延伸到推理。
Hopper仍然相关
值得注意的是:三年前的Hopper架构发布了可观的数字。拥有现有GH200部署的交易公司不会一夜之间过时。但对于新建或推理速度直接影响回报的公司而言,Blackwell的经济性看起来很有吸引力——NVIDIA声称相比前几代,LLM推理运营成本降低高达25倍。
完整的STAC报告,包括各种到达率下的详细交互模式指标,可通过STAC的官方渠道获得。评估AI基础设施升级的金融机构现在拥有经审计的第三方数据来为采购决策提供信息。
图片来源:Shutterstock- nvidia
- blackwell
- ai推理
- 金融交易
- llm



