写CUDA到底难在哪?

2025-06-19 15:05:14

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
为什么 macOS 并不差,可市场总敌不过 Windows?

为什么 macOS 并不差,可市场总敌不过 Windows?

如果你还用OSX系统,哪怕只是9年前的版本,市面上也几乎没有...

2025-06-21
美国搞出个“稳定币”,到底是什么?其它国家是如何看待稳定币的?

美国搞出个“稳定币”,到底是什么?其它国家是如何看待稳定币的?

我先放一个暴论: 如果稳定币法案最终成功推行,特朗普的历史地...

2025-06-21
为什么中国JK无法拍出日本JK的感觉?

为什么中国JK无法拍出日本JK的感觉?

三个原因 第一,我们所了解的日本女高中生的校服形象,大半是动...

2025-06-21
中国有能打到美国本土的导弹吗……有的话最远能打到哪里呢?

中国有能打到美国本土的导弹吗……有的话最远能打到哪里呢?

2024年试射的东风41。 据说相当于230颗广岛原***,...

2025-06-21
从现在看,沙特当年35亿买东风三的投资是不是划算的?

从现在看,沙特当年35亿买东风三的投资是不是划算的?

阿沙:尊敬的兔子,又到东风三保养时间了。 兔子:好的,10...

2025-06-21