cuda stream
发现这个博客越来越像带文本搜索的我的书签了哈哈,不过这样也算合理吧,毕竟高效的搬运经过筛选的有价值的文章比上网搜到一大堆废话要好吧.
要点
- 现在的GPU一般有3个引擎
- 传入
- 传出
- 计算
- 这3个可以并发
GPU supporting device overlap possesses the capacity to execute a kernel while performing a copy between device and host memory——————https://cs.wmich.edu/elise/courses/cs626/sp13/savitha/CudaStreams.pptx
近期评论