阅读背景:

CUDA SHARED MEMORY

来源:互联网 
!-- flowchart 箭头图标 勿删 --

在global Memory部分,数据对齐和连续是很重要的话题,当使用L1的时候,对齐问题可以忽略,但是非连续的获取内存依然会降低性能。依赖于算法本质,某些情况下,非连续访问是不可避免的。使用shared memory是另一种提高性能的方式。在global Me




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: