NVIDIA

CUTLASS:CUDA C++高性能线性代数运算库

CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA中实现各个级别和规模的高性能矩阵乘法(GEMM)。