This is a series of GPU optimization topics. Here we will introduce how to optimize the CUDA kernel in detail. I will introduce several basic kernel optimizations, including: elementwise, reduce, s…

Cuda 936 149 Updated Jul 29, 2023

yzhaiustc / Optimizing-SGEMM-on-NVIDIA-Turing-GPUs

Optimizing SGEMM kernel functions on NVIDIA GPUs to a close-to-cuBLAS performance.

Cuda 326 49 Updated Jan 2, 2025

Eddie-Wang1120 / Professional-CUDA-C-Programming-Code-and-Notes

CUDA C 编程权威指南代码实现包含了书上第二章到第八章的大部分代码实现和作者笔记，全由作者本人手动实现，难免有错误的地方，请大家谨慎参考，非常欢迎对错误的指正。如果有帮助的话请Star一下，对作者帮助很大，谢谢！

Cuda 320 22 Updated Oct 20, 2022

Yinghan-Li / YHs_Sample

Yinghan's Code Sample

Cuda 312 55 Updated Jul 25, 2022

QINZHAOYU / CudaSteps

基于《cuda编程-基础与实践》（樊哲勇著）的cuda学习之路。

Cuda 289 63 Updated Jan 15, 2024

YashasSamaga / ConvolutionBuildingBlocks

GEMM and Winograd based convolutions using CUTLASS

Cuda 26 3 Updated Jul 15, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

JiandongLai stulai

Block or report stulai

Lists (1)

NVIDIA

Starred repositories

deepseek-ai / DeepGEMM

DefTruth / CUDA-Learn-Notes

brucefan1983 / CUDA-Programming

Liu-xiandong / How_to_optimize_in_GPU

yzhaiustc / Optimizing-SGEMM-on-NVIDIA-Turing-GPUs

Eddie-Wang1120 / Professional-CUDA-C-Programming-Code-and-Notes

Yinghan-Li / YHs_Sample

QINZHAOYU / CudaSteps

YashasSamaga / ConvolutionBuildingBlocks

Starred topics

C