xiayuqing0622

Yuqing Xia xiayuqing0622

Achievements

flex_head_fa flex_head_fa Public

Forked from Dao-AILab/flash-attention

Fast and memory-efficient exact attention

Python 50 5
microsoft/nnfusion microsoft/nnfusion Public

A flexible and efficient deep neural network (DNN) compiler that generates high-performance executable from a DNN model description.

C++ 968 163
cutlass cutlass Public

Forked from NVIDIA/cutlass

CUDA Templates for Linear Algebra Subroutines

C++