xiaol / RWKV-LM Public

forked from BlinkDL/RWKV-LM

Notifications You must be signed in to change notification settings
Fork 0
Star 0

RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, saves VRAM, fast training, "infinite" ctx_len, and free sentence embedding.

Apache-2.0 license

0 stars 900 forks Branches Tags Activity

Star

Notifications

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 495 Commits
.github		.github
RWKV-v1		RWKV-v1
RWKV-v2-RNN		RWKV-v2-RNN
RWKV-v3		RWKV-v3
RWKV-v4		RWKV-v4
RWKV-v4neo		RWKV-v4neo
Research		Research
.gitignore		.gitignore
CITATION.cff		CITATION.cff
LICENSE		LICENSE
README.md		README.md
RWKV-chat.png		RWKV-chat.png
RWKV-ctxlen.png		RWKV-ctxlen.png
RWKV-demo.png		RWKV-demo.png
RWKV-eval.png		RWKV-eval.png
RWKV-eval2.png		RWKV-eval2.png
RWKV-formula.png		RWKV-formula.png
RWKV-loss.png		RWKV-loss.png
RWKV-paper.png		RWKV-paper.png
RWKV-time-w.png		RWKV-time-w.png
RWKV-v2-430M-Pile-LR.png		RWKV-v2-430M-Pile-LR.png
RWKV-v2-430M-Pile.png		RWKV-v2-430M-Pile.png
RWKV-v2-RNN-run.png		RWKV-v2-RNN-run.png
RWKV-v2-RNN.png		RWKV-v2-RNN.png
RWKV-v3-1.5B-Pile.png		RWKV-v3-1.5B-Pile.png
RWKV-v3-plan.png		RWKV-v3-plan.png
RWKV-v4-1.5B-Pile.png		RWKV-v4-1.5B-Pile.png
RWKV-vs-MHA.png		RWKV-vs-MHA.png