Name		Name	Last commit message	Last commit date
parent directory ..
kernels		kernels
src		src
Cargo.toml		Cargo.toml
README.md		README.md
build.rs		build.rs

README.md

`mistralrs-quant`

Quantization techniques for mistral.rs. This implements a common trait for all quantization methods to implement for ease of extension and development.

Currently supported:

GGUF: GgufMatMul
Gptq: GptqLayer
Hqq: HqqLayer
Unquantized (used for ISQ): UnquantLinear

Some kernels are copied or based on implementations in:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

mistralrs-quant

mistralrs-quant

README.md

`mistralrs-quant`

Files

mistralrs-quant

Directory actions

More options

Directory actions

More options

Latest commit

History

mistralrs-quant

Folders and files

parent directory

README.md

mistralrs-quant

`mistralrs-quant`