GitHub

The repository is based on SparseGPT code

Dependencies

torch: tested on v2.2.1
transformers: tested on v4.35.2
datasets: tested on v2.16.1

Usage

The simplest way to try this out is to run the following command:

python inference_demo.py --execution_mode 1 --compressed_model_path elvircrn/llama2-7b-double-sparse-sparsity0.7-wikitext2-final --pretrained_model_path <Llama-2-7b-hf_path>

Name		Name	Last commit message	Last commit date
Latest commit History 61 Commits
inference_lib		inference_lib
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
bench_kernel.py		bench_kernel.py
convert_legacy_format.py		convert_legacy_format.py
datautils.py		datautils.py
demo.py		demo.py
doublesparse.py		doublesparse.py
hf_convert.py		hf_convert.py
inference_demo.py		inference_demo.py
llama.py		llama.py
llama_inference.py		llama_inference.py
modelutils.py		modelutils.py
results.txt		results.txt
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Dependencies

Usage

About

Releases

Packages

Languages

License

elvircrn/double_sparse_kernel

Folders and files

Latest commit

History

Repository files navigation

Dependencies

Usage

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages