support fp8 t5 encoder in examples #366

Lay2000 · 2024-11-28T08:12:46Z

The examples now support T5 encoder FP8 quantization, which could save GPU memory usage without affecting the result quality.

feifeibear

Perfect!

feifeibear · 2024-11-28T08:18:44Z

examples/pixartalpha_example.py

@@ -19,10 +20,18 @@ def main():
    engine_args = xFuserArgs.from_cli_args(args)
    engine_config, input_config = engine_args.create_config()
    local_rank = get_world_group().local_rank
+    text_encoder = T5EncoderModel.from_pretrained(engine_config.model_config.model, subfolder="text_encoder", torch_dtype=torch.float16)
+    if args.use_fp8_t5_encoder:
+        from optimum.quanto import freeze, qfloat8, quantize


add optimum in setup.py

support fp8 t5 encoder in examples

66eb759

feifeibear approved these changes Nov 28, 2024

View reviewed changes

add optimum-quanto install requirements

f3a6d06

feifeibear reviewed Nov 28, 2024

View reviewed changes

update diffusers version in setup.py

7bcb1df

feifeibear approved these changes Nov 28, 2024

View reviewed changes

feifeibear merged commit 403f4e5 into main Nov 28, 2024
4 checks passed

feifeibear deleted the support_fp8_t5_encoder branch November 28, 2024 08:24

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

support fp8 t5 encoder in examples #366

support fp8 t5 encoder in examples #366

Lay2000 commented Nov 28, 2024

feifeibear left a comment

feifeibear Nov 28, 2024

support fp8 t5 encoder in examples #366

support fp8 t5 encoder in examples #366

Conversation

Lay2000 commented Nov 28, 2024

feifeibear left a comment

Choose a reason for hiding this comment

feifeibear Nov 28, 2024

Choose a reason for hiding this comment