Update transformer_engine._convert_model to skip LoRA layers #1766

vivekgoe · 2025-02-11T06:49:09Z

This PR updates transformer_enginer._convert_model() function such that lora-A, lora-B linear layers are skipped by TE. This has no impact on device time because these layers translate into small GEMMs whereas it helps in reducing host time by getting rid of TE host overhead.

…ers (#133) * Update transformer_engine._convert_model to skip LoRA layers * Remove print statement * Add check for peft module availability

HuggingFaceDocBuilderDev · 2025-02-11T06:53:07Z

The docs for this PR live here. All of your documentation changes will be reflected on that endpoint. The docs are available until 30 days after the last update.

vivekgoe · 2025-02-18T13:15:45Z

@regisss @libinta please help review and merge this PR.

regisss

LGTM!

[SW-217550] Update transformer_engine._convert_model to skip LoRA lay…

511496e

…ers (#133) * Update transformer_engine._convert_model to skip LoRA layers * Remove print statement * Add check for peft module availability

vivekgoe requested a review from libinta February 11, 2025 06:49

vivekgoe requested a review from regisss as a code owner February 11, 2025 06:49

vivekgoe added the synapse 1.21 label Feb 11, 2025

vivekgoe added synapse1.20 run-test Run CI for PRs from external contributors and removed synapse 1.21 labels Feb 18, 2025

regisss approved these changes Feb 18, 2025

View reviewed changes

regisss merged commit 21a5495 into huggingface:main Feb 18, 2025
4 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Update transformer_engine._convert_model to skip LoRA layers #1766

Update transformer_engine._convert_model to skip LoRA layers #1766

vivekgoe commented Feb 11, 2025

HuggingFaceDocBuilderDev commented Feb 11, 2025

vivekgoe commented Feb 18, 2025

regisss left a comment

Update transformer_engine._convert_model to skip LoRA layers #1766

Update transformer_engine._convert_model to skip LoRA layers #1766

Conversation

vivekgoe commented Feb 11, 2025

HuggingFaceDocBuilderDev commented Feb 11, 2025

vivekgoe commented Feb 18, 2025

regisss left a comment

Choose a reason for hiding this comment