[lmi][lcnc] fallback to accelerate backend when non text-generation m… #1667

siddvenk · 2024-03-25T22:58:21Z

…odel is provided

Description

Fallback to accelerate for non text-generation model architectures.

From my limited testing, non text-generation architectures are not supported for rolling batch. For these models, we fall back to hf accelerate with dynamic batching.

lanking520 · 2024-03-26T00:39:49Z

wlm/src/main/java/ai/djl/serving/wlm/LmiConfigRecommender.java

@@ -46,6 +51,9 @@ public final class LmiConfigRecommender {
                    Map.entry("qwen2", "vllm"),
                    Map.entry("stablelm", "vllm"));

+    private static final Set<String> OPTIMIZED_TASK_ARCHITECTURES =
+            Set.of("ForCausalLM", "LMHeadModel", "ForConditionalGeneration");


https://huggingface.co/THUDM/chatglm3-6b/blob/main/config.json#L5 this is going to break

ugh, that's good to know. didn't know about this type of config

i've added auto_map to fix this use-case

…odel is provided

siddvenk requested review from zachgk, frankfliu and a team as code owners March 25, 2024 22:58

lanking520 reviewed Mar 26, 2024

View reviewed changes

siddvenk force-pushed the auto-engine branch from e9b60e4 to 21b5613 Compare March 26, 2024 02:09

[lmi][lcnc] fallback to accelerate backend when non text-generation m…

3479f8f

…odel is provided

siddvenk force-pushed the auto-engine branch from 21b5613 to 3479f8f Compare March 26, 2024 03:21

lanking520 approved these changes Mar 26, 2024

View reviewed changes

siddvenk merged commit 761664e into deepjavalibrary:master Mar 26, 2024
7 checks passed

siddvenk deleted the auto-engine branch March 26, 2024 21:09

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[lmi][lcnc] fallback to accelerate backend when non text-generation m… #1667

[lmi][lcnc] fallback to accelerate backend when non text-generation m… #1667

siddvenk commented Mar 25, 2024

lanking520 Mar 26, 2024

siddvenk Mar 26, 2024 •

edited

Loading

siddvenk Mar 26, 2024

[lmi][lcnc] fallback to accelerate backend when non text-generation m… #1667

[lmi][lcnc] fallback to accelerate backend when non text-generation m… #1667

Conversation

siddvenk commented Mar 25, 2024

Description

lanking520 Mar 26, 2024

Choose a reason for hiding this comment

siddvenk Mar 26, 2024 • edited Loading

Choose a reason for hiding this comment

siddvenk Mar 26, 2024

Choose a reason for hiding this comment

siddvenk Mar 26, 2024 •

edited

Loading