added predict lang in whisper example

vllm-project · huseinzol05 · Jun 27, 2024 · Jun 27, 2024 · Jun 27, 2024 · Jun 28, 2024
commit 2d62f4559fa9ec0f3311416fffeb5c8bfa6f95f6
diff --git a/examples/whisper_example.py b/examples/whisper_example.py
@@ -19,11 +19,17 @@ def main():
 
     r = requests.get('https://github.com/mesolitica/malaya-speech/raw/master/speech/singlish/singlish0.wav')
     y = audio.decode_example(audio.encode_example(r.content))['array']
-    prompt = '<|startoftranscript|><|en|><|transcribe|>'
+
+    output_lang = llm.generate({
+        "prompt_token_ids": [50258],
+        "multi_modal_data": AudioData(y),
+    }, sampling_params = SamplingParams(max_tokens = 1, temperature = 0))
+
     outputs = llm.generate({
-        "prompt": prompt,
+        "prompt_token_ids": [50258, output_lang[0].outputs[0].token_ids[0], 50360],
         "multi_modal_data": AudioData(y),
-    })
+    }, sampling_params = SamplingParams(max_tokens = 10, temperature = 0))
+
     print(outputs[0].outputs[0].text)