How to improve model efficiency in practical applications? #219

mzgcz · 2024-12-03T08:58:07Z

How to improve the efficiency of online models (Streaming) in practical applications?
Language models can improve inference efficiency by performing batch inference through batch size; multiple instances can be used to handle concurrent inference requests; TensorRT can be used to optimize inference speed.
Which of the above measures are feasible for the MeloTTS online model? Are there any better recommendations?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

How to improve model efficiency in practical applications? #219

How to improve model efficiency in practical applications? #219

mzgcz commented Dec 3, 2024

How to improve model efficiency in practical applications? #219

How to improve model efficiency in practical applications? #219

Comments

mzgcz commented Dec 3, 2024