[ray] launch multiple GPU with ray #396

lihuahua123 · 2024-12-17T08:01:32Z

Support Ray to start the pipeline

xfuser/worker/worker.py

feifeibear · 2024-12-18T05:14:02Z

PR实现了通过ray方式启动多进程。参考vllm使用RayGPUExecutor来管理多个worker，每个worker执行diffusers pipefline的逻辑。

目前这种方式和torchrun启动程序（example.py)用法差别太大。

我建议设计一个DiffusionPipeline的Ray分布式版本，RayDiffusionPipeline，然后这个类提供from_pretrained，forward等接口。

PR中hardcode了一些地方，比如对模型初始化text_encoder处理，因为目前text_encoder是没有多卡切分的，可以让每个worker都重复载入text_encoder，希望尽量保持和torchrun接口一致性。

setup.py

xfuser/config/args.py

examples/run.sh

tests/executor/test_ray.py

xfuser/executor/gpu_executor.py

xfuser/worker/worker.py

tests/executor/ray_run.sh

xfuser/executor/gpu_executor.py

feifeibear · 2024-12-20T06:13:12Z

examples/ray/ray_flux_example.py

+    # output is a list of results from each worker, we take the last one
+    for i, image in enumerate(output[-1].images):
+        image.save(
+            f"/data/results/{model_name}_result_{i}.png"


save to a relative path ./results/xxx

feifeibear · 2024-12-20T06:14:21Z

xfuser/config/config.py

@@ -188,6 +192,9 @@ class ParallelConfig:
    sp_config: SequenceParallelConfig
    pp_config: PipeFusionParallelConfig
    tp_config: TensorParallelConfig
+    distributed_executor_backend: Optional[str] = None
+    world_size: int = 1 # FIXME: remove this
+    worker_cls: str = "xfuser.ray.worker.worker.Worker"


do we need distributed_executor_backend and worker_cls?

We don't need distributed_executor_backend, but we need worker_cls for ray to initial worker by its class name

def init_worker(self, *args, **kwargs): worker_class = resolve_obj_by_qualname( self.worker_cls) self.worker = worker_class(*args, **kwargs) assert self.worker is not None

feifeibear

LGTM

lihuahua123 force-pushed the main branch 2 times, most recently from 475668a to 61101c3 Compare December 17, 2024 12:31

feifeibear reviewed Dec 18, 2024

View reviewed changes

xfuser/worker/worker.py Outdated Show resolved Hide resolved

xfuser/worker/worker.py Outdated Show resolved Hide resolved

feifeibear reviewed Dec 19, 2024

View reviewed changes

feifeibear requested changes Dec 19, 2024

View reviewed changes

tests/executor/ray_run.sh Outdated Show resolved Hide resolved

feifeibear reviewed Dec 19, 2024

View reviewed changes

xfuser/executor/gpu_executor.py Outdated Show resolved Hide resolved

feifeibear changed the title ~~[WIP] Ray Support~~ [WIP] launch multiple GPU with ray Dec 20, 2024

feifeibear requested changes Dec 20, 2024

View reviewed changes

lihuahua123 added 8 commits December 20, 2024 14:55

[WIP] basic ray support

e0e9d87

create ray example

788aaa8

Remove rank

bcfce7a

fix

15ddc6f

Refactor ray pipeline

41166ad

Add copyright and clean up

6d98e40

Fix and refactor ray directory

fe82718

Fix

578d898

lihuahua123 force-pushed the main branch from 7e5114f to 578d898 Compare December 20, 2024 07:04

lihuahua123 added 2 commits December 20, 2024 15:13

Fix

29bae96

Add annotation for ray_run.sh

0c2067b

feifeibear approved these changes Dec 20, 2024

View reviewed changes

feifeibear changed the title ~~[WIP] launch multiple GPU with ray~~ [ray] launch multiple GPU with ray Dec 20, 2024

feifeibear marked this pull request as ready for review December 20, 2024 07:26

feifeibear merged commit f58302a into xdit-project:main Dec 20, 2024
3 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[ray] launch multiple GPU with ray #396

[ray] launch multiple GPU with ray #396

lihuahua123 commented Dec 17, 2024

feifeibear commented Dec 18, 2024

feifeibear Dec 20, 2024

feifeibear Dec 20, 2024

lihuahua123 Dec 20, 2024

feifeibear left a comment

[ray] launch multiple GPU with ray #396

[ray] launch multiple GPU with ray #396

Conversation

lihuahua123 commented Dec 17, 2024

feifeibear commented Dec 18, 2024

feifeibear Dec 20, 2024

Choose a reason for hiding this comment

feifeibear Dec 20, 2024

Choose a reason for hiding this comment

lihuahua123 Dec 20, 2024

Choose a reason for hiding this comment

feifeibear left a comment

Choose a reason for hiding this comment