Integrating OAI evals post training #85

farzadab · 2024-08-15T18:56:37Z

This PR switches our end of training evaluations to use the OpenAI evals framework.

pyproject.toml

setup.sh

ultravox/training/train.py

farzadab · 2024-08-22T04:30:48Z

Here's an example task which barely does any training, but does the full evaluation (assuming this PR is merged): https://wandb.ai/fixie/ultravox/runs/nxgfzg3v

ultravox/training/train.py

ultravox/model/ultravox_model.py

ultravox/training/train.py

juberti

Overall this LGTM, nice work.

ultravox/training/train.py

juberti · 2024-08-22T19:42:29Z

Not required for this PR, but it looks like wandb has some basic support for handling oaieval outputs, including sample-by-sample visualization, maybe if we can log to the right format we can get this visualization too: https://wandb.ai/wandb_fc/openai-evals/reports/OpenAI-Evals-Demo-Using-W-B-Prompts-to-Run-Evaluations--Vmlldzo0MTI4ODA3 (edit: looks like it just consumes the log files natively, so perhaps we can just log them to wandb as artifacts).

juberti · 2024-08-22T19:49:59Z

example wandb oaieval run: https://wandb.ai/wandb/jobs/runs/ugqqpjff?nw=nwuser_scott

farzadab · 2024-08-27T22:29:31Z

Justin using wandb.Table was a great idea. It shows all metrics in one table and also allows us to automatically create charts from them.
The charts from multiple experiments can also be stacked, even if they only match partially.

* allow lower python version for lambda cloud and adding ultravox-vllm * integrate oaievals * evaluations using oaievalset * make sure pipeline can be loaded correctly * force 1 GPU and set max_num_samples * logging eval Table to w&b + make text-only eval optional

farzadab added 5 commits August 12, 2024 10:07

allow lower python version for lambda cloud and adding ultravox-vllm

9ef7925

integrate oaievals

863e581

unpin ultravox-vllm dep version

f828cc7

evaluations using oaievalset

e26ea62

revert setup.sh changes for evals

9b46777

farzadab changed the title ~~Integration OAI evals post training~~ Integrating OAI evals post training Aug 15, 2024

farzadab added 5 commits August 15, 2024 12:15

Merge remote-tracking branch 'origin/main' into farzad-integrate-oaieval

19a8e9a

type fix

f55c0c4

Merge remote-tracking branch 'origin/main' into farzad-integrate-oaieval

22696d0

update task names: audio-required -> audio-core

a9ba178

fix mypy checks

932005a

farzadab marked this pull request as ready for review August 20, 2024 21:16

farzadab commented Aug 20, 2024

View reviewed changes

pyproject.toml Show resolved Hide resolved

setup.sh Show resolved Hide resolved

farzadab requested review from juberti and zqhuang211 August 20, 2024 22:14

farzadab commented Aug 20, 2024

View reviewed changes

ultravox/training/train.py Show resolved Hide resolved

update lora error to warning

24bd06b

farzadab removed request for juberti and zqhuang211 August 20, 2024 22:54

farzadab marked this pull request as draft August 20, 2024 22:54

farzadab added 5 commits August 20, 2024 16:55

make sure pipeline can be loaded correclty

ccbb736

formatting

b93b0b6

remove unneded whisper_model_modified

df72916

force 1 GPU and set max_num_samples

7159824

formatting

603e0f3

farzadab marked this pull request as ready for review August 22, 2024 04:23

farzadab requested review from juberti, petersalas and zqhuang211 and removed request for petersalas August 22, 2024 04:24

farzadab commented Aug 22, 2024

View reviewed changes

ultravox/training/train.py Show resolved Hide resolved

farzadab commented Aug 22, 2024

View reviewed changes

ultravox/training/train.py Show resolved Hide resolved

zqhuang211 reviewed Aug 22, 2024

View reviewed changes

ultravox/model/ultravox_model.py Show resolved Hide resolved

zqhuang211 reviewed Aug 22, 2024

View reviewed changes

ultravox/training/train.py Show resolved Hide resolved

zqhuang211 reviewed Aug 22, 2024

View reviewed changes

ultravox/training/train.py Outdated Show resolved Hide resolved

zqhuang211 reviewed Aug 22, 2024

View reviewed changes

ultravox/training/train.py Show resolved Hide resolved

revert to using is_master

40a963a

juberti approved these changes Aug 22, 2024

View reviewed changes

ultravox/training/train.py Outdated Show resolved Hide resolved

farzadab mentioned this pull request Aug 27, 2024

Store make_table results fixie-ai/evals#17

Merged

farzadab added 5 commits August 27, 2024 12:07

update evals repo commit

80bae16

Merge remote-tracking branch 'origin/main' into farzad-integrate-oaieval

898abc4

logging eval Table to w&b + make text-only eval optional

0c215a7

formatting

01d53ea

update evals verion (i.e. commit hash)

12f3554

farzadab merged commit 638a7a6 into main Aug 27, 2024
1 check passed

farzadab deleted the farzad-integrate-oaieval branch August 27, 2024 22:31

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Integrating OAI evals post training #85

Integrating OAI evals post training #85

farzadab commented Aug 15, 2024 •

edited

Loading

farzadab commented Aug 22, 2024 •

edited

Loading

juberti left a comment

juberti commented Aug 22, 2024 •

edited

Loading

juberti commented Aug 22, 2024

farzadab commented Aug 27, 2024

Integrating OAI evals post training #85

Integrating OAI evals post training #85

Conversation

farzadab commented Aug 15, 2024 • edited Loading

farzadab commented Aug 22, 2024 • edited Loading

juberti left a comment

Choose a reason for hiding this comment

juberti commented Aug 22, 2024 • edited Loading

juberti commented Aug 22, 2024

farzadab commented Aug 27, 2024

farzadab commented Aug 15, 2024 •

edited

Loading

farzadab commented Aug 22, 2024 •

edited

Loading

juberti commented Aug 22, 2024 •

edited

Loading