Skip to content

kkh090/level4-cv-finalproject-hackathon-cv-18-lv3

 
 

Repository files navigation

🔊 오디오 언어모델의 경량 모델링 레서피 탐구

Audio adapter의 결합 및 사전학습을 통해, 언어모델은 음성/음악/환경음 등의 소리를 이해하고 다양한 downstream task를 수행할 수 있게 되었습니다. VRAM의 크기가 작은 전형적인 디바이스 환경에서는 오디오 언어모델에 대한 경량 모델링이 필수적입니다. Audio understanding benchmarks에 대한 baseline 모델의 정확도를 유지하면서도, 더 작고 빠른 모델을 만드는 레서피를 디자인 해봅시다.

  • 주최 : NOTA, boostcamp AI Tech 7th
  • 기간 : 2025.01.10 ~ 2025.02.10

1. Members 👨🏻‍💻👩🏻‍💻

곽기훈 김민지 김현기 이해강 장희진 홍유향
kkh090 qzzloz hyeonrl98 lazely heeejini hyanghyanging

2. Project Structure 🗂️

📦 level4-cv-finalproject-hackathon-cv-18-lv3/
 ┣ 📂 configs
 ┃ ┣ 📜 train_stage1.yaml
 ┃ ┣ 📜 train_stage2.yaml
 ┃ ┣ 📜 salmonn_eval_config.yaml
 ┃ ┗ 📜 … 
 ┣ 📂 data
 ┣ 📂 demo
 ┣ 📂 eda
 ┣ 📂 wandb
 ┣ 📂 LLMPruner
 ┣ 📂 models
 ┃ ┣ 📂 beats
 ┃ ┃ ┗ 📜 … 
 ┃ ┣ 📜 salmonn.py
 ┃ ┗ 📜 utils.py
 ┣ 📂 scripts
 ┃ ┣ 📜 stage1_run.sh
 ┃ ┣ 📜 stage2_run.sh
 ┃ ┣ 📜 run_eval_efficiency.sh
 ┃ ┗ 📜 … 
 ┣ 📂 utils
 ┃ ┣ 📜 utils.py
 ┃ ┣ 📜 dist_utils.py
 ┃ ┣ 📜 salmonn_utils.py
 ┃ ┣ 📜 logger.py
 ┃ ┣ 📜 metrics.py
 ┃ ┗ 📜 runner.py
 ┣ 📜 config.py
 ┣ 📜 dataset.py
 ┣ 📜 optims.py
 ┣ 📜 train.py
 ┣ 📜 eval.py
 ┣ 📜 evaluate_salmonn.py
 ┣ 📜 evaluate_efficiency_salmonn.py
 ┗ 📜 … 


3. Requirements 💻

  1. Conda 가상환경 생성
conda create -n <가상환경명> python=3.9.17
conda activate <가상환경명>
  1. requirements 설치
bash scripts/requirements.sh
  1. 사전 학습 모델 체크포인트 다운로드

4. Run 🏃🏻

Train

bash scripts/stage1_run.sh
bash scripts/stage2_run.sh

Inference

bash scripts/run_submission_asr.sh

Latency

bash scripts/run_eval_efficiency.sh

5. Reference 🔗

About

level4-cv-finalproject-hackathon-cv-18-lv3 created by GitHub Classroom

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 85.5%
  • Python 14.5%