Speech Dataset Pipeline - WIP

Step 0: Download audio files from RTHK
Step 1: Split audio files into smaller chunks
Step 2: Source separation
Step 4: Language detection
Step 3: Voice enhancement

Prerequisites

pip install -r requirements.txt

Usage

# Download audio file and convert to 16kHz, at this stage, it would create a folder `audios` for original audio files and `audios_16k` for 16kHz audio files
python step-0.py

# Split audio files into smaller chunks and speaker diarization
python step-1.py --audio_root_path audios_16k

# Source separation, remove background music
python step-1.py --audio_root_path chunks

TODO...

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
clustering.py		clustering.py
demo.ipynb		demo.ipynb
diarizer.py		diarizer.py
metadata.csv		metadata.csv
requirements.txt		requirements.txt
step-0.py		step-0.py
step-1.py		step-1.py
step-2.py		step-2.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Speech Dataset Pipeline - WIP

Prerequisites

Usage

About

Releases

Packages

Languages

hon9kon9ize/speech-dataset-pipeline

Folders and files

Latest commit

History

Repository files navigation

Speech Dataset Pipeline - WIP

Prerequisites

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages