Запрос сформирован тем, что просмотр фильмов на оригинальном языке это популярный и действенный метод прокачаться при изучении иностранных языков. Важно выбрать фильм, который подходит студенту по уровню сложности, т.ч. студент понимал 50 - 70 % диалогов. Чтобы выполнить это условие, преподаватель должен посмотреть фильм и решить, какому уровню он соответствует. Однако это требует больших временных затрат.
Цель: разработать ML решение для автоматического определения уровня сложности англоязычных фильмов.
Для чего мы это делаем? Где будет применяться? Решение будет применяться преподавателями английского языка, чтобы оценить уровень лексики, который используется в фильме и который потребуется студенту, чтобы понять большую часть происходящего. Задача: Разработать ML решение для автоматического определения уровня сложности англоязычных фильмов. За время работы над проектом вы обучите языковую модель, разработаете для неё веб-интерфейс и создадите микросервис.
План работ:
- Предобработка данных
- Выбор метрики
- Создание модели
- Анализ результатов
- Сохранение модели и создание приложения Streamlit
Необходимые библиотеки:
- NLTK
- Numpy
- pandas
- PyPDF2
- pysrt
- re
- sklearn
Ссылки: