Материалы курса "Информационный поиск" который читается в МГТУ и других вузах осенью 2024 г.
Тут будут:
- код который показывали на семинарах
- шаблоны ДЗ
- и другие полезные материалы
Как самостоятельно запустить код, который показывали на семинарах?
Во-первых, нам понадобится машина с Linux, или любой другой UNIX-подобной системой, в которой:
- будет установлен python, "официальная" версия на которой преподаватели сами проверяли код это python 3.12 (но и на более ранних скорее всего все заведется)
- будут доступны shell (предпочтительно bash) и стандартные утилиты UNIX такие как ls и т.д.
Теперь предположим, что мы хотим запустить ноутбук seminars/08-learning-to-rank/catboost_ltr.ipynb из 8-го семинара про машинное обучение ранжированию.
Для этого сначала потребуется создать виртуальное окружение (ВНИМАНИЕ: для каждого семинара это окружение свое!).
Это делается так:
$ cd ДИРЕКТОРИЯ-В-КОТОРУЮ-ВЫ-СКЛОНИРОВАЛИ-РЕПУ-КУРСА
# Создадим папку для виртуальных окружений (если еще не создавали)
$ mkdir -p .venvs
# Создадим виртуальное окружение для семинара
$ python3 -m venv .venvs/seminar-08-learning-to-rank
Теперь надо активировать окружение и поставить в него пакеты, перечисленные в файлике ПАПКА-СЕМИНАРА/requirements.txt:
# Активируем окружение
$ source .venvs/seminar-08-learning-to-rank/bin/activate
# Ставим пакеты
$ pip install -r seminars/08-learning-to-rank/requirements.txt
# Смотрим что поставилось
$ pip list
В результате в окружении должны стать доступны:
- все необходимые для работы питонячие библиотеки, такие как catboost или whoosh
- jupyter-ноутбук
Теперь, находясь внутри окружения, запускаем jupyter, переходим в браузер и открываем интересный нам ноутбук из семинара:
# Запускаем jupyter
$ jupyter notebook