Необходимо реализовать скрипт, выполняющий следующие действия:
Для выполнения этого пункта вам понадобится библиотека requests
.
С помощью этой библиотеки можно делать HTTP-запросы в API hh.ru.
Что такое api.
С API, предоставляемым hh.ru, можно ознакомиться здесь.
Общая информация здесь
Вам понадобится этот метод. Чтобы тестировать запросы в api и смотреть, что они возвращают, можно использовать Postman. В качестве поискового запроса можно вводить ключевые слова, связанные с тематикой анализа данных: machine learning, data science, машинное обучение, big data, data analytics и тд. В ответе API будут интересующие нас поля: salary, area, name, employer
Необходимо сделать обработку полученных на первом шаге данных и получить следующую структуру: Словарь, где ключом является название вакансии (как оно задано на hh.ru), а значением - медианное значение зарплаты по этой вакансии. То есть необходимо сгруппировать данные по имени вакансии. Также можно использовать другие варианты, например, сгруппировать по городу или любому другому интересному параметру из выдачи. В поле salary hh.ru отдает значения диапазона. Значением зарплаты считать среднее значение из диапазона, например, если зп от 100 до 150, то фиксировать значение 125.
Необходимо выделить диапазоны зарплат, например:
до 80к, 80-120к, 120-150к, 150-200к, 200-300к, 300к+
Для каждого диапазона подсчитать количество предлагаемых вакансий.
Построить гистограммы распределений с легендой и подписями осей с использованием библиотек matplotlib или seaborn
Для выполнения заданий необходимо использовать функции [map, list, reduce, filter] (http://book.pythontips.com/en/latest/map_filter.html). Чтобы не писать все в одном файле можете установить jupyter.