python & Jupyter Notebook

Массовый анализ зарплат на HH.RU через API

Как анализировать текущую заработную плату на рынке труда по требуемой професси в конкретном городе за минуту
HeadHunter - онлайн сервис поиска работы. Он помогает найти работу соискателям, а работодателям - персонал. Быть может для многих будет открытием, но помимо поиска работы и персонала, HH.RU предоставляет API (программный интерфейс приложения). Попросту говоря, это инструмент взаимодействия нескольких программ, т.е. “прослойка” между приложением А и приложением Б. Как вы уже успели догадаться, хедхантер может отдавать данные, а наше приложение получать и обрабатывать. Какие именно данные hh.ru отдает описано на странице документации.

Я же хочу рассказать как получить информацию по заработным платам по опубликованным вакансиям работодателей по искомой должности или профессии.

Эта статистическая информация о распределении заработных плат по текущим опубликованным вакансиям будет полезна для работодателей тем, что появится понимание уровня заработных плат в конкретном городе и по конкретной специальности. Что даст ясность в назначении заработной платы в публикуемой вакансии: чтобы она была, как минимум, на уровне конкурентов, и в тоже время не выше рынка. А в случае, если требуется срочно нанять сотрудника, то какое предложение по зарплате тогда делать. Ведь занижая уровень заработной платы сужается круг потенциальных кандидатов и их профессионализм. А количество опубликованных вакансий вкупе с опубликованными резюме в какой-то степени говорит о степени конкуренции за кадры.

Для работников и кандидатов информация поможет понять на сколько их зарплата соответсвует рынку и на сколько уместно просить прибавку. И весь этот отчет, однажды подготовленный, формируется в любой момент в течение пары-тройки минут.

Обзор кода и модификация

Давайте посмотрим что же мы должны получить в итоге на примере вакансии менеджер по продажам. Страница результатов поиска показывает что в Москве имеется 16714 вакансий на данный момент времени.
Нам необходимо будет спарсить все вакансии, в которых указана заработная плата. Карточка вакансии состоит из наименования и описания, уровней зарплаты "от" и "до".
Будем собирать наименование и уровни зарплаты. В вакансиях, в которых указана только заработная плата "от" будем парсить только "от", а в которых заработная плата не указана, будем пропускать.
Посмотреть и скачать код для Jupyter Notebook, который будет извлекать из вакансий заработные платы по конкретному городу можно на моем аккаунте github. О работе кода я рассказываю на видео выше. Вам достаточно будет поставить только свои значения, составить запрос и получить результаты.

API HH.RU возвращаться по 100 результатов и это максимум, который возможен. Номер региона находится в справочнике Хэдхантера "Area". Дерево всех регионов находится здесь.
После окончания работы скрипта остается построить отдельные графики распределения и ящики с усами по спискам зарплат "от" и "до", а также рассчитать средние значения.
В нашем примере средние значения зарплат менеджеров по продажам в Мурманске получились 49 318 и 66 000 руб. соответственно.

Все графики, которые построили на основе данных парсинга сохраняются в папку со скриптом.

Таким нехитрым способом вы можете проанализировать уровень заработных плат в интересующим вас регионе и необходимой профессии.

Хотите чтобы мы проанализировали вам зарплаты?