Skip to content

DataSagess/FIC

Repository files navigation

FIC_hackaton

image

Ссылка на хакатон

Кейс репозитория:

Оценка уровня экспертности по резюме

Необходимо разработать систему оценки уровня эксперта по резюме.

Оценка должна должна учитывать:

  • Рейтинг организаций, в которых работал кандидат
  • Годы релевантного опыта
  • Компания, куда собеседуется кандидат
  • Грейд внутри компании, где работал кандидат Также для подсчёта финальной оценки можно учитывать любые другие факторы, информацию о которых дана в резюме. Для реализации можно использовать как готовые модели с подключением по API, так и дообучать open-source модели или создавать свои.

Предоставляемые данные

Датасет из резюме кандидатов и оценок уровня экспертности

Структура репозитория

  • data: Исходные и дополнительные данные
  • images: Изображения для визулала Desctop
  • models: Используемые модели
  • notebooks: Jupyer Notebooks
  • preprocessing: Файлы с функциями для препроцессинга
  • main.py: Основной файл для запуска
  • api.py: Файл для запуска API
  • desctop.py: Файл для запуска desctop приложения

Pipeline

Файл main.py считывает данные из json файла из папки data, после чего генерирует параметры (файлы в папке preprocessing), затем производится очистка данных и используется модель для предсказания результирующей переменной. Генерация параметров происходит за счёт "ручной" обработки текста, а так же векторизации алгоритмом BERT *В проекте используется Cuda.