В качестве домашнего задания мы предлагаем вам решить задачу бинарной классификации на большом корпусе imdb рецензий на фильмы.
Корпус можно скачать по ссылке
http://ai.stanford.edu/~amaas/data/sentiment/Ваша задача в sklearn, используя один из алгоритмов, рассмотренных на паре, построить и обучить классификатор, посчитать метрики качества, построить ROC кривую и посчитайте величину ROC AUC. - 4 балла
Используя предсказания вероятностей класса, найдите 15 самых негативных и самых позитивных рецензий по мнению модели. - 3 балла
Написать свои функции, которые бы считали tp, fp, tn, fn, и возвращали точность, полноту и ф-меру и применить их к результатам, полученным вашими классификаторами (если все сделано правильно, то результаты должны совпадать с полученными sklearn метриками). - 3 балла
Дедлайн - 11 октября 23:59