Талгат Даулбаев, Надежда Чиркова
Адрес для отправки домашних заданий, вопросов по заданиям и по курсу: [email protected]
В каждом модуле 4 домашних задания (каждое 10 баллов), 4 десятиминутных проверочных (каждая 2.5 балла, в сумме 10 баллов), итоговая сумма за ДЗ делится на 4. Кроме того, каждый студент делает проект в течение двух модулей.
Каждое ДЗ выдается на две (полных) недели. При условии сдачи ПОСЛЕ дедлайна за каждый просроченный день штраф -0.5 балла. Выйти в минус нельзя, то есть через 20 дней после дедлайна сдавать задание не имеет смысла.
За плагиат будем выпарывать строго наказывать обе стороны (вот тут можно уйти в минус). В случае наличия подозрений к присланному решению будем устраивать беседу со сдавшим с вопросами по коду и заданию.
- Домашнее задание 1. Выдано 28.01.16, дедлайн 23:59 10.02.16. Дополнительный материал по numpy и pandas
- Домашнее задание 2, notebook. Выдано 24.02.16, дедлайн 23:59
9.03.1612.03.16. - Домашнее задание 3 (материалы на почте). Выдано 14.03.16, дедлайн 23:59 27.03.16.
- Домашнее задание 4 было не обязательным.
- Домашнее задание 5 (материалы на почте). Выдано 06.05.16, дедлайн 23:59
20.05.1622.05.16. - Домашнее задание 6 Выдано 24.05.2016, дедлайн 23:59 31.05.2016.
- Информация про проекты: UPDATED 21.05.16
- Материалы первой консультации (подготовка и визуализация данных)
- Материалы второй консультации (feature endineering, композиции, разные трюки)
- Данные для предсказания зарплаты и соревнование на kaggle
- Дедлайн по первой части проекта: 10 апреля (позже сдать будет нельзя).
- Первое задание второго модуля: пункт 1 до 23:59 29.05.16 (заполнение таблицы), пункты 2 и 3 до 23:59
05.06.1612.06.16 (сдача ноутбука на почту) - кто сдал 5 июня, бонусный балл. - Второе (финальное) задание второго модуля: до 23:59 19.06.16
Семинар 1. Введение в машинное обучение. Ipython notebook и matplotlib.
Рекомендуемое домашнее задание: установить jupyter notebook, прочитать notebook с семинара и нарисовать график функции в matplotlib (см. в конце ноутбука).
Семинар 2. NumPy.
Хороший туториал по numpy.
Семинар 3. Проверочная по python и matplotlib. Pandas. Знакомство с данными.
- Конспект семинара + Проверочная
- Данные для проверочной, данные для семинара
- Решение проверочной и ликбез по python
Семинар 4. Векторное дифференцирование. Градиентный спуск.
Семинар 5. Sklearn. Метрические классификаторы: kNN.
Семинар 6. Метод максимального правдоподобия. Генерация случайных выборок. Наивный байесовский классификатор.
Семинар 7. Линейная регрессия.
Семинар 8. Линейная классификация.
Семинар 10. API. Метрики качества.
- Ноутбук
- Ответы на вопросы 27−30 (могут быть опечатки)
Семинар 11. Игровой семинар - повторение 1 модуля.
семинар 12. Decision Trees
Семинар 13. Методы отбора признаков и понижения размерности
Семинар 14. K-means своими руками.
Семинар 15. Решение задач по деревьям, композициям и метрическим методам.
Семинар 16. Поиск ассоциативных правил
- James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning
- Видеозаписи курса лекций К. В. Воронцова
- Лекции Andrew Ng на coursera.org: начинается 25 января, но практические задания на языке MATLAB/Octave
- Вводный курс К. В. Воронцова на coursera.org: на русском языке, начинается 26 января, практические задания на языке Python
- https://www.dataquest.io: сайт с интерактивными заданиями по Python для анализа данных
- Pattern Recognition and Machine Learning by C. Bishop: довольно продвинутая книга для особо желающих.