Введение в аналитику больших массивов данных
Курс представляет возможность познакомиться с основными понятиями в области аналитической обработки больших данных. В нем изложены основы машинного обучения, визуализации и хранения больших данных.
По результатам изучения курса читатель сможет переводить проблемы предметной области на язык технологий обработки больших данных.
В курсе излагаются основы машинного обучения по оригинальной методике, читатель познакомится с технологиями обработки больших данных. В ходе изучения будут сформированы представления о технических и методологических средствах анализа больших данных.
Цель: Ориентирование в области технологий и методологий анализа больших данных.
Необходимые знания: Теория вероятностей и математическая статистика, навык самостоятельной работы с различными источниками информации (интернет, печатные издания), умение обобщать информацию, полученную из разных источников, умение представлять результаты своих исследований.
Учебный план
| Модуль 1. Введение в большие данные | |||||
|
Вы можете
посмотреть лекцию
Лекция 1. Общее понятие о больших данных |
|||||
| Лекция 2. Основные вызовы больших данных | |||||
| Лекция 3. Определение термина «большие данные» | |||||
| Лекция 4. Процесс аналитики | |||||
| Тест 1 для курса # 1252 | |||||
| Модуль 2. Введение в Data Mining | |||||
| Лекция 5. Введение в когнитивный анализ данных | |||||
| Лекция 6. Классификация задач. Функция конкурентного сходства | |||||
| Лекция 7. Разработка алгоритмов на базе FRiS-функции | |||||
| Лекция 8. Информативность и выбор признаков | |||||
| Лекция 9. Обнаружение ошибок и заполнение пробелов | |||||
| Тест 2 для курса # 1252 | |||||
| Модуль 3. Основы языка R | |||||
| Лекция 10. Общие сведения о языке R. Основные функции | |||||
| Лекция 11. Синтаксис | |||||
| Лекция 12. Типы данных | |||||
| Тест 3 для курса # 1252 | |||||
| Модуль 4. Инструменты Data Mining | |||||
| Лекция 13. Weka | |||||
| Лекция 14. Визуализация | |||||
| Лекция 15. R как инструмент Data Mining | |||||
| Лекция 16. Решение задач Data Mining. R и Hadoop | |||||
| Лекция 17. Основные библиотеки для Data Mining | |||||
| Лекция 18. Возможности библиотеки Pandas | |||||
| Тест 4 для курса # 1252 | |||||
| Модуль 5. Обзор технологий хранения больших данных | |||||
| Лекция 19. Зачем нужны новые хранилища | |||||
| Лекция 20. Свойства больших данных и ограничения RDBMS | |||||
| Лекция 21. ACID требования, CAP-теорема, BASE архитектура | |||||
| Лекция 22. NoSQL | |||||
| Лекция 23. Интерфейсы | |||||
| Лекция 24. MapReduce | |||||
| Лекция 25. Ключ-значение | |||||
| Лекция 26. Колоночные | |||||
| Лекция 27. Документо-ориентированные | |||||
| Лекция 28. Графовые | |||||
| Тест 5 для курса # 1252 | |||||
| Экзамен | |||||


