Введение в аналитику больших массивов данных
Курс представляет возможность познакомиться с основными понятиями в области аналитической обработки больших данных. В нем изложены основы машинного обучения, визуализации и хранения больших данных.
По результатам изучения курса читатель сможет переводить проблемы предметной области на язык технологий обработки больших данных.
В курсе излагаются основы машинного обучения по оригинальной методике, читатель познакомится с технологиями обработки больших данных. В ходе изучения будут сформированы представления о технических и методологических средствах анализа больших данных.
Цель: Ориентирование в области технологий и методологий анализа больших данных.
Необходимые знания: Теория вероятностей и математическая статистика, навык самостоятельной работы с различными источниками информации (интернет, печатные издания), умение обобщать информацию, полученную из разных источников, умение представлять результаты своих исследований.
Учебный план
Модуль 1. Введение в большие данные | |||||
Вы можете
посмотреть лекцию
Лекция 1. Общее понятие о больших данных |
|||||
Лекция 2. Основные вызовы больших данных | |||||
Лекция 3. Определение термина «большие данные» | |||||
Лекция 4. Процесс аналитики | |||||
Тест 1 для курса # 1252 | |||||
Модуль 2. Введение в Data Mining | |||||
Лекция 5. Введение в когнитивный анализ данных | |||||
Лекция 6. Классификация задач. Функция конкурентного сходства | |||||
Лекция 7. Разработка алгоритмов на базе FRiS-функции | |||||
Лекция 8. Информативность и выбор признаков | |||||
Лекция 9. Обнаружение ошибок и заполнение пробелов | |||||
Тест 2 для курса # 1252 | |||||
Модуль 3. Основы языка R | |||||
Лекция 10. Общие сведения о языке R. Основные функции | |||||
Лекция 11. Синтаксис | |||||
Лекция 12. Типы данных | |||||
Тест 3 для курса # 1252 | |||||
Модуль 4. Инструменты Data Mining | |||||
Лекция 13. Weka | |||||
Лекция 14. Визуализация | |||||
Лекция 15. R как инструмент Data Mining | |||||
Лекция 16. Решение задач Data Mining. R и Hadoop | |||||
Лекция 17. Основные библиотеки для Data Mining | |||||
Лекция 18. Возможности библиотеки Pandas | |||||
Тест 4 для курса # 1252 | |||||
Модуль 5. Обзор технологий хранения больших данных | |||||
Лекция 19. Зачем нужны новые хранилища | |||||
Лекция 20. Свойства больших данных и ограничения RDBMS | |||||
Лекция 21. ACID требования, CAP-теорема, BASE архитектура | |||||
Лекция 22. NoSQL | |||||
Лекция 23. Интерфейсы | |||||
Лекция 24. MapReduce | |||||
Лекция 25. Ключ-значение | |||||
Лекция 26. Колоночные | |||||
Лекция 27. Документо-ориентированные | |||||
Лекция 28. Графовые | |||||
Тест 5 для курса # 1252 | |||||
Экзамен |
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: