Инструментальные средства для автоматизации и анализа данных
Курс программирования на языке Python для аналитиков данных. Предназначен в первую очередь для аналитиков данных, а также для всех, кто хочет изучить язык Python для его профессионального использования. В основу курса положены стандарты Института открытых программ дополнительного образования Высшей школы экономики.
Курс создан с упором на анализ данных, в связи с чем иллюстрирован большим количеством учебных примеров, написанных автором специально под тематику курса (сложность примеров возрастает по мере обучения).
Курс состоит из двух частей, дополнительных веб-семинаров по изученным темам и десяти очных встреч с ментором.
Учебный план
| Для начинающих | |||||
| 01. Введение в язык Python. Знакомство со средой программирования (интерпретатор Python и IDE PyCharm). Работа с командной строкой. Утилиты, команды, пайплайны | |||||
|
Вы можете
посмотреть лекцию
01.01. Обзор языка Python |
|||||
| 01.02. Инструментарий создания программ Python | |||||
| 01.03. Установка Python и PyCharm | |||||
| 01.04. Работа с командной строкой | |||||
| 01.05. Пайплайны | |||||
| 02. Простые типы данных. Базовые операции над ними. Интерпретация ошибок | |||||
| 02.01. Базовые литералы | |||||
| 02.02. Целые десятичные числа | |||||
| 02.03. Двоичные числа | |||||
| 02.04. 16- и 8-ричные | |||||
| 02.05. Числа с плавающей точкой | |||||
| 02.06. Строковые литералы | |||||
| 02.07. Логические или булевы литералы | |||||
| 02.08. Концепция переменной | |||||
| 02.09. Базовые типы данных | |||||
| 02.10. Приведение типов | |||||
| 02.11. Математические операции | |||||
| 02.12. Целочисленные операции | |||||
| 02.13. Битовые операции | |||||
| 02.14. Логические операции | |||||
| 02.15. Операции со строками | |||||
| 02.16. Интерпретация ошибок | |||||
| 03. Понятие управляющих конструкций. Условные операторы. Циклы for и while | |||||
| 03.01. Знакомство с PyCharm | |||||
| 03.02. Управляющие конструкции и условные операторы | |||||
| 03.03. Циклы for | |||||
| 03.04. Циклы while | |||||
| 03.05. Еще немного о циклах | |||||
| 04. Функции в Python. Лямбда-выражения и лямбда-функции. Рекурсия | |||||
| 04.01. Базовые методы Python для вывода данных | |||||
| 04.02. Метод Python для ввода данных | |||||
| 04.03. Функции | |||||
| 05. Регулярные выражения: синтаксис, сложные выражения, получение данных из веб-документа | |||||
| 05.01. Регулярные выражения | |||||
| 05.02. Синтаксис регулярных выражений | |||||
| 05.03. Составные регулярные выражения | |||||
| Тест 1 для курса Основы языка Python | |||||
| 06. Объектно-ориентированное программирование. Классы и объекты Python. Иерархия и наследование. Строки как экземпляры класса str. Понятие библиотеки. Библиотечные модуль. Выборочное импортирование. Пакеты | |||||
| 06.01. Объектно-ориентированное программирование | |||||
| 06.02. Иерархия классов | |||||
| 06.03. Строки Python как объекты | |||||
| 06.04. Набор методов класса str | |||||
| 06.05. Повторное использование кода | |||||
| 06.06. Выборочное импортирование атрибутов | |||||
| 06.07. Пакеты | |||||
| 07. Составные типы данных в Python (строки, списки, множества и словари). Итераторы, генераторы, генераторы списков | |||||
| 07.01. Списки | |||||
| 07.02. Вложенный список и рекурсия | |||||
| 07.03. Кортежи | |||||
| 07.04. Словари | |||||
| 07.05. Итераторы и генераторы | |||||
| 08. Защита от ошибок. Исключительные ситуации. Обработка исключений. Поиск ошибок в коде и отладка. Git. Работа с Git через командную строку (Git Bash). Работа с Git средствами PyCharm (в том числе работа с удаленным репозиторием в GitHub) | |||||
| 08.01. Исключения | |||||
| 08.02. Обработка исключительных ситуаций при помощи Try | |||||
| 08.03. Ищем ошибки вместе с PyCharm | |||||
| 08.04. Версии | |||||
| 08.05. Работа с Git через командную строку | |||||
| 08.06. Git и PyCharm | |||||
| 09. Файлы и работа с ними. Продвинутая работа со словарями | |||||
| 09.01 Концепция файла | |||||
| 09.02 Чтение файла | |||||
| 09.03 Создание файла и добавление в него записей | |||||
| 09.04 Продвинутая работа со словарями | |||||
| Тест 2 для курса Основы языка Python | |||||
| Для продолжающих | |||||
| 10. O-нотация и понятие о сложности вычислений. Ускорение работы кода на Python | |||||
| 10.01 Сложность вычислений | |||||
| 10.02 O-нотация | |||||
| 10.03 Примеры алгоритмов различной сложности | |||||
| 10.04 Факториальная сложность | |||||
| 10.05 – Ускорение работы кода. Профилирование | |||||
| 11. Введение в DOM. Сбор данных: web-scraping с BeautifulSoup | |||||
| 11.01 – Введение в HTML | |||||
| 11.02 – HTML и DOM | |||||
| 11.03 – Web Scraping с BeautifulSoup.prproj | |||||
| 11.04 – Парсинг страниц из сети | |||||
| 11.05 – Работа с XML-файлами | |||||
| 12. Сбор данных: Selenium, работа с сервисами через API | |||||
| 12.01 – Формы и методы GET и POST | |||||
| 12.02 – Selenium | |||||
| 12.03 – Работа с Selenium | |||||
| 13. Введение в SQL и базы данных с помощью Python | |||||
| 13.01 – Введение в базы данных | |||||
| 13.02 – SQLite | |||||
| 13.03 – Создаем первую базу данных | |||||
| 13.04 – Python и SQLite3 | |||||
| 14. Работа с SQL и базами данных с помощью Python. Работа с Excel-файлами | |||||
| 14.01 – SQLite3 и SQL | |||||
| 14.02 – Парсинг Excel-файла | |||||
| 14.03 – Сохранение данных в Excel-файл | |||||
| 14.04 – Работа с CSV-файлами | |||||
| 14.05 – Реляционная модель | |||||
| 14.06 – Форматы команды SELECT | |||||
| 15. Введение в numpy. Работа с векторами и матрицами | |||||
| 15.01 – Основа работы с массивами ndarray | |||||
| 15.02 – Простые операции с векторами и матрицами | |||||
| 15.03 – Манипуляции над массивами | |||||
| 15.04 – Линейная алгебра и дополнительные операции | |||||
| 16. Введение в pandas и разведочный анализ данных | |||||
| 16.01 – Класс Series | |||||
| 16.02 – Класс DataFrame | |||||
| 16.03 – Индексы | |||||
| 16.04 – Операции над массивами | |||||
| 17. Работа с пропущенными значениями в данных | |||||
| 17.01 – Отсутствующие данные | |||||
| 17.02 – Фильтрация отсутствующих данных | |||||
| 17.03 – Восполнение пропущенных значений | |||||
| 18. Визуализация для презентации данных: matplotlib. Основные виды графиков. Основные ошибки при создании визуализаций | |||||
| 18.01 – Знакомство с Matplotlib.prproj | |||||
| 18.02 – Конструирование графика | |||||
| 18.03 – Классы Figure и Axes | |||||
| 18.04 – Основные виды графиков | |||||
| 18.05 – Основные виды графиков. Продолжение | |||||
| 19. Создание интерактивных визуализаций: plotly | |||||
| 19.1 – Введение в Plotly | |||||
| 19.2 – Интерактивность при работе с точечными и линейными графиками | |||||
| 19.3 – Работа с другими графиками plotly | |||||
| 19.4 – Plotly и Dash – полная интерактивность | |||||
| 20. Разведывательный анализ данных. Особенности исследования текста. Наивный байесовский классификатор. Признаковое описание текстов | |||||
| 20.01 – Разведывательный анализ данных | |||||
| 20.02 – Особенности исследования текста | |||||
| 20.03 – Наивный байесовский классификатор | |||||
| 20.04 – Признаковое описание текстов | |||||


