Анализ данных
Много лет стремлюсь систематизировать и анализировать данные. В 2021 году прошёл курс Яндекс.Практикума «Аналитик данных» (Python + pandas, SQL, Tableau, PowerPoint). Изучаю математическую статистику и теорию вероятности, программирование на Python. Создаю свои датасеты по аэропортам России и самолётному парку авиакомпаний, баскетболу, электростанциям. С сентября 2021 года работал аналитиком данных в одной из крупнейших лизинговых компаний России - «Европлан».
Исследования

Исследование объявлений о продаже квартир в Санкт-Петербурге и Ленинградской области: Python+Jupyter Notebook (учебный проект курса «Яндекс.Практикума»)
SQL

Опыт работы с SQL с 2004 года.

СУБД: MS SQL (T-SQL), PostgreSQL (PL/pgSQL), Oracle, MySQL.

Свой проект, созданный самостоятельно: база данных фигурного катания России

Использую:
  • Разные виды джоинов (inner join, left join)
  • Агрегатные функции (count, sum, avg, max, min)
  • Оконные функции (ранжирующие - row_number, dense_rank; смещения - first_value, last_value, lag)
  • Временные таблицы
  • Общие табличные выражения (CTE)
  • Выражения case, coalesce, nullif
  • Вложенные запросы
  • Предикат [not] exists
  • Поля JSON
  • Индексы (create [unique] index)
  • Анализ таблицы (analyze)
  • Хранимые процедуры на MS SQL Server и PostgreSQL
Python

Парсинг данных игроков чемпионата России по футболу 2020/21 с сайта Championat.com: Python+Jupyter Notebook (успешное тестовое задание на разработчика аналитических систем)

Основной инструмент - Jupyter Notebook, немного PyCharm.

Библиотеки для анализа данных (pandas, NumPy) и визуализации (Matplotlib, Seaborn, Plotly).

Для проверки гипотез использую тесты: t-критерий Стьюдента, U-критерий Манна - Уитни, Z-тест.

Изучаю ML. Работал с библиотекой Scikit-learn: fit/predict, построение моделей (дерево решений, логистическая регрессия и случайный лес). Делал кластеризацию клиентов с помощью KMeans.
Презентация

Графики в Numbers:

Статистика аэропортов и авиакомпаний (собственное исследование):

Numbers: Пассажиропоток аэропортов Краснодарского края в 2016-2020 годах Numbers: Динамика пассажиропотока аэропортов России и Краснодара в 2017-2020 годах Numbers: Перевозка грузов авиакомпанией AirBridgeCargo в 2010-2020 годах

Tableau:
Дашборд со статистикой авиакомпаний России (собственное исследование)

Дашборд по взаимодействию пользователей и темам карточек Яндекс.Дзен (учебный проект курса «Яндекс.Практикума»)

MS PowerPoint:
Презентация исследования рынка общественного питания Москвы (учебный проект курса «Яндекс.Практикума»)

Курсы

Яндекс.Практикум:

  • «Аналитик данных (Data Analyst)» (полный 6-месячный курс)
  • «Инженер данных (Data Engineer)» - в процессе прохождения (бета-версия 6-месячного курса)
  • «Визуальные презентации»
  • «Excel для работы»
  • Вводные части «Python-разработчик», «Менеджер по интернет-маркетингу» и «Веб-разработчик»

Stepik

  • Введение в Data Science и машинное обучение (Анатолий Карпов)
  • Основы статистики (Анатолий Карпов)
  • Программирование на Python
  • Визуализация данных и основы работы в Tableau
  • Работа с электронными таблицами Excel