Продолжение истории самостоятельного обучения на DA/DS (data analyst, data scientist). Прошло 2 месяца.
Что делал прошлый месяц:
1) SQL , MySQL.
Общее понятие с акцентом на анализ данных: join, window функции, агрегирующие функции, вложенные запросы, primary/foreign keys, триггеры, построение ER диаграмм и тд.
Общее понятие о видах БД. Топ сайт для того чтобы иметь общее представление о существующих видах БД и популярности продуктов.
поделал немного заданий на stratascratch
2) матеша:
бесплатный курс на Яндекс практикум для дата анлитиков: теория множеств, логические операции, комбинаторика (размещения, сочетания), теорвер(условная вероятность, теорема Байеса, распределения случайных величин, мат ожидание сл.в., дисперсия (Var), ковариация (Cov).
Курс в целом отличный, но в конце каша, если честно.
Глазом глянул про построение гипотез(нулевая/альтернативная), A/B тестов и прочие интересности.
3) общее знакомство с ML
концепции и виды , простые эксперименты с DecisionTreeClassifier, RandomForest. Подготовка данных, split / fit / analyse result / choose another model /repeat. (sklearn питона)
лучшая диаграммы для старта чайника
4) Немного визуализации с MatPlotlib
5) Работа с REST API сайтов через py requests.
тянуть данные с БД
6) Знакомство с Google Collab как альтернатива Jupiter.
Супер тема, тк тебе вообще ничего не надо устанавливать и дают вычислительные мощности для простых проектов и обучения.
7) Остальное
по мелочи, про что 2 мес назад вообще понятия не имел.
План:
Чего-то абсолютно нового изучать не планирую, только совершенствование.
Scope: БД / Алгоритмы / Манипуляция данных / ML / Визуализация (tell story).
Tools: SQL ( на базе MySQL, мб PostreSQL и Mongo); Python : pandas , sklearn, matplotlib/seaborn, алгоритмы, requests (пулить данные из сети) и тд.
Другими словами, впереди много чего интересного.
Всем успехов!