Скрыть объявление
Гость

Вы находитесь в разделе
+ Курсы по программированию
Рекомендуем посмотреть
Топ курсов данного раздела
Рекомендуем обратить внимание на
ТОПы КУРСОВ подразделов данного раздела
по мобильной разработке
по Frontend
по Backend
по разработке компьютерных игр
по этичному хакингу
по разработке ПО
по верстке сайтов
по Python
по Javascript (JS)
по Java
по PHP
по Swift
по C#
по Unity
по 1C
по SQL

ДОСТУПНО Big Data для Data Science [Stepik Academy] [Александр Савченко, Анатолий Карпов]

Тема в разделе "+ Курсы по программированию (общий каталог)", создана пользователем admin, 4 сен 2020.

  1. admin

    admin Команда форума Admin

    Регистрация:
    10 мар 2019
    Сообщения:
    21.885
    Деньги:
    2.687 руб.

    Автор: [Stepik Academy] [Александр Савченко, Анатолий Карпов]
    Название: Big Data для Data Science

    1.png

    Описание курса

    Первая неделя. Введение в Big Data для Data Science

    1. Зачем DS знать Big Data?
    • Зачем нужны DS?
    • Две проблемы в работе с данными для DS
    • Teamwork (Data Engineer + Data Science + Data Analyst)
    2. Хранилища данных (SQL/NoSQL обзор)
    • SQL (PostgreSQL, MySQL)
    • NoSQL (Document, KV, Column, Graph)
    3. Обработка данных (Hadoop/Spark)
    • Применение Hadoop
    • Применение Spark
    4. Вебинар первой недели

    Вторая неделя. Hadoop

    1. Архитектура Hadoop и компоненты

    2. HDFS

    • Свойства
    • NameNode/DataNode
    • Отказоустойчивость
    • Работа с HDFS
    3. MapReduce парадигма (YARN/MR)
    4. Реляционные БД и SQL
    5. Hbase & Cassandra & ClickHouse
    6. Hive
    5. Вебинар второй недели


    Третья неделя. Spark

    1. Архитектура Spark и компоненты
    • Применение
    • Spark Core/SQL/Streams/GraphX/ML
    • Архитектура
    • Выполнение задач и мониторинг (master, mode...)
    2. Core (RDD/DataFrame)
    • RDD
    • DataFrame
    • DataFrame Spark vs Pandas (link)
    3. SparkSQL
    • Dataframe as SQL table
    4. Spark Streaming & Apache Kafka
    • Применение
    • Spark Streaming
    • Apache Kafka
    5. Вебинар третьей недели

    Четвёртая неделя. Workflow

    1. Архитектура хранилищ Data Warehouse vs Data Lake
    • Data Warehouse компоненты, плюсы и минусы
    • Data Lake компоненты, плюсы и минусы
    • Cloud AWS/GCP
    2. Управление задачами
    • ETL & ELT
    • Apache Airflow
    3. Вебинар четвёртой недели

    Пятая неделя. SparkML

    1. Модели и алгоритмы Spark ML
    • Spark ML Архитектура
    • Spark ML модели и алгоритмы
    • Spark ML - Практика
    • Spark ML - Задачи
    Шестая неделя. BI Tools
    • Введение в Business Intelligence
    • SuperSet - Практика
    • SuperSet - Задачи

    Продажник


     
    2 пользователям это понравилось.
  2. admin

    admin Команда форума Admin

    Регистрация:
    10 мар 2019
    Сообщения:
    21.885
    Деньги:
    2.687 руб.
Загрузка...
Похожие темы - Big Data для
  1. admin
    Ответов:
    2
    Просмотров:
    10
  2. admin
    Ответов:
    2
    Просмотров:
    18
  3. admin
    Ответов:
    2
    Просмотров:
    179
  4. (аноним)
    Ответов:
    2
    Просмотров:
    267
  5. (аноним)
    Ответов:
    2
    Просмотров:
    339