Последние темы автора:
- [Евгений Паромов] Проектирование платформы методом EventStorming
- [Современное образование] Русский язык. Теория языка. 1 - 11 класс (2025)
- [Дмитрий Черемушкин] Стратегический вебинар по крипто рынку (блокчейн и DeFi) (Октябрь 2025)
- [Данила Сусак] Клуб Битва за молодость 2.0. Модуль 4. Дух Дракона. Часть 4. Модуль 4ПРО. Развивая стратегию. Часть 1. Тариф 1 месяц (2025)
- [Надежда Бейнер] Визуализация и дизайн интерьера в HOMESTYLER
- #1
Голосов: 0
[BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:
- подходы к Realtime-обработке;
- гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
- Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
- архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
- семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
- отличия Key-Value хранилищ от реляционных БД;
- компактификация и её виды, CQLSH;
- архитектура Cassandra;
- обеспечение надёжности и высокодоступности в Key-Value хранилищах;
- интеграция Spark с Cassandra.
- как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
- trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
- форматы данных в Big Data: ORC vs Parquet, Avro, ...
Для просмотра ссылок пройдите регистрацию
Скачать - [BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)
Вы должны Войти на форум чтобы увидеть контент.
