Эффективный Spark. Масштабирование и оптимизация — Если у вас уже есть положительный опыт использования Spark для решения небольших задач, но вы по-прежнему ломаете голову – где та самая непревзойденная производительность Spark, позволяющая перемалывать колоссальные объемы данных – то эта книга для вас. Она расскажет, как эффективно использовать Spark для укрощения больших данных и вырасти из новичка в специалиста. Идеально подходит для программистов, инженеров по работе с данными, системных администраторов, обслуживающих крупномасштабные приложения.
Название: Эффективный Spark. Масштабирование и оптимизация Автор: Карау Х., Уоррен Р. Издательство: Питер Год: 2018 Страниц: 352 Формат: PDF Размер: 10,21 МБ Качество: отличное Язык: русский
Содержание:
Предисловие Глава 1. Введение в эффективный Spark Глава 2. Как работает Spark Глава 3. Наборы DataFrame/Dataset и Spark SQL Глава 4. Соединения (SQL и Core) Глава 5. Эффективные преобразования Глава 6. Работа с данными типа «ключ — значение» Глава 7. Выходим за рамки Scala Глава 8. Тестирование и валидация Глава 9. Spark MLlib и ML Глава 10. Компоненты и пакеты фреймворка Spark Приложение. Тонкая настройка, отладка и другие аспекты, обычно игнорируемые разработчиками