skip to main | skip to sidebar

Скахин Алексей / pihel

Личный блог. Заметки о программировании и не только

Страницы

Главная страница
Резюме
SQL
BigData

понедельник, 19 августа 2019 г.

Оптимизация хранения данных в bigdata

ORC: формат файла
Партицирование
Кластеризация
Сортировка
ORC: Bloom filter
Ускорение вставки в кластеризованную таблицу с динамическим партицированием
Сравнение результатов
Сравнение ORC с Parquet
Hive: Predicate pushdown
- Join predicate pushdown
- Partition pruning
Hive: BroadCast Join
Skew Join
Hive 3: Materialized view
Hive LLAP
Iceberg

5 комментариев:

Поделиться

Главная страница

Открыть веб-версию