![](https://skahin.ru/blog/img/sys_design.png)
среда, 3 июля 2024 г.
Grokking System Design Interview for Engineers
Метки:
bigdata,
db,
system design
![](https://skahin.ru/blog/img/sys_design.png)
четверг, 20 июня 2024 г.
воскресенье, 28 апреля 2024 г.
ClickHouse vs Spark в Яндекс облаке
Метки:
bigdata,
clickhouse,
performance,
s3,
spark,
yandex
Часто для DA/DS нужно расчитать множество разрезов одного агрегата.
При расчете не нужны join, но наличие distinct не дает свести к подходу от большего к меньшему.
В этой заметке попытался понять степень преимущества ClickHouse перед Spark и где есть недостатки в реалиях ЯО (спойлер: стоимость и IO при работе с S3).
При расчете не нужны join, но наличие distinct не дает свести к подходу от большего к меньшему.
В этой заметке попытался понять степень преимущества ClickHouse перед Spark и где есть недостатки в реалиях ЯО (спойлер: стоимость и IO при работе с S3).
четверг, 28 марта 2024 г.
CDC репликация средствами Debezium и Kafka Connect
Метки:
bigdata,
debezium,
kafka,
kafka connect,
mysql
Настрока CDC репликации данных между реляционной бд MySql и Kafka
четверг, 21 марта 2024 г.
Популярные группы leetcode задач
![](https://skahin.ru/blog/img/algo/leetcode.png)
Алгоритмы написаны на Scala 2.12 в java стиле.
Задача может быть сразу в нескольких разделах.
Подписаться на:
Сообщения (Atom)