В последние два года ClickHouse стал одним из лидирующих инструментов в задачах OLAP. Высокая производительность в совокупности с встроенными средствами масштабирования и отказоустойчивости дают широкие возможности по построению систем обработки данных. Однако при всём богатстве инструментов, есть ряд нюансов, которые стоит учитывать при проектировании хранилищ: движки хранения данных, система репликации, retention данных.
В докладе Александр Крашенников рассмотривает ряд паттернов использования ClickHouse, которые внедрили в Badoo:
- система хранения гетерогенных событий;
- сильно оптимизированное хранилище timeseries;
- подсистема хранения данных об A/B-тестах;
- Drop detection — система обнаружения отклонений в метриках в один SQL-запрос.
В докладе он рассматривает вопросы надёжной доставки данных в ClickHouse, а также ряд фич из последних релизов (кодеки сжатия данных).