YTsaurus и аналитические витрины с актуальностью в 15 минут / Филипп Козьмин, Яндекс Маркет
Что, если бизнесу нужны сложные аналитические витрины с актуальностью данных в минуты, а выходить в стриминговую обработку на CEP-движках, таких как Flink, дорого и overkill по скорости поставки данных? Есть ли компромиссное решение, не требующее полного разворота на 180 градусов от ETL-процессов, реализованных на SQL-диалекте? И, конечно, это решение должно быть масштабируемым до cотен ТБ. Поэтому это не PostreSQL.
«И оно есть у нас».
Триплет технологий YTsaurus YQL динамические таблицы позволили найти архитектуру поставок данных, повторяющую подход к обработке данных, заложенный в стриминге, но упрощающий реализации. Это дало нам достаточную скорость обработки данных в минуты, помноженную на технологии с невысоким входом и прозрачную для потребителя структуру промежуточных и конечных данных. И — вишенкой на торте — такие поставки интегрированы по данным классическим с T-1-поставками и их можно легко пересчитывать.
Деталями этой реализации на примере расчета быстрой Юнит Экономики в Яндекс Маркете мы и хотим поделиться.
77 views
113
32
2 years ago 00:56:19 6
Что такое YTsaurus и как развернуть его у себя
2 years ago 00:10:41 3
YTsaurus — платформа для хранения и обработки больших данных с открытым исходным кодом
1 year ago 00:47:48 1
YTsaurus — это будущее DWH, и в Яндекс Маркете оно наступило / Филипп Козьмин (Яндекс Маркет)
1 year ago 00:54:15 1
YTsaurus: опыт эксплуатации хранилища из 180К дисков / Павел Сушин (Яндекс)
1 year ago 00:39:39 1
YTsaurus SPYT: помогаем планировщику Apache Spark быть ещё эффективнее / Алексей Шишкин (Яндекс)