С сегодняшнего дня все пользователи могут ознакомиться с исходным кодом платформы Яндекс для хранения и обработки больших данных — YTsarus.
У нее нет единой точки отказа, репликация между серверами настроена автоматически, а кластер обновляется без потери вычислительного прогресса. Сама компания используют платформу для управления своими суперкомпьютерами, выстраиванием поискового индекса, а также распределения нагрузки между своими вычислительными мощностями.
Яндекс предлагает использовать YTsarus для решения разных задач:
Построение хранилищ данных, метаданных и ETL.
Машинное обучение при помощи управления кластерами GPU.
Ad hoc аналитика – технология может сама собирать необходимые данные и конвертировать их в отчеты.
Подробнее о возможностях платформы и способах ее применения читайте в статье на Хабре.