Great Expectations, это решение для тестирования качества данных, активно используется дата инженерами во многих компаниях, в т.ч. и в России (например обсуждается в группе Data Engineers в которой 3800 русскоговорящих участников)

Фреймворк на базе Python помогает определить правила проверок качества данных в удобном для дата инженеров формате. Проверки запускаются отдельным шагом в после завершения шага транспорта или трансформации данных. После запуска проверки генерируется отчет качества данных с человеко-читаемыми формулировками созданными на основе кода проверки. Проверки качества данных можно создать автоматически используя тренинговые дата-сеты, что позволит сильно ускорить разработку.

Great Expectations не обладает функциональностью “проверки качества кода”, не является оркестратором (таким как Airflow), не хранит и не версионирует данные. Альтернативы assertR для экосистем R и TFDV для TensorFlow экосистемы или Deequ для Spark.

Планы развития коммерческого предложения: существенное упрощение исполнения проверок через SaaS сервис со встроенным UI, охват менее опытных пользователей.

Партнерство по продажи в России безусловно востребованной SaaS версии решения видится ограниченным из за локации вендора в США.

Критика:

Перспективы: