|
|
rss_habr
Apache Atlas – доступный data catalogСреда, 25 Мая 2022 г. 18:33 (ссылка)
В задачах построения и развития Data Platform с течением времени мы всегда приходим к вопросу эффективного управления данными. Chief Data Officer, задавшись целью развить, вывести на новый уровень функцию управления данными, склоняются к “тяжеловесным” шагам, внедряя дорогостоящее вендорское ПО или начиная собственную разработку инструментов. В то же время в открытом доступе есть законченные, испытанные временем продукты, с которых можно начать испытывать и развивать процессы и компетенции в области Data Governance, применив минимум затрат на внедрение и двигаясь поступательно методом “маленьких побед”. Apache Atlas является одним из таких доступных open source-инструментов класса Data Catalog, который нам удалось полноценно опробовать и успешно замкнуть на него ряд процессов управления данными. Читать далееhttps://habr.com/ru/post/667834/?utm_source=habrahabr&utm_medium=rss&utm_campaign=667834
rss_habr
Использование Kudu для решения задач в реальном времени в окружении HadoopПятница, 06 Мая 2022 г. 17:18 (ссылка)
В предыдущей статье я поделился нашим опытом создания аналитического хранилища полного цикла на базе экосистемы Hadoop. Одним из тезисов той статьи стало утверждение о том, что аналитическую систему можно спроектировать, не прибегая к федерализации разных технологических платформ, предназначенных для решения локальных задач. В этом материале я попробую подробнее раскрыть, как в нашей системе реализован подход обработки и загрузки данных в реальном времени с использованием технологии Kudu, при котором эти данные сразу доступны для анализа. Читать далееhttps://habr.com/ru/post/664698/?utm_source=habrahabr&utm_medium=rss&utm_campaign=664698
|
LiveInternet.Ru |
Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат О проекте: помощь|контакты|разместить рекламу|версия для pda |