|
|
![]() Цвет сезона – слива. Что мы сделали с GreenPlum в 2022-м и что планируем в 2023-мСреда, 18 Января 2023 г. 12:07 (ссылка)
Привет, Хабр! Меня зовут Марк Лебедев, работаю архитектором в GlowByte. В июне 2022 года на митапе DataPeople мы с командой рассказывали о наших планах в части GreenPlum (запись выступления). Если коротко, тогда мы сфокусировались на развитии open-source и собирались выложить в публичный доступ наши наработки относительно мониторинга кластера и мониторинга запросов, плейбуки по инсталляции и наши подходы для нагрузочного тестирования. Собственно про них и хотелось бы поговорить подробно. В этой статье мы подведём итоги, что нам удалось сделать за прошедшие 6 месяцев, и расскажем о планах на будущий год. В конце статьи укажем все ссылки на репозитории. Читать далееhttps://habr.com/ru/post/711206/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711206
![]() Особенности VACUUM в MPP-форках PostgreSQLПонедельник, 16 Января 2023 г. 14:28 (ссылка)
Один из важнейших аспектов, за которым должен следить каждый администратор баз данных PostgreSQL — процесс поддержания «здоровья» базы данных vacuum / autovacuum, удаляющий из памяти неактуальные версии табличных строк и сбрасывающий счётчик транзакций. В этой статье я систематизировал особенности vacuum / autovacuum, с которыми сталкиваются администраторы MPP-РСУБД. Читать далееhttps://habr.com/ru/post/710806/?utm_source=habrahabr&utm_medium=rss&utm_campaign=710806
![]() [Перевод] Введение в архитектуру GreenplumСреда, 28 Декабря 2022 г. 09:13 (ссылка)
В этой статье поговорим о Greenplum — СУБД, основанной на PostgreSQL. Разберём её общую архитектуру, способы хранения данных, а также перечислим проблемы, с которыми можно столкнуться в ходе эксплуатации. Читать далееhttps://habr.com/ru/post/708124/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708124
![]() Как мы используем Greenplum в платформе данных ТинькоффПятница, 21 Октября 2022 г. 11:34 (ссылка)
Меня зовут Дмитрий Немчин, я руковожу отделом, который отвечает за движки хранения и обработки данных в платформе данных Тинькофф. Несколько лет назад мы поняли, что продукты, на которых работало хранилище, перестали нас устраивать. Объемы росли, понадобилось масштабируемое решение. В этом тексте я расскажу, как мы пришли к Greenplum в качестве ядра хранилища данных и как используем его. Читать далееhttps://habr.com/ru/post/694652/?utm_source=habrahabr&utm_medium=rss&utm_campaign=694652
![]() Разбираемся с платформами обработки данных на примере барбершопа «Бородатый сисадмин». Какие бывают и всем ли они нужныВторник, 18 Октября 2022 г. 11:41 (ссылка)
![]() Обычно тексты про работу с данными начинаются с числа, демонстрирующего объем производимых в мире данных. Или пассажа про то, что данные — новые золотые прииски («data is the new oil»). Это недалеко от правды: если раньше для понимания своих пользователей компаниям нужно было заказывать крупные социологические исследования, то сейчас, с глобальной цифровизацией, пользователи сами — осознанно или нет — предоставляет данные о себе. Обрабатывают данные, то есть вытаскивают из них пользу, совершенно разнопрофильные компании. Даже сеть семейных парикмахерских на районе может вести отчеты в Excel, используя ее как CRM-систему. На основе данных вывели список клиентов, давно не приходивших на стрижку? Самое время кинуть им sms с «индивидуальной» скидкой. В какой момент бизнесу стоит организовать целую платформу для обработки данных? Всегда ли обработка данных — это про big data? И какие варианты есть сейчас в России? Об этом всем — под катом. Читать дальше → https://habr.com/ru/post/694006/?utm_source=habrahabr&utm_medium=rss&utm_campaign=694006 ![]() В поисках СУБД для MarTech? Обратите внимание на GreenPlumВторник, 30 Августа 2022 г. 15:07 (ссылка)
Несмотря на общую популярность и тренд, Massive Parallel Processing (MPP) РСУБД всё ещё очень редко используются для целей автоматизации маркетинга (платформы aCRM). Часто быстрее и удобнее использовать классическую РСУБД. Однако рано или поздно организации приходят к тому, что вертикальное масштабирование уже не спасает, а бизнес продолжает расти. В рамках данной статьи хотим поделиться опытом использования Massive Parallel Processing (MPP) РСУБД на примере GreenPlum в проекте внедрения платформы aCRM для автоматизации маркетинговых процессов в крупном Retail. Поехали!https://habr.com/ru/post/685426/?utm_source=habrahabr&utm_medium=rss&utm_campaign=685426
![]() Сценарии применения Greenplum PXF для интеграции с Data Lake, OLTP, ClickhouseСреда, 17 Августа 2022 г. 11:31 (ссылка)
Привет! Меня зовут Артемий Козырь, и я Analytics Engineer в Wheely. Популярность массивно-параллельных СУБД (MPP) для решения аналитических задач неукоснительно растет. Сегодня хотел бы поговорить о широко распространенной СУБД Greenplum и, в частности, о Platform Extension Framework (PXF) - расширении, с помощью которого открываются почти неограниченные возможности интеграции с множеством внешних систем и форматов данных. В этой публикации Вас ждет: – Основные возможности PXF, конфигурация, способы оптимизации. – Организация Extract - Load с помощью PXF (Data Lake / OLTP). – Объединение локальных и внешних таблиц в запросах (Federated queries). – Запись данных во внешние системы (Clickhouse). Читать далееhttps://habr.com/ru/post/682990/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682990
![]() Связь GreenPlum и PostgreSQLПятница, 12 Августа 2022 г. 16:36 (ссылка)
GreenPlum — популярное решение для масштабных аналитических систем и в небольших стартапах, и в крупных корпорациях. Оно предлагает понятный пользователям синтаксис ANSI SQL, хорошо ложится на облачный ландшафт, позволяет обучать и применять модели машинного обучения, а ещё поддерживает реляционную СУБД PostgreSQL. В статье поговорим, как связаны GreenPlum и PostgreSQL, разберём их сходства и отличия. Читать далееhttps://habr.com/ru/post/682248/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682248
![]() Инжиниринг признаков в предварительной обработке данныхЧетверг, 28 Июля 2022 г. 12:27 (ссылка)
Привет, Хабр! На связи Рустем IBM Senior (помидор) DevOps Engineer и сегодня я хотел бы поговорить про Feature Engineering in Data Preprocessing. https://habr.com/ru/post/679554/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679554
![]() Как собрать платформу обработки данных «своими руками»?Четверг, 28 Июля 2022 г. 11:06 (ссылка)
Предыстория (очень короткая)Один заказчик, который заинтересовался нашими компетенциям в построении инфраструктур, предложил крупный интеграционный проект. Архитекторы клиента придумали сложную и большую платформу, которая включала в себя машинное обучение, обработку данных и управлялась с помощью Kubernetes. Нам поставили задачу реализовать проект платформы, настроить связность элементов, построить и запустить инфраструктуру в эксплуатацию. В итоге всё прошло хорошо и заказчик доволен. А у нас возникла идея скомпоновать свою платформу — такую, чтобы она была доступной не только большому бизнесу, но и компаниям среднего и малого масштаба. То есть сделать так, чтобы можно было получать большие возможности и не платить при этом огромные деньги. Читать дальше → https://habr.com/ru/post/679516/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679516
![]() Как и почему мы внедрили Greenplum в КХДВоскресенье, 24 Июля 2022 г. 15:48 (ссылка)
Привет, Хабр! Меня зовут Максим Солопин, в Росбанке я работаю архитектором корпоративного хранилища данных. В этом посте я расскажу о том, как мы переезжали из data lake, куда ежедневно сваливались все сырые данные, в удобную систему на основе Greenplum. А по дороге немного затрону развитие моделей корпоративных хранилищ данных. Читать далееhttps://habr.com/ru/post/678646/?utm_source=habrahabr&utm_medium=rss&utm_campaign=678646 ![]() DataVault на Greenplum с помощью DBTЧетверг, 16 Июня 2022 г. 19:27 (ссылка)
Привет, Хабр! Меня зовут Марк Порошин, я занимаюсь DataScience в DV Group. Недавно я уже рассказывал про то, как начать трансформировать данные с помощью dbt. Сегодня я решил поделиться, как мы в DV Group поженили dbt, Greenplum и DataVault, собрали все грабли, что могли; немного поконтрибьютили в open-source, но по итогу остались очень довольны результатом. Расскажу сначала пару слов о том, что такое DataVault. DataVault - методология построения хранилища, предполагающая высокую нормализацию данных (3ая нормальная форма). Основными ее компонентами являются: Читать далееhttps://habr.com/ru/post/671836/?utm_source=habrahabr&utm_medium=rss&utm_campaign=671836
![]() Митап Data People: Архитектурные решения нового времени 21.06.2022Пятница, 10 Июня 2022 г. 17:18 (ссылка)
Всем привет! 21 июня в 17:30 Data People by GlowByte приглашает Вас на летний митап - мы поделимся взглядами архитекторов на быстроменяющиеся процессы в условиях нового времени, расскажем как меняются решения внутри консалтинга и как адаптируются и масштабируются для бизнеса! Эксперты GlowByte расскажут в про СУБД GreenPlum, а также презентуют собственные разработки: стриминг-платформу для реализации online-расчета предодобренных предложений и платформу для разработки и операционализации ML на базе Opensource инструментов. Читать далееhttps://habr.com/ru/post/670836/?utm_source=habrahabr&utm_medium=rss&utm_campaign=670836
![]() Построение DWH на основе GreenplumПонедельник, 30 Мая 2022 г. 11:52 (ссылка)
DBA в Southbridge Иван Чувашов подготовил статью о построении DWH на основе Greenplum. Слово Ивану. Привет, Хабр! Я администратор баз данных с 15-летним опытом. Сегодня хочу рассказать про Data Warehouse на основе Greenplum — как они устроены, как их поднимать и с какими проблемами и нюансами я лично сталкивался в своей практике. Читать про Greenplumhttps://habr.com/ru/post/668490/?utm_source=habrahabr&utm_medium=rss&utm_campaign=668490
![]() GreenPlum. PostGISПятница, 27 Мая 2022 г. 11:22 (ссылка)
Всем привет! Рассмотрим расширение для баз данных, которое добавляет поддержку географических объектов, а значит появляется возможность выполнять запросы местоположения Читать далееhttps://habr.com/ru/post/667986/?utm_source=habrahabr&utm_medium=rss&utm_campaign=667986
|
|
LiveInternet.Ru |
Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат О проекте: помощь|контакты|разместить рекламу|версия для pda |