Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 96 сообщений
Cообщения с меткой

greenplum - Самое интересное в блогах

Следующие 30  »
rss_habr

Цвет сезона – слива. Что мы сделали с GreenPlum в 2022-м и что планируем в 2023-м

Среда, 18 Января 2023 г. 12:07 (ссылка)

Привет, Хабр! Меня зовут Марк Лебедев, работаю архитектором в GlowByte. В июне 2022 года на митапе DataPeople мы с командой рассказывали о наших планах в части GreenPlum (запись выступления). Если коротко, тогда мы сфокусировались на развитии open-source и собирались выложить в публичный доступ наши наработки относительно мониторинга кластера и мониторинга запросов, плейбуки по инсталляции и наши подходы для нагрузочного тестирования. Собственно про них и хотелось бы поговорить подробно. В этой статье мы подведём итоги, что нам удалось сделать за прошедшие 6 месяцев, и расскажем о планах на будущий год. В конце статьи укажем все ссылки на репозитории.

Читать далее

https://habr.com/ru/post/711206/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711206

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Особенности VACUUM в MPP-форках PostgreSQL

Понедельник, 16 Января 2023 г. 14:28 (ссылка)

Один из важнейших аспектов, за которым должен следить каждый администратор баз данных PostgreSQL — процесс поддержания «здоровья» базы данных vacuum / autovacuum, удаляющий из памяти неактуальные версии табличных строк и сбрасывающий счётчик транзакций.

В этой статье я систематизировал особенности vacuum / autovacuum, с которыми сталкиваются администраторы MPP-РСУБД.

Читать далее

https://habr.com/ru/post/710806/?utm_source=habrahabr&utm_medium=rss&utm_campaign=710806

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Введение в архитектуру Greenplum

Среда, 28 Декабря 2022 г. 09:13 (ссылка)

В этой статье поговорим о Greenplum — СУБД, основанной на PostgreSQL. Разберём её общую архитектуру, способы хранения данных, а также перечислим проблемы, с которыми можно столкнуться в ходе эксплуатации.

Читать далее

https://habr.com/ru/post/708124/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708124

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как мы используем Greenplum в платформе данных Тинькофф

Пятница, 21 Октября 2022 г. 11:34 (ссылка)

Меня зовут Дмитрий Немчин, я руковожу отделом, который отвечает за движки хранения и обработки данных в платформе данных Тинькофф. Несколько лет назад мы поняли, что продукты, на которых работало хранилище, перестали нас устраивать. Объемы росли, понадобилось масштабируемое решение. В этом тексте я расскажу, как мы пришли к Greenplum в качестве ядра хранилища данных и как используем его.

Читать далее

https://habr.com/ru/post/694652/?utm_source=habrahabr&utm_medium=rss&utm_campaign=694652

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Разбираемся с платформами обработки данных на примере барбершопа «Бородатый сисадмин». Какие бывают и всем ли они нужны

Вторник, 18 Октября 2022 г. 11:41 (ссылка)



Обычно тексты про работу с данными начинаются с числа, демонстрирующего объем производимых в мире данных. Или пассажа про то, что данные — новые золотые прииски («data is the new oil»). Это недалеко от правды: если раньше для понимания своих пользователей компаниям нужно было заказывать крупные социологические исследования, то сейчас, с глобальной цифровизацией, пользователи сами — осознанно или нет — предоставляет данные о себе.



Обрабатывают данные, то есть вытаскивают из них пользу, совершенно разнопрофильные компании. Даже сеть семейных парикмахерских на районе может вести отчеты в Excel, используя ее как CRM-систему. На основе данных вывели список клиентов, давно не приходивших на стрижку? Самое время кинуть им sms с «индивидуальной» скидкой.



В какой момент бизнесу стоит организовать целую платформу для обработки данных? Всегда ли обработка данных — это про big data? И какие варианты есть сейчас в России? Об этом всем — под катом.
Читать дальше →

https://habr.com/ru/post/694006/?utm_source=habrahabr&utm_medium=rss&utm_campaign=694006

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

В поисках СУБД для MarTech? Обратите внимание на GreenPlum

Вторник, 30 Августа 2022 г. 15:07 (ссылка)

Несмотря на общую популярность и тренд, Massive Parallel Processing (MPP) РСУБД всё ещё очень редко используются для целей автоматизации маркетинга (платформы aCRM). Часто быстрее и удобнее использовать классическую РСУБД. Однако рано или поздно организации приходят к тому, что вертикальное масштабирование уже не спасает, а бизнес продолжает расти.

В рамках данной статьи хотим поделиться опытом использования Massive Parallel Processing (MPP) РСУБД на примере GreenPlum в проекте внедрения платформы aCRM для автоматизации маркетинговых процессов в крупном Retail.

Поехали!

https://habr.com/ru/post/685426/?utm_source=habrahabr&utm_medium=rss&utm_campaign=685426

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Сценарии применения Greenplum PXF для интеграции с Data Lake, OLTP, Clickhouse

Среда, 17 Августа 2022 г. 11:31 (ссылка)

Привет! Меня зовут Артемий Козырь, и я Analytics Engineer в Wheely.

Популярность массивно-параллельных СУБД (MPP) для решения аналитических задач неукоснительно растет. Сегодня хотел бы поговорить о широко распространенной СУБД Greenplum и, в частности, о Platform Extension Framework (PXF) - расширении, с помощью которого открываются почти неограниченные возможности интеграции с множеством внешних систем и форматов данных.

В этой публикации Вас ждет:

– Основные возможности PXF, конфигурация, способы оптимизации.

– Организация Extract - Load с помощью PXF (Data Lake / OLTP).

Объединение локальных и внешних таблиц в запросах (Federated queries).

Запись данных во внешние системы (Clickhouse).

Читать далее

https://habr.com/ru/post/682990/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682990

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Связь GreenPlum и PostgreSQL

Пятница, 12 Августа 2022 г. 16:36 (ссылка)

GreenPlum — популярное решение для масштабных аналитических систем и в небольших стартапах, и в крупных корпорациях. Оно предлагает понятный пользователям синтаксис ANSI SQL, хорошо ложится на облачный ландшафт, позволяет обучать и применять модели машинного обучения, а ещё поддерживает реляционную СУБД PostgreSQL. В статье поговорим, как связаны GreenPlum и PostgreSQL, разберём их сходства и отличия.

Читать далее

https://habr.com/ru/post/682248/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682248

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Инжиниринг признаков в предварительной обработке данных

Четверг, 28 Июля 2022 г. 12:27 (ссылка)

Привет, Хабр! На связи Рустем IBM Senior (помидор) DevOps Engineer и сегодня я хотел бы поговорить про Feature Engineering in Data Preprocessing.

Читать далее

https://habr.com/ru/post/679554/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679554

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как собрать платформу обработки данных «своими руками»?

Четверг, 28 Июля 2022 г. 11:06 (ссылка)





Большое количество российских компаний столкнулись с ограничениями в области ПО. Они теперь не имеют возможности использовать многие важные инструменты для работы с данными. Но, как говорится, одна дверь закрылась — другая открылась. Альтернатива зарубежным решениям есть: платформу обработки данных можно создать своими силами. Расскажем, как мы в ITSumma это сделали, какие компоненты использовали, с какими ограничениями столкнулись и зачем вообще всё это нужно.



Предыстория (очень короткая)



Один заказчик, который заинтересовался нашими компетенциям в построении инфраструктур, предложил крупный интеграционный проект. Архитекторы клиента придумали сложную и большую платформу, которая включала в себя машинное обучение, обработку данных и управлялась с помощью Kubernetes. Нам поставили задачу реализовать проект платформы, настроить связность элементов, построить и запустить инфраструктуру в эксплуатацию.



В итоге всё прошло хорошо и заказчик доволен. А у нас возникла идея скомпоновать свою платформу — такую, чтобы она была доступной не только большому бизнесу, но и компаниям среднего и малого масштаба. То есть сделать так, чтобы можно было получать большие возможности и не платить при этом огромные деньги.
Читать дальше →

https://habr.com/ru/post/679516/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679516

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как и почему мы внедрили Greenplum в КХД

Воскресенье, 24 Июля 2022 г. 15:48 (ссылка)

Привет, Хабр! Меня зовут Максим Солопин, в Росбанке я работаю архитектором корпоративного хранилища данных. В этом посте я расскажу о том, как мы переезжали из data lake, куда ежедневно сваливались все сырые данные, в удобную систему на основе Greenplum. А по дороге немного затрону развитие моделей корпоративных хранилищ данных.

Читать далее

https://habr.com/ru/post/678646/?utm_source=habrahabr&utm_medium=rss&utm_campaign=678646

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

DataVault на Greenplum с помощью DBT

Четверг, 16 Июня 2022 г. 19:27 (ссылка)

Привет, Хабр!

Меня зовут Марк Порошин, я занимаюсь DataScience в DV Group. Недавно я уже рассказывал про то, как начать трансформировать данные с помощью dbt. Сегодня я решил поделиться, как мы в DV Group поженили dbt, Greenplum и DataVault, собрали все грабли, что могли; немного поконтрибьютили в open-source, но по итогу остались очень довольны результатом.

Расскажу сначала пару слов о том, что такое DataVault. DataVault - методология построения хранилища, предполагающая высокую нормализацию данных (3ая нормальная форма). Основными ее компонентами являются:

Читать далее

https://habr.com/ru/post/671836/?utm_source=habrahabr&utm_medium=rss&utm_campaign=671836

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Митап Data People: Архитектурные решения нового времени 21.06.2022

Пятница, 10 Июня 2022 г. 17:18 (ссылка)

Всем привет!

21 июня в 17:30 Data People by GlowByte приглашает Вас на летний митап - мы поделимся взглядами архитекторов на быстроменяющиеся процессы в условиях нового времени, расскажем как меняются решения внутри консалтинга и как адаптируются и масштабируются для бизнеса!

Эксперты GlowByte расскажут в про СУБД GreenPlum, а также презентуют собственные разработки: стриминг-платформу для реализации online-расчета предодобренных предложений и платформу для разработки и операционализации ML на базе Opensource инструментов.

Читать далее

https://habr.com/ru/post/670836/?utm_source=habrahabr&utm_medium=rss&utm_campaign=670836

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Построение DWH на основе Greenplum

Понедельник, 30 Мая 2022 г. 11:52 (ссылка)

DBA в Southbridge Иван Чувашов подготовил статью о построении DWH на основе Greenplum. Слово Ивану.

Привет, Хабр! Я администратор баз данных с 15-летним опытом. Сегодня хочу рассказать про Data Warehouse на основе Greenplum — как они устроены, как их поднимать и с какими проблемами и нюансами я лично сталкивался в своей практике.

Читать про Greenplum

https://habr.com/ru/post/668490/?utm_source=habrahabr&utm_medium=rss&utm_campaign=668490

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

GreenPlum. PostGIS

Пятница, 27 Мая 2022 г. 11:22 (ссылка)

Всем привет! Рассмотрим расширение для баз данных, которое добавляет поддержку географических объектов, а значит появляется возможность выполнять запросы местоположения

Читать далее

https://habr.com/ru/post/667986/?utm_source=habrahabr&utm_medium=rss&utm_campaign=667986

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<greenplum - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda