|
rss_habr
[Перевод] Apache Airflow vs PrefectПятница, 18 Ноября 2022 г. 11:55 (ссылка)
В мире современного дата-инжиниринга и MLOps необходимость оркестрации распределенных конвейеров данных с применением платформ управления рабочими процессами (workflow management platforms) становятся все очевиднее. Инструменты оркестрации рабочих процессов могут взять на себя тяготы обработки и распределения данных между системами и задачами, что по-прежнему является довольно сложным процессом. Оркестрация рабочих процессов является естественным ответом на растущую с течением времени сложность рабочих процессов и конвейеров. Очень часто команды разработчиков начинают с управления и обработки задач вручную, включая очистку данных, обучение, отслеживание результатов, развертывание и т. д. Но по мере усложнения задач и рабочих процессов ручная оркестрация становится все более трудоемкой. Это стало причиной развития платформ управления рабочими процессами и оркестрации в последние годы. Читать далееhttps://habr.com/ru/post/700166/?utm_source=habrahabr&utm_medium=rss&utm_campaign=700166
rss_habr
[Перевод] Введение в парадигму blockDAGЧетверг, 20 Октября 2022 г. 18:04 (ссылка)
Вопреки мнению, популярному в крипто-сообществе, применение направленного ациклического графа (directed acyclic graph, DAG) как основы для распределенного реестра не влечет ни отказа от майнинга с доказательством работы (proof of work, PoW), ни от блоков, ни от комиссий за транзакции. Использование DAG-а дает лишь возможность применить его структурные свойства для решения проблемы блоков-сирот, неустранимой в блокчейне. Но способность DAG-а справиться с ней и за счет этого улучшить масштабируемость конечного решения зависит еще и от ряда дополнительных правил, обеспечивающих согласованность набора транзакций и влияющих на выбор конструктивных решений, баланс между которыми приходится искать в ходе разработки системы. Что за проблема блоков-сирот?https://habr.com/ru/post/694584/?utm_source=habrahabr&utm_medium=rss&utm_campaign=694584
rss_habr
Causal Inference: DAGСуббота, 15 Октября 2022 г. 18:24 (ссылка)
Многие задачи, встающие перед аналитиками в компаниях, в конечном итоге сводятся к вопросам: а что если случится это? что будет, если мы введём эту фичу? что будет, если мы примем такую стратегию действий? что будет, если мы ничего не будем делать? Вы уже наверняка знаете, что лучший способ получить точные ответы на такие вопросы — это эксперименты. Наверное, вы также слышали, что «корреляция — это не каузация» и слепо доверять неэкспериментальным данным не стоит. Но почему это так? И так ли безнадёжны неэкспериментальные исследования? Можно ли приблизить их по точности к экспериментам, и если да, то как? Всё это попадает в область причинно-следственного вывода (Causal Inference). Она основана на многолетних трудах как в области «классической» статистики, так и в сфере машинного обучения — и даже для краткого введения в проблематику зачастую требуются многостраничные книги. Здесь мы попробуем рассказать о небольшом формальном инструменте, крайне популярном среди неэкспериментальных исследователей. Называется этот инструмент очень коротко — DAG. Узнать подробнееhttps://habr.com/ru/post/693532/?utm_source=habrahabr&utm_medium=rss&utm_campaign=693532
rss_habr
Dagster | ТуториалВторник, 27 Сентября 2022 г. 12:05 (ссылка)
Dagster — это оркестратор, предназначенный для организации конвейеров обработки данных: ETL, проведение тестов, формирование отчетов, обучение ML-моделей и т.д. На паре несложных примеров посмотрим как его развернуть, настроить и работать с ним. Читать далееhttps://habr.com/ru/post/690342/?utm_source=habrahabr&utm_medium=rss&utm_campaign=690342
rss_habr
[Перевод] Все, что вам нужно знать об Airflow DAGs, ч.1 — Основы и расписанияВоскресенье, 15 Августа 2022 г. 01:06 (ссылка)
Полное руководство по созданию DAG в Apache Airflow DAG, позволяющих создать конвейер данных из разных источников, запускаемый в определенные периоды времени с заданной логикой. Первая часть. Источник: DAGs: The Definitive Guide от astronomer.io Добро пожаловать в полное руководство по Apache Airflow DAG, представленное командой Astronomer. Эта электронная книга охватывает все, что вам нужно знать для работы с DAG, от строительных блоков, из которых они состоят, до рекомендаций по их написанию, динамической генерации, тестированию, отладке и многому другому. Это руководство, написанное практикующими для практикующих. Читать далееhttps://habr.com/ru/post/682384/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682384
|
LiveInternet.Ru |
Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат О проекте: помощь|контакты|разместить рекламу|версия для pda |