Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 249 сообщений
Cообщения с меткой

sre - Самое интересное в блогах

Следующие 30  »
rss_habr

[Перевод] Для чего нужен Observability Engineering

Понедельник, 30 Января 2023 г. 14:56 (ссылка)

Замечали, как часто в ИТ-отрасли появляется модное словечко, и тут же все начинают вставлять его в описание своих продуктов, чтобы привлечь побольше внимания?

Сейчас у нас в тренде observability (наблюдаемость), и многие вендоры уже берут его на вооружение.

Что такое observability? Просто навороченная версия мониторинга? Быстрее, выше, сильнее, настоящий Чак Норрис среди DevOps-инструментов! Так и хочется прикупить себе наблюдаемости, правда?

Давайте не будем поддаваться всеобщему ажиотажу и попробуем разобраться, что это такое и откуда вся шумиха.

Читать далее

https://habr.com/ru/post/713196/?utm_source=habrahabr&utm_medium=rss&utm_campaign=713196

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Data driven SRE

Четверг, 26 Января 2023 г. 12:00 (ссылка)

Начнем эту увлекательную историю издалека. Во время первого локдауна, в начале 2020 года, сайт Леруа Мерлен испытал б'oльшую нагрузку, чем когда-либо. Проводившие много времени дома и на даче наши пользователи взялись чинить полочки, проектировать новые кухни и всеми силами делать свой дом уютнее, воплощая в жизнь новые ремонтные проекты, а инженеры были вынуждены экстренно адаптировать системы под небывалый наплыв трафика. Тогда же стало ясно, что начатое незадолго до локдауна внедрение элементов SRE нужно ускорить.

Читать далее

https://habr.com/ru/post/712960/?utm_source=habrahabr&utm_medium=rss&utm_campaign=712960

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Внедряем устойчивый SRE-подход в компании

Пятница, 20 Января 2023 г. 19:30 (ссылка)

Сложно управлять микросервисами, не придерживаясь принципов SRE (site reliability engineering — обеспечение надёжности информационных систем). В этой статье мы расскажем, как наладили процесс SRE в компании Reputation.

Читать далее

https://habr.com/ru/post/711870/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711870

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Современный подход к наблюдаемости

Пятница, 02 Декабря 2022 г. 14:40 (ссылка)

Эпоха монолитных приложений почти прошла. Современные системы разделены на множество компонентов. Даже в самом простом приложении может быть много микросервисов, а у тех есть свои составляющие, например база данных, так что число элементов в системе растёт в геометрической прогрессии.

Чем качественнее наблюдение, тем меньше багов. А ещё можно вовремя находить узкие места и тратить меньше времени на обслуживание системы. В этой статье мы поговорим о наблюдаемости и её главных инструментах.

Читать далее

https://habr.com/ru/post/703056/?utm_source=habrahabr&utm_medium=rss&utm_campaign=703056

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Техническое обеспечение надежности сайтов (SRE): как проектируются безотказные ресурсы?

Вторник, 22 Ноября 2022 г. 12:31 (ссылка)

Под техническим обеспечением надежности сайтов понимается набор принципов и методик, позволяющих создавать высоконадежные и масштабируемые интернет-ресурсы и веб-приложения. Как и в любой другой области, в Site Reliability Engineering есть свои особенности и профессиональные секреты. Мы расспросили о них Дмитрия Зайцева, программного директора направления DevOps в Skillbox, CTO/CIO во flocktory.com.

Читать далее

https://habr.com/ru/post/700826/?utm_source=habrahabr&utm_medium=rss&utm_campaign=700826

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Несмотря на новые вызовы, наши требования к докладам DevOpsConf 2023 все так же высоки

Пятница, 18 Ноября 2022 г. 11:27 (ссылка)

Привет, Хабр! Меня зовут Дмитрий Зайцев. Я руководитель ПК конференции DevOpsConf. А ещё CTO/CIO @flocktory.com. Помогаю компании делать платформу реферального маркетинга для половины магазинов рунета, которая не падает в черную пятницу. Вместе с сообществом делал техническую редактуру перевода книги «Руководство по DevOps». Свое участие в мероприятиях начал с проведения московских DevOpsDays в 2017 году, был и членом ПК и частью команды организаторов. А с 2018 года зашел в ПК DevOpsConf и с прошлого года его возглавляю. В этой статье расскажу, чего ждать от конференции в 2023 году.

Читать далее

https://habr.com/ru/post/699892/?utm_source=habrahabr&utm_medium=rss&utm_campaign=699892

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Kubernetes the hard way

Четверг, 18 Ноября 2022 г. 01:45 (ссылка)

Всем привет. Меня зовут Добрый Кот Telegram.

От коллектива FR-Solutions и при поддержке @irbgeo Telegram : Продолжаем серию статей о K8S.

В этой статье расскажем, как развернуть кластер чистыми бинарями и парочкой конфигов.

Вошли и вышли, приключение на 20 минут)

Начать приключение

https://habr.com/ru/post/699074/?utm_source=habrahabr&utm_medium=rss&utm_campaign=699074

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

SRE: как его понимают бизнес и разработчики

Среда, 09 Ноября 2022 г. 15:08 (ссылка)

В сентябре Антон Скобин, коммерческий директор Слёрма, записал два выпуска подкаста «Манул Слёрма» с Олегом Блохиным, лидером инфраструктурной команды Dodo Engineering. Поговорили о том, как выстраивается работа SRE-команд, какие функции они выполняют и в чём профит от SRE для бизнеса. В этой статье поделимся главными мыслями этой беседы.

Читать далее

https://habr.com/ru/post/698358/?utm_source=habrahabr&utm_medium=rss&utm_campaign=698358

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Импортозамещение на практике. Часть 6. Пользовательские рабочие места

Пятница, 28 Октября 2022 г. 11:29 (ссылка)

Время шло, импортозамещение набирало обороты, пилоты становились продакш-средами, и все катилось под откос шло к светлому будущему.

Какое-то время назад мы с командой приступили к пилотированию миграции на «отечественное» ПО. И вот, что из этого вышло.

Мне интересно, что было дальше!

https://habr.com/ru/post/695284/?utm_source=habrahabr&utm_medium=rss&utm_campaign=695284

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Сделай так, чтобы оно больше не падало

Среда, 12 Октября 2022 г. 15:31 (ссылка)

Привет, меня зовут Ярослав Иссинский, я руководитель Технической платформы в группе «М.Видео-Эльдорадо». Сегодня я хочу рассказать про переход в публичное облако на примере крупной ритейл-компании.

Читать далее

https://habr.com/ru/post/692858/?utm_source=habrahabr&utm_medium=rss&utm_campaign=692858

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Внедрять или не внедрять. Развеиваем главные мифы о SRE

Понедельник, 03 Октября 2022 г. 22:29 (ссылка)

Site Reliability Engineering (SRE) пришел в компании, чтобы прорабатывать вопросы надежности целиком всей системы без разделения на отдельные зоны ответственности, как это было при работе сисадминов и программистов до появления DevOps'ов. Однако роль SRE-инженера, которую представил Google, каждый стал трактовать по-своему. Кто-то делал все строго по книге, а кто-то добавил в работу и свое личное видение.

Со временем обязанности SRE в компаниях, особенно на российском рынке, стали отличаться друг от друга. Вместе с тем появились сопутствующие вопросов о внедрении, обучении сотрудников, применении тех или иных инструментов и тд.

В этой статье мы собрали самые часто встречаемые мифы и вопросы о внедрении SRE и обучении его инструментам. Ответить на них нам помог Максим Гусев, Tech Lead SRE, на счету которого тысячи выстроенных пайплайнов CI/CD и более 100 инсталляций Kubernetes в продакшен.

Читать далее

https://habr.com/ru/post/691320/?utm_source=habrahabr&utm_medium=rss&utm_campaign=691320

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Пять инструментов Site Reliability Engineering

Среда, 28 Сентября 2022 г. 18:40 (ссылка)

Надежность (reliability) программного продукта всегда является одним из приоритетов компании. Особенно это актуально для ПО, превратившегося в ежедневный инструмент для своих пользователей. Они рассчитывают на заявленный функционал, поэтому любая невозможность его использования подрывает доверие, а следовательно, и желание им пользоваться.

В этой статье пойдет речь о главных инструментах Site Reliability Engineering (SRE) и о том, как они влияют на повышение надежности систем.

Читать далее

https://habr.com/ru/post/690590/?utm_source=habrahabr&utm_medium=rss&utm_campaign=690590

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Grafana OnCall — Open Source хаб для алертов и инцидентов

Суббота, 17 Сентября 2022 г. 13:15 (ссылка)

Привет, хабр! С удивлением обнаружил, что здесь нет ни одного упоминания Grafana OnCall, Incident Response Tool с открытым исходным кодом от Grafana Labs. И это нужно исправлять, ведь мы бурно растем как по звездочкам на гитхабе, так и как часть Grafana Cloud, а в issues на гитхабе, в основном, встречаются техлиды из FAANG.

Если кратко, OnCall — это инструмент, который поможет организовать надежные оповещения/реагирование на инциденты в команде, соблюдать SLA и не просыпаться ночью от звонков.

Что умеет и как поставить?

https://habr.com/ru/post/688794/?utm_source=habrahabr&utm_medium=rss&utm_campaign=688794

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<sre - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda