Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 206 сообщений
Cообщения с меткой

кластеризация - Самое интересное в блогах

Следующие 30  »
rss_habr

[Перевод] Представление, кластеризация и подобие в примерах, иллюстрациях и таблицах

Четверг, 02 Февраля 2023 г. 21:52 (ссылка)

Ключевые элементы машинного обучения и скрытых пространств





Эта статья послужит введением в представление (embedding), подобие (similarity) и кластеризацию (clustering).



Знать эти ключевые понятия машинного обучения нужно, чтобы понять, что такое скрытое пространство.




  • Под представлением понимается представление реального мира в виде данных. Только после представления мы сможем анализировать и использовать в приложениях объекты и явления реального мира.

  • Подобие определяет степень сходства между представлениями реального мира и позволяет, например, рекомендовать тот или иной товар.

  • Кластеризация позволяет объединить представления реального мира в группы, например, чтобы найти книги по заданной тематике.



За подробностями приглашаем под кат.

Читать дальше →

https://habr.com/ru/post/714304/?utm_source=habrahabr&utm_medium=rss&utm_campaign=714304

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Масштабирование NodeJS приложений, теория и практика

Суббота, 28 Января 2023 г. 15:08 (ссылка)

Масштабирование приложения Node.js может быть сложной задачей, но с правильными методологиями это можно сделать эффективно и результативно. В этой статье мы обсудим несколько методов масштабирования приложений Node.js, включая горизонтальное масштабирование, вертикальное масштабирование и балансировку нагрузки. Посмотрим практические примеры.

Читать далее

https://habr.com/ru/post/713420/?utm_source=habrahabr&utm_medium=rss&utm_campaign=713420

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Балансировка трафика на межсетевые экраны с помощью брокеров сетевых пакетов

Понедельник, 16 Января 2023 г. 20:24 (ссылка)

В связи со сложившейся мировой обстановкой, иностранные производители межсетевых экранов ушли с российского рынка, а использование уже эксплуатируемых остается под вопросом. Если вы тот самый специалист, который столкнулся с задачей перехода на отечественные МЭ и организации высокопроизводительного кластера, то в этой серии статей вы узнаете о балансировке трафика в кластере и её реализации на реальной инфраструктуре.

Читать далее

https://habr.com/ru/post/710970/?utm_source=habrahabr&utm_medium=rss&utm_campaign=710970

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как мы генерили генератор скриптов

Среда, 30 Ноября 2022 г. 18:25 (ссылка)

Привет, Хабр!

На связи VS Robotics. Мы по–прежнему занимаемся машинным обучением и автоматизацией решений на базе речевых технологий.

И мы по-прежнему верим в светлое будущее в то, что в скором времени роботизированные системы будут внедрены повсеместно, помогая человеку в любой сфере. Сегодня один из трендов по делегированию задач искусственному интеллекту – это… сам процесс программирования. Но мы имеем ввиду не те инструменты, коих множество в любой среде разработки, а те, что создаются компаниями под собственные нужды. И это поистине одна из самых увлекательных головоломок, предоставляющая айтишнику возможность наконец-то проявить свою творческую сущность.

Так уж сложилось в нашей компании, что мы не раз создавали собственные автоматизированные системы и программное обеспечение для своих продуктов и сервисов.

А совсем недавно мы запустили собственный AI-генератор скриптов, ну, и решили рассказать вам об этом инструменте, который сокращает ручной труд при создании скриптов для голосовых роботов. Это будет большая статья, как и та работа, которую мы проделали.

Читать далее

https://habr.com/ru/post/702654/?utm_source=habrahabr&utm_medium=rss&utm_campaign=702654

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Отказоустойчивые системы: зачем нужны и как построить

Понедельник, 07 Ноября 2022 г. 12:36 (ссылка)

Статья содержит вводную информацию о резервировании и других возможностях обеспечения отказоустойчивой работы серверов и прочего оборудования ИТ-инфраструктуры предприятия.

Мы всегда надеемся, что оборудование и инфраструктура будут работать чётко, надёжно, и без поломок. Особенно это важно там, где неисправности приводят к остановке бизнес–процессов и как следствие – финансовым и репутационным потерям. Как минимум, эти потери складываются из оплаты сотрудников за время простоя (пока они ждут восстановления работы системы), и упущенной за это время прибыли. К этому можно добавить суммы, затраченные на сам ремонт и восстановление системы (покупку исправных комплектующих, оплату работ по установке и замене, и т.п.). Сумма убытков может быть достаточно большой; в некоторых случаях простой может привести к непоправимым последствиям – вплоть до исчезновения бизнеса. Это является поводом задуматься о том, как можно избежать остановки работоспособности.

Читать далее

https://habr.com/ru/post/697796/?utm_source=habrahabr&utm_medium=rss&utm_campaign=697796

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Кластерный анализ в R

Воскресенье, 28 Августа 2022 г. 11:35 (ссылка)

Кластерный анализ решает задачу разбиения множества на группы (кластеры) по принципу наибольшей однородности.

Подобные задачи возникают во множестве сфер деятельности, в частности это реклама и маркетинг. Ситуация, когда нужно выделить группы клиентов, максимально «похожих» друг на друга или определить локации, в которых преобладают определённые предпочтения.

Рассмотрю подобный пример и расскажу о способах решения вопроса средствами языка R.

Читать далее

https://habr.com/ru/post/685040/?utm_source=habrahabr&utm_medium=rss&utm_campaign=685040

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как в Tele2 модель научилась разбирать 230 тысяч клиентских обращений

Пятница, 26 Августа 2022 г. 16:10 (ссылка)

Привет! Меня зовут Катя и я отвечаю за PR проектного офиса big data в Tele2. Не спешите переключаться после этих слов: я постаралась разобраться в том, как коллеги разработали инструмент для анализа обратной связи от абонентов.

В компании есть показатель NPS bottom Up, в рамках исследования мы задаем пользователю вопросы конкретно по точке контакта, например, о мобильном интернете. Упрощенно, методика исследования такая: человек отвечает на закрытые вопросы об услуге и может заполнить поле “свободный комментарий”. В последнем пункте и содержится всё самое интересное, но неподъемное для анализа ручками.

Читать далее

https://habr.com/ru/post/684800/?utm_source=habrahabr&utm_medium=rss&utm_campaign=684800

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как и зачем мы начали искать бизнес-инсайты в отзывах клиентов с помощью машинного обучения

Пятница, 26 Августа 2022 г. 11:14 (ссылка)

Естественный источник обратной связи для любой компании — отзывы их клиентов. И Альфа-Банк не исключение: за год мы собираем больше 100 млн оценок по различным каналам и продуктам. Но среди этих оценок очень мало содержательных текстовых комментариев, а самый популярных среди них (за 2021 год) — «Вопрос не решен!»

Чтобы решить эту проблему, Альфа-Банк собирает дополнительно до 500 тысяч отзывов в год. Этим занимается команда по сохранению лояльности клиентов: обзванивает клиентов, которые поставили негативную оценку, подробно их опрашивает, и старается решить проблему клиента на звонке, формируя свой экспертный отзыв.

Накапливаемые данные практически невозможно анализировать в ручном режиме в полном объеме, но можно сократить объем труда за счет машинного обучения. О том, как мы помогли оптимизировать процесс вычитки с помощью суммаризации на основе тематических моделей и будет эта статья.

Читать далее

https://habr.com/ru/post/684774/?utm_source=habrahabr&utm_medium=rss&utm_campaign=684774

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Ускоряем кластеризацию больших векторов, анализируя страны Центральной Азии

Среда, 03 Августа 2022 г. 20:31 (ссылка)

Любите ли вы задачи кластеризации? Лично я — да. Они хорошо поддаются визуализации, понятны людям, далеким от математики, и зачастую оказывают быстрое влияние на бизнес процессы. Однако, при решении задач кластеризации мы можем столкнуться с рядом проблем. Среди которых может быть:

большая размерность вектора признаков,
отсутствие данных на подмножестве фичей,
зашумленность значений / выбросы и т.д.

В случае, если количество объектов небольшое (и увеличить их естественным образом невозможно), то при неблагоприятном стечении обстоятельств мы можем столкнуться с серьезными проблемами в качестве нашей кластеризации.

Но если количество объектов достаточно большое, возникают вычислительные проблемы, такие как: нехватка ресурсов, скорость выполнения и т.д.

Читать далее

https://habr.com/ru/post/680724/?utm_source=habrahabr&utm_medium=rss&utm_campaign=680724

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Машинное обучение для поиска аномалий

Четверг, 16 Июня 2022 г. 11:55 (ссылка)

Поиск аномалий и выявление подозрительных операций широко применяется в клиентской аналитике, банковском аудите и других видах бизнес аналитики. Суть данной методики заключается в анализе больших объемов данных и выявлении поставщиков, клиентов, транзакций или иных активностей с крайне нетипичным поведением. Часто, такие аномалии являются индикатором мошенничества или поводом для более детального анализа подобных бизнес активностей.

Читать далее

https://habr.com/ru/post/671670/?utm_source=habrahabr&utm_medium=rss&utm_campaign=671670

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Лекарство от забывчивости: как я получал доступ к Node на OpenShift без ssh-ключа

Среда, 08 Июня 2022 г. 15:51 (ссылка)

Типичная ситуация с отвалившейся Node на OpenShift решается лёгким перезапуском забагавшего элемента. Но что делать, если ssh-ключ был забыт или остался на работе? Можно попробовать получить доступ с помощью смекалки и знаний команд Linux. Главный разработчик ГК «Иннотех» Ренат Гараев рассказал, как решал этот ребус и что получилось.

Читать далее

https://habr.com/ru/post/670290/?utm_source=habrahabr&utm_medium=rss&utm_campaign=670290

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Кластеризация поисковых запросов. Что это и как это делать?

Понедельник, 09 Мая 2022 г. 12:57 (ссылка)

Кластеризация семантического ядра – это распределение ключевых запросов на группы, которые будут использоваться для оптимизации определенных страниц на сайте или добавления новых страниц.

Приступают к кластеризации после очищенного семантического ядра от неподходящих и «мусорных» запросов. Если этого не делать, могут быть проблемы со структурой сайта, особенно это касается интернет-магазинов и крупных сайтов (например, агрегаторы).

Читать далее

https://habr.com/ru/post/664912/?utm_source=habrahabr&utm_medium=rss&utm_campaign=664912

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<кластеризация - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda