Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 13 сообщений
Cообщения с меткой

сэмплирование - Самое интересное в блогах

Следующие 30  »
rss_habr

Хитрые методики сэмплинга данных

Четверг, 27 Октября 2022 г. 12:19 (ссылка)

https://habr.com/ru/post/695276/?utm_source=habrahabr&utm_medium=rss&utm_campaign=695276

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как мы участвовали в чемпионате по DS длиной 3,5 месяца

Пятница, 03 Июня 2022 г. 17:55 (ссылка)

В марте 2021 года HeadHunter купил портал Dream Job и позже дополнительно встроил интерфейс оценки работодателя на свой сайт. Видимо, количество отзывов резко увеличилось настолько, что их стало сложно обрабатывать в ручном режиме. В результате, задача модерации отзывов была переведена в термины классификации и организован чемпионат на платформе Boosters для решения этой задачи.

Соревнования по анализу данных, в которых целевую переменную можно разметить ручками, принято проводить в Docker-формате. Однако, соревнование длилось 3,5 месяца и в целях учета интересов как организаторов, так и участников, проходило в 3 этапа. В соревновании участвовала команда лаборатории машинного обучения Альфа-Банка: я, Андрей Сон — специалист по интеллектуальному анализу данных, и Женя Смирнов — руководитель лаборатории.

Мы заняли второе место, чуть не дотянув до первого — разрыв составлял 0.0001 метрики. Дальше подробно расскажем, что происходило на каждом этапе, какие перед нами стояли задачи и как мы их решали.

Читать далее

https://habr.com/ru/post/669522/?utm_source=habrahabr&utm_medium=rss&utm_campaign=669522

Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<сэмплирование - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda