|
rss_habr
Падаем в кроличью нору. Ищем способ характеризовать текстовые датасетыПятница, 20 Января 2023 г. 11:49 (ссылка)
Всем привет! На связи Игорь Буянов, разработчик в команде разметки MTS AI. Сегодня я поделюсь с вами своими наработками, появившимися во время изучения метрик оценки генерации данных. Когда я только пришел в команду разметки, эта задача была особо актуальной - нас тогда просили нагенерить данные под тестирование информационного бота по COVID. Дело в том, что тестирование результатов выполнялось вручную, что значительно замедляло работу. Каких-либо автоматических метрик оценки качества генерации тестовых данных не существовало. В какой-то момент мне надоело это терпеть, и я решил посмотреть, а как качество текстов оценивают разработчики языковых моделей. У них точно есть перплексия, может, есть что-то еще. Спустя время, проведенное за штудированием статей, я нашел кандидата среди известных метрик для оценки качества генерации, но кроме того, к своему удивлению, у меня появилось несколько теоретических тезисов о качестве данных вообще. В этом посте я делюсь ими с сообществом в надежде на дальнейшее обсуждение. Для лучшего понимания дальнейшего текста рекомендую прочитать эту статью. Читать далееhttps://habr.com/ru/post/711764/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711764
rss_habr
[Перевод] Может ли Java-приложение использовать больше памяти, чем размер кучиПятница, 16 Декабря 2022 г. 15:19 (ссылка)
Возможно, вы замечали, что Java-приложение может превышать лимит памяти, указанный в параметре -Xmx (максимальный размер кучи). Дело в том, что JVM помимо кучи использует и другие области памяти. Давайте начнем со структуры памяти Java-приложения и источников потребления памяти. Читать далееhttps://habr.com/ru/post/705982/?utm_source=habrahabr&utm_medium=rss&utm_campaign=705982
rss_habr
Покажи мне свой Git, и я скажу, кто тыВторник, 04 Октября 2022 г. 16:02 (ссылка)
Можно ли с помощью GitHub анализировать работу, не заглядывая в монитор сотрудника — без скриншотов и тайм-трекеров? Я Александр Кириллов, технический директор компании Evrone. Больше 20 лет я посвятил разработке. В этой статье поделюсь с вами опытом, который собрал за время работы с распределенными командами. Расскажу о том, как, не нарушая приватность разработчиков, следить за качеством работы на проектах и отслеживать нежелательные паттерны с помощью метрик в Jira и Git. Читать далееhttps://habr.com/ru/post/691468/?utm_source=habrahabr&utm_medium=rss&utm_campaign=691468
rss_habr
Экономим на Azure SQL DatabasesПятница, 16 Сентября 2022 г. 10:01 (ссылка)
Всем привет! В данной статье я расскажу о том, как наша компания смогла сэкономить за счет внедрения Azure SQL Elastic Pool. Дополнительно будут примеры Azure REST API для энумерации SQL Servers, для энумерации SQL databases и для получения метрик. Самые пытливые в конце статьи узнают сэкономленную величину. Здесь исходники Читать далееhttps://habr.com/ru/post/688534/?utm_source=habrahabr&utm_medium=rss&utm_campaign=688534
rss_habr
Precision и recall. Как они соотносятся с порогом принятия решений?Пятница, 15 Апреля 2022 г. 10:50 (ссылка)
Недавно, постигая азы Машинного Обучения и изучая классификацию, я наткнулся на precision и recall. Диаграммки, которые часто вставляют, объясняя эти концепции, мне не помогли понять отличия между ними. Но чудо, я придумал объяснение, которое понятно мне, и я надеюсь, что оно поможет кому-нибудь из вас на пути изучения ML (возможно это объяснение кто-то придумал до меня) . Перед тем как начинать, давайте представим горку песка, но в этом песке ещё есть песчаные камни, они ведь тоже являются песком, так? Также в этом песке есть некоторый мусор. Наша задача - просеять песок... Читать далееhttps://habr.com/ru/post/661119/?utm_source=habrahabr&utm_medium=rss&utm_campaign=661119
|
LiveInternet.Ru |
Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат О проекте: помощь|контакты|разместить рекламу|версия для pda |