|
|
![]() [Перевод] Большой объём данных для машинного обучения — не панацеяВторник, 09 Ноября 2022 г. 02:21 (ссылка)
![]() Модели глубокого обучения обладают потрясающим свойством — они становятся лучше с увеличением объёма данных, и кажется, что этот процесс практически неограничен. Чтобы получить качественно работающую модель, недостаточно больших объёмов данных, нужны ещё и точные аннотации. Хотя большие объёмы данных помогают модели решать проблему несогласованности данных в разных аннотациях, люди всё равно могут совершать повторные ошибки, укореняющиеся в модели. Например, когда человеку нужно нарисовать вокруг объекта прямоугольник, он обычно стремится, чтобы объект точно попал в этот прямоугольник, то есть склонен ошибаться в сторону увеличения прямоугольника. Использование такой модели для избегания столкновений приведёт к ложноположительным результатам, из-за чего беспилотный транспорт будет останавливаться без причины. Превышение размера ограничивающих прямоугольников — пример систематической ошибки, а бывают ещё и случайные. Случайные и систематические ошибки влияют на обученную модель по-разному. Читать дальше → https://habr.com/ru/post/695548/?utm_source=habrahabr&utm_medium=rss&utm_campaign=695548
![]() Практический Metric learningВторник, 01 Ноября 2022 г. 15:05 (ссылка)
В этом посте мы поговорим о задаче metric learning, подходах к её решению, и разберём их на практике, используя open-source проект OpenMetricLearning. В качестве бонуса покажем, как с помощью простых эвристик можно догнать текущие SotA модели. Читать далееhttps://habr.com/ru/post/695380/?utm_source=habrahabr&utm_medium=rss&utm_campaign=695380
![]() Разбор задачи «Распознавание дорожных знаков на кадрах с автомобильного видеорегистратора», Цифровой ПрорывПятница, 21 Октября 2022 г. 19:46 (ссылка)
Привет, Хабр! Этой статьей я открываю цикл материалов по разбору задач Всероссийского чемпионата "Цифровой Прорыв", связанных с Computer Vision. Решение, предлагаемое в статье, позволяет получить место в топ-5 лидерборда. Особенность данного подхода в том, что мы не будем использовать данные для обучения, предлагаемые организаторами соревнования. В конце даются советы по улучшения решения, а также идеи, которые могут привести к первому месту. Читать далееhttps://habr.com/ru/post/694812/?utm_source=habrahabr&utm_medium=rss&utm_campaign=694812
![]() TorchOk — представляем open-source пайплайн для обучения нейросетей в компьютерном зренииЧетверг, 29 Сентября 2022 г. 12:10 (ссылка)
Иннополис — место, где формируются идеи, которые затем вырываются в большой мир, чтобы сделать его немного лучше, удобнее и технологичнее. Так произошло и с разработками компании EORA, которая опубликовала пайплайн для машинного обучения, заточенный под работу с компьютерным зрением. Все необходимое для работы с ним опубликовано на GitHub под лицензией Apache 2.0, но если хотите подробностей из первых уст — добро пожаловать под кат. Передаем слово руководителю отдела компьютерного зрения EORA Data Lab Владу Виноградову. Мы много лет разрабатывали TorchOk, и чувствуем, что настало время для презентации: нам есть, что показать и о чем рассказать. Читать далееhttps://habr.com/ru/post/690494/?utm_source=habrahabr&utm_medium=rss&utm_campaign=690494
![]() Similar images: APIВторник, 21 Сентября 2022 г. 01:48 (ссылка)
Кортокая версия. Я набил API и python библиотеку, которые позволяют искать картинки похожую на искомую. API бесплатный, на один запрос выдает до 20 похожих картинок. В базе данных 18 миллионов изображений. Надеюсь, в ближайшее время, добавлю еще 50M. API: LINK python wrapper: LINK Web Demo: LINK. Можно загрузить свою картинку или воспользоваться текстовым поиском. Можно кликать на картинки в результате поиска и смотреть что найдет по ней. Хороший вопрос за сколько шагов можно дойти от чего-то невинного до порнухи или хотя бы обнаженки. Читать далееhttps://habr.com/ru/post/689372/?utm_source=habrahabr&utm_medium=rss&utm_campaign=689372
![]() [Перевод] Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данныхПонедельник, 19 Сентября 2022 г. 11:34 (ссылка)
![]() У Колумбийского университета есть хорошая история о плохих данных. Проект в сфере здравоохранения был нацелен на снижение затрат на лечение пациентов с пневмонией. В нём использовалось машинное обучение (machine learning, ML) для автоматической сортировки записей пациентов, чтобы выбрать тех, у кого опасность смертельного исхода минимальна (они могут принимать антибиотики дома), и тех, у кого опасность смертельного исхода высока (их нужно лечить в больнице). Команда разработчиков использовала исторические данные из клиник, а алгоритм был точным. Но за одним важным исключением. Одним из наиболее опасных состояний при пневмонии является астма, поэтому врачи всегда отправляют астматиков в отделение интенсивной терапии, что приводило к минимизации уровня смертности для этих пациентов. Благодаря отсутствию смертельных случаев у астматиков в данных алгоритм предположил, что астма не так уж опасна при пневмонии, и во всех случаях машина рекомендовала отправлять астматиков домой, несмотря на то, что для них риск осложнений при пневмонии был наибольшим. ML сильно зависит от данных. Это самый критически важный аспект, благодаря которому и возможно обучение алгоритма; именно поэтому машинное обучение стало столь популярным в последние годы. Но вне зависимости от терабайтов информации и экспертизы в data science, если ты не можешь понять смысл записей данных, то машина будет практически бесполезной, а иногда и наносить вред. Читать дальше → https://habr.com/ru/post/684580/?utm_source=habrahabr&utm_medium=rss&utm_campaign=684580
![]() Самообучающийся трекер объектов: как отслеживать цель в изменчивых условиях сценыПятница, 16 Сентября 2022 г. 17:20 (ссылка)
Специалисты по компьютерному зрению не один десяток лет бьются над трекингом объектов. Они перепробовали многое: от старой-доброй оценки движения оптическим потоком до сетей-трансформеров. Есть один подход к трекингу, широко известный на западе, но о котором мало пишут по-русски: Incremental Visual Tracker (IVT). Это трекер объектов на основе модифицированного метода главных компонент: он самообучается на ходу и адаптируется к изменчивым условиям. Давайте исследуем физиологию этого трекера, чем он интересен и где его можно применить — а затем изучим проблемы его реализации и нюансы использования. Под катом ссылка на репозиторий и много математики. Читать далееhttps://habr.com/ru/post/688524/?utm_source=habrahabr&utm_medium=rss&utm_campaign=688524
![]() Уроки компьютерного зрения. ОглавлениеСреда, 14 Сентября 2022 г. 20:30 (ссылка)
Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 1. Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 2. Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 3. Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 4. Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 5. Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 6. Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 7. Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 8. Читать далееhttps://habr.com/ru/post/688316/?utm_source=habrahabr&utm_medium=rss&utm_campaign=688316
![]() Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 8Понедельник, 12 Сентября 2022 г. 20:10 (ссылка)
На прошлом уроке мы углубились в изучение контуров. В частности, научились работать со структурой, которую возвращает функция выделения контуров, научились аппроксимировать и обходить контур, научились программировать кое-какие геометрические операции, чтобы создать инвариантное описание объекта. Напомню, как это мы сделали: нашли контур объекта, аппроксимировали его, обошли этот контур, вычислили косинусы углов между гранями аппроксимированного контура. Сегодня продолжим тему прошлого урока. Вычислим инвариантный вектор новым методом: через отношения длин сторон. Мы начнем обход так же с самой удаленной от центра точки, только будем брать стороны, а не углы межу сторонами. И первая сторона это та, что прилегает к первой точке. То есть она соединяет первую точку и следующую за ней по часовой стрелке. И все эти длины сторон мы разделим на самую длинную сторону. Хотя нет, сделам лучше. Сделаем минимакс нормализацию: вычтем из длины стороны минимум и разделим на разницу между минимумом и максимумом. У нас будет вектор чисел от 0 до 1. И так, займемся кодингом. Сначала напишем цикл, создающий исходный масcив: Читать далееhttps://habr.com/ru/post/687864/?utm_source=habrahabr&utm_medium=rss&utm_campaign=687864
![]() Как мы научились дистанционно оценивать техническое состояние автомобиляПонедельник, 12 Сентября 2022 г. 18:52 (ссылка)
Добрый день, коллеги! Меня зовут Елена Волченко. В компании Финолаб я являюсь руководителем отдела машинного обучения и анализа данных. Этой статьей я хочу начать цикл публикаций о создании нашей командой сервиса дистанционной оценки технического состояния автомобилей на основе технологий искусственного интеллекта. Мой рассказ будет разделен на две части. В первой расскажу о потребностях и проблемах в дистанционной оценке повреждений автомобилей. Во второй - о том, как мы решали эту задачу с помощью нейронных сетей и классического machine learning, с какими проблемами сталкивались, каких результатов достигли и что еще предстоит сделать. Читать далееhttps://habr.com/ru/post/687776/?utm_source=habrahabr&utm_medium=rss&utm_campaign=687776
![]() [Перевод] Как за неделю разметить миллион примеров данныхПятница, 12 Августа 2022 г. 12:51 (ссылка)
![]() В 2019 году компания OpenAI опубликовала статью о точной настройке GPT-2, в которой она использовала Scale AI для сбора мнений живых разметчиков с целью совершенствования своих языковых моделей. Хотя в то время мы уже размечали миллионы задач обработки текста и computer vision, уникальные требованиях к срокам и субъективная природа задач OpenAI создали для нас новую сложность. В частности, трудность заключалась в следующем: как поддерживать качество меток в больших масштабах без возможности проверки чужой работы разметчиками? Сегодня мы подробно расскажем о своём подходе к решению этой проблемы, о системе автоматического майнинга бенчмарков, которую мы для этого создали, а также об уроках, которые получили в процессе. Этой статьёй мы хотим проиллюстрировать небольшую часть тех сложностей, делающих масштабируемую разметку данных такой интересной сферой работы. Читать дальше → https://habr.com/ru/post/680960/?utm_source=habrahabr&utm_medium=rss&utm_campaign=680960
![]() Распознавание поднятых пальцев на Python+OpenCVСуббота, 06 Августа 2022 г. 11:00 (ссылка)
В данной статье хочу рассмотреть банальный и не сложный проект, а именно подсчет количества поднятых пальцев. Все исходники можно найти на моем Github. Код будем рассматривать с самого начала, но лучше всего ознакомиться с моими предыдущими статьями. Подготавливаем среду и устанавливаем следующие библиотеки: Читать далееhttps://habr.com/ru/post/679460/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679460
![]() Albumentations: FeedbackВторник, 02 Августа 2022 г. 21:51 (ссылка)
Warning: Текст ниже сухой, так как написан больше для публичного логирования и интересен будет скорее тем, кто библиотеку уже использует. Читать далееhttps://habr.com/ru/post/680514/?utm_source=habrahabr&utm_medium=rss&utm_campaign=680514
![]() Drag-and-Drop на Python+OpenCVПонедельник, 01 Августа 2022 г. 11:00 (ссылка)
В данной статье расскажу про простой Drag-and-Drop на Python+OpenCV. Идея заключается в перемещении созданных квадратов на экране жестами руки. Так как нам потребуется как-то воспроизводить https://habr.com/ru/post/679444/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679444
![]() Поиск объектов на видео с помощью PythonПятница, 29 Июля 2022 г. 11:00 (ссылка)
В данной статье хочу рассказать про поиск объектов на видео с помощью Python и OpenCV. Помимо обычных видео, можно использовать и камеры. Полный код и все исходники можно найти на моем Github. Данный проект является продолжением моей предыдущей статьи - Поиск объектов на фото с помощью Python. Для того, чтобы не тратить много времени на ее изучение, я распишу весь процесс по новой. Читать далееhttps://habr.com/ru/post/678706/?utm_source=habrahabr&utm_medium=rss&utm_campaign=678706
![]() J.A.R.V.I.S. и помидоркиВторник, 26 Июля 2022 г. 22:35 (ссылка)
Моё детство прошло в деревне. С юных лет я познавал таинства выращивания картохи и сооружения чучел из консервных банок. Для меня оказалось открытием, что автоматические комбайны, убиравшие поля кукурузы в Интерстелларе, бороздят вполне реальные поля. А системы автоматического отслеживания здоровья растений с push-уведомлениями для фермеров и другие элементы кибер-деревни становятся обыденностью. Читать далееhttps://habr.com/ru/post/679218/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679218
|
|
LiveInternet.Ru |
Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат О проекте: помощь|контакты|разместить рекламу|версия для pda |