Модели мира или мультиагентное обучение с подкреплением в рамках бюджета

Пятница, 24 Июня 2022 г. 09:28 + в цитатник

Всем привет! Меня зовут Владимир, и в этом я году оканчиваю магистратуру “Программирование и анализ данных” в Высшей школе экономики в Петербурге, а также работаю в JetBrains Research. В этом посте я хочу рассказать про нашу статью Scalable Multi-Agent Model-Based Reinforcement Learning, которую приняли на большую конференцию AAMAS’22 (A*). Над статьёй я работал вместе с Алексеем Шпильманом, заведующим Центром анализа данных и машинного обучения в Вышке.

В статье мы впервые предлагаем использовать модель мира в мультиагентных средах с большим количеством агентов, показывая эффективность такого подхода в использовании опыта при обучении. Модель мира позволяет обучать оптимальное поведение агентов в десятки раз быстрее текущих аналогов, что значительно уменьшает количество требуемых ресурсов.

https://habr.com/ru/post/672938/?utm_source=habrahabr&utm_medium=rss&utm_campaign=672938

<a href="https://www.liveinternet.ru/users/rss_habr/post493247749/">РњРѕРґРµР»Рё РјРёСЂР° РёР»Рё РјСѓР»СЊС‚РёР°РіРµРЅС‚РЅРѕРµ РѕР±СѓС‡РµРЅРёРµ СЃ РїРѕРґРєСЂРµРїР»РµРЅРёРµРј РІ СЂР°РјРєР°С… Р±СЋРґР¶РµС‚Р°</a><br/>Р’СЃРµРј РїСЂРёРІРµС‚! РњРµРЅСЏ Р·РѕРІСѓС‚ Р’Р»Р°РґРёРјРёСЂ, Рё РІ СЌС‚РѕРј СЏ РіРѕРґСѓ РѕРєР°РЅС‡РёРІР°СЋ РјР°РіРёСЃС‚СЂР°С‚СѓСЂСѓ вЂњРџСЂРѕРіСЂР°РјРјРёСЂРѕРІР°РЅРёРµ Рё Р°РЅР°Р»РёР· РґР°РЅРЅС‹С…вЂќ РІ Р’С‹СЃС€РµР№ С€РєРѕР»Рµ СЌРєРѕРЅРѕРјРёРєРё РІ РџРµС‚РµСЂР±СѓСЂРіРµ, Р° С‚Р°РєР¶Рµ СЂР°Р±РѕС‚Р°СЋ РІ JetBrains Research. Р’ СЌС‚РѕРј РїРѕСЃС‚Рµ СЏ С…РѕС‡Сѓ СЂР°СЃСЃРєР°Р·Р°С‚СЊ РїСЂРѕ РЅР°С€Сѓ СЃС‚Р°С‚СЊСЋ Scalable Multi-Agent Model-Based Reinforcement Learning, РєРѕС‚РѕСЂСѓСЋ РїСЂРёРЅСЏР»Рё РЅР° Р±РѕР»СЊС€СѓСЋ РєРѕРЅС„РµСЂРµРЅС†РёСЋ AAMASвЂ™22 (A*). РќР°Рґ СЃС‚Р°С‚СЊС‘Р№ СЏ СЂР°Р±РѕС‚Р°Р» РІРјРµСЃС‚Рµ СЃ РђР»РµРєСЃРµРµРј РЁРїРёР»СЊРјР°РЅРѕРј, Р·Р°РІРµРґСѓСЋС‰РёРј Р¦РµРЅС‚СЂРѕРј Р°РЅР°Р»РёР·Р° РґР°РЅРЅС‹С… Рё РјР°С€РёРЅРЅРѕРіРѕ РѕР±СѓС‡РµРЅРёСЏ РІ Р’С‹С€РєРµ. Р’ СЃС‚Р°С‚СЊРµ РјС‹ РІРїРµСЂРІС‹Рµ РїСЂРµРґР»Р°РіР°РµРј РёСЃРїРѕР»СЊР·РѕРІР°С‚СЊ РјРѕРґРµР»СЊ РјРёСЂР° РІ РјСѓР»СЊС‚РёР°РіРµРЅС‚РЅС‹С… СЃСЂРµРґР°С… СЃ Р±РѕР»СЊС€РёРј РєРѕР»РёС‡РµСЃС‚РІРѕРј Р°РіРµРЅС‚РѕРІ, РїРѕРєР°Р·С‹РІР°СЏ СЌС„С„РµРєС‚РёРІРЅРѕСЃС‚СЊ С‚Р°РєРѕРіРѕ... <a href="https://www.liveinternet.ru/users/rss_habr/post493247749/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Подписка по e-mail

-Поиск по дневнику

-Постоянные читатели

-Статистика

Модели мира или мультиагентное обучение с подкреплением в рамках бюджета