Publication: Context detection and identification in multi-agent reinforcement learning with non-stationary environment çok etmenli pekiştirmeli öǧrenmede devingen ortamlarda baǧlam deǧişim tespiti ve tanımlama
Loading...
Files
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
© 2022 IEEE.Reinforcement learning methods are mostly constructed on the very assumption that environments are stationary. However, most real world environments are non-stationary; that is, we assume they are composed of several stationary components (i.e., sub-environments or contexts). So, methods with this assumption are not capable of learning non-stationary environments. Reinforcement Learning - Context Detection (RL-CD) method enables the agent to learn the environment without prior information; detect the environment\"s context change points and create a partial model for each context. The underlying environment of this approach is single-agent and has shortcomings for multi-agent learning. In this study, we introduce a new approach called Multi-agent reinforcement learning-context detection (MARL-CD), which can both detect context change points and enable agents to learn non-stationary environments with multi-agent settings. This approach is based on RL-CD approach. MARL-CD is more efficient in terms of detecting context change created by the agents on the environment and detecting the context change of the environment itself. It enables an agent to detect the context changes not only from the change of environment dynamics but also from policy changes of agents in the environment. In the approach in this study, it has been shown by the experimental results that the agents spend 16% less energy and are more efficient than RL-CD in terms of detecting the change points more accurately.
—Peki¸stirmeli ögrenme yakla¸sımları, ço ˘ gunlukla or- ˘ tamın duragan olması varsayımıyla etmenin ö ˘ grenmesini konu ˘ alır. Fakat, gerçek hayat uygulamalarında ortam duragan de- ˘ gildir. Birçok dura ˘ gan ortamın bir araya gelmesiyle olu¸san ˘ devingen ortamlardır. Ortamda birden fazla etmen bulunabilir ve bu etmenler de ortamı devingen hale getirmektedir. Peki¸stirmeli ö˘grenme-ba˘glam sezme (RL-CD) [1] yöntemi, etmenin devingen ortam hakkında önsel bir bilgisi olmadan ögrenmesini ˘ ve baglam de ˘ gi¸simlerinin belirlenmesini sa ˘ glayan yakla¸sımdır. ˘ Bu yakla¸sımın temelindeki ortamda tek etmen vardır ve çok etmenli ögrenim için eksiklikleri bulunmaktadır. Bu çalı¸smada ˘ çok etmenli devingen ortamlarda hem baglam de ˘ gi¸sim noktalarını ˘ sezebilen hem de etmenlerin ortamları ögrenebilmesine olanak ˘ saglayan ˘ çok etmenli peki¸stirmeli ö˘grenme-ba˘glam sezme (MARLCD) adında yeni bir yakla¸sım geli¸stirilmi¸stir. Bu yakla¸sım RLCD yöntemini temel alır. Çok etmenli ögrenmede, etmenlerin ˘ ortam üzerinde olu¸sturdukları devingenligi sezmesi ve ba ˘ glam ˘ degi¸sikli ˘ gini belirlemesi yönüyle daha verimlidir. Ba ˘ glamdaki ˘ degi¸siklikleri yalnızca ortam dinamiklerinin de ˘ gi¸siminin yanı sıra ˘ ortamdaki etmenlerin politika degi¸siklikleriyle de belirleyebilme- ˘ sini saglar. Bu çalı¸smadaki yakla¸sımda, etmenler enerjilerini %16 ˘ daha az harcayarak ve degi¸sim noktalarını daha do ˘ gru sezmesi ˘ açısından RL-CD’ye daha verimli oldugu, deney sonuçları ile ˘ gösterilmi¸stir
—Peki¸stirmeli ögrenme yakla¸sımları, ço ˘ gunlukla or- ˘ tamın duragan olması varsayımıyla etmenin ö ˘ grenmesini konu ˘ alır. Fakat, gerçek hayat uygulamalarında ortam duragan de- ˘ gildir. Birçok dura ˘ gan ortamın bir araya gelmesiyle olu¸san ˘ devingen ortamlardır. Ortamda birden fazla etmen bulunabilir ve bu etmenler de ortamı devingen hale getirmektedir. Peki¸stirmeli ö˘grenme-ba˘glam sezme (RL-CD) [1] yöntemi, etmenin devingen ortam hakkında önsel bir bilgisi olmadan ögrenmesini ˘ ve baglam de ˘ gi¸simlerinin belirlenmesini sa ˘ glayan yakla¸sımdır. ˘ Bu yakla¸sımın temelindeki ortamda tek etmen vardır ve çok etmenli ögrenim için eksiklikleri bulunmaktadır. Bu çalı¸smada ˘ çok etmenli devingen ortamlarda hem baglam de ˘ gi¸sim noktalarını ˘ sezebilen hem de etmenlerin ortamları ögrenebilmesine olanak ˘ saglayan ˘ çok etmenli peki¸stirmeli ö˘grenme-ba˘glam sezme (MARLCD) adında yeni bir yakla¸sım geli¸stirilmi¸stir. Bu yakla¸sım RLCD yöntemini temel alır. Çok etmenli ögrenmede, etmenlerin ˘ ortam üzerinde olu¸sturdukları devingenligi sezmesi ve ba ˘ glam ˘ degi¸sikli ˘ gini belirlemesi yönüyle daha verimlidir. Ba ˘ glamdaki ˘ degi¸siklikleri yalnızca ortam dinamiklerinin de ˘ gi¸siminin yanı sıra ˘ ortamdaki etmenlerin politika degi¸siklikleriyle de belirleyebilme- ˘ sini saglar. Bu çalı¸smadaki yakla¸sımda, etmenler enerjilerini %16 ˘ daha az harcayarak ve degi¸sim noktalarını daha do ˘ gru sezmesi ˘ açısından RL-CD’ye daha verimli oldugu, deney sonuçları ile ˘ gösterilmi¸stir
Description
Keywords
Sosyal ve Beşeri Bilimler, Sosyoloji, Kütüphanecilik, Bilgi Sistemleri, Haberleşme ve Kontrol Mühendisliği, Sinyal İşleme, Bilgisayar Bilimleri, Algoritmalar, Veritabanı ve Veri Yapıları, Mühendislik ve Teknoloji, Social Sciences and Humanities, Sociology, Library Sciences, Information Systems, Communication and Control Engineering, Signal Processing, Computer Sciences, algorithms, Database and Data Structures, Engineering and Technology, Mühendislik, Bilişim ve Teknoloji (ENG), Sosyal Bilimler (SOC), Bilgisayar Bilimi, Mühendislik, Sosyal Bilimler Genel, BİLGİSAYAR BİLİMİ, YAPAY ZEKA, BİLGİSAYAR BİLİMİ, YAZILIM MÜHENDİSLİĞİ, TELEKOMÜNİKASYON, MÜHENDİSLİK, ELEKTRİK VE ELEKTRONİK, BİLGİ BİLİMİ VE KÜTÜPHANE BİLİMİ, Engineering, Computing & Technology (ENG), Social Sciences (SOC), COMPUTER SCIENCE, ENGINEERING, SOCIAL SCIENCES, GENERAL, COMPUTER SCIENCE, ARTIFICIAL INTELLIGENCE, COMPUTER SCIENCE, SOFTWARE ENGINEERING, TELECOMMUNICATIONS, ENGINEERING, ELECTRICAL & ELECTRONIC, INFORMATION SCIENCE & LIBRARY SCIENCE, Bilgisayar Ağları ve İletişim, Fizik Bilimleri, Bilgisayar Bilimi Uygulamaları, Bilgisayarla Görme ve Örüntü Tanıma, Yazılım, Bilgi Sistemleri ve Yönetimi, Sosyal Bilimler ve Beşeri Bilimler, Computer Networks and Communications, Physical Sciences, Computer Science Applications, Computer Vision and Pattern Recognition, Software, Information Systems and Management, Social Sciences & Humanities, context detection, multi-agent, non-stationary environment, Reinforcement learning, Peki¸stirmeli ö˘grenme, devingen ortamlar, ba˘glam sezme, çoklu etmenli ö˘grenme, Reinforcement learning, non-stationary environment, context detection, multi-agent
Citation
Talha Selamet E., Tumer B., \"Context Detection and Identification In Multi-Agent Reinforcement Learning With Non-Stationary Environment Çok Etmenli Pekiştirmeli Öǧrenmede Devingen Ortamlarda Baǧlam Deǧişim Tespiti ve Tanimlama\", 30th Signal Processing and Communications Applications Conference, SIU 2022, Safranbolu, Türkiye, 15 - 18 Mayıs 2022
