Publication:
Context detection and identification in multi-agent reinforcement learning with non-stationary environment çok etmenli pekiştirmeli öǧrenmede devingen ortamlarda baǧlam deǧişim tespiti ve tanımlama

dc.contributor.authorTÜMER, MUSTAFA BORAHAN
dc.contributor.authorsTalha Selamet E., Tumer B.
dc.date.accessioned2022-12-23T08:52:46Z
dc.date.accessioned2026-01-11T13:47:34Z
dc.date.available2022-12-23T08:52:46Z
dc.date.issued2022-01-01
dc.description.abstract© 2022 IEEE.Reinforcement learning methods are mostly constructed on the very assumption that environments are stationary. However, most real world environments are non-stationary; that is, we assume they are composed of several stationary components (i.e., sub-environments or contexts). So, methods with this assumption are not capable of learning non-stationary environments. Reinforcement Learning - Context Detection (RL-CD) method enables the agent to learn the environment without prior information; detect the environment\"s context change points and create a partial model for each context. The underlying environment of this approach is single-agent and has shortcomings for multi-agent learning. In this study, we introduce a new approach called Multi-agent reinforcement learning-context detection (MARL-CD), which can both detect context change points and enable agents to learn non-stationary environments with multi-agent settings. This approach is based on RL-CD approach. MARL-CD is more efficient in terms of detecting context change created by the agents on the environment and detecting the context change of the environment itself. It enables an agent to detect the context changes not only from the change of environment dynamics but also from policy changes of agents in the environment. In the approach in this study, it has been shown by the experimental results that the agents spend 16% less energy and are more efficient than RL-CD in terms of detecting the change points more accurately.
dc.description.abstract—Peki¸stirmeli ögrenme yakla¸sımları, ço ˘ gunlukla or- ˘ tamın duragan olması varsayımıyla etmenin ö ˘ grenmesini konu ˘ alır. Fakat, gerçek hayat uygulamalarında ortam duragan de- ˘ gildir. Birçok dura ˘ gan ortamın bir araya gelmesiyle olu¸san ˘ devingen ortamlardır. Ortamda birden fazla etmen bulunabilir ve bu etmenler de ortamı devingen hale getirmektedir. Peki¸stirmeli ö˘grenme-ba˘glam sezme (RL-CD) [1] yöntemi, etmenin devingen ortam hakkında önsel bir bilgisi olmadan ögrenmesini ˘ ve baglam de ˘ gi¸simlerinin belirlenmesini sa ˘ glayan yakla¸sımdır. ˘ Bu yakla¸sımın temelindeki ortamda tek etmen vardır ve çok etmenli ögrenim için eksiklikleri bulunmaktadır. Bu çalı¸smada ˘ çok etmenli devingen ortamlarda hem baglam de ˘ gi¸sim noktalarını ˘ sezebilen hem de etmenlerin ortamları ögrenebilmesine olanak ˘ saglayan ˘ çok etmenli peki¸stirmeli ö˘grenme-ba˘glam sezme (MARLCD) adında yeni bir yakla¸sım geli¸stirilmi¸stir. Bu yakla¸sım RLCD yöntemini temel alır. Çok etmenli ögrenmede, etmenlerin ˘ ortam üzerinde olu¸sturdukları devingenligi sezmesi ve ba ˘ glam ˘ degi¸sikli ˘ gini belirlemesi yönüyle daha verimlidir. Ba ˘ glamdaki ˘ degi¸siklikleri yalnızca ortam dinamiklerinin de ˘ gi¸siminin yanı sıra ˘ ortamdaki etmenlerin politika degi¸siklikleriyle de belirleyebilme- ˘ sini saglar. Bu çalı¸smadaki yakla¸sımda, etmenler enerjilerini %16 ˘ daha az harcayarak ve degi¸sim noktalarını daha do ˘ gru sezmesi ˘ açısından RL-CD’ye daha verimli oldugu, deney sonuçları ile ˘ gösterilmi¸stir
dc.identifier.citationTalha Selamet E., Tumer B., \"Context Detection and Identification In Multi-Agent Reinforcement Learning With Non-Stationary Environment Çok Etmenli Pekiştirmeli Öǧrenmede Devingen Ortamlarda Baǧlam Deǧişim Tespiti ve Tanimlama\", 30th Signal Processing and Communications Applications Conference, SIU 2022, Safranbolu, Türkiye, 15 - 18 Mayıs 2022
dc.identifier.doi10.1109/siu55565.2022.9864802
dc.identifier.urihttps://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=85138734884&origin=inward
dc.identifier.urihttps://hdl.handle.net/11424/283896
dc.language.isotur
dc.relation.ispartof30th Signal Processing and Communications Applications Conference, SIU 2022
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectSosyal ve Beşeri Bilimler
dc.subjectSosyoloji
dc.subjectKütüphanecilik
dc.subjectBilgi Sistemleri, Haberleşme ve Kontrol Mühendisliği
dc.subjectSinyal İşleme
dc.subjectBilgisayar Bilimleri
dc.subjectAlgoritmalar
dc.subjectVeritabanı ve Veri Yapıları
dc.subjectMühendislik ve Teknoloji
dc.subjectSocial Sciences and Humanities
dc.subjectSociology
dc.subjectLibrary Sciences
dc.subjectInformation Systems, Communication and Control Engineering
dc.subjectSignal Processing
dc.subjectComputer Sciences
dc.subjectalgorithms
dc.subjectDatabase and Data Structures
dc.subjectEngineering and Technology
dc.subjectMühendislik, Bilişim ve Teknoloji (ENG)
dc.subjectSosyal Bilimler (SOC)
dc.subjectBilgisayar Bilimi
dc.subjectMühendislik
dc.subjectSosyal Bilimler Genel
dc.subjectBİLGİSAYAR BİLİMİ, YAPAY ZEKA
dc.subjectBİLGİSAYAR BİLİMİ, YAZILIM MÜHENDİSLİĞİ
dc.subjectTELEKOMÜNİKASYON
dc.subjectMÜHENDİSLİK, ELEKTRİK VE ELEKTRONİK
dc.subjectBİLGİ BİLİMİ VE KÜTÜPHANE BİLİMİ
dc.subjectEngineering, Computing & Technology (ENG)
dc.subjectSocial Sciences (SOC)
dc.subjectCOMPUTER SCIENCE
dc.subjectENGINEERING
dc.subjectSOCIAL SCIENCES, GENERAL
dc.subjectCOMPUTER SCIENCE, ARTIFICIAL INTELLIGENCE
dc.subjectCOMPUTER SCIENCE, SOFTWARE ENGINEERING
dc.subjectTELECOMMUNICATIONS
dc.subjectENGINEERING, ELECTRICAL & ELECTRONIC
dc.subjectINFORMATION SCIENCE & LIBRARY SCIENCE
dc.subjectBilgisayar Ağları ve İletişim
dc.subjectFizik Bilimleri
dc.subjectBilgisayar Bilimi Uygulamaları
dc.subjectBilgisayarla Görme ve Örüntü Tanıma
dc.subjectYazılım
dc.subjectBilgi Sistemleri ve Yönetimi
dc.subjectSosyal Bilimler ve Beşeri Bilimler
dc.subjectComputer Networks and Communications
dc.subjectPhysical Sciences
dc.subjectComputer Science Applications
dc.subjectComputer Vision and Pattern Recognition
dc.subjectSoftware
dc.subjectInformation Systems and Management
dc.subjectSocial Sciences & Humanities
dc.subjectcontext detection
dc.subjectmulti-agent
dc.subjectnon-stationary environment
dc.subjectReinforcement learning
dc.subjectPeki¸stirmeli ö˘grenme
dc.subjectdevingen ortamlar
dc.subjectba˘glam sezme
dc.subjectçoklu etmenli ö˘grenme
dc.subjectReinforcement learning
dc.subjectnon-stationary environment
dc.subjectcontext detection
dc.subjectmulti-agent
dc.titleContext detection and identification in multi-agent reinforcement learning with non-stationary environment çok etmenli pekiştirmeli öǧrenmede devingen ortamlarda baǧlam deǧişim tespiti ve tanımlama
dc.typeconferenceObject
dspace.entity.typePublication

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
file.pdf
Size:
806.21 KB
Format:
Adobe Portable Document Format