Solving a markov decision process multidimensional problem with tensor decomposition

Kuinchtner, Daniela

Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/18619

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Sales, Afonso Henrique Corrêa de
dc.contributor.advisor	Meneguzzi, Felipe Rech
dc.contributor.author	Kuinchtner, Daniela
dc.date.accessioned	2021-09-30T12:08:05Z	-
dc.date.available	2021-09-30T12:08:05Z	-
dc.date.issued	2021	pt_BR
dc.identifier.uri	https://hdl.handle.net/10923/18619	-
dc.description.abstract	Processo de Decisão de Markov (MDP) é um modelo usado para planejamento de tomada de decisão de agentes em ambientes estocásticos e completamente observáveis. Embora, muita pesquisa se concentra na solução de problemas de MDPs atômicos em formas tabulares ou MDPs com representações fatoradas, nenhuma se baseia em métodos de decomposição de tensores. Resolver MDPs usando álgebra tensorial oferece a perspectiva de alavancar avanços em cálculos baseados em tensor para aumentar a eficiência de solucionadores de MDP. Nesta pesquisa, primeiro, é formalizado problemas multidimensionais de MDP usando álgebra tensorial. Segundo, é desenvolvido um solucionador de MDP usando o método de decomposição de tensor CANDECOMP-PARAFAC para compactar as matrizes de transição de estados. O solucionador utiliza os algoritmos de iteração de valor e iteração de política para computar a solução de forma compacta. Então, os algoritmos compactos são avaliados de forma empírica em comparação com métodos tabulares. Como resultados, é mostrado que a abordagem tensorial pode computar problemas maiores usando substancialmente menos memória, abrindo novas possibilidades para métodos baseadas em tensores para o planejamento estocástico.	pt_BR
dc.description.abstract	Markov Decision Process (MDP) is a model used for planning decision-making of agents in stochastic and completely observable environments. Although much research is focused on solving atomic MDP problems in tabular forms or MDP problems with factored representations, none is based on tensor decomposition methods. Solving MDPs using tensor algebra offers the prospect of leveraging advances in tensor-based calculations to increase MDP solvers’ efficiency. In this research, first, we formalize MDP multidimensional problems using tensor algebra. Second, we develop an MDP solver using the CANDECOMP-PARAFAC tensor decomposition method to compact state transition matrices. The solver uses the value iteration and policy iteration algorithms to compute the solution compactly. Then, we empirically evaluate the compact algorithms compared to tabular methods. As a result, we show that the tensor approach can compute larger problems using substantially less memory, opening up new possibilities for tensor-based methods for stochastic planning.	en_US
dc.language.iso	Português	pt_BR
dc.publisher	Pontifícia Universidade Católica do Rio Grande do Sul	pt_BR
dc.rights	openAccess	en_US
dc.subject	CADEIAS DE MARKOV - COMPUTAÇÃO	pt_BR
dc.subject	SIMULAÇÃO E MODELAGEM EM COMPUTADORES	pt_BR
dc.subject	INFORMÁTICA	pt_BR
dc.title	Solving a markov decision process multidimensional problem with tensor decomposition	pt_BR
dc.type	masterThesis	pt_BR
dc.degree.grantor	Pontifícia Universidade Católica do Rio Grande do Sul	pt_BR
dc.degree.department	Faculdade de Informática	pt_BR
dc.degree.program	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.degree.level	Mestrado	pt_BR
dc.degree.date	2021	pt_BR
dc.publisher.place	Porto Alegre	pt_BR
Appears in Collections:	Dissertação e Tese

Files in This Item:

File	Description	Size	Format
000500717-Texto+completo-0.pdf	Texto completo	13,37 MB	Adobe PDF	Open View

Show simple item record See statistics Search for other versions of fulltext via SFX