Planning with Uncertain Specifications.

    [인공지능신문] AI ( supervised learning : Robots Learn Human Behavior ) - 부제 : 더이상의 서빙 아르바이트생은 없다!

    # keypoint : 로봇에게 집안일을 하는 방법을 보여주는 것으로 로봇은 인간의 행동을 관찰함으로써 식탁을 차리는 것과 같은 복잡한 일을 수행하는 법을 배운다. MIT 연구팀은 로봇들이 복잡한 작업을 배울 수 있도록 하는 '불확실한 스펙을 가진 계획 수립(Planning with Uncertain Specifications. 이하, PUNS)' 시스템을 개발. 보상 공학(Reward engineering)은 강화학습에서 높은 성과에 도출하기 위해 매우 중요하며, 이전의 연구에는 주로 보상을 대표하는 마르코비안(Markovian) 기능에 초점을 맞춤. 또한 사용자가 직접 정의한 작업 사양에 초점을 맞추는 비마르코프(non-Markov) 보상을 선형 시간 논리(LTL, linear temporal log..