rl

    [인공지능신문] 생체모방로봇 ( 개 : 행동 묘사) - using 강화학습(RL)

    #keypoint : 구글 AI 연구팀은 로봇이 실제 동물(개)의 움직임과 패턴을 모방할 수 있는 학습과 구동을 위해 RL을 사용해 개의 움직임을 한 줄씩 코딩하는 대신 실제 개의 행동 비디오를 제공해 4족 로봇을 훈련시켜 빠른 보행에서 뛰고, 점프하고, 꼬리추적, 회전에 이르기까지 다양한 민첩한 행동을 수행할 수 있는 기술을 개발 # 참고 논문( Learning Agile Robotic Locomotion Skills by Imitating Animals ) : https://arxiv.org/abs/2004.00784 # 참고 : http://www.aitimes.kr/news/articleView.html?idxno=15922 구글 AI, 강화학습으로 동물 모방을 통해 민첩한 '4족 로봇' 훈련시키..

    [Youtube] Samsung Techtonic 2019: 회로설계자동화 - 회로설계자동화를 위한 강화학습적용기: 제조현장 강화학습 적용가이드 (민찬호 프로 (AI선행연구Lab))

    Track1. 회로설계자동화를 위한 강화학습적용기 - 제조현장 강화학습 적용가이드 (민찬호 프로 (AI선행연구Lab)) 1. 시작하기에 앞서 : 프로젝트 소개 + 강화학습이란? - 반도체 회로(PCB) 설계프로세스 자동화기술 : pin(start)과 ball(end)을 잇는 회로 설계 - 반도체 라우팅 프로젝트의 특징 : 데이터 적음(전무가가 손으로 설계). 회로간의 교차가 없어야함(간섭 없어야함). pin(start)(시작점)과 ball(end)(끝점)은 고정되어 있음. unsupervized learning(강화학습) : 잘하면 상, 못하면 벌. 실제행동의 경험에서 배우고 직접생성. 일반적인 방법론으로 모든 문제에 적용가능한 것으로 보임. 성능이 떨어짐. Environment : 강화학습이 이루어지는..