Unity machine learning agent란? 유니티 환경에서 강화학습 에이전트를 학습시키기 위한 도구이다.
기계 학습이란? 아서 사무엘이 1959년에 IBM의 R&D 저널에서 처음 사용한 개념으로 코드로 명시하지 않은 동작을 데이터로부터 학습하여 실행하는 알고리즘 개발에 대한 연구분야이다. 인공신경망(ANN), 결정 트리, 딥러닝 등 유형 - 지도, 비지도, 강화 학습
ㅇ 지도 학습(Supervised Learning) 정답이 있는 데이터 세트를 기반으로 알고리즘이 데이터의 특징을 이용하여 오차를 줄여 나가는 방식으로 학습 학습 완료 시, 정답과 유사한 예측 가능 회귀(Regression), 분류(Classfication) 등의 문제 해결에 사용 예시) 질병의 위험 요소 식별 및 예방 조치 계획, 이메일의 스팸 여부 분류 ㅇ 비지도 학습(Unsupervised Learning) 정답이 존재하지 않고 데이터가 가진 특징만을 기반으로 학습 군집화(Clustering) 등의 문제 해결에 사용 예시) 고객 데이터에서 연관성 식별, 다양한 관심사에 따른 사람 분류 ㅇ 강화학습(Reinforcement Learning) 환경과 상호 작용하여 보상이라는 기준으로 보상을 최대한 많이 받을 수 있도록 학습 명확한 보상을 설정할 수 있는 문제 해결에 사용 예시) 화학 반응 최적화, 차량이 스스로 주차할 수 있도록 교육해 시간 소모 및 시행착오 작업 감소
구체적 예시 처음 주차하는 방법을 배우는 상황
강화학습의 기초 용어