자율주행 판단 과제

1. 트리 구조를 기반으로 경로를 탐색하는 데 있어 A*알고리즘과 RRT알고리즘의 탐색 방식의 차이점에 대해서 자세히 기술하시오.

A* 알고리즘은 주어진 출발 꼭짓점에서부터 목표 꼭짓점까지 가는 최단 경로를 찾아내는 그래프/트리 탐색 알고리즘이다. 현실 세계를 격자 그리드로 나누어 표현하여 탐색 영역을 2차원 배열 형태로 변환하여 다룬다. 각 그리드의 중심을 노드라 지칭하고, 각 노드마다 부모/자식 노드의 관계를 맺으며 Score를 계산하며 업데이트한다. 목적 지점이 탐색 범위 안에 들어온다면 목표지점에서 거꾸로 시작점으로 부모 노드를 찾아가서 최종 경로를 선택한다. RRT 알고리즘은 무작위 샘플링을 이용하여 고차원 구성 공간을 탐색하는 알고리즘으로, 근접한 포인트들과 이어나가는 과정을 통해 주행할 수 있는 경로들의 후보를 확장해 나가는 기술이다. 중앙 시작점에서부터 경로의 후보들이 확장되기 시작해서 탐색 공간 전체에 대한 경로 후보들을 확보한다. 확장하는 트리 T가 목적지에 도달하면 목적지부터 시작점까지 재귀적으로 트리를 검색하여 실시간으로 경로를 선택한다.

2. 자율주행 자동차에 강화학습 기술을 적용할 수 있다. 강화학습의 1)정의, 2)구성요소, 3)동작 원리, 4)차선 유지를 위한 강화학습 적용 방법론에 대해서 서술하시오.

1)강화학습이란 어떤 환경 안에서 정의된 주체가 현재 상태를 관찰하여, 선택할 수 있는 행동 중에서 가장 최대의 보상을 가져다주는 행동이 무엇인지에 대해서 학습하는 것이다. 2)강화학습의 구성요소에는 주체(Agent), 환경(Environment), 행동(Action), 보상(Reward)가 있다. 3)강화학습의 동작 원리는 주행 환경에 따라 특성 행동들에 대한 Reward를 할당하여, 가장 최대의 보상을 달성하는 행동에 대해서 학습하는 것이다. 정의된 주체가 주어진 환경의 현재 상태를 관찰하여 이를 기반으로 행동을 취하게 되고, 환경의 상태가 변하며 정의된 주체는 보상을 받게 된다. 보상을 기반으로 정의된 주체는 더 많은 보상을 얻을 수 있는 방향으로 행동을 학습한다. 4)차선 유지 시나리오에서 강화학습 모델을 설계하여 적용할 수 있다. 우선 인간이 수동주행하여 도로 중앙을 달리는 주행, 왼쪽으로 치우쳤다가 다시 중앙으로 돌아오는 주행, 오른쪽으로 치우쳤다가 다시 중앙으로 돌아오는 주행 등 다양한 상황의 도로를 강화학습 기반의 인공지능 모델에 학습시킨다. 중앙을 달리는 상황에서 Reward를 주고, 왼쪽으로 치우친 상황에서는 중앙으로 가도록 오른쪽으로 조향하는 것에 Reward를, 오른쪽으로 치우친 상황에서는 왼쪽으로 조향하는 것에 Reward를 할당하여 강화학습 모델을 학습시키면 어떤 환경에서도 차로 유지가 가능하게 된다.

3. 자율주행 요소기술 중 판단 기술은 주행상황에 대한 올바른 판단을 구현하기 위해 Rule-based와 AI-Based 의 2가지 방법론이 적용되고 있다. 두 방법론을 비교하여 서술하시오

Rule-Based Decision-Making이란 주어진 입력에 대해서 확고한 규칙에 따라서 결과갑을 도출해내는 방식이다. 엄격한 규칙에 따라 의사를 결정하며 간단한 도로 상황에서 사용하기 용이한 방법이다. 입력, 규칙, 결과 행동 간 관계가 명확한 경우에 Rule-Based Decision-Making을 사용하는 것이 적합하다. AI-Based Decision-Making은 딥러닝, 강화학습 등을 통하여 주행 데이터 학습 기반으로 주행 상황을 판단하고 그에 맞는 행동을 실행하는 방법이다. 인공지능 기반 의사 결정으로 주행 상황에 맞는 인공지능 기반 판단 모델을 설계 및 학습하여 사용할 수 있다. Rule-Based Decision-Making의 경우 복잡한 주행 환경에서 입력과 규칙이 많아져 그에 따른 결과 행동을 명확하게 정의하기 어려워지는 문제점이 있지만, AI-Based Decision-Making은 규칙기반 의사결정에 비해 복잡한 주행 환경에서도 방대한 학습 데이터로 학습된 적합한 모델을 이용한다면 보다 원활한 판단이 가능하다는 장점이 있다.

4. Fail safe의 정의와 Fail Safe의 3단계가 의미하는 바를 서술하시오

Fail Safe란 차량의 일부 결함, 고장 발생 시 다른 안전장치가 작동되어 결정적인 사고나 파괴를 예방하는 장치이다. Fail Safe 의 3단계는 1단계 Fail Passive, 2단계 Fail Active, 3단계 Fail Operational로 동작한다. 1단계 Fail Passive는 부품이 고장나면 운행을 통상 정지하는 단계이다. 엔진, 모터 등 주행 안전성과 직결된 부품이나 조향, 가감속과 직접적 관련된 부품에서 결함이 있으면 주행을 즉각 정지한다. 2단계 Fail Active는 부품이 고장나면 경보를 울리며 짧은 시간 동안만 운전이 가능한 단계이다. 주행 안전성과 관련은 있지만 즉각적인 정지까지는 요구하지 않는 고장시에 동작되며, 갓길 등 안전한 곳에 정차할 수 있도록 짧은 시간 동안 운전이 가능하다. 3단계 Fail Operational은 추후 보수가 될 때까지 기능을 유지하는 단계이며, 운전상 가장 선호하는 방법이다. 자율주행 차량에 여러대 장착되어있는 카메라들 중 한대가 고장나서 운행에 지장이 없는 경우 동작되는 방법론이다. 고장이나 결함의 종류에 따라 주행 안전성을 고려하여 정의에 따라 명확하게 분류하여 사용자의 안전성을 극대화하는 것이 올바른 Fail Safe 전략이다.

5. 자율주행 판단 기술에서 AI 접목이 필요한 이유가 무엇인지 의견을 제시해보시오.

기존의 규칙 기반 의사 결정 방법으로는 복잡한 도로 상황에서 많은 입력과 조건 설정이 필요하여 의사 결정까지의 명확한 정의를 내리기 어려워 한계점이 존재한다. 그러나 AI 가 접목될 경우 주행 판단 의사 결정을 비롯하여 측위 기술에도 사용될 수 있다. 또한 End-to-End 학습 방식을 통해서 숙련된 운전자의 주행 패턴을 따라하는 모방학습을 통해 자율주행을 구현하게 된다면 복잡한 교차로 상황에서도 학습을 통해 주행이 가능하다. 또한 AI 접목을 통해 규칙 기반 의사 결정에서의 복잡한 if-then 구조보다 간단한 구조를 가져서 개발 편의성도 좋을 것으로 생각된다.