Speech의 정의
- 사람에 의해 발화되고 의미를 가지는 시계열 신호 → 음성 신호
- 발화 정보
- 언어적 정보 : 언어학적 의미를 가진 정보
- 비언어적 정보 : 화자의 특징, 상황적 맥락 등
- 음성 = 화자 정보 + 언어 정보 + 상황 정보
음성 인식의 장단점
- 장점
- Natural : 정보 교환을 위한 별도의 교육이 필요 없음
- Flexible : 사용이 편하고 눈과 손이 자유로움
- Efficient : 타이핑이나 손으로 쓰는 것보다 빠름
- Economical : 별도의 도구가 필요 없음
- Remote / Mobile / Wireless
- Applicable : 화자 인식, 감정 인식 등이 가능
- 단점
- 발음 - 사투리, 건강 상태에 따라 다름
- 환경 - 주변 잡음이 섞임
- 사용자의 기대치가 높음
음성 통신의 형태
- 음성 인식 : 화자의 음성을 대상으로 인식
- 대화 관리 : 화자의 의도 분석 → 의도한 내용 처리
- 음성 생성 : 음성을 통한 의문 사항 요구나 정보 제공


음성 인식
- 음성에 포함된 언어적인 정보 추출 → 인간이 해독할 수 있는 표현방법으로 변환
- 종류
음성 인식 시스템의 분류