0강. Introduction to ML
What is Machine Learning?
통계학 vs ML
- 통계학은 math, 수학과 관련됨 → rigid하다.(엄격하다)
- ML은 Flexible하다. 경험기반의 직관인 휴리스틱한 지식을 사용함
AI, ML, DNN, Big Data는 어떻게 다를까?

- Rule-Based AI : 코드를 짜서 만든 프로그램처럼 규칙 기반의 AI
- ML : 주어진 데이터를 통해 지능, 지식을 학습하고 학습을 한 embedding (장착이 됨)
⚡ 다른점
- AI : 지능적으로 행동하는 프로그램을 설계하기 위해 우리가 지능을 프로그램에 넣은 것
- 지능은 인간으로부터, 데이터로부터 얻을 수 있다.
- BigData : 말그대로, 데이터셋이다. 어떻게 데이터를 수집, 관리, 분석하는지
- Machine Learning : 말그대로, 학습이다. 어떻게 데이터로부터 유용한 패턴을 얻는지
머신러닝 문제의 유형 Some types of ML
- Classfication 분류 : 여러 데이터 중에서 레이블 1개를 도출해내는 것 (카테고리, 클래스)
- (x1, x2, y = color)
- label : “고양이”, “개”와 같은 텍스트 (1, 2와 같은 숫자가 될 수도)
- Regression 회귀 : 실제 값(real value)을 예측하는 것
- (x, y = real value)
- real value : 숫자, 실제 값
- real value 중에서 1개를 선택하는 문제라고 하면, classfication & regression 둘다 해당됌
- 숫자 사이의 간격, 평균, 변화량 등 수치적으로 의미가 있을때 regression이라함
- Clustering 클러스터링 : 레이블링 되지 않은 데이터가 주어지고 데이터의 그룹화를 해야하는 경우
- Dimension reduction 차원 축소 : 레이블링 되지 않은 데이터가 주어졌을때 정보 손실을 최소화하기 위해 차원을 축소 해야함
⚡ real value 실수형 vs nominal value 명목형
- nominal value 중에서 1개 선택 → classfication
- nominal value : non-ordered 순서가 없다.
- 고양이, 개, 자동차, A, B, C, / 1, 2, 3 → 순서가 아닌 번호일뿐 일때
- real value 중에서 1개 선택→ regression
- real value : ordered 순서가 있다.
Supervised & Unsupervised Learning 지도학습&비지도학습