GD에서는 모든 데이터를 고려하여 미분 값을 계산한다.

하지만 미분 값 계산은 각 데이터에 대해 개별적으로 이루어지기 때문에, 반드시 모든 데이터를 한 번에 확인할 필요는 없다.

따라서, 일부 데이터만 활용하여 미분 값을 계산하여 연산량을 줄일 수 있다.

패턴 모드와 미니 배치 모드의 경사 하강법에는 랜덤 샘플링이 적용되기 때문에, Stochastic(확률적)이라는 수식어를 붙인다.

데이터를 무작위로 선택하여 훨씬 적은 데이터셋으로 평균 값을 추정할 수 있다.