1. 활동목표

    머신러닝의 개념을 이해하고, 다양한 머신러닝 대회에 도전해보기.

  2. 진행내용

    먼저 가장 기초가 머신러닝의 가장 기초가 되는 binary classfication 문제인 캐글 대회의 타이타닉 생존자예측 문제를 풀며, 기본적인 머신러닝 툴 사용법과, 개념을 익힘으로써 시작하였다. 그 이후 발전된 regression 문제인 데이콘의 집값에측 regression 문제를 풀며, 좀 더 발전된 머신러닝 모델을 사용하였다. 그 이후 시계열 예측문제가 같이 포함되어 있는, 풍력 발전된 예측을 도전해보며, 더 고급화된 데이터 시각화, 데이터 전처리 능력을 길렀고, gpt를 이용해 특성 추출을 하는 방법까지 알아냈다. 마지막으로 동일한 문제인 시계열 예측과 관련된 문제, 수요예측 문제를 도전하고 있다.

  3. 다음 목표

    머신러닝 대회를 통해 여러가지 문제를 해결하며, 모델 사용능력과 데이터 전처리에 대한 이해 등은 높아졌지만, 직관적으로 어떤 모델이 왜 좋은 성능을 발휘하는가에 대해 직관적인 이해를 하기에 수학적인 능력과 데이터 분포에 대한 지식이 부족하다는 것이 느껴졋다. 그리고 이미 만들어져았는 모델의 툴을 이용하다보니 이것이 성능을 개발하기에, 한계가 있음을 느겼다. 따라서 좀 더 깊은 공부가 필요함이 느껴졌고, 전공 책이나 수학을 공부하며, 다른 머신러닝 대회를 꾸준히 도전해봐야겠다는 목표를 가졌다.

  4. 활동성과

    머신러닝의 개념과 활용법에 대해 이해하였으며, 특히 숫자형데이터에 관한 regression 모델과,class 분류모델에 대해 더 명확히 이해하였다. 또 전처리과정또한 나름의 방식으로 자동화 시키는 툴들에 대한 사용법을 배웠고, 어떤 데이터 종류이든지 처리할 수 있는 힘을 길렀다. 또 시계열데이터에 대한 분석과 그와 관련된 개념들을 배웠으며, 배운지식들을 통해, 데이콘과 같은 머신러닝대회에 도전할 수 있는 경험을 가지게 되었다.