CLICK AI 가이드 / 데이터 결합


하나의 데이터 파일안에 우리가 원하는 모든 정보를 가지고 있을 때, 인공지능 학습을 하기에는 더할나위 없이 최고의 상황입니다. 하지만 하나의 데이터 파일로는 정보가 부족할 때 혹은 다른 추가적인 데이터가 필요할 때, 우리는 더 높은 신뢰도 혹은 정확도를 가진 인공지능을 위해서 필연적으로 두 개 이상의 데이터를 결합해야 합니다. 일반적으로 프로그래밍을 이용하거나 엑셀을 통해 할 수 있지만, 프로그래밍의 경우 이에 대한 전문적인 지식이 있어야 한다는 전제가 있고 또한, 엑셀을 이용한 작업은 시간적 비용이 많이 드는 노동입니다.

CLICK AI에서는 언급된 두 가지 방법을 대신해서 클릭만으로 데이터를 쉽게 결합하는 방법을 제공하며, 데이터 결합은 텍스트 기반의 인공지능 모델에 한해서 적용됩니다.

학습 목표 - 두 가지의 데이터셋을 이용해서 데이터결합 후 인공지능 학습

학습 자료 - 유리굴절률.csv, 유리성분.csv

유리굴절률.csv

유리성분.csv

위의 두 데이터셋을 살펴보면 서로 다른 데이터를 가지고 있습니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/64cc8c7a-8047-4293-8138-7ae425cdfd9a/.png

[ 유리성분.csv의 경우, 각 id값을 가진 유리 마다 성분들이 정리되어 있습니다. ]

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/fd10dbaf-fcd6-47b2-9d1b-41b6b775dca7/.png

[ 유리굴절률.csv의 경우, 각 id값을 가진 유리마다 굴절률과 유리의 종류가 카테고리화되어 1부터 7까지의 숫자로 표기되어 있습니다. ]

유리의 종류를 구분 짓기 위해서는 유리의 굴절률 뿐만 아니라 유리가 가진 성분들이 유리의 종류를 구분 짓는 데 중요한 역할을 합니다. 그렇기 때문에, 위 두 데이터를 결합 할 필요가 있습니다.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/36a6e8f8-2b5c-43e9-8371-9cdb74f3e1f3/.png