2020 컴퓨테이셔널 방법론 부트캠프
은진수
웹 크롤러: 조직적, 자동화된 방법으로 월드 와이드 웹을 탐색하는 컴퓨터 프로그램
Google: 페이직 검색을 위해 url 탐색 및 html 수집
SNS에서 제공하는 Open API를 통해 데이터 수집
기사, 커뮤니티 댓글, 영화 평점 등을 프로그램을 통해 돌아다니며 수집
정해진 특정한 방법이 있지 않고 수집하려는 데이터의 종류, 모델의 구조, 대상이 되는 웹 페이지의 성격(레이아웃) 등에 따라 수집하는 규칙을 heuristic하게 정해야 하는 경우가 많음.
수업의 대상
수업 내용
알 수록 도움이 되는 Data crwaling에 도움이 되는 것들