Newsboy – 한국어 중심 웹 스크래핑·콘텐츠 분석 유틸리티
한줄 슬로건
“웹에서 텍스트를 긁고 (NLP로) 선명하게 읽는다.”
🎯 Executive Summary
문제: 한국어 웹 콘텐츠를 대량 수집·가공(NLP)하려는 개인/연구·학습자의 반복 작업 부담
해결: Python 기반 스크래핑 + 한국어 NLP(토픽 메타에 konlpy 명시) 모듈 구조로 단계별 처리
결과: 공개 자료에 KPI 수치 미기재
1. 배경·목표
사용자/페르소나: Python 사용자)로, 한국어 텍스트 수집·전처리 필요
범위(Out of scope): 배포형 서비스/웹 UI
2. 역할·스택·기간
역할/기여: 개인 프로젝트
스택: Python 100%,
기간: 2024.6.20. - 2024.7.8.
3. 데모 & 링크
Demo: (없음)
Repo:
https://github.com/MelonChicken/Newsboy
시연영상:
https://youtube.com/shorts/5YaNErJwAwA?feature=share
4. 아키텍처 요약