Malicious URL Classification — LSTM 기반 악성 URL 탐지 모델 구축

단순 URL 시퀀스와 보안 도메인 지식 기반 특성을 결합한 하이브리드 딥러닝 탐지 모델


개요

항목 내용
기간 2025.05 ~ 2025.06
팀 구성 개인 프로젝트
역할 AI 모델 설계, 데이터 전처리 및 분석
플랫폼 Python (Google Colab 환경)
기술 스택 Python, TensorFlow / Keras, Pandas, NumPy, scikit-learn

기획 배경

[cite_start]새로운 유형의 악성 URL이 급증하면서 기존의 규칙 기반 탐지 방식이 가진 한계가 명확해졌습니다[cite: 5, 6]. [cite_start]공격 패턴의 변화를 유연하게 식별하기 위해서는 학습 기반 모델의 도입이 필수적이었습니다[cite: 7]. 단순한 텍스트 구조만으로는 정상 사이트를 교묘하게 모방한 URL을 분류하기 어렵기 때문에, URL의 문맥을 파악하는 LSTM 신경망과 보안 도메인 지식이 반영된 수작업 특성(Handcrafted Features)을 결합한 멀티 인풋 신경망 기반 탐지 모델을 기획했습니다.


내가 기여한 것

멀티 인풋 딥러닝 아키텍처 설계

대규모 데이터셋 분석 및 최적화


핵심 구현 / 트러블슈팅

문제 상황