정현

수호

텍스트 들어옴 → 문자열로 정상, 비정상 유무 확인 및 url 유무 확인.

url → 정상 및 비정상 유무 확인

건하

텍스트가 비정상이여도 url이 문제없다면 실제 피해 x

하지만 텍스트가 비정상이면 100% url 구분이 필요 없음(url모델 실행 x)

텍스트가 정상이지만 url이 문제있다면 실제 피해 o (대부분의 정교한 피싱이 이에 해당) ← 주의

결론 : 텍스트로 구분짓는 이유?? 텍스트 구분 모델이 없어도 url모델로 진단 후 피해x

가중치 1:9 or 2:8

텍스트 url
정상 정상 정상
정상 비정상
비정상 정상
비정상 비정상

streamlit에서 데이터 받아오기

{
    "sms_text": str,   # 문자 내용+URL
    "url": str | None  # 포함된 URL (없으면 None)
}

이진 분류

# SMS 모델
{"is_malicious": bool, "confidence": float}

# URL 모델
{"is_malicious": bool, "confidence": float}