정현
수호
텍스트 들어옴 → 문자열로 정상, 비정상 유무 확인 및 url 유무 확인.
url → 정상 및 비정상 유무 확인
건하
텍스트가 비정상이여도 url이 문제없다면 실제 피해 x
하지만 텍스트가 비정상이면 100% url 구분이 필요 없음(url모델 실행 x)
텍스트가 정상이지만 url이 문제있다면 실제 피해 o (대부분의 정교한 피싱이 이에 해당) ← 주의
결론 : 텍스트로 구분짓는 이유?? 텍스트 구분 모델이 없어도 url모델로 진단 후 피해x
가중치 1:9 or 2:8
| 텍스트 | url | |
|---|---|---|
| 정상 | 정상 | 정상 |
| 비 | 정상 | 비정상 |
| 비 | 비정상 | 정상 |
| 비 | 비정상 | 비정상 |
{
"sms_text": str, # 문자 내용+URL
"url": str | None # 포함된 URL (없으면 None)
}
# SMS 모델
{"is_malicious": bool, "confidence": float}
# URL 모델
{"is_malicious": bool, "confidence": float}