ML만⇒ 다 악성으로 판단함. 데이터셋이 외국꺼라 한국 사이트는 못 거름
rule을 추가함.
rule로 거르고 그 다음 ML..
정확도는 올라갔지만 뭔가 찜찜함..ML비중이 적어서.
순서: DB 기반 블랙/화이트리스트 ⇒ 이상패턴(ML)
이상데이터:정상데이터 = 1:1 로 해라
sqlite나 filesearch로 rule based 추출해라