개인 공부

고현서

신현식

노현지


GitHub 주소

브렌치 확인 필수 , main에 push 금지

GitHub - group5-ocr/POLO at AI


AI LLM 데이터셋

  1. 위키피디아의 복잡한 문서와 쉬운 문서를 병렬

bogdancazan/wikilarge-text-simplification · Datasets at Hugging Face

  1. 문장 단순화에 특화된 데이터셋

facebook/asset · Datasets at Hugging Face

  1. 논문에서 쓰인 핵심 데이터셋 (gemini)

사용 모델 : Qwen 2.5 7B https://huggingface.co/Qwen/Qwen2.5-7B