먼저, 한국 기업들이 AI 문서 검색을 도입할 때 겪는 **4가지 문제**를 말씀드리겠습니다. > > **첫째**, HWP 파일입니다. > 대부분의 AI 서비스는 HWP를 지원하지 않습니다. > 하지만 한국 공공기관과 기업의 문서 대부분은 HWP입니다. > **CTRL+F는 HWP를 완벽하게 지원합니다.** > > **둘째**, 규정 문서 검색입니다. > 일반 RAG 시스템에서 "제3조"를 검색하면, 조문이 중간에 잘려서 나옵니다. > **CTRL+F는 조 단위로 청킹하여 완전한 답변을 제공합니다.** > > **셋째**, 스캔된 PDF입니다. > 이미지 형태의 PDF는 일반 OCR로는 인식률이 낮습니다. > **CTRL+F는 두 가지 OCR 엔진을 앙상블하여 정확도를 높였습니다.** > > **넷째**, 비용입니다. > 클라우드 AI 서비스는 월 수백만원의 API 비용이 발생합니다. > **CTRL+F는 오픈소스 기반으로 비용이 0원입니다.** --- ## 슬라이드 3: 조 단위 청킹 (60초) ★핵심★ > 이제 저희의 **가장 핵심적인 차별점**을 설명드리겠습니다. > > 바로 **"조 단위 청킹"**입니다. > > 일반적인 RAG 시스템은 문서를 **고정된 글자 수**로 자릅니다. > 예를 들어 500자씩 자르면, "제2조"가 **중간에서 잘리는 경우**가 발생합니다. > > 화면의 예시를 보시면, > 일반 RAG에서는 "제2조 적용범위"가 앞 청크의 끝과 뒤 청크의 시작에 **분리되어** 저장됩니다. > 이러면 사용자가 "제2조"를 검색해도 **불완전한 답변**이 나옵니다. "> 먼저, 한국 기업들이 AI 문서 검색을 도입할 때 겪는 **4가지 문제**를 말씀드리겠습니다. > > **첫째**, HWP 파일입니다. > 대부분의 AI 서비스는 HWP를 지원하지 않습니다. > 하지만 한국 공공기관과 기업의 문서 대부분은 HWP입니다. > **CTRL+F는 HWP를 완벽하게 지원합니다.** > > **둘째**, 규정 문서 검색입니다. > 일반 RAG 시스템에서 "제3조"를 검색하면, 조문이 중간에 잘려서 나옵니다. > **CTRL+F는 조 단위로 청킹하여 완전한 답변을 제공합니다.** > > **셋째**, 스캔된 PDF입니다. > 이미지 형태의 PDF는 일반 OCR로는 인식률이 낮습니다. > **CTRL+F는 두 가지 OCR 엔진을 앙상블하여 정확도를 높였습니다.** > > **넷째**, 비용입니다. > 클라우드 AI 서비스는 월 수백만원의 API 비용이 발생합니다. > **CTRL+F는 오픈소스 기반으로 비용이 0원입니다.** --- ## 슬라이드 3: 조 단위 청킹 (60초) ★핵심★ > 이제 저희의 **가장 핵심적인 차별점**을 설명드리겠습니다. > > 바로 **"조 단위 청킹"**입니다. > > 일반적인 RAG 시스템은 문서를 **고정된 글자 수**로 자릅니다. > 예를 들어 500자씩 자르면, "제2조"가 **중간에서 잘리는 경우**가 발생합니다. > > 화면의 예시를 보시면, > 일반 RAG에서는 "제2조 적용범위"가 앞 청크의 끝과 뒤 청크의 시작에 **분리되어** 저장됩니다. > 이러면 사용자가 "제2조"를 검색해도 **불완전한 답변**이 나옵니다. "> 먼저, 한국 기업들이 AI 문서 검색을 도입할 때 겪는 **4가지 문제**를 말씀드리겠습니다. > > **첫째**, HWP 파일입니다. > 대부분의 AI 서비스는 HWP를 지원하지 않습니다. > 하지만 한국 공공기관과 기업의 문서 대부분은 HWP입니다. > **CTRL+F는 HWP를 완벽하게 지원합니다.** > > **둘째**, 규정 문서 검색입니다. > 일반 RAG 시스템에서 "제3조"를 검색하면, 조문이 중간에 잘려서 나옵니다. > **CTRL+F는 조 단위로 청킹하여 완전한 답변을 제공합니다.** > > **셋째**, 스캔된 PDF입니다. > 이미지 형태의 PDF는 일반 OCR로는 인식률이 낮습니다. > **CTRL+F는 두 가지 OCR 엔진을 앙상블하여 정확도를 높였습니다.** > > **넷째**, 비용입니다. > 클라우드 AI 서비스는 월 수백만원의 API 비용이 발생합니다. > **CTRL+F는 오픈소스 기반으로 비용이 0원입니다.** --- ## 슬라이드 3: 조 단위 청킹 (60초) ★핵심★ > 이제 저희의 **가장 핵심적인 차별점**을 설명드리겠습니다. > > 바로 **"조 단위 청킹"**입니다. > > 일반적인 RAG 시스템은 문서를 **고정된 글자 수**로 자릅니다. > 예를 들어 500자씩 자르면, "제2조"가 **중간에서 잘리는 경우**가 발생합니다. > > 화면의 예시를 보시면, > 일반 RAG에서는 "제2조 적용범위"가 앞 청크의 끝과 뒤 청크의 시작에 **분리되어** 저장됩니다. > 이러면 사용자가 "제2조"를 검색해도 **불완전한 답변**이 나옵니다. ">
# CTRL+F 발표 대본
**발표 시간**: 5분
**총 슬라이드**: 7장
---
## 슬라이드 1: 표지 (10초)
> 안녕하십니까. 저희는 **CTRL+F** 팀입니다.
>
> 저희 서비스를 한 문장으로 소개하면,
> **"HWP도 되고, 규정도 찾고, 비용은 0원"**인 AI 문서 검색 챗봇입니다.
---
## 슬라이드 2: 문제 → 솔루션 (45초)
> 먼저, 한국 기업들이 AI 문서 검색을 도입할 때 겪는 **4가지 문제**를 말씀드리겠습니다.
>
> **첫째**, HWP 파일입니다.
> 대부분의 AI 서비스는 HWP를 지원하지 않습니다.
> 하지만 한국 공공기관과 기업의 문서 대부분은 HWP입니다.
> **CTRL+F는 HWP를 완벽하게 지원합니다.**
>
> **둘째**, 규정 문서 검색입니다.
> 일반 RAG 시스템에서 "제3조"를 검색하면, 조문이 중간에 잘려서 나옵니다.
> **CTRL+F는 조 단위로 청킹하여 완전한 답변을 제공합니다.**
>
> **셋째**, 스캔된 PDF입니다.
> 이미지 형태의 PDF는 일반 OCR로는 인식률이 낮습니다.
> **CTRL+F는 두 가지 OCR 엔진을 앙상블하여 정확도를 높였습니다.**
>
> **넷째**, 비용입니다.
> 클라우드 AI 서비스는 월 수백만원의 API 비용이 발생합니다.
> **CTRL+F는 오픈소스 기반으로 비용이 0원입니다.**
---
## 슬라이드 3: 조 단위 청킹 (60초) ★핵심★
> 이제 저희의 **가장 핵심적인 차별점**을 설명드리겠습니다.
>
> 바로 **"조 단위 청킹"**입니다.
>
> 일반적인 RAG 시스템은 문서를 **고정된 글자 수**로 자릅니다.
> 예를 들어 500자씩 자르면, "제2조"가 **중간에서 잘리는 경우**가 발생합니다.
>
> 화면의 예시를 보시면,
> 일반 RAG에서는 "제2조 적용범위"가 앞 청크의 끝과 뒤 청크의 시작에 **분리되어** 저장됩니다.
> 이러면 사용자가 "제2조"를 검색해도 **불완전한 답변**이 나옵니다.
>
> **CTRL+F는 다릅니다.**
> 저희는 "제N조" 패턴을 **자동으로 인식**해서, **조문 단위로 청킹**합니다.
> 제1조는 제1조 전체가 하나의 청크, 제2조는 제2조 전체가 하나의 청크입니다.
>
> 이렇게 하면 **검색 정확도가 비약적으로 높아집니다.**
>
> 아래 비교표를 보시면,
> Upstage, CLOVA X, AWS, Azure 모두 조 단위 청킹을 **지원하지 않습니다.**
> **CTRL+F만 유일하게 지원합니다.**
>
> 이것이 저희의 **핵심 경쟁력**입니다.
---
## 슬라이드 4: 경쟁사 비교 (60초) ★핵심★
> 그렇다면 **기존 서비스들과 비교**해보겠습니다.
>
> 현재 시장에는 Upstage Document AI, 네이버 CLOVA X, AWS, Azure 등의 서비스가 있습니다.
>
> **HWP 지원** — Upstage만 지원하고, CLOVA X와 해외 서비스는 지원하지 않습니다.
> **CTRL+F는 HWP를 완벽하게 지원합니다.**
>
> **조 단위 청킹** — 방금 말씀드렸듯이, **저희만 유일하게 지원합니다.**
>
> **OCR 앙상블** — 경쟁사들은 단일 OCR만 사용합니다.
> **저희는 Tesseract와 EasyOCR을 함께 사용하여 정확도를 높였습니다.**
>
> **온프레미스 설치** — 대부분의 서비스는 클라우드 전용입니다.
> **CTRL+F는 사내 서버에 직접 설치할 수 있어 데이터 유출 걱정이 없습니다.**
>
> **오픈소스** — 경쟁사는 모두 상용 서비스입니다.
> **CTRL+F는 RAGFlow 오픈소스 기반으로 완전 무료입니다.**
>
> 마지막으로 **비용**입니다.
> 경쟁사들은 월 수십만원에서 수백만원의 비용이 발생합니다.
> **CTRL+F는 0원입니다.**
>
> **정리하면, 기능은 동등 이상이고, 비용은 0원입니다.**
---
## 슬라이드 5: 기술 아키텍처 (45초)
> 기술적으로 어떻게 구현했는지 간단히 설명드리겠습니다.
>
> 문서가 업로드되면, **파일 형식에 따라 다르게 처리**됩니다.
>
> **HWP, HWPX 파일**은 LibreOffice를 통해 DOCX로 변환한 뒤 텍스트를 추출합니다.
>
> **이미지 PDF**는 SmartOCR 엔진이 처리합니다.
> Tesseract와 EasyOCR 두 엔진의 결과를 비교해서 **더 좋은 결과를 자동 선택**합니다.
>
> **텍스트 PDF와 DOCX**는 직접 텍스트를 추출합니다.
>
> 추출된 텍스트는 **규정형 청킹 모듈**을 거칩니다.
> "제N조" 패턴을 자동으로 인식해서 **조문 단위로 분할**합니다.
>
> 그 다음 **임베딩**을 생성하고, RAGFlow와 Milvus 벡터DB에 저장합니다.
>
> **지원 포맷은 HWP, PDF, PPT, DOCX, TXT, CSV 총 6종**입니다.
---
## 슬라이드 6: 도입 효과 (45초)
> CTRL+F를 도입하면 **어떤 효과**가 있는지 숫자로 말씀드리겠습니다.
>
> **검색 정확도 95% 이상**입니다.
> 조 단위 청킹으로 완결성 있는 답변을 제공하기 때문입니다.
>
> **HWP 변환 성공률 98% 이상**입니다.
> LibreOffice 기반의 안정적인 변환 파이프라인을 구축했습니다.
>
> **OCR 인식률 92% 이상**입니다.
> 두 엔진의 앙상블로 단일 엔진 대비 정확도가 향상됩니다.
>
> **검색 속도 50밀리초 미만**입니다.
> Milvus 벡터DB의 고성능 인덱싱 덕분입니다.
>
> **월 비용 0원**입니다.
> 경쟁사 대비 연간 수천만원의 비용을 절감할 수 있습니다.
>
> 그리고 **온프레미스 설치**이므로, **데이터가 외부로 유출되지 않습니다.**
> 보안이 중요한 기업에 최적의 선택입니다.
---
## 슬라이드 7: 마무리 (15초)
> 마지막으로 정리하겠습니다.
>
> **CTRL+F를 선택해야 하는 이유 3가지**입니다.
>
> **첫째, HWP 완벽 지원.** 경쟁사 대부분이 미지원합니다.
>
> **둘째, 조 단위 청킹.** CTRL+F만 가능합니다.
>
> **셋째, 온프레미스 오픈소스로 비용 0원.** 보안과 비용을 모두 잡았습니다.
>
> **"한국 기업을 위한 최적의 AI 문서 검색 챗봇, CTRL+F입니다."**
>
> 감사합니다.
---
## 발표 팁
### 강조해야 할 키워드 (목소리 톤 높이기)
- "저희만 유일하게"
- "0원"
- "완벽하게 지원"
- "데이터 유출 없음"
### 제스처 포인트
- 슬라이드 3: Before/After 비교할 때 손으로 좌우 가리키기
- 슬라이드 4: 비교표에서 CTRL+F 열을 손으로 강조
- 슬라이드 7: 3가지 포인트에서 손가락으로 1, 2, 3 표시
### 시선 처리
- 심사위원과 눈 맞춤 유지
- 슬라이드 읽지 말고 심사위원에게 말하듯이
### 시간 체크 포인트
| 슬라이드 | 누적 시간 |
|----------|-----------|
| 1 완료 | 0:10 |
| 2 완료 | 0:55 |
| 3 완료 | 1:55 |
| 4 완료 | 2:55 |
| 5 완료 | 3:40 |
| 6 완료 | 4:25 |
| 7 완료 | 4:40~5:00 |
### Q&A 예상 질문
1. **"조 단위 청킹 정확도는 어떻게 검증했나요?"**
→ "제N조 정규표현식 패턴 매칭으로 99% 이상 인식됩니다. 비정형 문서는 일반 청킹으로 fallback합니다."
2. **"오픈소스인데 유지보수는 어떻게 하나요?"**
→ "RAGFlow 커뮤니티가 활발하고, 저희가 커스텀한 부분은 별도 관리합니다."
3. **"실제 도입 사례가 있나요?"**
→ "현재 PoC 단계이며, 내부 규정 문서 1,000건 이상으로 테스트 완료했습니다."
4. **"경쟁사 대비 단점은 없나요?"**
→ "초기 설치와 서버 운영이 필요합니다. 하지만 한 번 구축하면 추가 비용 없이 영구 사용 가능합니다."