AI Developer, Back-end, ASR, NLP, Software Engineer
.jpg)
<aside>
🇰🇷 Seoul, Republic of Korea
</aside>
<aside>
✉️ shout2517@naver.com
</aside>
<aside>
📞 010-8580-2527
</aside>
<aside>
<img src="/icons/notion_gray.svg" alt="/icons/notion_gray.svg" width="40px" /> 🔗이력서
</aside>
<aside>
<img src="/icons/notion_gray.svg" alt="/icons/notion_gray.svg" width="40px" /> 🔗Notion 포트폴리오
</aside>
<aside>
🇰🇷 손 익 현
</aside>
<aside>
<img src="attachment:6f33565d-8c7e-4567-b6ad-45b8b8c2b9cc:Alphabet-A-Transparent-PNG.png" alt="attachment:6f33565d-8c7e-4567-b6ad-45b8b8c2b9cc:Alphabet-A-Transparent-PNG.png" width="40px" /> Ik Hyeon SON
</aside>
<aside>
<img src="attachment:d623ba88-6b62-4493-ba5e-9d3bc318fdbd:나라한icon.png" alt="attachment:d623ba88-6b62-4493-ba5e-9d3bc318fdbd:나라한icon.png" width="40px" /> 孫 益 賢
</aside>
🤝Introduce
.png)
“안녕하세요. 도전하고 만들어내는 개발자 손익현입니다.”
음성인식, 화자 분리, 자연어 처리 등 다양한 AI 기술을 실제 서비스에 적용하고, 데이터 생성·정제부터 모델 훈련, 모델 서빙까지 AI 개발 전 과정을 직접 수행한 경험이 있습니다.
특히, Data-Centric 학습을 지향하며, 데이터 생성 및 정제 자동화, AI 모델 및 모듈의 상용화를 위한 연구개발, 고성능 서버 구축 등 서비스 안정성과 실용성을 모두 고려한 개발을 해왔습니다.
다양한 B2B/B2C 프로젝트에서 AI 기술을 적용하며, 대용량 데이터 처리와 대규모 트래픽 대응이 가능한 AI 아키텍처 설계 및 구현 경험도 보유하고 있습니다.
최신 AI 오픈소스를 기반으로 한 모델 훈련, 서빙, 데이터 처리에 익숙하며, 업무 자동화와 협업 도구 활용, 다양한 IT 기술 탐색에 깊은 관심을 가지고 지속적으로 학습하고 있습니다.
📝Experience
.png)
STT
DataCentric 훈련 - 도메인 특화 훈련
- 금융/리테일/서비스 등 산업별 업무 특화 모델 훈련 및 훈련시간 절약
- 훈련시간 감소
- feature 추출 2w→1w
- 훈련 8w →4w
- 기존평가셋 인식률 유지 및 신규평가셋 인식률 동일하게 상승
DataCentric 훈련 - 서비스별 훈련
- 콜봇(보이스봇/콜봇/로보텔러), 실시간(상담분석, 상담도우미)
- 구어체(상담시 고객, 회의 등), 낭독체(상담사, 아나운서, 방송체) 데이터 비율 조정 및 생성
- 구어체, 단답형 인식률 향상(평가셋에 따라 2~15% 상승)
훈련 데이터 정량적 필터링
- 휴먼에러 대응, 공수 절감, 훈련시간 절약, 오버피팅방지
- CER, WER, AM Score, LM Score, N-gram 기반 필터링
- 500H → 200H 중복 데이터 최소 50% 제거, 훈련된 LM데이터 확보
C++/JNI 모델 서빙
- Kaldi, Wenet의 Export 상황 고려
- 음성 스트리밍 대화 상황에서 비동기 서비스형태가 필요
Triton 모델 서빙
- 목적 : E2E 모델 리소스 절약(Kaldi와 근접)
- 내용 : Wenet 오픈소스를 사용하여 STT모델 서빙
- 결과 : Kaldi 기준 HW사용량 최소 2배, Triton전 대비 최소 10배 축소
Speech Diarization
발화 시간 정렬
- 목적 : 화자분리 모델 VAD의 비교적 낮은 정확도
- 내용 : diar화자값 + STT발화시간값 기준 재정렬
화자 정보 정확도 측정 - CER/WER/TER
- 목적
- DER, JER 평가데이터 생성 한계
- 일관적이고 직관적이 평가 지표 필요
- 내용
- 자체 STT모델을 사용하도록 상황을 제한
- Char, Word, Token 단위 화자 정보 정확도 측정
- STT발화시간 기준으로 평가.
NLP
대화 구성 모듈
- 음성인식 결과 대화 구성
- 자바 라이브러리 구현
비정규화 모듈 - 규칙 기반
- 목적 : 주소, 생년월일, 전화번호 등 체계화된 숫자표현 비정규화
- 내용
- 문맥 및 우선순위로 처리여부 판단
- 주요 개인정보 위주, 변환 대상 태깅
- 결과
- 2시간발화 음성인식결과 0.001 초 내 처리
- 음성인식, 비정규화 모델 훈련데이터 생성 및 정제
- 숫자변환, 개인정보 마스킹 등 도입
비정규화 모듈 - 사전 기반
- 목적 : 연속된 숫자발화, 체계화된 숫자표현, 고유명사(알파벳포함) 등 비정규화 처리
- 내용
- 결과
하이브리드 비정규화 모듈
- 목적 : E2E 기반 비정규화 + 규칙/사전 기반 비정규화 검증
- 내용 : E2E모델의 Hallucination, Over-generation 현상 검증 및 교정
- 결과 : 특허
비정규화 데이터 자동 생성, 수집기
- 목적 : 사전데이터 및 비정규화된 STT모델 훈련데이터 수집
- 내용
- 결과