name: Yumi Park
location: Seoul, Korea
education: M.S. Statistics, Dongguk University
focus: RAG Systems · Video Retrieval · Data Pipelines
background:
- Designed and built RAG systems for enterprise document search
- Built Video RAG prototype for gov't R&D project (1st round pass)
- ML modeling at EdTech company (Woongjin ThinkBig AI Labs)
- Taught generative AI to non-developers at Samsung C&T AI AcademyBM25 + InternVideo2 + ColBERT 하이브리드 검색 파이프라인. 정부 R&D 과제 1차 통과.
InternVideo2 FAISS ColBERT BM25 Runway DINOv2 C2PA Gradio
- 7,010개 MSR-VTT 영상 인덱싱 + 하이브리드 검색(BM25·Dense·WRRF 융합·ColBERT 리랭킹)
- Scene Graph → 3경로 분기(USE_AS_IS / TRANSFORM / GENERATE) PD 워크스테이션
- MSR-VTT 1k-A 벤치마크 평가 파이프라인 구축 중 (Dense R@1 논문 기준선 51.9 대조)
- DINOv2 전환 효과 + DreamColour LUT 색보정 + C2PA ES256 출처 서명
건설 법규 9개 PDF 기반 AI 챗봇 · 삼성물산 AI Academy 교육 프로젝트 (팀 리더)
Python FAISS BM25 bge-reranker GPT-4o-mini Streamlit
- FAISS + BM25 하이브리드 검색 + bge-reranker 정밀도 향상
- GPT-4o-mini로 질의 7가지 유형 분류 후 유형별 응답 전략 분기
- 비전공자 팀원이 직접 구현할 수 있는 단계별 실습 ipynb 설계
제조업 결함 데이터 부족 문제 해결을 위한 이미지 합성 PoC
VQGAN MaskGIT PyTorch HuggingFace Gradio
- LlamaGen VQGAN + Halton-MaskGIT (ICLR 2025) 파이프라인 설계
- NEU-DET 등 3종 데이터셋 통합, 2,659장 → 8배 증강, VQGAN 파인튜닝 Edge IoU +10.6%
- Weighted sampling으로 클래스 불균형 보정, Gradio inpainting 데모 배포
건설 표준 용어 하이브리드 검색 엔진
Python FAISS ColBERT OpenAI API
- OpenAI Embedding(의미 유사도 60%) + ColBERT 토큰별 최대 유사도(40%) 가중 결합
- 구어체 질의 → 정확한 표준 용어 검색 달성
- Circuit Breaker + Rate Limiting API 장애 대응 구조 설계
대규모 동시접속 티켓팅 시스템 · 부트캠프 파이널 프로젝트 (팀장)
Spring Boot Redis MySQL React Docker AWS
- AI 리뷰 요약 기능 설계 및 CRUD 구현 (Together AI → OpenAI 모델 전환 포함)
- 좌석 파트 리팩토링 — 구역(section) 기반에서 등급(grade) 기반 좌석 관리로 전환
- 공연장 규모(small/medium/large)에 따른 좌석 배치도 동적 조정 구현
| 기간 | 역할 | 주요 내용 |
|---|---|---|
| 2025.08–11 | 삼성물산 AI Academy 강사 (엘리스) | 건설업 실무진 대상 생성형 AI 교육, RAG 챗봇 커리큘럼 설계 |
| 2023.09–2024.12 | 웅진씽크빅 AI Labs 연구팀 | 국어 문항 난이도 예측 CatBoost 모델 (R²=0.57), ALP 시스템 역추적 분석 |


