Skip to content
View LimPark996's full-sized avatar
🏠
Working from home
🏠
Working from home

Block or report LimPark996

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
LimPark996/README.md

Typing SVG


About Me

name: Yumi Park
location: Seoul, Korea
education: M.S. Statistics, Dongguk University
focus: RAG Systems · Video Retrieval · Data Pipelines

background:
  - Designed and built RAG systems for enterprise document search
  - Built Video RAG prototype for gov't R&D project (1st round pass)
  - ML modeling at EdTech company (Woongjin ThinkBig AI Labs)
  - Taught generative AI to non-developers at Samsung C&T AI Academy

Featured Projects

VideoRAG — AI-Powered Video Retrieval & Synthesis

BM25 + InternVideo2 + ColBERT 하이브리드 검색 파이프라인. 정부 R&D 과제 1차 통과.

InternVideo2 FAISS ColBERT BM25 Runway DINOv2 C2PA Gradio

  • 7,010개 MSR-VTT 영상 인덱싱 + 하이브리드 검색(BM25·Dense·WRRF 융합·ColBERT 리랭킹)
  • Scene Graph → 3경로 분기(USE_AS_IS / TRANSFORM / GENERATE) PD 워크스테이션
  • MSR-VTT 1k-A 벤치마크 평가 파이프라인 구축 중 (Dense R@1 논문 기준선 51.9 대조)
  • DINOv2 전환 효과 + DreamColour LUT 색보정 + C2PA ES256 출처 서명

Repo


Construction Law RAG Chatbot

건설 법규 9개 PDF 기반 AI 챗봇 · 삼성물산 AI Academy 교육 프로젝트 (팀 리더)

Python FAISS BM25 bge-reranker GPT-4o-mini Streamlit

  • FAISS + BM25 하이브리드 검색 + bge-reranker 정밀도 향상
  • GPT-4o-mini로 질의 7가지 유형 분류 후 유형별 응답 전략 분기
  • 비전공자 팀원이 직접 구현할 수 있는 단계별 실습 ipynb 설계

Repo


Metal Defect Synthesis

제조업 결함 데이터 부족 문제 해결을 위한 이미지 합성 PoC

VQGAN MaskGIT PyTorch HuggingFace Gradio

  • LlamaGen VQGAN + Halton-MaskGIT (ICLR 2025) 파이프라인 설계
  • NEU-DET 등 3종 데이터셋 통합, 2,659장 → 8배 증강, VQGAN 파인튜닝 Edge IoU +10.6%
  • Weighted sampling으로 클래스 불균형 보정, Gradio inpainting 데모 배포

Repo Demo


Term Search System

건설 표준 용어 하이브리드 검색 엔진

Python FAISS ColBERT OpenAI API

  • OpenAI Embedding(의미 유사도 60%) + ColBERT 토큰별 최대 유사도(40%) 가중 결합
  • 구어체 질의 → 정확한 표준 용어 검색 달성
  • Circuit Breaker + Rate Limiting API 장애 대응 구조 설계

Repo


Ticketmon — Concert Ticketing Platform

대규모 동시접속 티켓팅 시스템 · 부트캠프 파이널 프로젝트 (팀장)

Spring Boot Redis MySQL React Docker AWS

  • AI 리뷰 요약 기능 설계 및 CRUD 구현 (Together AI → OpenAI 모델 전환 포함)
  • 좌석 파트 리팩토링 — 구역(section) 기반에서 등급(grade) 기반 좌석 관리로 전환
  • 공연장 규모(small/medium/large)에 따른 좌석 배치도 동적 조정 구현

Backend


Work Experience

기간 역할 주요 내용
2025.08–11 삼성물산 AI Academy 강사 (엘리스) 건설업 실무진 대상 생성형 AI 교육, RAG 챗봇 커리큘럼 설계
2023.09–2024.12 웅진씽크빅 AI Labs 연구팀 국어 문항 난이도 예측 CatBoost 모델 (R²=0.57), ALP 시스템 역추적 분석

Skills

AI / RAG / Search

Python OpenAI FAISS HuggingFace Claude ChatGPT

ML / Data

NumPy Pandas scikit-learn PostgreSQL

Backend / Infra

Spring Boot Redis Docker AWS Google Colab Jupyter Notebook


Connect

LinkedIn HuggingFace


Pinned Loading

  1. term-search-system-ver1 term-search-system-ver1 Public

    Python

  2. cntchatbot_pjt1 cntchatbot_pjt1 Public

    (엘리스) 삼성물산 AI 아카데미 교안 1 - 부동산 시장 동향 리포트 요약 Q&A AI Agent

    Python 5

  3. cntworkbot_pjt1 cntworkbot_pjt1 Public

    (엘리스) 삼성물산 AI 아카데미 교안 2 - 건축 관련 규제 문서 요약 및 준수계획 초안 작성 AI Agent

    Jupyter Notebook 4

  4. Yum-CS-Study-Memo/Effective-Java-Study-Memo Yum-CS-Study-Memo/Effective-Java-Study-Memo Public

    Effective-Java-Study-Memo