프로젝트 배경
1) 문제점 - CoA·GMP·성분분석서 등 문서 종류마다 다른 테이블 레이아웃과 단위 표기를 통일된 성분 스키마로 자동 변환하는 파싱 전략 필요 - 식약처 고시 개정 시 기존 허가 건의 Rule 소급 적용 여부와 버전 전환 시점을 명확히 처리하는 Rule 버전 관리 아키텍처 설계 필요 - 의약품 허가 서류가 영어·일어·중국어 혼재 경우 각 언어의 단위·수치 표기 차이를 정규화하는 전처리 파이프라인 설계
프로젝트 성과
2단계 PDF 파싱 파이프라인 설계
PyMuPDF 블록 구조 분석 후 Claude API JSON mode로 성분·규격 수치를 추출하는 2단계 파이프라인 구현, 표 형식·자유 형식 혼재 문서에서 필드 추출 신뢰도 점수 부여 구조 설계
Rule 버전 관리 및 롤백 구조 구현
Rule 변경마다 rule_versions 테이블에 snapshot 보존, 이전 버전 복원 시 트랜잭션 내 원자적 교체 및 활성 Rule과의 충돌 검증 로직 설계
Celery 기반 비동기 OCR 처리 큐 설계
Celery + Redis 브로커로 PDF 처리 태스크를 비동기 큐에 분리, 대용량 파일 처리 시 FastAPI 응답 블로킹 방지 및 처리 상태를 SSE로 클라이언트에 스트리밍
허가 기한 D-day 알림 스케줄러 구현
Celery Beat 기반 일별 기한 도래 검사 스케줄러 구현, PostgreSQL Partial Index로 '기한 임박' 조건 필터 최적화, 알림 발송 이력 중복 방지 upsert 로직 설계
이중 무결성 결재 워크플로우 구축
결재 상태 전이를 PostgreSQL CHECK constraint와 Python FSM 양쪽에 이중 적용, append-only audit 레코드 구조로 결재 이력 위변조 방지 설계
핵심 기능
진행 단계
의약품 허가 프로세스 분석 및 Rule 스키마 설계
2025.06.
식약처 수입허가 심사 기준 분석, Pydantic 기반 Rule 조건 타입 10종 정의, PostgreSQL 테이블 31개 및 버전 관리 구조 설계
프로젝트 상세
1) 포트폴리오 소개 의약품 수입허가 신청 문서(CoA·GMP·성분분석서)를 업로드하면 OCR로 핵심 수치를 자동 추출하고, 식약처 허가 기준 Rule 세트가 불충족 항목을 즉시 감지하여 심사 Risk Level을 산정하는 규제 대응 자동화 플랫폼을 Python FastAPI + React 기반으로 설계·구현 2) 작업 범위 - 허가 심사 현황 대시보드: 진행 중인 허가 건의 심사 단계, Risk L








