프로젝트 배경
1) 문제점 - 기존 문제집은 인쇄된 종이로 문제가 기재되어, 메타데이터 없이 문제의 디지털화하기 위해서 수동작업 - 수동 작업 시 인건비 및 디지털화 속도(500문항 기준 7시간 내외)가 많이 소요되어 비용 낭비가 큼 - 문제집 내의 문항들은 출판사마다 양식, 형태, 글꼴 등 상이한 특징 때문에 AI 없이 자동 분철하기에 어려움 2) 프로젝트 목표 - 문항 인식 : 각 문항들을 객체인식(
프로젝트 성과
전자 문제집 개별 문제 추출 정확도 95% 달성
- 각 시료의 단일 문항에 대하여 정확한 영역 추출이 가능한지 평가
추출 개별 문제 OCR 정확도 95% 달성
영역 추출을 통해 분리가 완료된 개별 문항 이미지 내에 존재하는 텍스트를 추출 후 결과물에 대하여 평가
추출 문제 카테고리 분류 정확도 90% 달성
개별 문항의 추출 정보를 기반으로 분석하여 카테고리 자동 분류 정확도 평가
핵심 기능
진행 단계
문항/전체 개발 구조 분석 및 정의
2023.06.
- 모델 요구사항 및 요구 성능, 적용 플랫폼에 따른 적합 모델 선정
프로젝트 상세
Linux에서 YOLO 기반의 객체인식 모델과 OpenCV 기반 영상처리 알고리즘을 결합하여 PDF 형식의 전자 문제집 파일에서 각 문항과 지문들을 분철하여 OCR 텍스트로 추출하는 자동 인식 및 자동 분철 기술입니다. ※ 보유 인공지능 학습 및 추론 PC 1. 인공지능 서버 AMD 라이젠 스레드리퍼 PRO 7965WX (스톰 픽) 32C 64T DDR4-3200 ECC/REG 64GB X 8







