ctsoftdotkr · 위시켓(Wishket)

프로젝트 배경

1) 문제점 - 기존 문제집은 인쇄된 종이로 문제가 기재되어, 메타데이터 없이 문제의 디지털화하기 위해서 수동작업 - 수동 작업 시 인건비 및 디지털화 속도(500문항 기준 7시간 내외)가 많이 소요되어 비용 낭비가 큼 - 문제집 내의 문항들은 출판사마다 양식, 형태, 글꼴 등 상이한 특징 때문에 AI 없이 자동 분철하기에 어려움 2) 프로젝트 목표 - 문항 인식 : 각 문항들을 객체인식(

로그인하고 프로젝트 배경 확인하기

프로젝트 성과

전자 문제집 개별 문제 추출 정확도 95% 달성

- 각 시료의 단일 문항에 대하여 정확한 영역 추출이 가능한지 평가

추출 개별 문제 OCR 정확도 95% 달성

영역 추출을 통해 분리가 완료된 개별 문항 이미지 내에 존재하는 텍스트를 추출 후 결과물에 대하여 평가

추출 문제 카테고리 분류 정확도 90% 달성

개별 문항의 추출 정보를 기반으로 분석하여 카테고리 자동 분류 정확도 평가

핵심 기능

로그인하고 핵심 기능 1개 더 확인하기

개별 문제 인식 및 추출/분할 기술

- PDF, 이미지로 스캔된 종이 문제집 기반의 문항영역 객체인식(좌표, 클래스(지문, 문항, 문제번호 등 개별영역 분류))
- OCR 기반 개별 문항 텍스트 추출

진행 단계

문항/전체 개발 구조 분석 및 정의

2023.06.

- 모델 요구사항 및 요구 성능, 적용 플랫폼에 따른 적합 모델 선정

로그인하고 진행 단계 확인하기

프로젝트 상세

Linux에서 YOLO 기반의 객체인식 모델과 OpenCV 기반 영상처리 알고리즘을 결합하여 PDF 형식의 전자 문제집 파일에서 각 문항과 지문들을 분철하여 OCR 텍스트로 추출하는 자동 인식 및 자동 분철 기술입니다. ※ 보유 인공지능 학습 및 추론 PC 1. 인공지능 서버 AMD 라이젠 스레드리퍼 PRO 7965WX (스톰 픽) 32C 64T DDR4-3200 ECC/REG 64GB X 8

로그인하고 프로젝트 상세 확인하기