안녕하세요.
담당 매니저 김수민입니다.
기간제(상주) 프로젝트 희망 근무 시작일을
등록해 주시면, 파트너님의 일정에 맞는
적합한 프로젝트를 추천해 드려요.
플러스
전자문제집(PDF)파일 문항영역 자동 인식 및 자동 분철 기술
개발
PC프로그램
데이터 분석ㆍBI, AI 모델 구축, 머신러닝ㆍ딥러닝
프로젝트 배경
1) 문제점 - 기존 문제집은 인쇄된 종이로 문제가 기재되어, 메타데이터 없이 문제의 디지털화하기 위해서 수동작업 - 수동 작업 시 인건비 및 디지털화 속도(500문항 기준 7시간 내외)가 많이 소요되어 비용 낭비가 큼 - 문제집 내의 문항들은 출판사마다 양식, 형태, 글꼴 등 상이한 특징 때문에 AI 없이 자동 분철하기에 어려움 2) 프로젝트 목표 - 문항 인식 : 각 문항들을 객체인식(
프로젝트 성과
전자 문제집 개별 문제 추출 정확도 95% 달성
- 각 시료의 단일 문항에 대하여 정확한 영역 추출이 가능한지 평가
추출 개별 문제 OCR 정확도 95% 달성
영역 추출을 통해 분리가 완료된 개별 문항 이미지 내에 존재하는 텍스트를 추출 후 결과물에 대하여 평가
추출 문제 카테고리 분류 정확도 90% 달성
개별 문항의 추출 정보를 기반으로 분석하여 카테고리 자동 분류 정확도 평가
핵심 기능
개별 문제 인식 및 추출/분할 기술
- PDF, 이미지로 스캔된 종이 문제집 기반의 문항영역 객체인식(좌표, 클래스(지문, 문항, 문제번호 등 개별영역 분류))
- OCR 기반 개별 문항 텍스트 추출
진행 단계
문항/전체 개발 구조 분석 및 정의
2023.06.
- 모델 요구사항 및 요구 성능, 적용 플랫폼에 따른 적합 모델 선정
프로젝트 상세
Linux에서 YOLO 기반의 객체인식 모델과 OpenCV 기반 영상처리 알고리즘을 결합하여 PDF 형식의 전자 문제집 파일에서 각 문항과 지문들을 분철하여 OCR 텍스트로 추출하는 자동 인식 및 자동 분철 기술입니다. ※ 보유 인공지능 학습 및 추론 PC 1. 인공지능 서버 AMD 라이젠 스레드리퍼 PRO 7965WX (스톰 픽) 32C 64T DDR4-3200 ECC/REG 64GB X 8

비슷한 프로젝트를 준비 중이라면?
위시켓 매니저와 상담하세요.

참여 개발사와 미팅 연결

프로젝트 1:1 컨설팅 제공

무료로 프로젝트 등록하기

작업한 파트너 프로필 보기

ct******
개발 · 법인사업자

프로젝트 정보

참여 기간
2023.05. ~ 2024.01.
참여율
참여율이 100%인 프로젝트는 해당 파트너님이 온전히 작업한 결과물입니다.
외부 공동 작업의 경우 기여도에 따라 참여율이 달라지며 역할, 프로젝트 설명을 통해 업무 분야 및 참여 범위를 확인할 수 있습니다.
100%
고객사
중소벤처기업부
역할
객체인식 AI 학습 및 기반 플랫폼 개발
관련 기술
크롤링
YOLO
OpenCV
빅데이터
스크래핑
Python