프로젝트 개요 :
- 글로벌 임상시험 데이터 검색 제공 시스템 개발
현재 준비 상황 :
- Spring framework JDK 1.8 기반으로 개발된 기존 시스템에 추가 기능 개발
- 엘라스틱서치 기반 검색엔진 개발 및 유지보수
- 임상시험 데이터 시각화
- 임상시험 RAW 데이터 기반으로 서비스 DB 구축 운영
필요 요소 :
- 글로벌 임상시험 데이터 검색 제공 시스템 개발
개발환경/언어/방식 :
1) 전체 시스템 구성
- AWS EC2, RDS(MariaDB) 구성
- Spring Framework으로 개발된 기존 시스템
- Git을 활용한 형상관리
2) 필수 기술:
- Elasticsearch
- Java Spring Framework
- Tiles
- Git
주요 기능 List/주요 화면 List/메뉴 구성/요구 사항 등 :
1) 사용자 경험 기반의 추가 기능 도출에 따른 백엔드 기능 개발
1. 수집된 임상시험 RAW 데이터 기반으로 추가 기능에 필요한 서비스 DB 설계 및 생성
2. 임상시험 데이터 시각화를 위한 DB 설계 및 생성
3. 주기적인 사용자 이메일 알림 서비스를 위한 AWS SES 서비스 개발
4. 화면 설계를 기반으로 기타 신규 기능/서비스 개발
2) AWS에서 지원하는 elasticsearch를 가지고 검색엔진 개발이 필요함
1. 검색 유사어(자동완성)
2. 통합검색 : 키워드 하이라이트, 문서 내 중심 키워드, 정렬 등
3. 사용자 검색어 연계 : 연관어 추출을 위한 검색어 수집 및 연계
4. 사용자 Dictionary 추가 : 키워드 축적/최신화에 따른 검색 품질 향상
5. 색인 대상 조회 : 크롤링된 데이터 및 내부 content(텍스트, office 문서, 아래한글, pdf 문서 등) 추가에 대한 주기적인 색인처리 및 키워드 추출
6. 데이터 중복 방지 : 동일 콘텐츠의 중복 등록 방지 처리
7. 동의어 처리 : 한글-한글, 한글-영문
산출물 :
- 개발 원본 소스 코드
참고 서비스/사이트 :
- Elasticsearch 실시간/배치 데이터 싱크 프로젝트 경험이 가장 필수입니다.
업무내용이 많으며 기간은 짧아보이는데 1명만 뽑는건가요?