프로젝트 배경
개발이 끝난 프로그램은 작은 입력 처리 실수 하나로도 보안 취약점이 생길 수 있어서 테스트가 중요하다. 하지만 현실에서는 개발자가 “생각나는 입력 몇 개”만 넣어보는 경우가 많고, 그래서 버그를 놓치기 쉽다. 퍼징(Fuzzing)은 많은 양의 무작위 값을 자동으로 넣어 크래시가 발생하는 지점을 찾아내는 방법으로 효과적이지만 준비 과정(환경 구축, 테스트 코드 작성)과 결과 해석(재현/원인 분류)이 어렵다는
프로젝트 성과
GPT 대비 약 50% ~ 80% 정도의 성능 달성
LLM인 GPT 4o 모델을 기준으로 진행
소형 LLM인 phi3 3B 모델을 파인튜닝하여 4가지 취약한 버전의 오픈소스로 테스트 진행
소형 LLM인 phi3 3B 모델을 파인튜닝하여 4가지 취약한 버전의 오픈소스로 테스트 진행
GPT 대비 약 1.7배 생성시간 단축
LLM인 GPT 4o 모델을 기준으로 진행
소형 LLM인 phi3 3B 모델을 파인튜닝하여 4가지 취약한 버전의 오픈소스로 테스트 진행
GPT 4o는 개당 약 12초, phi3 3b는 개당 약 8초 정도로 단축
소형 LLM인 phi3 3B 모델을 파인튜닝하여 4가지 취약한 버전의 오픈소스로 테스트 진행
GPT 4o는 개당 약 12초, phi3 3b는 개당 약 8초 정도로 단축
홍익대학교 AI 창업 공모전 장려상 수상
2024. 11. 16. 홍익대학교 주관으로 진행된 AI 창업 공모전에서 장려상 수상
한양대학교 ERICA SW 창업 아이디어톤 장려상 수상
2024. 11. 30. 한양대학교 ERICA SW 창업 아이디어톤 장려상 수상
한국정보과학회 논문 투고
2024. 10. 30. 한국정보과학회 논문 투고
핵심 기능
진행 단계
선행 연구 분석 및 1차 프로토타입 개발
2024.09.
퍼징 기법에 대한 학습, 오픈소스 AI 퍼징 도구인 PromptFuzz에 대한 소스 분석, 논문 리뷰, 프로토타입 설계 및 개발, 데이터셋 마련, 모델 지정 및 학습
프로젝트 상세
Fuzzing 테스트는 높은 효율성과 낮은 오탐률로 널리 사용되지만, 테스트 코드 작성 시간과 결과 해석의 어려움이 단점이다. 구글과 텐센트는 이를 보완하기 위해 각각 OSS-Fuzz-Gen과 Prompt-fuzz를 공개했으나, 외부 LLM 사용으로 인한 소스코드 유출 위험과 높은 진입 장벽이 문제다. 이를 해결하기 위해, Docker 기반 On-premise 환경과 파인튜닝된 내부 LLM을 활






