배경 및 목적
공인중개사가 부동산 중개시 건축물 대장에서 위법사항을 확인해 고객에게 위법내용을 반드시 고지해야 할 의무가 있음
그런데, 건축물 대장에 '변동내용 및 원인' 란에 이미 해결된 사항이 함께 기재되있어, 위법사항과 해결된 상황을 구별하려면 일일히 확인해 엑셀에 노가다로 입력해야 함
이런 불편을 해소하기위해 건축물 대장에서 위법사항만 텍스트로 추출해 구글 스프레드시트에 정리할 수 있는 자동화 필요
# 시나리오 구성
PDF 파일 업로드
텍스트 추출 (OCR 포함)
위법사항 관련 정보 식별 및 추출
추출된 정보 정리 및 구조화
결과 저장 또는 보고
실제 건축물 대장에 기록된 사례
-위반건축물
-위반된 건축물이지만 별도 표시내용 없음
-실제 건축물 대장
해결방법
-변동내용 및 원인항목에서 위반된 내용만 추출하면 노가다 작업을 하지 않아도
-텍스트로 추출, 스프레드시트에 정리