부동산 건축물 대장에서 위법사항 내용만 자동으로 추출하기

배경 및 목적

공인중개사가 부동산 중개시 건축물 대장에서 위법사항을 확인해 고객에게 위법내용을 반드시 고지해야 할 의무가 있음

그런데, 건축물 대장에 '변동내용 및 원인' 란에 이미 해결된 사항이 함께 기재되있어, 위법사항과 해결된 상황을 구별하려면 일일히 확인해 엑셀에 노가다로 입력해야 함

이런 불편을 해소하기위해 건축물 대장에서 위법사항만 텍스트로 추출해 구글 스프레드시트에 정리할 수 있는 자동화 필요

# 시나리오 구성

  • PDF 파일 업로드

  • 텍스트 추출 (OCR 포함)

  • 위법사항 관련 정보 식별 및 추출

  • 추출된 정보 정리 및 구조화

  • 결과 저장 또는 보고

    실제 건축물 대장에 기록된 사례

-위반건축물

한글 숫자가 적힌 종이 한 장

-위반된 건축물이지만 별도 표시내용 없음

한국 달력이 종이에 보여요

-실제 건축물 대장

빨간색 원이 있는 문서

해결방법

-변동내용 및 원인항목에서 위반된 내용만 추출하면 노가다 작업을 하지 않아도
-텍스트로 추출, 스프레드시트에 정리

1

👉 이 게시글도 읽어보세요