[코인프 스터디][개인] 신라촌락문서를 GPT4에 넣어보았다.


1. 사건의 발단


코인프스터디 팀 과제를 마치고 GPT에게 데이터 시각화의 가능성을 보았다. 이것저것 시도해보던 중 갑자기 떠오른 ‘신라촌락문서’. 고등학교 때 학생부종합전형을 준비하면서 신라촌락문서에 대한 통계적 분석과 역사학적 의의를 제기한 보고서를 작성한 적이 있었다. GPT에게 이걸 준 사람은 아무래도 세계 최초인 듯한 (자만한) 생각에 바로 진행시키게 되었다.


우선 오랜만에 과거에 썼던 보고서 먼저 꺼내보기로 했다.

(보고서라고 보기에는 솔직히 너무 우습다..)

아무튼 고3 때의 나를 회상하며 1분 정도 추억에 젖어가다가 정신을 차리고 신라촌락문서에 대한 정보를 다시 찾기 시작하였다. 이미 저명한 학자분들께서 신라촌락문서에 대한 역사적-통계적 분석을 다 마치신 상태이고, 시각화된 자료도 많았지만, 그럼에도 나는 GPT4로 시각화를 해보기로 하였다.


2. 사건의 진행


신라촌락문서란 무엇인가?

(고등학교 때의 나에게 대신하기로 하였다..)

신라 촌락 문서는 1933년 일본 나라시 동대사의 정창원에 발견되었다. 안에는 촌락에 관한 내용들이 있었는데, 일본에서 발견되었지만, 문서의 내용 가운데 지금의 충청북도 청주인 ‘서원경(西原京)’이 기록되어 있었으므로, 이 문서가 신라의 촌락에 대한 기록임을 알게 되었다.

 문서는 서로 연결된 2편을 붙인 것인데, 각 편에 2개 촌씩 모두 4개 촌에 대한 상세한 사항이 기록되어 있다. 2편의 서로 다른 문서편에는 각각 2개씩, 모두 4개의 촌이 보이고 있다. 그 중 하나에는 이름을 알 수 없는 어느 현에 소속된 사해점촌, 살하지촌이, 다른 하나에는 이름을 알 수 없는 촌과 서원경 소속의 또 다른 촌이 각각 이어져 기재되어 있다. 처음에는 이 두 문서가 서로 이어져 있는 것으로 생각하여 모두 서원경 부근의 촌락으로 추정하였다, 하지만, 엄밀히 말해 두 문서는 서로 연결된 것이 아니며 그 순서도 분명히 알 수 없기 때문에 두 문서의 촌락이 서로 인접하여 있다고 단정지을 수는 없다.

앞서 말한대로 신라 촌락 문서에 기재된 촌은 총 4개로 서원경(오늘날 청주)에 근접하였을 것으로 추정되는 사해점촌(沙害漸村: A촌)·살하지촌(薩下知村: B촌)·모촌(某村: C촌)과 서원경(西原京)의 직접 관할 아래 있던 모촌(某村: D촌)으로 분류된다.


이 중 사해점촌(沙害漸村)에 대한 원문 해석본을 토대로 데이터 시각화를 진행하고자 한다. 아래는 국사편찬위원회에서 제공하는 신라촌락문서의 사해점촌에 관한 원문 해석본이다.


이 현(縣)의 사해점촌(沙害漸村)을 조사해 보니, 지형은 산과 평지로 이루어져 있으며, 마을의 둘레는 5725보(步), 공연(孔烟)의 수는 합하여 11호(戶)가 된다. 계연(計烟)은 4, 나머지 3이다. 이 가운데 중하연(仲下烟) 4호, 하상연(下上烟) 2호, 하하연(下下烟) 5호이다. 마을의 모든 사람을 합치면 147명이며, 이 중 3년 전부터 살아온 사람과 3년 사이에 태어난 자를 합하면 145명이 된다.

정(丁) 29명(노(奴) 1명 포함), 조자(助子) 7명(노(奴) 1명 포함), 추자(追子) 12명, 소자(小子) 10명이며, 3년 사이에 태어난 소자 5명, 제공(除公) 1명이다.

여자는 정녀(丁女) 42명(비(婢) 5명 포함), 조여자 9명, 소여자 8명이며, 3년간에 태어난 소여자 8명(비 1명 포함), 제모(除母) 2명, 노모(老母) 1명 등이다. 3년 사이에 이사 온 사람은 둘인데, 추자 1명, 소자 1명이다.

가축으로는 말 25마리가 있으며, 전부터 있던 것 22마리, 3년 사이에 더해진 말이 3마리이다. 소는 22마리인데, 전부터 있던 것 17마리, 3년 사이에 더해진 소 5마리이다.

논[畓]은 전부 102결(結) 2부(負) 4속(束)인데, 관모전(官謨田)이 4결, 내시령답(內視令畓)이 4결, 연수유답(烟受有畓)이 94결 2부 4속이며 그 중 촌주가 그 직위로 받은 논이 19결 70부가 포함되어 있다.

밭은 전부 62결 10부 5속인데 모두 연(烟)이 받은 것이다.마전(麻田)은 전부 1결 9부이다. 뽕나무는 1004그루인데, 3년 사이에 심은 것이 90그루, 전부터 있던 것이 914그루이다. 잣나무는 모두 120그루이고, 3년 사이에 심은 것이 34그루, 전부터 있던 것이 86그루이다. 호두나무는 모두 112그루이고, 3년사이에 심은 것이 38그루, 전부터 있던 것이 74그루이다.

- 출처: http://contents.history.go.kr/front/hm/view.do?levelId=hm_033_0050


2-1. 그냥 일단 보내버리기

바로 정리해준다. 이제 시각화를 들어가고자 하는데, 솔직히 나도 모르는 용어가 너무 많았다. 과거의 내가 그나마 정리해둔 내용이 있기 때문에 그 내용을 주고 학습을 시켜보았다.

논문도 같이 주긴 했었는데, 읽지 못하는 것 같아서 내 자료만 주고 학습을 시켜보았다.

(안타깝게도 딱히 변한 건 없어보인다..)


2-2. 데이터 시각화를 시작해보자.


사실 나는 데이터 시각화에 굉장히 무지하다. 유일하게 내가 이해할 수 있는 건 백분율과 약간의 그래프들.. 그렇기 때문에 이를 읽고 있는 데이터 시각화에 전문적인 독자들과 교수님들께 답답함을 유발할 수 있음을 미리 양해를 구하고자 합니다..


일단 나는 모르기 때문에, GPT에게 어떻게 나타낼 수 있는 지 물어보았다.

음.. 우선 인구분포는 용어에 대한 공부가 더 필요할 것 같고.. 제일 만만해보이는 나무 분포로 가봐야겠다 생각하였다.


2-2-1. 나무 분포

우선 막대 그래프로 나무 분포를 확인하였다. 다른 시각화도 있는 지 질문해보았고 원형 차트를 요청하게 되었다.


한글 폰트를 주었음에도 깨지는 문제가 발생하여 영어로 출력해달라고 요청했다. 막대그래프와 비교했을 때 훨씬 더 직관적이고 가독성 있게 이를 출력해주는 듯 보인다. 뽕나무(Mulberry Trees)가 전체 나무 중 대부분을 차지하고 있으며, 그 다음으로 잣나무(Pine Trees)와 호두나무(Walnut Trees)가 차지하는 비율이 더 작은 것으로 보인다.


2-2-2. 논과 밭, 그리고 마전

두번째는 땅의 면적에 관한 통계이다. 일단 무턱대고 시각화를 요청해보았다.


마음에 들지 않는다. ‘결’이라는 표현이 와닿지 않고, 결과적으로 내가 이해하지 못하였다. GPT에게 현대식으로, 그리고 영어로 요청을 하게 되었다.

스스로 헥타르로 변환해서 하는 모습이 기특하다..

  • 논(Paddy Fields): 약 101.22ha

  • 밭(Dry Fields): 약 61.92ha

  • 마전(Hemp Fields): 약 1.88ha


이제야 조금 더 와닿는 수치가 되었다. 다른 그래프도 시도해보았다.

스택 바 차트:

히트맵:


포인트 그래프:


이것저것 시도해보았다. 이 중 막대그래프와 스택 바 차트가 비교적 직관적이라는 것을 알 수 있었다.


[심화?] 구분에 따라서 토지를 다시 나누어보았다.


신라촌락문서에서 토지는 논, 밭, 마전으로 구분되긴 하지만, [내시령답], [관모전], [연수유답]으로 나눌 수도 있다.


“논[畓]은 전부 102결(結) 2부(負) 4속(束)인데, 관모전(官謨田)이 4결, 내시령답(內視令畓)이 4결, 연수유답(烟受有畓)이 94결 2부 4속이며 그 중 촌주가 그 직위로 받은 논이 19결 70부가 포함되어 있다.

밭은 전부 62결 10부 5속인데 모두 연(烟)이 받은 것이다.마전(麻田)은 전부 1결 9부이다.”

- 신라촌락문서


GPT4는 각각의 용어에 대해서 다음과 같이 설명해주었다.

  • 관모전 (官謨田): 이는 관리(관리는 관청에서 관할하는 영역 내의 사람들)가 사용하는 논을 의미합니다.

  • 내시령답 (內視令畓): "내시령"은 내시(직접 왕에게 부속된 신하나 종)의 지휘자를 의미하며, 이 답은 그들이 관리하는 논이나 밭을 의미합니다.

  • 연수유답 (烟受有畓): 이는 일반 마을 사람들이 사용하는 논이나 밭을 의미합니다.


다만 고교 때 작성했던 내 문서를 참조하여 조금 다시 적어보자면,(틀린 내용일 수도 있습니다..)

  • 관모전 (官謨田): 이는 관리(관리는 관청에서 관할하는 영역 내의 사람들)가 사용하는 논을 의미합니다.(동일)

  • 내시령답 (內視令畓): 내시령답은 통일 신라시대의 관리직책인 ‘내시령’에게 할당된 관료전(거의 동일)

  • 연수유답 (烟受有畓): 국가로부터 지급받아서 소유하고 있는 전이나 답이라는 뜻으로 당나라의 균전제와 마찬가지로 국가에서 연호에게 토지를 지급한 것.(거의 동일)

+ 촌주위답: 촌추위답은 본 사료에서 “그 중 촌주가 그 직위로 받은 논”에 해당하는 땅인데, 말 그대로 촌주가 받은 땅을 말한다.


표현 방식이 달라서 그렇지 서로 동일하게 알고 있음을 알 수 있다. (둘다 맞거나, 둘다 틀리거나)’


아무튼 다시 데이터 시각화로 돌아와서, 막대 그래프와 원형 차트를 출력해달라고 하였다.




똑똑하게도 헥타르로 앞서 단위를 변경한 내용을 기억하고, 바꿔주었다. 그리고 원문에서도 알 수 있듯이, 연수유답이 가장 많은 비율을 차지함을 알 수 있었다.




3. 사건의 결론


내가 통계에 아무리 무지하다고 하여도, GPT로 인해서 보완되는 부분이 상당히 크다는 것을 알 수 있었다. 늘 GPT를 쓰면서 느끼는 부분이지만, 내가 부족한 건 상관없다. 다만 얼마나 흥미와 열정을 가지고 있는가가 훨씬 더 중요한 것 같다. 나는 통계에 대해서 완전히 무지하지만, GPT를 통해서 통계적 표현을 할 수 있었다.

아울러 고문서(古文書) 임에도 ChatGPT에서 사용할 수 있다는 게 상당히 놀랍다. 개인적으로 GPT가 한국사나 한문에는 상당히 약하다고만 생각했었는데, 오늘 사용을 계기로 이러한 생각을 조금 버리게 된 것 같다. 물론 그렇다고 한문 해석을 온전히 맡기기에는 아직 부족한 점은 많은 듯하다. 그러나 고문헌 연구에서도 어느 정도 빛을 발할 수 있지 않을까 싶다.

마지막으로 이 경험은 개인적으로 고등학교 때 하고 싶었던 부분을 해보는 경험이었다. 물론 대학교 내에서 이걸 한 것은 아니지만, 단순히 논문을 참조하는 것 이상으로 스스로 맛보고 씹고 뜯는 재미가 상당하다는 것을 알게 되었다. 고등학교 때 이 보고서의 마지막을 ‘영국의 둠스데이 북(신라촌락문서의 영국판..)’과 비교 분석하고 싶다는 내용으로 추후 연구 주제에 대한 여지를 남겨두었는데, 기회가 된다면(물론 영어도 돼야 한다.) GPT4를 통해 비교해 보는 것도 좋은 경험이 되지 않을까 싶다.

신라촌락문서를 엑셀 파일로 출력해 달라고 요청하였다. 혹시 한번 사용해보고 싶은 사람은 이걸 사용해도 괜찮고, 실제 원문 해석본을 사용해도 좋다.

Shilla_Village_Data.xlsx
4
2개의 답글

👉 이 게시글도 읽어보세요