(8기 자녀방) 기말고사 문제 은행 만들기


#[8기 AI A2Z] 문항 제작 유형(수능형 포함) 총정리 - PDF 편집 툴 정리

꼬비님의 사례를 참고해서 저희 딸의 필기 노트로 한국사 문제은행 만들기를 시도해 봤습니다. 결과물 중 일부를 딸에게 전달해 주기는 했는데, 오늘 시험이라 얼마나 도움이 될지는 모르겠네요.

결론적으로.. 생각만큼 쉽지 않은 작업이였습니다.

전체적인 진행 과정을 정리해 보았습니다.

(ChatGPT 프롬프트 작성 시 Persona Pattern 적용 : 고등학교 한국사 선생님 역할 지정)

  1. 먼저, 재료 준비하기

처음 계획은 1) 해당 범위의 교과서 내용, 2) 딸아이의 필기 노트를 가지고 하는 참고 자료를 만들려고 했습니다.

일단 딸아이의 필기 노트를 사진 찍어서 이미지 파일을 확보합니다.

다음으로. 교과서 pdf를 얻기 위해 교과서 출판사와 관련 사이트에 들어가서 봤더니, 교사 자격이 아니면 pdf를 다운로드 받을 수가 없었습니다.

아쉬운 대로 e-book 형태로 볼 수는 있고, 프린트를 할 수 있는 기능이 있어서 해당 범위 설정 후 [pdf 프린트]로 파일을 얻기는 했는데. ChatGPT가 인식을 하지 못합니다. (마우스로 긁기가 안됨)

결국 필기 노트만 가지고 작업을 하기로..


  1. 필기 노트 이미지의 텍스트 변환하기

필기 노트 이미지를 ChatGPT에 넣고 텍스트로 추출해 달라고 하니..

안된다고 하네요.

그래서, 결국은 OCR의 강자인 Askup의 도움을 받았습니다. 확실히 OCR에서는 제일 막강한 거 같습니다.

Askup의 도움으로 모든 노트 필기 이미지를 1차로 텍스트 추출을 했는데, 필기 노트 상태가 손으로 작성한 것이고 형식이 정형화 되어 있지 않아서 그런지 글자가 잘못 인식된 부분이 많이 눈에 띄었습니다.


  1. Askup 추출 텍스트와 이미지를 동시에 ChatGPT에 넣고 정리하기

그래서 찾은 대안은 Askup 추출 텍스트와 원본 이미지를 동시에 ChatGPT에 넣고, 내용 정리를 해 달라고 했습니다. 이미지만 넣었을 때는 못한다고 하더니, 이렇게 하니 그래도 일은 합니다.

Persona(고등학교 한국사 선생님)를 지정하면서 프롬프트에 관련 자료의 검색 등 활용 가능한 모든 능력을 동원하여 텍스트의 내용 손실이나 축약 없이 최대한 복원해 달라고 했더니, 복원 결과도 그리 나쁘지 않게 나온 듯 합니다.

이렇게 총 24장의 이미지에 대한 복원 작업을 진행하였습니다.

중간 중간 오류 나오는 경우도 생기고.. 그러다 보니, 제한 사용량 초과 되고…

다행스럽게도 한시적으로 유료 계정이 2개인 게 도움이 되었습니다!!


  1. 이제 문제 만들자!

이 부분을 진행할 때는 꼬비님의 사례가 있어서 큰 문제 없이 진행할 수 있었습니다.

한국사라는 과목과 내신 시험의 특성, 작업 시점 기준으로 당장 내일 시험이라는 점을 고려하여 단답형과 빈칸 유형의 문제로 출제하였습니다.

꼬비님의 문제 유형별 프롬프트를 참고하고, 중간 중간 출력 된 문제 상태를 보면서 이것 붙이고 저것 붙이고 해서 최종적으로 사용한 프롬프트는 다음과 같습니다.

결론적으로.. 문제 출제 단계에서는 제시된 문제 유형에 따라서 문제 출제는 잘 되는 거 같습니다.

하지만.. 조금 욕심을 내다 보니.. 몇 가지 문제점(?)을 느끼게 되었는데요.

  • 중복된 문제 출제: 제한된 범위에서 너무 과도한 문제(100문제이상)를 내달라고 하니, 아무리 중복 문제는 제외해 달라고 규칙을 제시해도 중복 문제를 계속 출제함.

  • 일부 주제에 편중된 문제 출제: 자세히 분석해 보지는 못했지만, 전체 범위에서 골고루 출제되지는 않는느낌이 들었음.

  • 다운로드 파일 생성의 어려움: 토큰 제한에 걸려서 인지, 생성된 문제를 다운로드 받을 수 있는 파일로 만들어 달라고 하면 오류가 계속 남.(하나 하나 긁어야 하는 애로 사항 발생)


추가로 빈칸 채우기와 유사하긴 한데.. 보통 내신 영어 시험 준비할 때 쓰는 문제 유형 중에 “빵꾸노트(교과서 지문에서 중간 중간 중요 단어를 blank 처리)”라는 것이 있습니다.

원본 문장을 그대로 유지하면서 빈칸을 만들어야 하는데, 이 부분의 구현이 잘 안되고… 중요 단어를 blank 처리하는 것도 쉽지 않은 듯 하고.. 이 부분은 차후에 좀 더 시도를 해 보야 할 거 같습니다.


느낀 점 정리

  • 소위 “데이터 전처리”가 정말 중요하고.. 중요한 만큼.. 고단한 일이라는 것을 다시금 느낌.

  • 꼬비님도 말씀하셨던 부분인데.. 긁어지지 않는 PDF 파일은 참.. 곤란하다..

  • 역시 OCR은 Askup이 최강이다…

  • 대량으로 문제를 자동으로 생성할 때, 문제의 Quality 관리가 쉽지는 않겠구나.. (문제의 수준, 중복성, 편중성 등)

  • 필기 노트 같은 것을 활용해서 이런 방식으로 문제 은행을 만든다면, 노트 필기 하는 단계부터 구조화에 대한 고민을 하는 것이 필요할 듯…

  • 중간 중간 발생하는 예측하기 힘든 오류들… 대단한 인내심을 요하는 작업인 듯 합니다.

  • 캠프명이 “자녀와 함께 AI”인데.. (기말고사 공부하는) 자녀와 함께, AI (공부하기)를 실천한 듯~^^



6
4개의 답글

👉 이 게시글도 읽어보세요