차려줘도 왜 먹지를 못하니
안녕하세요. API방 유민수 파트너님이 차려주신 밥상에 숟가락만 살포시 얹은 결과입니다.
제 경우는 연구실과 집을 오가면서 두 대의 컴퓨터로 작업을 해서 여러 번 시도가 있었습니다. 연구실 컴으로 작업하다가 끝까지 수행을 못하고 귀가후 노트북으로 다시 처음부터 작업을 해서 과정이 그다지 매끄럽지 않았습니다.
사용하신 프롬프트를 챗GPT에 따라했는데 단계적으로 과정절차를 잘 보여주지 않았습니다. 1) 아마도 custom insturction에 customized된 persona를 부여하지 않아서 그런가 봅니다. 그리고 2) 컴퓨터의 로컬 세팅차이에 기인한 바도 있지 않을까 합니다.
1차 시도) 텍스트 추출상의 오류 및 text의 chunk화 과정에서의 오류
PDF 텍스트 추출 (한글)2차 시도) 토큰수를 줄이고자 영어 프롬프트로 진행했으나 챗GPT시스템상의 오류발생
PDF 파일 처리 도움요청3차 시도) 3차 시도) 장소이동으로 다른 컴에서 오류 발생이전 히스토리를 챗GPT에게 설명후 다음 단계를 시도하나 잘 되지 않음. 히스토리 설명이 너무 간결하지 않았나 추측해볾.
New chat4차 시도) 혹시나 하여 다른 작품 파일로 같은 과정을 밟았으나 API key생성후 translation과정에서 오류발생: 세션 초기화로 인해 필요한 함수와 라이브러리가 모두 초기화되어서 오류가 발생. 다시 필요한 함수와 라이브러리를 정의하고 진행하지만 여전히 진행이 안됨.
번역 API 사용 안내5차 시도) 다시 원래 시도하던 파일을 새세션에서 시도함. 코랩에서 API로 번역하는 시간이 너무 오래 걸려서 챗GPT에게 질문후 추천받은 시간절약형 병렬구조로 시도해 보았으나 여전히 시간이 오래 걸리고 run time 에러가 발생함. 결국 튜토리얼에 있는 코드를 가져와서 번역이 진행됨.
*** 비개발 초보자로서의 소고:
GPT3.5로 시작해서 마지막에는 GPT4.0으로 번역을 마무리했는데 버전에 따른 API사용 비용 차이가 날 것 같습니다. 마지막 시도에서 약 한시간 가량 API를 활용하여 진행되었는데 번역량이 많으면 비용문제도 감안해야 할 것 같습니다. 그리고 시도하는 중에 분량이 많은 작품전체를 pdf로 올리니 코랩의 메모리 문제가 발생했습니다. pdf량도 분할해서 여러 차례 진행해야 할 것 같습니다. 다음번에는 번역가와 AI번역의 대조분석을 시도해 보고자 합니다.