◆ 목표 : 카톡 단톡방의 운동인증 내용을 구글시트나 에어테이블에 자동으로 옮기기
◆ 원래의 진행 계획
- 카카오 오픈단톡방 채팅내역 다운로드 하기 ( 현재는 자동으로 불가, 향후 RPA로 시도 예정)
- PDF로 전환 하기 (60페이지 정도 되는 용량)
- 원드라이브 링크는 CHATGPT에서 참조 못함
- 수동으로 Ask your PDF 사이트에 PDF 업로드
- 용량이 너무 커서 일부 파일만 올림
- CHATGPT 4.0 에서 플러그인 등록하여 (날짜, 순번, 이름, 운동내역)을 테이블 형식으로 출력요청
- 출력내용이 많으면 단계적으로 출력 요청
- 출력 내용을 구글 시트나 AIRTABLE로 옮기기
- 개인별, 운동실적을 그래프로 그리고 그 이미지를 다시 단톡방으로 공유
◆ 결과 : 아직 제대로 되는 것이 하나도 없음
======================================================
◆ 실패사례 1 ( GPT에서 실수로 삭제를 해서 실패사례도 날라감)
======================================================
◆ 실패사례 1 ( GPT에서 실수로 삭제를 해서 실패사례도 날라감)
- PDF를 CHATGPT에서 읽어들였으나 데이터를 제대로 추출하지 못함
- 매일 10명 조금 넘는 사람들이 인증을 하지만, 3~4명만 출력하고
- 그나마 날짜도 며칠 밖에 하지 못함
2 운동한 날짜만이라도 확인하려고 했으나, 역시 몇개의 날짜밖에 출력 안함
- 전체 60페이지중에 초기 20페이지만 뽑아서 운동한 날짜를 뽑아보라고 함 : OK
- 거기에 추가로 날짜별로 운동한 횟수를 뽑아보라고 함 : 실패
- PDF 인식에 한계가 있는 것 같아서 단톡방 채팅 내역을 일부 카피해서 직접 붙여 넣음
- 3~4일치 인식하는 것도 제대로 출력이 안됨.
=======================================================
◆ 실패사례 2
◆ 실패사례 2
- 데이터를 줄여서 PDF로 만듬 (최근 10일정도 분량, 25페이지)
- 먼저 입력한 사람들과 입력횟수 추출해보기 : 안하겠다고 함. 다른 SW 사용하라고 함
- 자꾸 따져보고, 천천히 해보라고 함. : 4명만 추출 (이전에는 14명을 추출함)
- 페이지도 4~5페이지만 찾아본 것 같아서 항의하고 다시하라고 하니 동문서답함
- 계속 동일한 답변만 반복함.
- 유효한 입력 (특정한 양식의 입력방법)만 추출하고, 동일 한 것중 입력시점이 제일 늦은 것만 선택
- 그리고 제일 늦게 입력한 사람 카톡 내용만 출력 (누적 기입이라서) : 동문서답
- 다시 천천히 입력한 자료에 대해 설명하고 출력 예제를 보여주며 출력을 요청 : 역시 동문 서답
- 아주 기초적인 질문들은 해봄 : 페이지수 맞음, 모든날짜 찾아보기 (틀림), 텍스트 갯수 (거부)
- 오류 지적하고 수정하고 다시 바꿔서 질문 : 페이지수 (맞음), 날짜는 지적에 맞춤, 14명 추출
- 입력한 사람들 이름 순차적 출력 요청 : 전혀 틀리는 답변
◆ 배운점
- 카톡방 채팅으로 데이터 추출은 다른 방법으로 고민해봐야 함 (마지막 업로드 사람 기준)
- 효과적인 프롬프트의 리스트를 평소 만들어서 보관해야 함
- 실패는 빨리 공유해서 조언을 받아야 함.
◆ 토론을 통해 배운점과 상식들
- 데이터 클린징 전처리가 필요하다는 조언
⇒ 맞는 말씀인데, 그렇게 하면 내가 결국 데이터 가공 및 코딩을 하는 것 같은 느낌.
⇒ 아직 그런 실력이 안되어 진도가 나가지 않음 - 카카오 R봇을 공부해보라는 조언
⇒ 기대는 컸는데, 공부하기는 어렵고, 딱히 내 목표와 약간 거리가 있는 방향성
링크 1 : https://velog.io/@whrod/mebot-kakao1
링크 2 : https://quantrader.tistory.com/128 - 노코드툴이 결국 모든 것이 구독료 혹은 사용료를 내야 해서 부담이라는 질문
⇒ 에어테이블 24불, 재피어 스타터 20불 : 시도해보라는 조언