불필요한 엑셀 빈칸 삭제 실패 사례

안녕하세요? 이번 10기에 처음으로 AI를 사용하기 시작한 씨티점퍼라고 합니다.


뭔가 이렇게 이렇게 해서 성공적으로 자동화에 성공했다를 올려야 하는데^^;;;; 일단 실패 사례도 사례니, 참고하실 수 있도록 올려봅니다.


먼저 챗지피티 4.0에게 작업을 시켜본 자료는 아래와 같습니다.

1) 파일 사이즈: 6.29mb
2) 작업대상: 1,952행(총 866페이지)
3) 현 파일의 문제점
- 회사 시스템에서 엑셀 출력 양식이 2개 또는 3개의 열에 한 데이터로 되어 있는 것들이 있음
- 종이 출력을 기준으로 설정된 양식이라, 헤더가 불필요하게 반복됨
- 꼭 필요한 헤더 역시 1개의 행으로 구성된게 아니라 3개의 행에 나눠져서 기재되어 있음.
4) 챗지피티 4.0을 통한 작업 목표
- 불필요하게 합쳐져 있는 열 삭제
- 3개의 행에 걸쳐져 있는 헤더를 하나로 합치기
- 첫 헤더를 제외하고, 중복으로 반복되는 모든 헤더 삭제
- 그래서 최종적으로 편집이 용이한 엑셀 상태로 만들고, 데이터 분석하기

  1. 최초 시도: 샘호트만’s 초보자들을 위한 데이터 분석 서포터 활용

1) 원본 자체를 던져주고 데이터 분석 요청 → 파일의 크기나 복잡성 때문에 분석 불가

2) 불필요한 중복메뉴나 공백이 많아서 그런 것 같으니 삭제 요청 → 전처리 하는 과정에서 시간 초과 발생하여 직접 처리 불가

3) 파일 안 데이터를 극단적으로 줄여서 불필요한 중복메뉴나 공백 제거 요청 → Pandas 라이브러리 사용하라면서 니가해라 시전


  1. 2차 시도: 새로운 채팅창을 생성하여 진행

1) GPT 세뇌 작업

1. 당신은 지난 20년 동안 다양한 데이터를 엑셀로 정리하고 분석하는 최고의 전문가입니다.

2. 엑셀에는 불필요한 중복이나 공백을 효율적으로 제거하는 기술이 있습니다.

3. 또한, 주어진 데이터를 효과적으로 분석하고 제안하는 능력도 뛰어납니다.


2) 똑같은 원본 파일 던져주고, 불필요한 열과 행 삭제 요청 → 코드 해석 중 오류 발생 시전


3) 이번에는 세부적으로 다시 지시해봄.

1. b, c, h, ah, aj 열 삭제

2. 1~6행에 있는 것처럼 고지자<<전체>> 확인대장, (2024년도 1학기), 학부가 들어 있는 모든 행 삭제

3. 7~9행에 있는 헤더를 한 줄로 통합.

예) 등록금_책정액_입학금 / 등록금_책정액_수업료

4. 7~9행을 제외한 하단의 모든 중복되는 헤더 삭제

5. A열의 순번을 기준으로 정렬

4) 하지만, 이번에도 니가해라 시전 ㅠ

5) 마지막으로, 첫번째 임무를 내가 해줄테니, 나머지는 니가 해봐라. 그것도 어려우면 니가 할 수 있는게 도대체 뭐냐?라고 질문 → 니가 해라 또 시전 ㅠ


  1. 결론

1) 이상한(?) 형식의 엑셀을 정상적인(피봇을 돌릴 수 있는) 데이터 형식으로 한번에 바꾸는 것은 어려운 것으로 보임

2) 파일사이즈가 너무 크면 일을 하다 만다.

3) 헤더는 수동으로 정확하게 1개의 행으로 만들어야 한다.

4) 챗지피티를 만능 요술상자처럼 생각했는데, 데이터 전처리가 필수로 보인다.

5) 다음에는 챗지피티를 활용한 엑셀 데이터 분석에 도전해봐야겠다.

3
2개의 답글

👉 이 게시글도 읽어보세요!

📚 AI 활용 사례 더 보기