당근마켓에서 중고 물품만 팔아본 이커머스 애송이에요. 이번 주말에만 5개를 팔고 신나게 집을 비웠어요. 하지만 GPTers 과제는 어나더레벨..
그래도 열심히 이커머스의 댄싱킹 한상문님의 스텝을 그대로 밟아 보기도 합니다.
1주차에 진행한 내용
1. 네이버 데이터랩 Top 20 키워드 크롤링
2. 데이터 전처리(?)
3. 데이터 분석
4. 상품 유형 선택
5. 리뷰 크롤링 + 분석
*총 5번의 삽질이 내용에 버무려져 있습니다.
1. 네이버 데이터랩 Top 20 키워드 크롤링
무난한 인테리어 소품으로 가보자는 방향을 정하고 한 첫번째 삽질은 바로 자동 크롤링 시도였습니다. 시간을 팡팡 뿌렸죠. GPT가 또 그럴듯하게 장단맞춰 가이드를 해주니까, 할 수 있을 줄 알았습니다.
Apps Script.. 구글 Colab.. Python…. 네이버 데이터랩 개발자 뭐시기 API도 받고.. (비개발자..) 아무튼 꽤 오래 농락당했습니다.
내 손이 하는 일을 내 머리가 모르게 해라(?) 제가 지금 뭐하는건지 설명좀 해주실분…?
이러고 있던 그때! 이커머스 방의 서포터님께서 키워드를 수작업으로 크롤링하니 1년 치가 3분 걸린다는 말씀을 듣고 그제서야 현실세계로 돌아왔습니다. (시간의 은인..)
마침 키워드가 겹쳐서 나눠서 크롤링하니 순식간에 끝났습니다.
2. 데이터 전처리(?)
여기서 또 두번째 삽질이 시작됩니다. 그냥 파일 올리고 숫자 빼달라고 하면 GPT가 잘 해줄줄 알았죠. 엄청 단순한 작업이니까요.
하지만 여러번 해봐도 한글은 그대로 있고, 한글 위에 ㅡ이렇게 빗금이 간 결과물만을 줬습니다. (빡쳐서 그 결과물은 다 삭제해버렸..)
삽질하다가 예시를 주고 해결했습니다.
바로 이어서 세번째 삽질 Go.
GPT 함수로 구글 스프레드시트에서 번역을 했는데, 한번 쓰윽 보는데 이상한 단어들이 많았습니다.
Mood, Gypsum.. Zhang Stand?????
Noise.. Bedtime.. Poppo Pay?
아니 다른건 그렇다 치고 Zhang Stand는 좀 선 넘지 않았나요.
사실은 그냥 상관없이 분석하고, 나중에 결과물이 나오면 저게 뭔지만 살펴보면 되는건데, 왜 그 생각을 못하고 저런 단어들을 맞게 고치고 있었을까요? (성격탓)