Claude Code로 "내가 AI를 어떻게 쓰고 있는지" 2주 더 추적해봤어요 - 바선생 사용기 2편

바선생 2주 후 — "그래서 진짜 늘긴 했나" 다시 측정해봤어요

바선생(vibe-sunsang) 사용기 후속편 — 2주 전 첫 진단이랑 비교해본 기록


🎯 바쁘시면 이것만 읽어도 돼요

  • 2주 전에 바선생으로 처음 측정해봤는데, 이번에 한 번 더 돌려서 Before/After를 비교해봤어요

  • 지난번 최대 약점이던 VERIFY(검증)가 이번엔 최대 강점으로 뒤집혀서 나왔어요

  • 근데 한 축이 오르니까 다른 축(ORCH)이 같이 떨어지더라고요 — 이게 제일 신기했어요

  • 같은 데이터를 다른 가중치로 보니까 "약점"이 약점이 아니었어요. 측정 잣대가 이렇게 중요한 줄 그때 처음 알았어요


👀 이런 분들께 도움돼요

  • 바선생을 한 번 써봤는데 "또 돌리면 뭐가 다를까" 궁금한 분

  • AI 활용 능력이 진짜 늘고 있는지 수치로 확인하고 싶은 분

  • 내 약점이라고 들은 게 진짜 약점인지 의심해본 적 있는 분

  • 코칭 받은 걸 실천하면 점수가 따라오는지 보고 싶은 분


😮 Before: 2주 전엔 "내 약점이 뭔지"만 알았어요

처음 측정했을 땐 종합 L3.0~L3.5가 나왔어요. ORCH(도구 조합)가 강점인 줄 알았는데, 비교해보니 그게 GPTers 스터디 맥락 덕분이었다는 걸 그때 알았어요. 그리고 VERIFY(검증)가 공통 약점으로 찍혔어요 — "AI가 먼저 제안하기 전에 내가 먼저 검증하는 습관이 없다"는 말을 들었어요.

근데 약점을 안다고 바로 고쳐지는 건 아니잖아요. "다음엔 검증부터 시켜야지" 하고 끝났어요.

✨ After: 2주 만에 약점이 강점으로 뒤집혔어요

이번에 다시 돌렸더니 공식 레벨은 L4.0 Pilot 그대로인데, 내부 점수가 3.81에서 4.22로 올라갔어요(L4.5 문턱이래요). 더 놀란 건, 지난번에 받은 숙제 두 개를 이번에 진짜로 실천했더니 점수가 따라왔다는 거예요. "고쳐줘" 대신 "이거 적용하면 뭐가 달라져?"를 먼저 묻고, 단계마다 검증부터 시켰더니 VERIFY가 약점에서 강점으로 뒤집혀서 나왔어요.

코칭 받은 걸 행동으로 옮기니까 그게 다음 측정에 잡힌다는 걸 처음 봤어요.


🔨 이번에 한 것

지난번이랑 똑같이 세 개를 순서대로 돌렸어요.

/vibe-sunsang 변환    ← 2주간 새 대화 로그를 마크다운으로
/vibe-sunsang 멘토링   ← 6축 코칭 (지난 리포트랑 비교)
/vibe-sunsang 성장     ← 레벨 리포트 + 종단 비교

추가로 두 가지를 더 해봤어요.

  • 이번에 큰 작업이 하나 있었는데(캐릭터 설정을 9단계로 쪼개서 분석한 거), 그걸 뺐을 때랑 넣었을 때를 따로 비교해봤어요

  • 그 작업은 코딩이 아니라 창작에 가까워서, Builder(코딩) 가중치 말고 Designer(창작/기획) 가중치로도 다시 돌려봤어요


📊 결과

6축 변화 (지난 측정 → 이번 측정)

지난번

이번

변화

DECOMP (작업 분해)

4.2

4.5

VERIFY (검증)

3.8

4.5

▲▲ 약점→강점

ORCH (도구 조합)

4.0

3.5

▼ 이번 약점

FAIL (실패 대응)

3.2

4.0

▲▲

CTX (맥락 제공)

3.8

4.0

META (메타인지)

3.5

4.5

▲▲ 최대 상승

종합

3.81

4.22

VERIFY랑 META가 크게 올랐는데, 동시에 ORCH가 떨어졌어요. 알고 보니 이번에 혼자 깊게 파는 작업(9단계로 쪼갠 분석)을 하느라 멀티에이전트나 도구 조합을 거의 안 썼더라고요. 한 축이 오르면 다른 축이 내려갈 수도 있다는 걸 그때 처음 알았어요.

같은 데이터, 가중치만 바꿔봤어요

Builder 가중치

Designer 가중치

Fit Score

4.20

4.20

레벨 이름

Pilot (조종사)

Planner (설계자)

ORCH 약점의 의미

다음 레벨 막는 병목

정상 패턴 (문제 아님)

점수는 똑같이 4.20인데 해석이 완전히 달라졌어요. "도구 적게 쓰고 깊게 설계하는" 행동이 코딩 잣대로는 약점인데, 창작/기획 잣대로는 원래 그런 거래요. 제 약점이 실력 문제가 아니라 이번에 그런 종류의 작업을 했기 때문이었어요.


💡 효과적이었던 것

코칭 → 실천 → 재측정 사이클이 처음으로 닫혔어요

지난번에 "고쳐줘 말고 원인부터 물어봐", "검증을 먼저 요청해" 두 가지를 들었는데, 이번엔 그걸 실제로 했어요. 그랬더니 FAIL이랑 VERIFY 점수가 따라 올라왔어요. 피드백이 그냥 조언이 아니라 다음 점수로 연결된다는 게 눈에 보였어요.

약점을 의심하게 됐어요

ORCH가 떨어졌다고 나왔을 때, 예전 같으면 "아 도구 조합을 더 써야겠다"로 끝났을 거예요. 근데 가중치를 바꿔보니 그게 약점이 아닐 수도 있더라고요. 측정 잣대가 작업 성격이랑 안 맞으면 멀쩡한 강점도 약점으로 보인다는 걸 알았어요.


⚠️ 이런 건 아쉬웠어요

  • 창작 작업은 처음에 코딩 잣대로 잡혔어요: 제가 직접 "이건 창작 작업이야"라고 등록해주기 전까진 코딩(Builder)으로 분류돼 있었어요. 작업 종류를 미리 알려줘야 정확하게 나와요

  • 공식 레벨은 그대로라 살짝 아쉬웠어요: 내부 점수는 올랐는데 공식 레벨(L4.0)은 안 바뀌어서, 처음엔 "안 늘었나?" 싶었어요. 근데 안을 들여다보니 게이트 하나가 열려 있었어요


📋 따라하려면

1. /vibe-sunsang 변환   (지난번 측정 이후 새 대화 반영)
2. /vibe-sunsang 멘토링  (지난 리포트랑 비교 코칭)
3. /vibe-sunsang 성장    (레이더 차트 + 종단 비교)

추천: 2~3주에 한 번씩 돌려서 Before/After를 쌓아보세요. 한 번만 찍으면 사진이고, 두 번 찍으면 영상이 되더라고요.

그리고 작업 종류가 코딩이 아니면(창작·기획·운영) 워크스페이스 유형을 꼭 맞게 등록해두세요. 잣대가 달라지면 결과 해석도 달라져요.


내 다음 목표

즉시: 혼자 깊게 파는 작업에서도 "이 단계는 에이전트나 스킬한테 맡길 수 있나?"를 한 번씩 물어보기 (ORCH 회복)

단기: Fit Score 4.5 넘기기 — 그러면 첫 L4.5예요. 지금 막힌 게 게이트가 아니라 ORCH 점수래요

중기: 이번에 만든 작업 정리 프로세스를 다른 프로젝트에도 써보기 → L5 Architect

과제 마무리가 생각보다 오래 걸려서 일단 바선생 후기부터 공유해봅니다~

1
1개의 답글

뉴스레터 무료 구독