원문:
미드저니 개인화 프롬프트와 심리상태 분석과연 이 주제가 미드저니 캠프 발표 주제로 적절할 것인가하는 고민을 잠시 했지만
후다닥 만들어버린 이 만화를 발표하기엔 너무 분량이 짧아서 미드저니를 이용해서 생각하고 있던 아이디어 하나를 끄적여 봅니다.
토요일 발표용 파일
(ppt버전)미드저니 personalization 프롬프트를 활용한 심리상태 엿보기.pptx
미드저니 personalization 프롬프트를 활용한 심리상태 엿보기.pdf
개인화 프롬프트 소개
미드저니에서 최근 재밌는 업데이트가 하나 있었습니다.
개인화(personalization)라는 프롬프트인데요.
그동안 내가 마음에 들어했던 그림을 기반으로 해서 일종의 내 취향의 스타일을 이미지 생성에 적용할 수 있도록 해주는 겁니다.
어떻게 데이터를 수집하는가
차근차근 설명해보면
일단 저장되는 데이터는 2종류가 있는데요.
좋아요
미드저니는 이렇게 다른 사람들이 생성한 이미지 중 마음에 드는 것은 하트를 누를 수 있습니다. 이 이미지들은 따로 모아서 볼 수도 있도록 해두었구요.
Task
웹 버전 미드저니의 Task에 들어가보면 rank images라는 항목이 있습니다. 위의 스크린샷 처럼 두가지 이미지를 보여주고 둘 중 어떤 이미지가 더 마음에 드는지 고르는 겁니다.
제가 제 개인화 코드를 만들때는 이런 선호도 선택이 200개가 넘으면 개인화 코드가 생성된다고 했습니다. 지금도 아마 비슷할 것 같네요.
200개가 넘은 다음 --p 프롬프트를 이미지 생성 때 추가하시면 내 개인화 코드를 볼 수 있고, 그 이미지에 내 취향이 적용되어 생성됩니다.
ranking을 얼마나 했는지는 디스코드에서 /info를 입력해보면 확인하실 수 있습니다.
개인화코드는 미드저니에서 추후에도 꾸준히 업데이트 하겠다고 공지했고 앞으로가 더 기대됩니다.
얼마나 차이가 있을까?
개인화코드가 만들어지는 알고리즘은 알 수 없지만 개인화코드에 따른 스타일의 변화는 분명합니다.
gpters AI 이미지생성 2번방 오픈톡에서 피카쏭님과 엘리스님이 정리해서 올려주셨던 내용인데요, 동일한 프롬프트를 입력하고 개인화 코드만 달리해서 생성해본 겁니다. 이미지를 보면 아시겠지만 같은 프롬프트라도 개인화 코드에 따라 스타일이 명확하게 다르다는 걸 알 수 있습니다.
이미지와 관련된 심리검사
미 드저니가 어떤 원리로 개인화코드를 만드는지는 모르지만, 나의 개인 취향이라는 것은 다양한 것이 반영되어 있습니다. 어쩌면 나의 심리적 상태라던지 성격 같은 부분도 내가 선호하는 이미지를 선택할 때 무의식적으로 영향을 줄 수 있고요.
이미지와 심리상태라고 하니 바로 떠오르는 검사가 하나 있었습니다.
HTP라고 하는 검사인데요. House-Tree-Person의 약자로, 이름 그대로 집, 나무, 사람을 그리도록 하고 그 그림을 분석해서 심리상태라던지 성격적인 부분을 평가하는 심리검사 입니다. 원래는 직접 그리도록 하는 건데요... 생각해봤던 건 개인화코드를 적용하고 저 3요소에 대한 이미지를 생성하도록 한다음 그 이미지들을 HTP검사의 해석 방법을 통해 분석해보면 무언가 심리적인 의미를 발견할 수도 있지 않을까라는 생각을 했습니다.
이미지 생성을 통한 분석의 한계점
당연하지만 원래의 HTP검사는 짧은 시간 내에 그리기 때문에 대개 단색이고 굉장히 간단한 형태의 그림을 분석하게 됩니다. 생성 이미지는 화려하죠.
분석의 요소 중에 필압이라던지 그림을 그리는데 걸린 시간 같은 부분도 있는데, 미드저니에게 생성을 시킨다면 이런 요소들은 평가가 되지 않을 겁니다.
기본적으로는 학술적으로 검증이 안되어 있는 건 당연하고요.
그럼에도, 흥미로운 부분
HTP검사의 제한점
HTP검사는 주로 아동들에게 시행합니다. 일단 아이들이 자신의 감정을 말로 잘 표현하지 못하는데 그림은 언어로 표현할 수 없는 부분도 표현해주거든요. 그리고 성인에서는 잘 하지 않는데 그 이유는 일반적인 성인이라면 그림을 그리라고 했을때 기본적으로 그림에 심리적인 방어를 합니다. 적당히 적절한 그림을 그린다는 거죠. 심리적으로 불안정하다고 해서 그걸 그림에 있는 그대로 투영하지는 않을 가능성이 큽니다. 그래서 성인에서 이 검사는 해석이 굉장히 제한적이고 큰 의미가 드러나지 않을 수 있습니다.
AI를 통한 이미지 생성이 기대되는 부분
개인화코드는 이미 만들어져 있는 것이고 이 것으로 이미지를 생성할때는 나의 의식적인 방어가 끼어들 여지가 없습니다. 그래서 성인도 해볼 수 있습니다.
물론 개인화코드를 만들기 위한 ranking 작업 때 의도적으로 특정 방향의 이미지를 골랐다면 모를 일이지만 200개 이상을 선택해야 하고, 각 그림이 어떤 의도의 그림인가가 모호하기 때문에 의식적인 요소가 개입할 여지가 굉장히 적은 편입니다. 조금 더 보충해서 설명한다면, 예를 들어 설문 형식의 심리검사라면 "나는 혼자 있는 것보다 사람들과 어울리는 것을 선호한다."라는 질문은 사실 의도를 읽을 수 있습니다. MBTI였다면 혼자 있는 걸 선호한다면 I, 사람들과 어울리는 것을 선호한다면 E겠죠. 이런 검사를 자기보고식 검사라고 하는데 사실 어느 정도는 내가 바라는 방향이 반영될 수 밖에 없습니다.
그렇기 때문에 이론적으로는 그림을 통한 평가가 조금 더 나의 무의식적인 부분을 보여줄 수 있습니다. 이런 류의 검사들을 투사적(projective) 검사라고 합니다.
해보기 전 사전 경고
일단 저는 HTP검사를 해석하는 방법을 모릅니다. 사실 그래서 이런 아이디어를 떠올렸을 수도 있고요. 투사검사는 해석이 굉장히 어렵고 임상심리로 대학원 과정까지 마친 임상심리사 선생님들이 충분한 경험을 쌓아서 하시는 검사입니다. 저는 주로 해석된 보고서를 읽어보기만 했고요. 그렇기 때문에 이런 시도는 학술적으로 전혀 근거가 없고 전문가의 입장에서 보면 얼토당토 않은 이야기일 수 있습니다.
개인화코드는 아직 완성되지 않았습니다. 미드저니가 최근 설문조사를 하면서 인종, 성별, 직업, 성적 취향등을 물은 적이 있는데요. 아마 특정 조건에 따른 선호 이미지에 대한 데이터를 모으려고 하는 것 같긴 합니다. 일단 원리를 모르기도 하고요.
그렇기 때문에 아직 이론적으로 정립되지 않은 이런 사짜 아이디어로 어떤 결과물을 받아보셨다고 해도 적당히 걸러서 읽어보셔야 합니다. 저는 직업 상 심리평가 보고서를 대략 몇백장 정도는 읽어보았고 어떤 요소가 일반적으로 유의미한 내용인지 대략적인 감은 있다고 생각해서 시도해보았습니다.
마찬가지로 혹시나 공개된 타인의 개인화코드를 통해 그 사람을 파해쳐보려고 시도하는 것은 굉장히 해롭습니다. 기본적으로 예의가 아닐 뿐더러 큰 의미를 찾기 어려울 겁니다.
내 개인화코드를 넣고 이미지를 생성한 다음 분석시키기
저는 딱 두사람의 개인화코드를 통한 해석을 시도해보았습니다.