2024 FDA 신약 승인현황을 GPT로 보기 편하게

소개

본 자료는 국가신약개발사업단에서 오늘 발간한 2024 FDA 신약 승인현황 자료입니다. 어떤 카테고리의 약물이 어떤 표적을 가지는지 시각화하기 위해 GPT를 사용해볼 예정입니다.

https://kddf.org//ko/board/research/view/?bc_no=2474&page=1

진행 방법

‎​GPT-4o를 이용했습니다. 우선 PDF 원문을 업로드하도 그에 맞게 질문을 던졌습니다.

항목 목록이 포함된 웹사이트의 스크린샷

표는 정확하게 읽고 표시해줬습니다. 여기서 약물의 분자타입과 치료타입을 그래프로 나타내고 싶어 추가 가공을 합니다. 글자로 된 변수는 좌표로 나타내기 어렵기 때문에 숫자로 바꿔주는 요청을 했더니 비교적 잘 변환시켰습니다.

이제 seaborn 모듈의 jointplot처럼 그려달라고 요청했습니다.

구글애널리틱스 대시보드 스크린샷

차트까지 잘 그려주네요. 하지만 각 점에 해당하는게 어떤 약물인지 몰라 라벨링을 부탁합니다. 그리고 약간의 디자인 변경을 요청합니다.

모두 보여드리지 않았지만 몇 번의 시도가 있었고 원하는 결과를 얻지는 못했습니다. 클로드로도 시도했는데 무료 플랜이라 질문 제한에 걸리더군요.

파이썬 코드를 어느 정도 알고 있었기 때문에 조금 더 수정을 요청합니다.

파란색과 흰색 배경의 웹페이지 스크린샷
지도와 지도가 표시된 웹페이지 스크린샷

코드에 맞는 수정이 다소 이뤄졌지만 아직 만족스럽지 않습니다. 더 이상의 수정은 의미가 없을 것이라고 생각해서 두 변수를 각각 차트로 그리는 것으로 바꿨습니다.

설문조사 결과를 보여주는 그래프 스크린샷

단일 막대차트는 잘 그려주네요.

이렇게 FDA에서 승인 받은 약들의 타입을 그래프로 시각화 해보았습니다.

결과와 배운 점

  1. 차트를 수정하는데 프롬프트로만 해결하기보다 차트를 그리는 파이썬 코드를 다른 창에서 물어보면서 원하는 코드를 프롬프트로 요청하는게 더 잘 반영되는걸 배웠습니다.

  2. 표는 잘 읽네요. 그런데 문자변수를 숫자변수로 바꾸는 단계가 없었다면 더 많은 시간이 걸렸겠습니다. 이 글에서는 그 시행착오가 빠져있습니다.

  3. 클로드 아티팩트를 좀 더 잘 사용할 수 있었으면 결과를 비교해도 좋았을 것 같습니다.

3
1개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요