GLP-1으로 연습 해보는 AI를 이용한 신약개발 : 디자인부터 특허까지

소개

제약시장에서 근 몇년 AI만큼 이슈가 된 내용이 있다면, GLP-1이 아닐까 싶습니다. GLP-1은 뇌와 위, 장 등에 작용해서 포만감을 주고, 음식물 소화를 느리게해주고, 인슐린분비를 촉진해주죠. 굉장한 당뇨병치료제, 비만치료제인데. 뇌신경 보호기능까지 보고되고 있는 참 신기한 약입니다.

노보 노디스크는 당뇨병부터 비만약까지, 빅토자-삭센다, 오젬픽-위고비의 출시를 연속적으로 하면서 2023년 100조의 매출을 냈고, 2024년에는 더 증가했을거라고 하더라고요.

지난달에는 한소파마에서 전임상단계의 경구용 GLP-1제품을 머크(Merck)로 업프론트 1500억, 마일스톤페이먼트 최대 2조 조건으로 라이센싱아웃 했던 내용도 꽤 흥미로웠죠.

단백질 디자인이 전문 분야도 아니고, 아이디어만으로 시작할수 없는게 바이오텍이기도 하지만, 강성준 스터디장님과 함께하는 신약개발 스터디를 청강하는 김에 (1) 단백질 구조 예측 연습과 (2) ChatGPT와 Claude를 이용하여 신약으로 개발할만한 구조를 추천을 받아봤습니다.

진행 방법

AlphaFold Server(https://alphafoldserver.com)의 기능을 보기 위해, 들어가 봤습니다.

단백질, DNA등의 정보를 넣고 구조를 예측하는 형태인것 같습니다. 참고로 Ligand에는 ATP, GTP, FAD, NAD 같은 에너지신호 및 사이클에 관련된 nucleotides와 derivatives가 있었습니다.

Google 문서 페이지의 스크린샷

uniprot.org에서 아래의 GLP-1과 GLP1R의 시퀀스를 찾아서 Protein 두개를 선택하고 넣었습니다.

GLP1R MAGAPGPLRLALLLLGMVGRAGPRPQGATVSLWETVQKWREYRRQCQRSLTEDPPPATDLFCNRTFDEYACWPDGEPGSFVNVSCPWYLPWASSVPQGHVYRFCTAEGLWLQKDNSSLPWRDLSECEESKRGERSSPEEQLLFLYIIYTVGYALSFSALVIASAILLGFRHLHCTRNYIHLNLFASFILRALSVFIKDAALKWMYSTAAQQHQWDGLLSYQDSLSCRLVFLLMQYCVAANYYWLLVEGVYLYTLLAFSVLSEQWIFRLYVSIGWGVPLLFVVPWGIVKYLYEDEGCWTRNSNMNYWLIIRLPILFAIGVNFLIFVRVICIVVSKLKANLMCKTDIKCRLAKSTLTLIPLLGTHEVIFAFVMDEHARGTLRFIKLFTELSFTSFQGLMVAILYCFVNNEVQLEFRKSWERWRLEHLHIQRDSSMKPLKCPTSSLSSGATAGSSMYTATCQASCS

GLP-1
HAEGTFTSDVSSYLEGQAAKEFIAWLVKGRG

파란색과 파란색 분자의 이미지

적어도 두개의 단백질이 어디에 있는지는 보여줄것 같았는데, 그런 기능은 못찾겠네요.
두개의 단백질을 넣더라도 하나로 만들어서 예측해줍니다. 아마도 리간드와 리셉터니까 결합구조가 잘 예측이되나봅니다.

일단 어디에 있는지라도 보려고 두개의 모양을 따로 예측해서 비교해봅니다.
따로 그려서 이렇게 저렇게 돌려보니까, 어디 있는지 알겠네요! 아마도 오른쪽에 제가 빨간 대시라인으로 체크해둔곳이 GLP-1인가봅니다. 참 신기한 세상이네요.

이렇게 해석해도 되는지 모르겠지만, 추가적으로 왼쪽 빨간화살표있는 곳을 보면 GLP-1이 붙게되면 GLP1R이 더욱 안정한 구조를 띄는것처럼 보이는 것 같습니다.

gpr과 gpr의 두 가지 다른 이미지

아마 맞겠지만, 각 단백질을 따로 표시해주는 툴을 찾아보았습니다.
구조적으로 어느 부분이 잘 맞는 부분인지 궁금했거든요. 리셉터-리간드의 관계는 자물쇠-키 같아서 서로 인식하는 부분이 있는거라고 배웠으니까요.
https://neurosnap.ai/에서 Boltz-1 (AlphaFold 3)를 이용해서 그린 그림은 아래와 같습니다.

DNA 분자의 3D 모델

그리고 결합에 중요할 것 같이 보이는 부분도 표시해 봅니다.
제눈엔 A2, E3, T5, F6, 16G, K20, A24이 중요해보이네요.

DNA 가닥을 보여주는 컴퓨터 화면의 스크린샷


제가 눈으로 보고 고른 곳과 GPT가 추천해주는 내용도 비슷하네요. 아마 레퍼런스 기반이겠죠?

진짜 세상이 많이 변했네요. 예전에 생화학이나 미생물학하는 친구들보면, 일단 논문 찾아보고 알려진 도메인에서 포인트뮤테이션 쭉 만들어놓고 노가다로 기능확인하던데... 이제 무조건 먼저 구조부터 돌려보고 실험할테니, 시간도 돈도 많이 절약되겠네요. 속도면에서는 경쟁도 심해지겠지만.

한국어 텍스트가 있는 페이지

GLP-1과 GLP1R의 Binding affinity를 계산해보기 위해, HADDOCK과 AMDock을 시도해봤지만, 내가 인터넷에서 주워온 PDB파일은 어디가 불편한건지 돌아가지 않네요. 강성준 박사님 도와주세요!

신약으로서의 GLP-1을 개발하기 위해서는 기존 GLP-1대비 장점이 있어야, 지적재산권보호를 받을수 있죠. 기존 노보노디스크가 성공한 이유는 Arg34를 Lysine으로 치환해, DPP-4 분해를 막고, Fatty acid를 결합하여 안정성을 올린데에 있는것처럼요.

저는 안정적이고 지속적으로 체내에 약물을 공급할수 있는 DDS를 사용한다는 전제하에, GLP1R과 결합이 강화된 펩티드를 개발한다는 걸 목표로 해봤습니다.

ChatGPT와 Claude에게 요청했습니다. "Binding affinity를 올릴수 있는 mutation 좀 주세요"

근거와 함께 제시해 주네요. 뭔가 진짜 될것같습니다.

다양한 옵션이 있는 페이지의 스크린샷

저는 ChatGPT보다 Claude의 답변이 더 맘에 들었습니다.
왜냐면 시너지 효과도 고민해줬고, 저는 까먹고 있던 면역원성 이슈도 알려줬거든요.

언제나 그렇듯, 일을 잘하는 친구들은 일을 더하게 됩니다.

한국사이트 스크린샷

아주 맘에 드는 3가지의 조합을 받았습니다.
(1) HAEGTFTSDVSSYLEGQAAKEWIAWHVKGRG
(2) HAEGTFTGDVSSYLEGQAAKKFIAWLVKGRG
(3) HAEGTFTGDVSSYLEGQAAKKWIAWHVKGRG

워낙 짧은 단백질이라서, 형성에 별 문제 없겠지만 알파폴드 서버를 통해서 구조를 다시 예측해보았습니다.

다양한 그래프를 보여주는 일련의 스크린샷


이 조합들의 특허성도 확인해 보았습니다.
뭔가 항상 ChatGPT는 판단을 해주고 싶어하지 않는 자세네요. 말 안듣는 대학원생 같아요.
반면 클로드는 깔끔하게 가려운데를 긁어주는 맛이 있습니다.

종이 한 장과 종이 한 장

결과와 배운 점

이 내용을 계속 개발하고 잘 만들어서 잘 팔아먹으려면,

(1) 특허 및 논문을 추가적으로 확인해서 신규성이 확보가 되는지 확인을하고,

(2) 실제로 affinity가 증가했는지, cell / animal 실험에서 효력 및 시그널 등으로 진보성이 확보가 되는지 확인을 하는 절차가 더 필요하겠지요.

하지만 비교적 후보군이 빠르고 간단하게 나온다는 점이 참 신기하네요. 클로드의 시너지스틱 구조 디자인이라던지, 제가 놓쳤던 면역원성에 대한 이슈라던지, 청구항 디자인 하는것도 아주 맘에들었어요.

자꾸 에러가 나서 가능할지는 모르겠지만, 이번 14기동안 단백질-단백질 Affinity 계산하는건 한번 해보고 싶네요.

도움 주신 분들

14기 신약개발 스터디장님

그리고 스터디 끝나고 위 사례 해보는 동안 라디오처럼 후토크해주셨던 스터디원분들

감사합니다.

4
2개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요