강성준
강성준
🌻 10기 서포터
🪙 지피터스금손
🌻 11기 서포터

HuggingFace로 단백질 3D구조 생성하기

#10기 #HuggingFace #HuggingFace10기

안녕하세요. 허깅페이스 10기 서포터 강성준입니다.

오늘은 본업으로 살짝 복귀하여, 허깅페이스를 이용하여 신약개발을 위한 단백질 3D구조 만들기 실습을 진행해 보았습니다.

허깅페이스에 단백질 3D구조를 생성하는 모델들이 몇개가 있고 그 중에서 잘 작동하는 최신 모델 하나를 가져와 보았습니다.

ProteinMPNN + ESM - a Hugging Face Space by simonduerr

Simonduerr라는 분께서 올려주신 ProteinMPNN + ESMFold라는 모델로, 오늘은 ESMFold의 사용 사례를 보여드릴까 합니다!

이번에도 역시 우리의 희망 Space에 Gradio를 이용해 편리하게 만들어진 모델을 사용해보도록 하겠습니다!

저기에서 File 올리는 곳에 PDB(Protein Data Bank) file 를 넣고 돌리면 3D 단백질 모델이 나옵니다!

PDB file은 NCBI등의 단백질 정보사이트에서 받으실수 있습니다!

예시 : 6MRR: De novo designed protein Foldit1 (nih.gov)

요렇게 미국 NIH 정부 사이트에서 PDB file(단백질 서열정보가 들어 있습니다.)

이걸 받아서 허깅페이스 스페이스에 집어 넣으면, 아래와 같이 3D 단백질 서열이 나오게 됩니다.

3D구조의 색깔은 그 단백질 구조의 실제 신뢰도(실존 가능성)으로 보실수 있을듯합니다! 둘 중에는 위의 단백질 3D구조가 더 Confident하군요!

Heat block으로 아미노산의 배열 가능성과 확률도 제안해줍니다!

오늘은 여기까지입니다! 어려운 단백질 내용이라 재미가 모두 멸종되어버렸습니다.

아직 공부가 많이 부족한데, 다음 시간에는 이 모델의 원리와 활용법을 좀 더 자세히 공부해보려고 합니다!

감사합니다!

7

(채용) 크리에이터, 마케터, AI 엔지니어

지피터스: 콘텐츠를 AI로 재가공 해 원소스 멀티유즈하는 스타트업

👉 이 게시글도 읽어보세요