#10기 #HuggingFace #HuggingFace10기
안녕하세요. 허깅페이스 10기 서포터 강성준입니다.
오늘은 본업으로 살짝 복귀하여, 허깅페이스를 이용하여 신약개발을 위한 단백질 3D구조 만들기 실습을 진행해 보았습니다.
허깅페이스에 단백질 3D구조를 생성하는 모델들이 몇개가 있고 그 중에서 잘 작동하는 최신 모델 하나를 가져와 보았습니다.
ProteinMPNN + ESM - a Hugging Face Space by simonduerr
Simonduerr라는 분께서 올려주신 ProteinMPNN + ESMFold라는 모델로, 오늘은 ESMFold의 사용 사례를 보여드릴까 합니다!
이번에도 역시 우리의 희망 Space에 Gradio를 이용해 편리하게 만들어진 모델을 사용해보도록 하겠습니다!
저기에서 File 올리는 곳에 PDB(Protein Data Bank) file 를 넣고 돌리면 3D 단백질 모델이 나옵니다!
PDB file은 NCBI등의 단백질 정보사이트에서 받으실수 있습니다!
예시 : 6MRR: De novo designed protein Foldit1 (nih.gov)
요렇게 미국 NIH 정부 사이트에서 PDB file(단백질 서열정보가 들어 있습니다.)
이걸 받아서 허깅페이스 스페이스에 집어 넣으면, 아래와 같이 3D 단백질 서열이 나오게 됩니다.
3D구조의 색깔은 그 단백질 구조의 실제 신뢰도(실존 가능성)으로 보실수 있을듯합니다! 둘 중에는 위의 단백질 3D구조가 더 Confident하군요!
Heat block으로 아미노산의 배열 가능성과 확률도 제안해줍니다!
오늘은 여기까지입니다! 어려운 단백질 내용이라 재미가 모두 멸종되어버렸습니다.
아직 공부가 많이 부족한데, 다음 시간에는 이 모델의 원리와 활용법을 좀 더 자세히 공부해보려고 합니다!
감사합니다!