신약 개발 단계와 단계 별 AI tool 리스트

단백질 구조 기반의 신약 개발은 크게 네 가지 주요 단계로 나뉩니다.

최근 인공지능(AI)의 도입으로 데이터 분석과 예측의 정확도가 높아져 연구의 속도와 효율성이 향상되었습니다. 각 신약 개발 단계에서 활용 가능한 AI 도구와 그 도구들이 연구에 기여하는 방식, 그리고 고려해야 할 한계점을 정리해보았습니다.

알약이 들어 있는 깔때기 다이어그램

(이미지 출처: Biodide 블로그)


  • 1단계: 표적 탐색 (Target Identification)

    • 질병 발병 기전을 이해하고 치료 타겟이 될 수 있는 특정 단백질이나 유전자를 식별하는 단계입니다.

    • 활용 가능한 AI 도구:

      • AlphaFold (Transformer-based prediction model)
        높은 단백질 구조 정확도로 표적 탐색에 적합하며, 많은 수의 단백질 구조를 정확하게 예측해 연구 효율성을 높임.
        한계점: 동적 구조나 복잡한 단백질-리간드 상호작용 예측에 제한적.

      • DeepChem (Graph neural networks, reinforcement learning)
        다양한 화합물과 표적 단백질 간 상호작용을 예측하여 약물 개발 초기 단계에 유용.
        한계점: 충분한 학습 데이터를 필요로 하며, 예측 모델의 일반화가 어려움.

  • 2단계: 리드 화합물 발견 (Hit Discovery & Lead Identification)

    • 식별된 표적 단백질과 결합할 수 있는 화합물(리드 화합물)을 탐색하여 초기 신약 후보를 선정하는 단계입니다.

    • 주요 업무 범주: 고속 스크리닝, 가상 도킹 시뮬레이션, 예비 특성 분석

    • 활용 가능한 AI 도구:

      • RoseTTAFold (Deep learning structure prediction model)
        단백질-단백질 상호작용 및 복합체 구조 예측에 효율적이며 복합체 설계에도 유용.
        한계점: 고정된 단백질 구조로 인해 구조적 유연성을 고려하기 어려움.

      • Schrödinger's Maestro (Physics-based model and machine learning)
        화합물의 구조와 결합 친화도를 효율적으로 분석하여 빠르게 스크리닝 가능.
        한계점: 가상 스크리닝의 정확도는 도킹 알고리즘에 제한적이며, 실제 실험 데이터와의 차이가 존재할 수 있음.

  • 3단계: 리드 최적화 (Lead Optimization)

    • 리드 화합물의 구조를 개선하여 약물의 효능, 안전성 및 생체 이용률을 최적화하는 단계입니다.

    • 주요 업무 범주: 화학적 구조 수정, 결합 친화도 개선, 독성 및 ADMET 평가

    • 활용 가능한 AI 도구:

      • Rosetta (Monte Carlo-based molecular simulation)
        분자 모델링과 구조 예측을 통해 최적화된 화합물을 설계하여 약물 효능 향상에 기여.
        한계점: 계산량이 매우 크고, 복잡한 구조에서는 시간이 오래 걸림.

      • Schrödinger's Maestro (Machine learning-based ADMET and toxicity prediction)
        독성 및 ADMET 예측을 통해 초기 단계에서 후보 물질의 안전성을 검토 가능.
        한계점: 실제 임상에서의 ADMET 데이터와 모델 간 불일치 가능성, 높은 비용 문제.

  • 4단계 : 임상 전 시험 및 후보 물질 검증 (Preclinical Testing & Candidate Validation)

    • 최적화된 후보 물질을 실험적으로 검증하여 임상 시험에 적합한지 평가하는 단계입니다. AI Endotyping을 통해 Personalized Medicine을 개발하는 데도 도움을 줄 수 있습니다.

    • 주요 업무 범주: 독성 및 안전성 시험, 약리학적 특성 평가, 환자 맞춤형 예측

    • 활용 가능한 AI 도구:

      • CryoSPARC (Image processing and structure prediction)
        Cryo-EM 데이터를 통해 전임상에서 구조 변화를 정밀하게 관찰해 임상 전 검증에 유리.
        한계점: 고비용 및 복잡한 장비 필요, 샘플 준비 및 분석에 시간 소요.

      • DeepChem (Machine learning-based toxicity prediction)
        독성 및 ADMET 예측 모델을 통해 전임상 단계에서 효율성을 높임.
        한계점: 예측 모델이 신뢰성 있는 독성 예측을 위해 충분히 검증되지 않은 경우가 있음.


**추후 수정 보완 될 수 있는 내용입니다. (2024-11-12)

앞으로 실제로 위 툴들을 경험하며 같은 각각의 단계에서 어떻게 활용될 수 있는지 파악해 나갈예정 입니다.

셀프스터디 방법 with ChatGPT 4o

구체적인 단계 구분하기 - 바운더리 설정

먼저 관련 서적에서 언급된 대로 약물 개발 과정의 주요 단계를 구분했습니다. 각 단계에서 요구되는 주요 업무와 AI 도구의 적용 가능성을 질문했습니다.

  • 표적 탐색 (Target Identification): 질병의 발병 기전을 이해하고 치료 타겟 단백질이나 유전자를 식별하는 단계.

  • 리드 화합물 발견 (Hit Discovery & Lead Identification): 타겟 단백질과 결합할 수 있는 화합물 후보를 탐색하는 단계.

  • 리드 최적화 (Lead Optimization): 리드 화합물의 구조를 개선하여 약물의 효능, 안전성, 그리고 생체 이용률을 높이는 단계.

  • 임상 전 시험 및 후보 물질 검증 (Preclinical Testing & Candidate Validation): 최적화된 후보 물질의 안전성과 독성을 실험적으로 검증하는 단계.

각각의 단계에서 활용 가능 한 AI툴을 요청했습니다.

표에 있는 한국어 단어 목록

마크다운 표를 옵시디언에 붙이면 더 깔끔하게 볼 수 있었는데, 게시판에 이렇게 작성할 수 없는 것 같아서 바닥 글 형식으로 요청했습니다.

각각의 툴이 어떤 AI 모델로 구동하는지 파악하는 것이 중요하다고 생각하여 추가로 내용을 작성해 달라고 했습니다. 이보다 더 많은 tool들이 많을 것 같아 내용은 업데이트 할 예정입니다.

4
2개의 답글

👉 이 게시글도 읽어보세요