AI로 살펴보는 생물학과 질병의 연결고리

이미지

AI와 단백질 접힘 연구: 약물 발견의 열쇠

단백질 접힘 연구는 AI 기반 노력, 특히 AlphaFold와 같은 기술의 핵심 동력 중 하나입니다. 이 연구의 목표는 질병 관련 단백질의 접힘과 기능을 이해하고, 이를 표적으로 하는 분자를 설계하는 것입니다. 그러나 인간 질병에 중요한 많은 단백질은 큰 무질서 영역을 포함하고 있어 모델링이 어렵습니다.

  • AlphaFold는 2020년에 CASP(단백질 구조 예측 비공식 대회)에서 전례 없는 성공을 거두며 과학계를 놀라게 했습니다. 이를 통해 AI가 복잡한 생물학적 문제 해결에 어떤 잠재력을 가질 수 있는지 보여주었습니다.
  • 단백질 접힘 이해의 중요성은 많은 질병이 단백질의 잘못된 접힘에 연관되어 있다는 점에서 강조됩니다. 예를 들어, 크로이츠펠트-야코프병(CJD)과 같은 프리온 질환은 잘못 접힌 단백질로 인해 발생합니다.

신경퇴행성 질환과 단백질의 역할

알츠하이머와 파킨슨 병과 같은 신경퇴행성 질환에서는 IDR을 포함한 단백질이 중요한 역할을 합니다. 정상 상태에서 유연하고 비구조적인 이들 단백질은 잘못 접힐 경우 독성 응집체를 형성하여 뇌세포를 파괴합니다. 이러한 변화 과정은 여전히 분자 생물학에서 풀리지 않은 큰 문제로 남아 있으며, AI는 아직 이 과제를 해결하지 못했습니다.

  • 2019년 통계에 따르면, 전 세계적으로 약 5000만 명의 사람들이 치매를 앓고 있으며, 그 중 약 60%에서 70%가 알츠하이머병과 관련이 있습니다. 이는 단백질 접힘 장애와 직결된 사례로 볼 수 있습니다.
  • 파킨슨 병에서는 알파-시뉴클레인이라는 단백질이 핵심 역할을 하는데, 이 단백질이 잘못 접히면 뇌의 특정 부분에서 독성 응집체가 형성되며, 이는 도파민 생성 세포의 손실로 이어집니다.

AI 모델의 한계: 안정된 구조에 의존

연구자들이 버튼을 조정하거나 기능을 추가하지 못한 것이 아니라, 접근 방식 자체가 안정적인 구조에 의존하고 있습니다. 결과적으로, 무질서가 내재되거나 잘못된 접힘으로 도입될 때, AI는 낮은 신뢰도 점수를 제공합니다. 이는 과학자들에게 덜 유용한 결과를 초래합니다.

  • 세계보건기구(WHO)에 따르면, 많은 생물학적 분자는 고정되지 않은 상태로 존재하며, 정적인 상태에서의 구조만을 다룰 경우 예측의 정확도가 떨어질 수 있습니다.
  • AI의 안정적 구조 의존은 무질서 영역(IDRs)과 같은 단백질에 대한 한계를 설정하는데, 이는 전체 인간 프로테옴의 약 40%가 무질서 단백질로 되어 있어 상당한 영향을 미칩니다.

암 연구에서의 유사한 딜레마

암 연구에서도 유사한 문제가 발생합니다. 게놈의 수호자로 불리는 종양 억제 단백질 p53은 잘못 접히는 경우 암을 유발할 수 있습니다. p53의 무질서 영역은 종양 억제 활동을 조절하며, 이들이 제대로 작동하지 않으면 암세포의 무제한 성장을 허용합니다.

  • p53 변이는 전 세계 암 환자의 약 50%에서 발견되며, 이는 암 발병과 직접적으로 관련이 있습니다. 이러한 변이는 유전적 요인 및 환경적 스트레스에 의해 활성화됩니다.
  • 또 다른 연구에 따르면, 새로운 p53 복구 치료법은 암세포의 저항성을 줄이는 데 중요한 역할을 하며, 이는 AI 기반 모형을 통해 더욱 효율적으로 개발될 수 있습니다.

IDR이 AI 예측을 벗어나는 이유

IDR은 AI 기반 단백질 구조 예측에 근본적인 도전을 제기합니다. 이들 영역은 구조적으로 이질적이며, 세포 조건, 분자 상호작용, 생화학적 수정에 따라 다양한 형태를 취합니다. 이는 AI 모델이 “최적 구조”를 예측하도록 설계되었기 때문에 큰 문제를 일으킵니다.

  • 많은 연구자들이 지적하듯이, IDR은 단백질군의 약 30~50%를 차지하며, 이는 다양한 생물학적 역할을 가능하게 합니다. 그러나 이렇게 구조가 다양하기 때문에 AI의 예측이 복잡해질 수밖에 없습니다.
  • 2021년 보고서에 따르면, AI를 통한 IDR 예측의 정확성은 고정된 구조를 가진 단백질에 비해 약 20% 낮은 결과를 보입니다.

IDR의 구조적 불확정성과 AI 모델의 한계

IDR의 구조는 고정된 형태가 없기 때문에 AI 모델의 훈련 데이터에 포함되지 않습니다. 이는 X선 결정학 및 저온 전자 현미경과 같은 기술로부터 얻어진 구조 데이터에 의존하기 때문입니다. 하지만 IDR은 결정화되지 않으며, 다양한 상호작용 조건에서 여러 형태로 존재합니다.

  • Protein Data Bank(PDB)에 따르면 전체 단백질 구조 데이터의 5% 미만이 IDR을 포함하여 불확정적 구조를 가진 부분으로 구성되어 있습니다.
  • 저온 전자 현미경을 통해 얻은 IDR 데이터는 정밀도가 낮고 변천하며, 이는 AI 훈련에 사용될 때 불확실성을 증가시킵니다.

IDR의 생화학적 수정과 예측의 불완전성

IDR은 화학적으로 수정되어 AI 모델이 동적으로 반영하지 못하는 경우가 많습니다. 인산화, 메틸화, 유비퀴틴화와 같은 후번역 수정은 IDR의 형태와 기능을 바꿀 수 있습니다. 그러나 이러한 수정이 AI 훈련 데이터에 체계적으로 포함되지 않기 때문에 예측이 불완전하거나 오도될 수 있습니다.

  • 후번역 수정은 질병의 진행 과정에서 중요한 요인으로 작용할 수 있으며, 이를 간과한 AI 모델은 질병 메커니즘 예측에서 한계를 가질 수 있습니다.
  • 2020년 연구에 따르면, 인간 체내에서 약 200개의 인산화사이트가 IDR에서 발견되었으며, 이는 생물학적 프로세스에서 중요한 역할을 합니다.

약물 발견에서의 IDR 도전

질병과 관련된 많은 단백질, 특히 암에 연관된 p53과 알츠하이머와 관련된 타우는 큰 IDR을 포함합니다. AI 기반 약물 개발은 안정적인 결합 부위를 목표로 하기 때문에 고정된 결합 부위가 없는 IDR을 모델링하는 데 적합하지 않습니다. 이는 치료적 개입을 위한 IDR의 표적화가 훨씬 더 어려워지는 결과를 초래합니다.

  • 알츠하이머에 연관된 타우 단백질은 병리학적 형태로 전환 시 여러 가지 IDR를 포함하여 신경섬유 엉킴을 일으킵니다. 이러한 상태는 신경세포의 손상과 질병 진행의 핵심 원인입니다.
  • 새로운 치료 방법을 개발하는 데 있어, 임상 시험에 기록된 IDR 표적 약물의 성공률은 일반 단백질에 비해 현저히 낮습니다.

TIM-3 문제: 움직이지 않는 단백질

AI가 IDR을 처리하는 데 있어 한계는 단순한 이론이 아니라 실질적인 문제를 초래합니다. TIM-3는 면역 조절의 핵심 플레이어로서 암 면역 요법의 유망한 표적으로 알려져 있습니다. 하지만 TIM-3는 고정된 결합 주머니가 없어 AI 예측에서 실질적인 도전을 제공합니다.

  • 최근 TIM-3의 변형 연구가 진행되고 있으며, 이는 새로운 항암 치료제를 개발하는 데 중요한 방향성을 제공합니다. 연구에 따르면, TIM-3는 다양한 암 유형에서 면역회피 기작의 중요한 요소로 작용합니다.
  • 이러한 연구는 TIM-3 표적 치료를 위한 새로운 AI 기반 분석 도구의 필요성을 다시 한번 부각시킵니다.

출처 : 원문 보러가기