단백질 기능 변화 이끄는 BioEmu-1 모델

이미지

단백질 구조 예측의 새로운 시대

단백질은 근육 형성부터 질병 보호까지 생물학적 과정에 필수적인 역할을 합니다. 최근 몇 년간 딥러닝을 통해 단백질 구조에 대한 이해가 크게 향상되었으며, 이는 아미노산 서열로부터 단백질 구조를 정확히 예측하는 것을 가능하게 합니다. 하지만 단일 구조 예측은 단백질의 복잡한 동적인 성질을 완전히 반영하지 못합니다. BioEmu-1이라는 딥러닝 모델은 단백질이 가질 수 있는 다양한 구조적 집합을 제시하며, 단백질 기능의 이해에 한 걸음 더 다가가게 합니다.

  • 단백질은 약 20개의 서로 다른 아미노산의 배열로 구성되어 있으며, 이러한 배열은 무한한 구조적 다양성을 만들어냅니다. 이는 단백질이 가지는 기능적 다양성을 설명하는 기초가 됩니다.
  • 딥러닝 기반 AlphaFold 모델은 2020년 14차 CASP(Critical Assessment of protein Structure Prediction) 실험에서 탁월한 예측 정확도를 보여준 바 있으며, BioEmu-1 모델도 이와 유사한 딥러닝 기술을 통해 구조 예측의 혁신을 이루고 있습니다.

분자 동역학 시뮬레이션의 한계

전통적으로 분자 동역학(MD) 시뮬레이션은 단백질의 움직임과 변형을 시뮬레이션하는데 사용되었습니다. 하지만 이러한 시뮬레이션은 매우 오랜 시간이 걸리며, 컴퓨팅 자원이 많이 소모됩니다. 이러한 한계를 극복하기 위해 BioEmu-1이 개발되었으며, 이는 단일 GPU로 시간당 수천 개의 단백질 구조를 생성할 수 있습니다.

  • 일반적인 MD 시뮬레이션은 복잡한 물리적 계산 때문에 시뮬레이션 시간에 따라 최대 수백 시간 이상이 소요될 수 있습니다. 이러한 연산 부담은 자원의 효율적인 활용을 방해합니다.
  • BioEmu-1의 효율성은 현대 AI 하드웨어 발전 덕분에 가능해졌으며, 이는 빅데이터 처리 및 모델 훈련에 최적화된 GPU의 발전과 관련이 있습니다.

BioEmu-1의 데이터 학습

BioEmu-1은 AlphaFold 데이터베이스, 광범위한 MD 시뮬레이션 데이터셋, 그리고 단백질 접힘 안정성 데이터셋을 학습하여 발전되었습니다. AlphaFold 데이터베이스는 BioEmu-1이 다양한 구조를 예측할 수 있도록 하며, MD 시뮬레이션 데이터는 물리적으로 타당한 구조적 변화를 예측하게 도와줍니다. 또한, 단백질 접힘 안정성 데이터셋은 접힌 구조와 접히지 않은 구조를 적절한 확률로 샘플링하도록 합니다.

  • AlphaFold에서 사용되는 수백만 개의 단백질 구조 데이터는 BioEmu-1의 학습 정확도를 높이는 중심 자료로, 단백질 구조 예측의 정확성을 강화합니다.
  • MD 시뮬레이션 데이터는 실제 분자 운동을 시간 단위로 캡처하여, 모델이 예측할 수 있는 가능성 있는 경로들을 제시합니다.

새로운 구조 예측 및 실험 결과

BioEmu-1은 이전에 관찰되지 않은 중간 구조들을 예측하며, 단백질 기능에 대한 새로운 가설을 제공합니다. 예를 들어, 콜레라균에서 유래된 LapD 단백질의 다양한 구조를 성공적으로 예측하였습니다. 이러한 예측은 신약 개발과 같은 분야에서 중요한 발전의 기초를 마련합니다.

  • LapD 단백질의 구조적 다양성은 세포 내 환경 변화에 따라 다르게 작용할 수 있는 잠재적 메커니즘을 제시합니다. 이는 조절 단백질의 새로운 기능 발견에 도움이 됩니다.
  • 실제로 신약 개발 과정에서 단백질 구조 예측은 새로운 효소나 단백질 타겟지정을 통한 생체 내 활성 화합물 설계에 중추적인 역할을 합니다.

컴퓨팅 효율성과 안정성 예측

BioEmu-1은 기존의 MD 시뮬레이션보다 훨씬 적은 자원으로 높은 정확도의 결과를 제공합니다. 또한, 단백질의 접힘 자유 에너지를 예측하여 단백질의 안정성을 정확하게 평가할 수 있습니다. 이는 치료제 개발에 중요한 역할을 할 수 있습니다.

  • BioEmu-1의 효율적인 자원 사용은 클라우드 기반 연산 환경에서 더 빠르고 효율적인 작업 처리를 가능하게 합니다. 이는 계산 비용을 크게 감소시킵니다.
  • 단백질 접힘 자유 에너지의 정확한 예측은 안정성, 가능성 있는 변이 예측 그리고 특정 조건에서의 장기 변화를 평가하는 데 필요한 핵심 정보를 제공합니다.

BioEmu-1의 향후 방향

BioEmu-1은 단백질이 취할 수 있는 모든 구조를 생성하는 첫 단계로, 더 많은 연구자들이 이 모델을 활용해 잠재력과 한계를 발견해 주기를 기대하고 있습니다. BioEmu-1이 다양한 단백질에 어떻게 작용하는지에 대한 실험적 결과가 기대됩니다.

  • 향후 연구 방향으로는 이전에 다루지 않았던 복잡한 복합 단백질 구조 예측, 단백질-단백질 상호작용 예측, 그리고 생체막 단백질의 구조 예측 등이 있습니다.
  • BioEmu-1이 의학적 예측 외에도 환경 생물학, 산업 응용 등 다양한 과학 분야에서 활용될 가능성이 높습니다. 지속적인 데이터베이스 갱신과 모델 개선은 연구 결과를 더욱 향상시킬 것입니다.

출처 : 원문 보러가기