생화학분자생물학회입니다.
AI 기반 세노세라퓨틱스
작성자
김성영 (건국대학교 의과대학/의학전문대학원)작성일자
2024-03-15조회수
2846AI 기반 세노세라퓨틱스
김성영
건국대학교 의과대학/의학전문대학원
palelamp@kku.ac.kr
서론
인구 고령화는 현대 사회의 가장 심각한 문제 중 하나로 심혈관 질환, 암, 알츠하이머병 등 노화 관련 질병은 개인의 삶의 질을 저하시키고 사회 경제적 부담을 가중시키는 주요 원인이 되고 있다. 최근 노화 관련 많은 연구결과가 축적되면서 정립된 컨셉 중에 하나가 '제로 사이언스'(Geroscience) 컨셉으로, 노화를 단순한 자연적인 과정이 아닌 치료가 가능한 질병으로 간주하고, 노화 과정을 직접적으로 타게팅하여 생물학적 노화를 늦추거나 예방하는 치료법 개발을 목표로 한다. 노화세포는 노화 과정에서 개체의 조직과 기관에 축적되며, 이는 조직과 기관의 기능 및 구조 변화를 유도할 뿐만 아니라, 암, 당뇨, 심혈관 질환, 노화 황반변성, 퇴행성 뇌신경 질환과 같은 다양한 노화 관련 질환의 주요 병인으로 작용을 한다. 따라서 노화를 지연시키거나 극복하는 것이 노화 관련 질환의 예방과 치료에 가장 효과적이고 근본적인 방법으로 제안되고 있다. 실제로 2011년 메이오 클리닉 연구팀이 노화 세포를 제거함으로써 쥐의 수명을 건강하게 연장시킬 수 있다는 연구 결과를 발표한 이후로 수많은 세노세라퓨틱스(senotherapeutics) 후보 물질들이 발굴되고 노화 제어 약물로서의 가능성이 제시되고 있다. 세노세라퓨틱스는 크게 세포사멸을 유도, 노화세포만 선택적으로 제거하는 세노리틱스(senolytics)와 노화 세포의 특성을 조절하여 기능이나 형태를 젊은 세포처럼 복원하는 세노모르픽스(senomorphics)로 구분지을 수 있다. 대표적인 세노리틱스 약물로는 플라보노이드 계열의 퀘르세틴(quercetin), 피세틴(fisetin) 그리고 2세대 티로신 키나제 억제제(TKI)인 다사티닙(dasatinib)이 잘 알려져 있다. 그 외에도 BCL-XL 및 Bcl-2 kinase 억제제, p53, HSP90 저해제 등이 최근 세노리틱 효과가 있는 것으로 보고되었고 세노모르픽스로는 mTOR 저해제, JAK 저해제 등이 보고되었다 1,2. 하지만 많은 세노세라퓨틱스 후보 물질이 세포 및 동물실험에서 그 효능이 보고되었으나, 이러한 약물들의 전임상 성적과 재현율은 기대에 크게 미치지 못하는 것으로 나타났다 3,4. 노화 관련 질환은 단일 원인으로 설명하기 어려운 다인자 복합 질환이라는 점을 고려했을 때, 세노세라퓨틱스 약물을 스크리닝하고 선별하는 것은 쉽지 않으며, 더 많은 근거가 필요하다는 것을 알 수 있다.
데이터 기반 신약 개발
최근 유전체 빅데이터의 급증, 빠르게 증가하는 연산 속도, 기계학습 알고리즘의 고도화 등의 영향으로 신약 개발의 패러다임이 데이터 기반(data-driven) 방식으로 빠르게 변화하고 있고, AI는 신약 개발의 전 주기에 활용되고 있다. 신약 개발을 위한 스크리닝의 주요방법은크게 타깃 기반 약물 발견(Target-based Drug Discovery, TDD)과 표현형 약물 발견(Phenotypic Drug Discovery, PDD)으로 나눌 수 있다 5. TDD는 질환과 관련된 분자 기전을 규명한 후 설정한 타겟에 대해 후보 물질이 원하는 phenotype이 나오는지 확인하는 방법인데 비해, 표현형 약물 PDD는 생물학적 시스템을 직접 사용하여 새로운 약물 스크리닝을 수행하는 방법이다. TDD에서는 주로 분자 표현자(molecular descriptor)를 이용한 Quantitative structure–activity relationship(QSAR) 기반 가상 스크리닝, ADME 예측, 구조 예측 등의 모델링에 AI가 활용되는 데 비해 PDD는 타깃에 의존하지 않고 질환 표현형 또는 신호 전달 경로를 직접적으로 정량화하는 데 AI가 주로 응용된다. 노화관련 질환이 대부분 다인자 복합 질환이라는 점을 고려했을 때 PDD는 꽤 매력적인 접근 방식이며, TDD와 비교해 보다 합리적인 방법론을 제공할 수 있다는 기대를 받고 있다. 또한 기존 약물의 새로운 MOA(Mode of Action)와 적응증(indications)을 찾아내는 데도 많은 장점을 가지고 있다. 실제 PDD는 저비용과 빠른 속도 개발, 그리고 안전성 어느 정도 보장돼 성공률이 상대적으로 높은 약물 재창출(drug repositioning)에도 광범위하게 활용되고 있다.
전사체 프로파일에 기반한 약물 재창출
최근 오믹스 기반 PDD 접근법으로 Connectivity Map(CMap)과 CMap의 확대 버전인 LINCS 프로그램이 광범위하게 활용되고 있다 6. CMap은 약물 유래 전사체 프로파일 데이터베이스를 활용하는 방법으로 다양한 세포주에 대량의 약물을 처리한 후 전사체 분석을 수행한 대규모 화학유전체 데이터베이스로, 약물 처리에 따른 유전자 발현 변화를 분석함으로써 새로운 작용점 또는 적응증을 찾는 약물 재창출 방법론을 제공한다. 특정 질병이 있는 상태에서 어떤 유전자의 발현이 한 방향으로 변화를 일으켰다면, 이러한 유전자 발현을 반대 방향으로 변화시킬 수 있는 약물 이 해당 질병의 치료 효과를 제공할 수 있다는 가설에 기반한 방법론으로, 해당 질병의 유전자 발현 패턴과 기존에 알려진 compound의 유전자 발현 패턴을 비교해 유사성(connectivity) 분석을 수행한다. 이러한 방식으로 다양한 질환 모델에서 많은 신약 후보가 발굴되었으나, CMap/LINCS도 재현 가능성 문제가 심각한 것으로 최근 밝혀졌다. 연구 결과의 재현성 부족은 신약 개발의 비효율성을 야기하는 주요 원인 중 하나로, 이러한 문제를 해결하기 위해서는 더욱 강건(robust)하고 안정적인 알고리즘 개발이 시급하다고 할 수 있다.
메타-기계학습을 이용한 약물 재창출
우리 연구실에서는 어떻게 많은 근거를 가지고 보다 신뢰할 만한 세노세라퓨틱스 신약 후보를 발굴할 수 있을지에 중점을 두고 연구를 진행해왔다. 질환과 약물의 유전자 발현 변화에 기반한 알고리즘의 핵심은 질환의 유전자 발현 시그니처(signature)가 얼마나 관련 질환의 표현형을 잘 반영(representation)할 수 있느냐가 가장 중요한 인자이자 성공적인 신약 발굴의 기본 전제가 될 것이다. 이에 보다 일관적(consistent)이고 정확한 시그니처를 뽑아내기 위해 유전자 발현 빅데이터를 이용한 비슷한 주제에 모든 개별 연구들을 스크리닝 해 공통의 효과크기(pooled effect)를 합성하는 메타분석과 정확한 특징 선별(feature selection)을 위한 기계학습을 결합한 분석 파이프라인을 설계하고, 이를 응용한 새로운 PDD 기반의 약물 개발 파이프라인을 개발하였다. 새로운 파이프라인은 기존의 cMap 기반 알고리즘의 한계를 많은 부분 어드레스 할 것으로 기대된다. 먼저, 재현성 부족과 관련해서는 메타분석 기반의 시그니처 합성을 통해 보다 일관성을 지닌 모델링이 가능하고, 둘째, 모델의 해석력을 향상시키기 위해 생물 경로 기반의 기계학습 알고리즘을 적용하고 원치 않는 방향으로 인리치 되는 생물 경로인 오프 타깃(off target) 생물 경로에 페널티를 부여하는 알고리즘을 도입했으며, 셋째, 기존 알고리즘과는 달리 약물을 선별하는 과정에서 연구자의 도메인 지식을 반영할 수 있는 툴을 임베드하여 보다 정확한 약물을 선별할 수 있도록 하였다.
메타-기계학습 기반의 알고리즘 프로세싱 결과-생물경로(상)와 유전자(하)
결론
대부분의 노화 관련 질환은 단일 인자로 설명하기 힘든 다인자 복합질환이라는 점에서 유전자 발현 프로파일에 기반한 접근 방식은 혁신 세노세라퓨틱스를 발굴하는 데 보다 매력적인 솔루션을 제공할 수 있다. 실제로 이 방식은 다양한 질병 모델에서 많은 후보 물질을 발굴하는 데 성공했지만 동시에 심각한 재현성 문제를 가지고 있다. 선행연구를 통해 메타-기계학습을 이용한 알고리즘을 통해 보다 일관성을 지닌 약물 선별이 가능함을 확인하였고, 이를 통한 세노리틱스의 선별은 보다 높은 근거를 제공하면서 신약개발의 전주에 발생하는 다양한 불확실성을 최소화 할 수 있을 것으로 기대된다.
참고문헌
1. Chaib S, Tchkonia T and Kirkland JL (2022) Cellular senescence and senolytics, the path to the clinic. Nat Med 28, 1556–1568.
6. Subramanian A, Narayan R and Corsello SM et al (2017) A next generation connectivity map, L1000 platform and the first 1,000,000 profiles. Cell 171, 1437-1452.e17.