• 인간 게놈 프로젝트 22년 만의 쾌거⋯기존 누락 데이터 92% 해결
  • 쓸모없는 '정크 DNA'는 없었다⋯'점핑 유전자'의 작동 방식도 규명
  • 암·당뇨병·희귀질환 관련 핵심 유전자 영역 완벽 해독
  • 인종·개인별 맞춤 '정밀 의료' 시대 성큼⋯유전 다양성 중요성 부각
dna 픽사베이.jpg
국제 공동 연구팀은 지난 23일 과학 저널 '네이처(Nature)'에 두 편의 논문을 게재해 인간 게놈 프로젝트가 완성된 지 22년 만에 인류 역사상 가장 방대하고 정밀한 인간 유전 변이 목록을 공개했다. 사진=픽사베이

 

인간 게놈 프로젝트가 완성된 지 22년 만에 인류 역사상 가장 방대하고 정밀한 인간 유전 변이 목록이 나왔다. 

 

전 세계 1,084명의 유전체를 긴 DNA 조각으로 정밀하게 연결하고 비교한 이번 연구는 그간 베일에 싸여 있던 '구조 변이'의 실체를 대거 밝혔다. 구조 변이란 DNA 설계도에서 글자 하나가 바뀌는 작은 오류가 아니라, 문단 전체가 통째로 빠지거나 다른 곳에 복사되는 것처럼 유전 정보의 큰 덩어리가 변하는 현상이다. 또한 쓸모없다고 여겨졌던 '정크 DNA'와 스스로 복제해 이동하는 '점핑 유전자'의 새로운 기능을 확인했다.


과학계는 이번 성과가 난치성 질환 진단의 새로운 문을 열고 정밀 의료의 미래를 앞당길 획기적인 전환점이 되리라 기대를 모으고 있다. 코네티컷 대학교의 바버라 멜로니 분자세포생물학 교수는 "기념비적인 논문"이라며 "오랫동안 접근이 어려웠던 진단 사례들을 해결할 문을 열었다"고 평가했다.


국제 공동 연구팀은 지난 23일 과학 저널 '네이처(Nature)'에 두 편의 논문을 내고 이 같은 연구 결과를 발표했다. 연구팀은 최신 장문 염기서열 분석 기술을 써서 5개 대륙 26개 인구 집단을 대표하는 1,019명과, 이와는 별개로 5개 대륙 28개 인구 집단에서 확보한 65명의 게놈을 고해상도로 분석했다.


이는 2003년 인간 게놈 프로젝트 초안 발표, 2022년 최초의 '틈 없는(gapless)' 인간 게놈 완성, 2023년 '판게놈(pangenome)' 발표에 이은 또 하나의 중요한 이정표다. 판게놈은 한 사람의 유전 정보가 아닌, 여러 인종과 집단의 유전 정보를 합쳐 인류 전체의 다양성을 보여주는 일종의 '종합 게놈 지도'다. 이번 연구는 여기서 한발 더 나아가 인간 게놈 데이터에서 기존에 빠져 있던 92%를 채우며 유전체 지도의 완성도를 크게 높였다.

 

네이처에 이번 주 게재된 두 편의 논문은 유럽계 중심의 기존 유전체 분석을 넘어, 보다 다양한 인류 집단의 유전적 다양성을 조명하는 중요한 진전을 이뤘다.


첫 번째 논문에서 국제 공동연구팀은 다섯 대륙 26개 인구 집단을 대표하는 1,019명의 유전체를 분석했다. 연구진은 각 염기서열이 수만 개의 염기쌍으로 이루어진 '롱 리드(long read)' 데이터를 활용해 정밀도를 높였다. DNA는 이중나선 구조로, 염기쌍 하나는 그 사다리의 가로막대 하나에 해당한다.


"기존의 100개 염기쌍 안팎의 짧은 읽기로는 서로 유사하게 생긴 유전체 영역들을 정확히 구분하기 어렵다"고 이번 연구에 참여한 바르셀로나 유전체조절연구소(CGR)의 박사과정 연구원 헤수스 에밀리아노 소텔로-폰세카는 설명했다. "반복서열이 많은 유전체에서는 이런 문제가 특히 심각하지만, 2만 염기쌍 수준의 장기 읽기를 사용하면 각 염기서열을 유전체 상의 고유한 위치에 정확히 할당할 수 있다"고 그는 전했다.

 

 

65명의 다양한 인간을 대상으로 한 롱리드시퀀싱(LRS), 유전체 조립 및 유전 변이 분석.png
65명의 다양한 인간을 대상으로 한 롱리드시퀀싱(LRS), 유전체 조립 및 유전 변이 분석. a, 본 연구에서 분석된 65명의 다양한 인간 집단 중 대륙 그룹(내부 고리)과 인구 그룹(외부 고리). AFR, 아프리카; AMR, 아메리카; EAS, 동아시아; EUR, 유럽; SAS, 남아시아. 인구 집단은 1000 Genomes Project11에 따라 분류되었으며, 케냐 키냐와 지역의 마사이(MKK)와 아슈케나지(ASK) 라벨이 추가됐다. b, 각 게놈 조립체에서 하플로타입 1(haplotype 1, H1) 및 haplotype 2(H2) 컨티그의 스캐폴드 auN. 데이터 포인트는 인구 집단별로 색상이 구분된다. 점선은 각 하플로타입의 auN 중간값을 표시한다. 점선은 단위 대각선을 표시한다. c, 각 게놈 조립체에서 변이 호출 또는 k-mer 통계(방법)를 기반으로 한 품질 값(QV) 추정치. d, 각 게놈 조립체에서 T2T를 통해 조립된 염색체 수(단일 contig 및 scaffold 포함)(방법). 중앙값(실선)과 첫 번째 및 세 번째 사분위수(점선)가 표시된다. e, 단일 컨티그(어두운 파란색, T2T 컨티그) 또는 단일 스캐폴드(밝은 파란색, T2T 스캐폴드)에 포함된 T2T 염색체 수. 불완전한 염색체는 'T2T 아님'또는 완전히 누락된 경우 '누락'으로 표시된다. 해당 단일 염색체 조립에 존재하지 않는 성 염색체는 'NA'로 표시된다. f, 본 연구에서 T2T-CHM13 참조 게놈을 기준으로 다양한 염색체형에서 검출된 중복되지 않은 SV의 누적 수 (세 개의 트리오 자녀 제외). g, 각 염색체형에서 T2T-CHM13 참조 게놈을 기준으로 검출된 SV의 수, 인구별로 색상 구분. 삽입과 삭제는 T2T-CHM13 참조 게놈에 비해 균형이 맞지만, GRCh38 참조 게놈에 비해 균형이 맞지 않는다(확장 데이터 그림 1d). 사진 출처=Nature

 

이번 연구에서 밝혀진 새로운 유전체 변이의 절반 이상은 이러한 반복 영역에서 발견됐다. 특히 그중 많은 수가 '점핑 유전자(jumping genes)'로 알려진 전이인자(transposon)에서 유래한 것으로 분석됐다. 전이인자는 유전체 내 여러 위치로 '이동'하면서 자신의 염기서열을 복사·붙여넣는 기능을 갖고 있다. 이들이 어디에 착지하느냐에 따라 유전체를 불안정하게 만들거나, 유해한 돌연변이를 유발해 암 등 질환을 일으킬 수 있다.


공동저자인 CGR의 독립 연구원 베르나르도 로드리게스-마르틴은 라이브 사이언스와 이메일 인터뷰에서 "이번 연구는 일부 전이인자가 조절 서열을 '탈취'해 자신들의 활성을 증폭시킬 수 있음을 보여준다"고 밝히며, "이는 이들의 돌연변이 유발 메커니즘을 이해하는 데 중요한 단서를 제공한다"고 설명했다.


특히 이번 연구에서는 일부 점핑 유전자가 특정 조절 분자인 '비암호화 장기 RNA(long noncoding RNA)'와 결합함으로써, 보통보다 훨씬 많은 복제본을 만들어내는 메커니즘도 포착됐다. 유럽분자생물학연구소(EMBL) 코르벨 연구실 출신의 로드리게스-마르틴 박사는 "이처럼 점핑 유전자가 조절 분자와 ‘동승’하는 방식은 매우 이례적인 생물학적 전략"이라며 "우리에게도 놀라운 발견이었다"고 밝혔다.

 

정밀도 높인 '원투 펀치' 분석 기술


이번 연구의 핵심 성과는 유전 정보의 큰 덩어리가 변하는 '구조 변이'에 대한 이해를 크게 넓힌 데 있다. 특히 과거 '정크 DNA'로 불리며 별다른 기능이 없다고 알려졌던 반복 서열에서 유전체 변이의 절반 이상이 발견돼, 그 생물학적 중요성을 새롭게 조명했다.


이러한 성과는 옥스퍼드 나노포어(Oxford Nanopore)와 퍼시픽 바이오사이언스(Pacific Biosciences)의 기술을 조합한 덕분이다. 옥스퍼드 나노포어의 기술은 DNA의 매우 긴 조각을 한 번에 읽어 전체적인 뼈대를 잡는 데 쓰였고, 퍼시픽 바이오사이언스의 기술은 각 글자(염기)를 아주 정확하게 읽어내 정밀도를 높이는 데 활용됐다. 

 

코네티컷 대학교 보건센터의 크리스틴 벡 수석 저자 겸 유전학자는 이 '원투 펀치' 전략 덕분에 과거의 기술 장벽을 넘어 빠져 있던 게놈 영역을 밝힐 수 있었다고 설명했다. 연구팀은 각 개인의 염기서열을 부모에게서 함께 물려받는 유전자 묶음인 '하플로타입(haplotypes, 일배체형)'으로 나눈 뒤, 이를 기준 게놈과 비교해 질병을 유발할 수 있는 구조 변이를 찾아냈다.


암·당뇨병 등 질병 핵심 유전자 첫 해독


연구팀은 당뇨병, 척수성 근위축증 같은 질병과 연관된 가장 복잡한 유전 영역 일부를 완벽하게 해독했다. 대표적인 예로 면역 반응의 핵심인 '주조직적합성복합체(MHC)' 영역이 있다. MHC는 우리 몸의 세포가 '나'인지 아니면 외부에서 침입한 '적'인지를 구별하는 신분증 역할을 하는 중요한 부분이다. 이 영역의 유전 정보는 암, 제2형 당뇨병, 바이러스 감수성의 개인차와 관련이 깊다.


또한, 척수성 근위축증 치료제 표적인 SMN1 및 SMN2 유전자의 서열과, 녹말 음식 소화를 돕는 아밀라아제 유전자 묶음도 완전히 해독했다.


세포 분열의 중심 역할을 하는 '동원체(centromere)'의 숨겨진 특징도 드러났다. 동원체는 세포가 분열할 때 염색체가 양쪽으로 정확하게 나뉘도록 밧줄(방추사)을 거는 고리 같은 역할을 한다. 이 고리를 이루는 '알파 위성 배열'이 개인에 따라 그 길이가 최대 30배까지 차이 날 수 있다는 사실을 밝혀냈다. 

 

벡 박사는 이런 동원체 변이가 다운 증후군, 에드워즈 증후군, 파타우 증후군과 같은 삼염색체성 질환, 즉 특정 염색체를 3개 갖는 염색체 이상을 일으킬 수 있다고 설명했다.


'단일 염기' 넘어 '구조 변이'로…정밀 의료의 새 길


이번 연구 결과는 정밀 의료에 중대한 영향을 미친다. 서던캘리포니아 의과대학의 찰스턴 치앙 의학 집단 유전학자는 "이번 연구는 개인의 질병 위험도를 더 명확히 정의하는 데 근본 구실을 한다"고 말했다. 

 

그는 과거 유전병 진단 연구가 대부분 DNA 글자 하나만 바뀌는 작은 변이(단일 염기 다형성, SNP)를 찾는 데 집중해, 이번 연구에서 다룬 '문단' 단위의 큰 변화(구조 변이)를 지나쳐왔다고 지적하며, 이번 연구가 이를 보완할 초석을 마련했다고 평가했다.


"유전 다양성 보고는 아프리카"…편중된 연구에 경종


연구의 또 다른 뜻은 샘플의 다양성에 있다. 이번 연구에서 아프리카계 혈통 샘플에 가장 많은 구조적 다양성이 나타났는데, 이는 인류 유전적 다양성의 가장 깊은 원천이 아프리카에 있다는 기존 이론을 뒷받침한다. 멜로니 교수는 전통적으로 유럽계에 치우쳤던 기준 게놈을 생각할 때 이 발견이 꼭 필요하다고 덧붙였다.


물론 치앙 박사는 표본 크기가 여전히 적다는 점을 지적하며, 전 세계 인구 전체를 대표하려면 더 많은 분석이 필요하다고 말했다. 그럼에도 그는 "우리 분야가 유전 변이 데이터 생성 쪽에서 나아가고 있는 명백한 방향"이라며 "오랫동안 논의해 온 생각들이 하나씩 실현되고 있다"고 기대를 나타냈다.

전체댓글 0

비밀번호 :
메일보내기닫기
기사제목
[퓨처 Eyes(95)] 최고 정밀도 인간 게놈 지도 공개⋯'정크 DNA'·구조 변이 비밀 풀었다
보내는 분 이메일
받는 분 이메일