인간의 DNA를 연구하는 아주 손쉬운 방법 (53 ) 0
아!
Sanger 시퀀싱이라면 인간 유전체를 쉽게 알아낼 수 있을겁니다
Sanger 시퀀싱?
이거 싼거 아녀?
인간의 유전체는 아데닌 (A), 티민 (T), 사이토신 (C), 구아닌 (G) 4가지로 이루어집니다
DNA를 복제하는 DNA 중합효소와 A, T, C, G 그리고 복제할 DNA만 있으면 시험관 안에서도 DNA 합성을 할 수 있죠
그런데 이 Sanger 시퀀싱은 일반적인 A, T, C, G만 쓰는게 아니라
서로 다른 색깔의 형광물질이 달린 특별한 A, T, C, G를 미량 섞어서 DNA합성 반응응을 일으킵니다
이 특별한 형광 A, T, C, G는 다음 A, T, C, G가 붙을 '가지'가 없어서
이 형광 A, T, C, G를 DNA 중합효소가 사용하는 순간 DNA 합성반응이 종결됩니다
이를 사슬 종결 (Chain Termination) 반응이라고 합니다
이 형광 ATCG를 미량 섞고 충분히 DNA 합성반응을 일으킨다면 다양한 길이의 DNA가 만들어질겁니다
만약 DNA의 서열 19번째까지는 일반 ATCG까지 잘 합성되다가 20번째에 형광 ATCG가 우연히 들어가게 되면 20번째 서열에서 DNA 합성 반응이 종결되겠죠
이 방법으로 길이 100짜리 DNA에 대해서 충분히 DNA 합성반응을 충분히 진행시키면
확률론적으로 1~100인 DNA를 모두 획득할 수 있게 됩니다
이 확률은 일반적으로 푸아송 분포를 따른다고 알려져 있습니다
그리고 길이 1~100인 DNA들을 미세한 구멍이 나있는 겔(gel)에 걸어 전압을 걸어줍니다
DNA는 -전하를 띄기 때문에 전압에 따라 겔의 미세한 구멍을 따라 움직이게 되고
크기가 작은 DNA는 구멍을 더 빨리 빠져나가 빠르게 움직이며, 큰 DNA는 늦게 움직이게 됩니다
이런식으로 DNA를 겔에 넣고 전압에 따라 충분한 시간을 움직이게 해주면 DNA가 크기순으로 정렬되게 됩니다
그리고 이 크기순으로 정렬된 DNA로부터 형광신호를 읽어서 A,T,C,G중 어떤게 있는지 확인합니다
예를 들어 A에 빨간색 형광을 달아놨고, 길이 20짜리 DNA에 빨간색 형광 신호가 잡히면
DNA 서열 중 20번째 자리에는 A가 있다는걸 알 수 있겠죠
이게 바로 Sanger 시퀀싱 방법입니다
방법 자체는 훌륭한 것 같은데
시간과 비용이 너무 많이 들고 무엇보다 인간 유전체같은 긴 서열을 읽는건 기술적으로 힘들고 비효율적이야
인간 유전체는 30억염기나 되는데 1부터 30억 염기 크기의 DNA를 합성시키고,
이걸 또 겔에 넣어 정렬시키려면 수천km짜리 겔이 필요할껄??
인간 유전체가 너무 길어서 읽기 힘들면 여러 조각으로 나눠서 읽는겁니다
이런식으로 인간 유전체를 랜덤하게 조각낸 다음에 조각 하나하나 Sanger 시퀀싱을 적용시키는 것이죠
DNA를 짧게 조각내서 읽겠다는 발상 자체는 좋지만 무작위로 조각을 내는게 문제야
무작위로 조각이 나기 때문에 재현성 있는 실험이 힘들어
이 방법을 하려면 한번의 sanger 시퀀싱마다 동일한 서열의 파편으로만 이루어진 순도 높은 샘플이 필요한데
이렇게 랜덤하게 조각이 나서 서로 다른서열의 파편들이 섞여버리면 실험 할때마다 결과가 바뀔꺼라고
동일한 서열의 DNA 파편들이 많이 필요하다면 만들면 되는 것입니다
랜덤하게 조각난 DNA 조각들을 박테리아 인공 염색체 (Bacterial Artificial Chromosome)에 삽입한 후 박테리아에 넣습니다
그럼 박테리아는 이게 자기 유전물질인줄 알고 열심히 복제를 합니다
이렇게 박테리아가 복제한 유전물질을 다시 수거하면 한 DNA 조각과 동일한 무수한 복제를 얻을 수 있죠
이걸 BAC 라이브러리라고 합니다
이렇게 랜덤하게 조각이 난 인간 유전체를 대상으로 BAC 라이브러리를 만든 후 각 조각별로 sanger 시퀀싱을 하는겁니다
BAC라이브러리와 Sanger 시퀀싱을 통해 유전체 파편들의 서열을 알았다고 치자
근데 랜덤하게 조각이 났기 때문에 시퀀싱을 해도 각 조각들의 순서를 모르잖아?
시퀀싱 열심히 해봤자 각 조각들로 전체를 완성할 수 없으면 의미가 없어
Shotgun 시퀀싱은 컴퓨터를 이용하여 조각난 염기서열을 이어붙이는 방법입니다
컴퓨터의 방대한 연산량이 있어야만 가능한 기술이죠
인간 유전체를 랜덤하게 조각내는 것이기 때문에 같은 부위라도 다른 패턴으로 조각이 나는 경우가 있을 것입니다
그렇다면 파편별로 서열이 겹치는 부분이 있을 수도 있지요
이걸 컴퓨터의 막대한 연산력을 이용해서 겹치는 부분을 모조리 찾아내 계속 이어붙여 나가는 것입니다
이 짓을 계속 하다보면 언젠간 전체 서열이 완성되겠죠
물론 이 방법은 확률론에 근거한 방법이기 때문에 겹치는 부분이 잘 안나와서 전체를 완성할 수 없을지도 모릅니다
하지만 확률론적으로 더 많은 파편을 더 많이 시퀀싱 할수록 다양한 패턴이 나올 것이고
그만큼 겹치는 부분에 대한 정보가 많아져서 전체를 완성할 확률도 높아지죠
기술적으로 BAC 라이브러리로 복제할 수 있는 조각의 길이는 20만 염기정도야
인간의 유전체 길이가 30억염기이니 확률적으로 충분히 전체를 커버하기 위해서는 DNA 조각을 2만개는 만들어야한다구
6개국 20개 기관과 협엽하여 13년만에