유머 게시판

HOT 게시글

유머 게시판입니다.

인간의 DNA를 연구하는 아주 손쉬운 방법 (53 ) 0

추천179 비추천0
jin030
24/07/08 20:12:01 24/07/08 20:12:01 23,656
 (14.♡.194.130)






img/23/05/24/1884d57afea52788d.png


아!

인간 유전체 해독하고싶다!





img/23/05/24/1884d57afea52788d.png


근데 어떻게 하지?



img/23/05/24/1884d3635cb52788d.png


img/23/05/24/1884d37ab6c52788d.png


Sanger 시퀀싱이라면 인간 유전체를 쉽게 알아낼 수 있을겁니다






img/23/05/24/1884d57afea52788d.png


Sanger 시퀀싱?

이거 싼거 아녀?






img/23/05/24/1884d37ab6c52788d.png


인간의 유전체는 아데닌 (A), 티민 (T), 사이토신 (C), 구아닌 (G) 4가지로 이루어집니다

DNA를 복제하는 DNA 중합효소와 A, T, C, G 그리고 복제할 DNA만 있으면 시험관 안에서도 DNA 합성을 할 수 있죠




img/23/05/24/1884d3a18d952788d.png


그런데 이 Sanger 시퀀싱은 일반적인 A, T, C, G만 쓰는게 아니라 

서로 다른 색깔의 형광물질이 달린 특별한 A, T, C, G를 미량 섞어서 DNA합성 반응응을 일으킵니다


이 특별한 형광 A, T, C, G는 다음 A, T, C, G가 붙을 '가지'가 없어서

이 형광 A, T, C, G를 DNA 중합효소가 사용하는 순간 DNA 합성반응이 종결됩니다

이를 사슬 종결 (Chain Termination) 반응이라고 합니다



img/23/05/24/1884d37ab6c52788d.png


이 형광 ATCG를 미량 섞고 충분히 DNA 합성반응을 일으킨다면 다양한 길이의 DNA가 만들어질겁니다

만약 DNA의 서열 19번째까지는 일반 ATCG까지 잘 합성되다가 20번째에 형광 ATCG가 우연히 들어가게 되면 20번째 서열에서 DNA 합성 반응이 종결되겠죠




img/24/07/08/1909111785e52788d.png

이 방법으로 길이 100짜리 DNA에 대해서 충분히 DNA 합성반응을 충분히 진행시키면

확률론적으로 1~100인 DNA를 모두 획득할 수 있게 됩니다

이 확률은 일반적으로 푸아송 분포를 따른다고 알려져 있습니다




img/23/05/24/1884d554a9a52788d.png


그리고 길이 1~100인 DNA들을 미세한 구멍이 나있는 겔(gel)에 걸어 전압을 걸어줍니다

DNA는 -전하를 띄기 때문에 전압에 따라 겔의 미세한 구멍을 따라 움직이게 되고

크기가 작은 DNA는 구멍을 더 빨리 빠져나가 빠르게 움직이며, 큰 DNA는 늦게 움직이게 됩니다


이런식으로 DNA를 겔에 넣고 전압에 따라 충분한 시간을 움직이게 해주면 DNA가 크기순으로 정렬되게 됩니다

그리고 이 크기순으로 정렬된 DNA로부터 형광신호를 읽어서 A,T,C,G중 어떤게 있는지 확인합니다


예를 들어 A에 빨간색 형광을 달아놨고, 길이 20짜리 DNA에 빨간색 형광 신호가 잡히면

DNA 서열 중 20번째 자리에는 A가 있다는걸 알 수 있겠죠




img/23/05/24/1884d37ab6c52788d.png


이게 바로 Sanger 시퀀싱 방법입니다




img/23/05/24/1884d5737a652788d.png




img/23/05/24/1884d57afea52788d.png


방법 자체는 훌륭한 것 같은데

시간과 비용이 너무 많이 들고 무엇보다 인간 유전체같은 긴 서열을 읽는건 기술적으로 힘들고 비효율적이야


인간 유전체는 30억염기나 되는데 1부터 30억 염기 크기의 DNA를 합성시키고,

이걸 또 겔에 넣어 정렬시키려면 수천km짜리 겔이 필요할껄??




img/24/07/08/190911ff8a852788d.png


img/23/05/24/1884d5a66a852788d.png



인간 유전체가 너무 길어서 읽기 힘들면 여러 조각으로 나눠서 읽는겁니다



img/23/05/24/1884d5ccb2c52788d.png



이런식으로 인간 유전체를 랜덤하게 조각낸 다음에 조각 하나하나 Sanger 시퀀싱을 적용시키는 것이죠




img/23/05/24/1884d5737a652788d.png


img/23/05/24/1884d57afea52788d.png


DNA를 짧게 조각내서 읽겠다는 발상 자체는 좋지만 무작위로 조각을 내는게 문제야

무작위로 조각이 나기 때문에 재현성 있는 실험이 힘들어


이 방법을 하려면 한번의 sanger 시퀀싱마다 동일한 서열의 파편으로만 이루어진 순도 높은 샘플이 필요한데

이렇게 랜덤하게 조각이 나서 서로 다른서열의 파편들이 섞여버리면 실험 할때마다 결과가 바뀔꺼라고




img/23/05/24/1884d5a1e3552788d.png




img/23/05/24/1884d5a66a852788d.png


동일한 서열의 DNA 파편들이 많이 필요하다면 만들면 되는 것입니다






img/23/05/24/1884d5da23052788d.png


랜덤하게 조각난 DNA 조각들을 박테리아 인공 염색체 (Bacterial Artificial Chromosome)에 삽입한 후 박테리아에 넣습니다


그럼 박테리아는 이게 자기 유전물질인줄 알고 열심히 복제를 합니다





img/23/05/24/1884d5a66a852788d.png


이렇게 박테리아가 복제한 유전물질을 다시 수거하면 한 DNA 조각과 동일한 무수한 복제를 얻을 수 있죠

이걸 BAC 라이브러리라고 합니다

이렇게 랜덤하게 조각이 난 인간 유전체를 대상으로 BAC 라이브러리를 만든 후 각 조각별로 sanger 시퀀싱을 하는겁니다





img/23/05/24/1884d5737a652788d.png



img/23/05/24/1884d57afea52788d.png


BAC라이브러리와 Sanger 시퀀싱을 통해 유전체 파편들의 서열을 알았다고 치자

근데 랜덤하게 조각이 났기 때문에 시퀀싱을 해도 각 조각들의 순서를 모르잖아?


시퀀싱 열심히 해봤자 각 조각들로 전체를 완성할 수 없으면 의미가 없어





img/23/05/24/1884d630f2652788d.png



img/23/05/24/1884d5a66a852788d.png


Shotgun 시퀀싱은 컴퓨터를 이용하여 조각난 염기서열을 이어붙이는 방법입니다

컴퓨터의 방대한 연산량이 있어야만 가능한 기술이죠




img/23/05/24/1884d668d9f52788d.png



인간 유전체를 랜덤하게 조각내는 것이기 때문에 같은 부위라도 다른 패턴으로 조각이 나는 경우가 있을 것입니다

그렇다면 파편별로 서열이 겹치는 부분이 있을 수도 있지요




img/23/05/24/1884d699aae52788d.png


이걸 컴퓨터의 막대한 연산력을 이용해서 겹치는 부분을 모조리 찾아내 계속 이어붙여 나가는 것입니다

이 짓을 계속 하다보면 언젠간 전체 서열이 완성되겠죠






img/23/05/24/1884d5a66a852788d.png


물론 이 방법은 확률론에 근거한 방법이기 때문에 겹치는 부분이 잘 안나와서 전체를 완성할 수 없을지도 모릅니다

하지만 확률론적으로 더 많은 파편을 더 많이 시퀀싱 할수록 다양한 패턴이 나올 것이고

그만큼 겹치는 부분에 대한 정보가 많아져서 전체를 완성할 확률도 높아지죠





img/23/05/24/1884d5737a652788d.png



img/23/05/24/1884d57afea52788d.png


기술적으로 BAC 라이브러리로 복제할 수 있는 조각의 길이는 20만 염기정도야

인간의 유전체 길이가 30억염기이니 확률적으로 충분히 전체를 커버하기 위해서는 DNA 조각을 2만개는 만들어야한다구






img/23/05/24/1884d57afea52788d.png

그리고 말이 2만개이지 기술적으로 20만염기도 한번에 못 읽어
겔이라는 물리적인 공간에 DNA를 정렬하는 sanger 시퀀싱의 원리상 한번에 1000개의 염기를 읽는것도 빠듯하다고?



img/23/05/24/1884d57afea52788d.png

즉 하나의 BAC 라이브러리 기술의 한계치인 20만염기조차 200번에 걸쳐서 나눠 읽어야 할 판이고
시행착오와 반복실험을 포함하면 정말 아득한 작업이야

그리고 이걸 2만번이나 또 다시한다고?




img/23/05/24/1884d57afea52788d.png

이 짓을 어느세월에 하고 있겠어?




img/23/05/24/1884d8312c652788d.png



img/23/05/24/1884d5a66a852788d.png


2만개의 BAC 라이브러리를 만든 후 전 세계의 실험실에 나눠줘서 각자 서열을 읽게 시키는겁니다





img/23/05/24/1884d5737a652788d.png



img/23/05/24/1884d84181e52788d.png




img/23/05/24/1884d8943d852788d.jpeg


6개국 20개 기관과 협엽하여 13년만에

2004년 인간 유전체 사업 (Human genome project) 완료


----------------


예전에 몇번 베스트에 올라갔던건데 내용 업데이트좀 해봤어요
등록된 댓글이 없습니다.