중합효소 연쇄 반응 - Polymerase Chain Reaction(PCR)
간단하지만 강력한 기법으로 DNA를 복제하고 실제로 원하는 만큼 DNA 사본을 만들 수 있는 놀랍고도 강력한 방법인 중합효소 연쇄 반응(Polymerase Chain Reaction, PCR)에 대해서 알아봅시다.
PCR(중합효소 연쇄 반응)은 DNA를 복제하여 원하는 만큼의 DNA 사본을 만들 수 있는 강력한 실험 기법입니다. 이 기술은 유전체학, RNA 염기서열 분석 등 다양한 분야에서 필수적으로 사용되며 특히 단일 세포나 분자가 아닌 충분한 양의 DNA가 필요한 실험에서 매우 중요한 역할을 합니다.
RNA 염기서열 분석을 할 때는 RNA를 DNA로 바꾸고 그 사본을 많이 만들어야 합니다. 누군가 게놈을 시퀀싱할 때 우리는 단순히 단일 세포나 단일 분자의 염기서열을 분석하지 않습니다.
염기서열 분석에 사용하는 모든 기술을 활용하기 위해서는 시작하기 전에 DNA 분자의 동일한 사본을 많이 만들어야 합니다.
DNA는 항상 이중 가닥을 이루고 있죠. 아래의 이미지와 같이 두 가닥의 DNA가 있습니다.
상단에는 A, C, G, T 가 있고 하단에는 상보적인 가닥이 있습니다.
그리고 이전에 언급한 것처럼 DNA에는 5에서 3으로 방향을 이루고 있습니다.
따라서 DNA 염기서열의 시작은 5가 되고 끝은 3이 됩니다.
DNA가 스스로 달라붙는다는 사실은 PCR에 사용할 매우 중요한 특성입니다.
PCR에서는 15-20개 염기 길이의 짧은 DNA 조각인 ‘프라이머(Primer)’를 사용합니다. 조금 더 짧을 수도 있고 조금 더 길 수도 있습니다.
이것은 복제하고자 하는 DNA와 상보적인 서열을 가집니다. 순방향과 역방향 두 개의 프리미어가 사용되며, 각각 DNA의 다른 말단에 결합합니다.
아래의 예시는 프라이머 두 개를 사용한 예시인데요, 하나는 초록색이고 다른 하나는 파란색입니다.
초록색 프라이머는 상단 DNA 가닥의 중간 부분에 결합하는 순방향(Forward) 프라이머입니다.
이 프라이머는 하단 DNA 가닥과 상보적으로 결합하게 됩니다.
하단에 있는 파란색 프라이머는 역방향(Reverse)프라이머 입니다. DNA의 반대쪽 말단에 결합하게 됩니다.
이처럼 프라이머는 DNA의 특정 부위에 상보적으로 결합하여 DNA 복제의 시작과 끝 지점 역할을 하며, 두 프라이머를 통해 원하는 DNA 영역을 선택적으로 증폭할 수 있습니다.
→ 따라서, 프라이머는 연구자가 자신의 실험 목적에 맞게 특정 DNA 부위를 선택하여 그에 맞는 서열을 설계하고 주문 제작하는 것입니다. 이는 PCR의 큰 장점 중 하나로, 원하는 DNA 부위를 선택적으로 증폭할 수 있게 해줍니다.
DNA를 가열하면 DNA가 녹거나 두 가닥이 서로 분리되어 떨어져 나가게 됩니다. 따라서 혼합물이 뜨거우면 프라이머가 DNA에 달라붙지 않고 DNA의 두 가닥도 서로 달라붙지 않습니다(94°C에서 진행되는 변성 단계). 그런 다음 식히거나 어닐링하고 온도를 낮추어 프리미어가 단일 가닥 DNA에 결합하도록 합니다.
프라이머는 크기가 작아 DNA에 쉽게 결합할 수 있는 특징이 있습니다. 마지막으로 72°C에서 진행되는 신장 단계에서는 DNA 중합효소가 프라이머가 결합된 부위부터 dNTPs(A, C, G, T)를 이용하여 새로운 DNA 가닥을 합성합니다.
DNA 중합효소의 작동 원리를 다음과 같이 정리할 수 있습니다. DNA 중합효소는 DNA 가닥에서 특별한 구조를 인식하여 작동합니다. 이 구조는 일부는 단일 가닥이고 일부는 이중 가닥인 부분입니다.
구체적으로, 프라이머가 단일 가닥 DNA에 결합하여 만든 이중 가닥 부분을 인식하고 이 프라이머가 결합된 지점에서부터 나머지 단일 가닥 부분을 따라 새로운 DNA를 합성하기 시작합니다. 즉, 프라이머가 제공하는 이중 가닥 구조를 시작점으로 삼아 빈 부분의 염기서열을 상보적으로 채워나가는 것입니다.
위의 작업들을 수행한 후의 결과는 아래와 같습니다.
한 번의 복제 과정을 거치면 초록색 프라이머가 있는 상단 부분에서는 중합효소가 프라이머를 시작점으로 삼아 전체 서열을 완성하고 동시에 다른 중합효소는 파란색 프라이머가 있는 하단 부분에서 시작하여 반대쪽 가닥의 서열을 완성하는 모습입니다.
이 과정에서 DNA 중합효소는 용액 속에 있는 A,C,G,T 뉴클레오티드를 사용하여 새로운 DNA 가닥을 만듭니다. 이렇게 만들어진 두 개의 이중 가닥 DNA는 원본과 동일한 서열을 가지게 되며 이 과정이 계속 반복되면서 DNA가 기하급수적으로 증폭되는 것을 알 수 있습니다.
이를 연쇄반응 이라고 하며 라운드를 거칠 때마다 이전에 가지고 있던 DNA의 양이 2배로 늘어납니다.
전체적인 흐름을 그림으로 살펴보면 아래와 같습니다.
높은 온도에서 DNA는 두 가닥으로 분리가 됩니다. 몇 분이면 저렇게 잘 분리가 된다고 합니다.
온도를 54도까지 식히면 이 온도에서 프라이머가 DNA에 달라붙게 됩니다. 그러면 중합효소가 이 이중 가닥의 조각을 찾아서 채우기 시작합니다. 두 개의 종합효소가 기존 가닥을 채우고 이중 가닥 DNA를 생성하기 시작하는 것을 볼 수 있습니다. 이렇게 하면 완벽한 복제본을 만들게 됩니다.
정리하자면 PCR을 위해 필요한 재료는 다음과 같습니다.
- DNA
- primers
- DNA polymerase
- A’s , C’s, G’s, T’s
복제하려는 DNA가 필요하고 살아있는 유기체의 모든 DNA가 될 수 있습니다.
차세대 시퀀싱 - Next Generation Sequencing
차세대 시퀀싱(NGS)은 2007년부터 현재까지 사용되고 있는 최신 DNA 염기서열 분석 기술입니다. DNA 시퀀싱 기술은 여러 세대를 거쳐 발전했는데, 1970-90년대에는 프레드 생어(Sanger)가 발명한 생어 시퀀싱이 주로 사용되었습니다.
초기에는 수작업으로 진행되어 느리고 힘들었지만, 1980년대에 자동화된 DNA 염기서열 분석기가 개발되면서 효율성이 크게 향상되었습니다. 1990년대에는 DNA 마이크로어레이 기술이 등장했으나 이는 정확한 시퀀싱이 아닌 DNA나 RNA의 결합을 측정하는 기술이었습니다.
NGS의 작동 원리는 DNA 중합효소의 특성을 활용합니다. 먼저 분석하고자 하는 DNA 주형을 수백에서 천 개 정도의 염기 길이를 가진 작은 조각으로 자르고, 이를 화학적으로 슬라이드에 부착합니다. 슬라이드에는 수백만에서 수천만 개의 DNA 조각이 부착될 수 있습니다. 이후 PCR을 통해 각 조각의 동일한 사본을 여러 개 만들어 클러스터를 형성합니다.
시퀀싱 과정에서는 형광 표지된 뉴클레오티드(A, C, G, T)를 사용합니다. 이 뉴클레오티드들은 두 가지 특별한 변형을 가지고 있습니다. 첫째, 각각 다른 색의 형광을 발합니다. 둘째, '터미네이터' 변형이 있어 한 번에 하나의 뉴클레오티드만 추가될 수 있습니다. DNA 중합효소가 이러한 뉴클레오티드를 하나씩 추가하면, 레이저로 빛을 비춰 형광 신호를 촬영합니다. 각 사이클마다 새로운 염기가 추가되고, 이를 촬영하여 연속적인 이미지를 얻게 됩니다.
이 기술의 한계점은 시퀀싱 사이클이 진행될수록 오류가 증가한다는 것입니다. 이는 DNA 중합효소가 완벽하지 않아 일부 가닥이 앞서가거나 뒤처지는 현상 때문입니다. 초기에는 이러한 오류가 적지만, 시간이 지날수록 동기화되지 않은 가닥들이 늘어나 오류가 커집니다. 이러한 이유로 NGS로는 수천 개 이상의 염기를 연속적으로 읽을 수 없습니다.
최종적으로 얻어지는 결과는 As, Cs, Gs, Ts의 연속된 시퀀스와 함께 각 위치별 품질 값이 포함됩니다. 이 품질 값은 기본 호출 소프트웨어가 각 위치에서 발생할 수 있는 오류의 확률을 추정한 것으로, 형광 신호의 순도를 기반으로 계산됩니다. 시퀀스가 진행될수록 형광 신호의 순도가 떨어지므로, 후반부로 갈수록 품질 값이 낮아지는 경향이 있습니다.
시퀀싱의 응용 - Next Generation Sequencing Applications
가장 기본적인 아이디어는 DNA를 만들어야 한다는 것입니다. 염기서열을 분석하기 위해서는 DNA가 필요하니까요. (Convert Molecule to DNA)
그런 다음 2세대 시퀀싱 기술을 적용하는 것입니다.
엑솜 시퀀싱(Exome Sequencing)은 오늘날 가장 인기가 많은 방법입니다. 엑솜이라는 것은 Genome에 있는 모든 엑손(단백질로 번역되는 DNA 부분)만을 모아 놓은 것입니다.
이 부분에 대해서 다시 살펴보면, 우리의 DNA는 RNA로 전사됩니다. 이 과정에서 RNA는 엑손과 인트론으로 잘게 쪼개집니다. 인트론은 버려지고, 남아있는 엑손은 서로 연결되며 엑손은 단백질로 번역됩니다.
따라서 세포 집합체 안에서 어떤 단백질이 활성화되고 있는지 알고 싶다면 엑손이 무엇인지 알아야 합니다.
유전학에서 우리는 유전자 돌연변이를 찾을 때 단백질에 영향을 미치는 돌연변이에 대부분 관심을 갖습니다. 이러한 돌연변이는 엑손에서 발생해야 합니다. 따라서 세포에서 엑손만 캡쳐하고 그 엑손의 염기서열을 분석할 수 있습니다. 엑손은 전체 Genome에서 약 1.5%(30-60만 염기쌍)만 차지하지만, 대부분의 질병 관련 돌연변이가 이 영역에서 발생합니다.
마그네틱 비드를 사용하여 엑손 DNA를 선택적으로 포획하는 방식으로 진행됩니다. 비드에 부착된 상보적 DNA와 엑손 DNA를 혼성화시켜 분리한 후 시퀀싱을 수행합니다.
또 다른 기술은 RNA-Sequencing 입니다. 여기에는 세포 또는 세포 집합체에서 활성화되는 모든 유전자를 포획하는 것이 포함됩니다. 방금 언급한 것처럼 단백질을 생산하려면 DNA가 먼저 RNA로 전사된 다음 단백질로 번역됩니다. 따라서 RNA를 포착한다면 특정 세포 세트 또는 세포 유형에서 어떤 유전자가 발현되거나 활성화되는지 알 수 있습니다. RNA 분자에서 매우 중요한 특징은 전사 후에 세포가 A로 구성된 긴 줄이 된다는 것입니다.
RNA의 폴리A 꼬리를 이용하여 성숙한 mRNA만을 선택적으로 포획하여 사용할 수 있습니다. A가 길지 않은 것은 모두 무시할 수 있죠. 저런 꼬리를 폴리 A 꼬리라고 부릅니다.(Poly A tail)
역전사효소를 사용하여 RNA를 DNA로 변환한 후 시퀀싱을 수행합니다. 이 방법을 통해 필요한 부분을 캡쳐한 RNA와 일치하는 DNA를 얻을 수 있습니다.
일단 DNA를 얻었으면 염기서열 분석만 하면 되겠죠? 그리고 그 시점부터 어떤 세포나 유전자가 그 세포를 활성화시킬지 알아내는 것은 계산상의 문제입니다. 매우 복잡한 계산이지만 중요한 계산이죠.
차세대 시퀀싱 기술이 도입된 이후 큰 인기를 끌고있는 세 번째 기술은 ChIP-Seq입니다.
ChIP-seq(Chromatin Immunoprecipitation Sequencing)은 특정 단백질이 DNA의 어느 부분에 결합하는지를 이해하기 위한 중요한 실험 기법입니다. 이는 DNA의 유전자 발현 조절 메커니즘을 이해하는 데 핵심적인 역할을 합니다. 세포마다 다른 유전자 발현 패턴을 가질 수 있는 것은 전사 인자라는 단백질들이 DNA의 특정 부위에 결합하여 근처에 있는 유전자의 발현을 조절하기 때문입니다.
현미경으로는 염색체에서 단백질이 결합된 정확한 위치를 직접 관찰할 수 없기 때문에, ChIP-seq은 이를 간접적으로 확인할 수 있는 방법을 제공합니다. 이 기술은 가교결합이라는 과정을 통해 단백질을 DNA에 직접 고정시키는 것으로 시작합니다. 관심 있는 세포를 채취한 후, 단백질과 세포의 DNA를 교차 연결하여 단백질이 결합된 위치를 고정합니다.
그 다음 단계에서는 DNA를 수많은 작은 단편으로 파편화합니다. 이때 대부분의 단편은 단백질이 결합되어 있지 않지만, 일부 단편에는 관심 있는 단백질이 결합되어 있습니다. 이러한 단백질-DNA 복합체를 특이적으로 분리하기 위해 항체를 사용합니다. ChIP-seq에서는 특정 단백질을 인식하는 항체를 설계하여 이를 혼합물에서 분리해냅니다. 단백질이 DNA에 고정되어 있기 때문에, 단백질을 분리할 때 그것이 결합되어 있던 DNA 조각도 함께 분리됩니다.
마지막으로, 분리된 단백질을 제거하고 남은 DNA 단편들의 염기서열을 분석합니다. 이렇게 얻어진 DNA 서열은 원래 단백질이 결합해 있던 위치의 DNA 서열을 나타냅니다. 결과적으로 이 실험은 단백질-DNA 결합 위치 확인 문제를 염기서열 분석 문제로 전환시킨 것이며, 얻어진 짧은 DNA 단편들의 서열을 통해 단백질 결합 부위를 파악할 수 있습니다.
바이설페이트 시퀀싱(Bisulfite Sequencing) 또는 메틸 시퀀싱은 DNA의 메틸화 패턴을 분석하는 중요한 기술입니다. DNA 메틸화는 세포 내에서 단백질 발현에 영향을 미치는 중요한 후성유전학적 변형입니다. 특히 메틸화 표지(메틸기)는 세포 분열 과정에서 다음 세대로 전달될 수 있어 유전자 발현 조절에 장기적인 영향을 미칩니다.
메틸화 위치를 확인하는 실험 과정은 다음과 같습니다: 먼저, DNA 샘플을 동일한 양의 두 부분으로 나눕니다. 이 중 한 샘플에 바이설페이트 전환이라는 특별한 화학적 처리를 합니다. 이때 중요한 점은 메틸기가 항상 시토신(C)에만 부착된다는 것입니다. 바이설페이트 처리 과정에서는 메틸화되지 않은 모든 시토신(C)이 우라실(U)로 변환됩니다. 반면, 메틸화된 시토신은 변환되지 않고 그대로 유지됩니다.
이렇게 처리된 두 개의 샘플(처리된 것과 처리되지 않은 것)의 DNA 시퀀싱을 수행한 후, 결과를 비교 분석합니다. 하지만 이 과정에서 일반적인 시퀀스 정렬 프로그램으로는 분석이 어렵습니다. 왜냐하면 바이설페이트로 처리된 DNA는 참조 게놈과 많은 차이를 보이기 때문입니다. 따라서 이를 위해 특별히 설계된 정렬 프로그램을 사용해야 합니다. 이 프로그램은 변환된 우라실(U)을 원래 게놈의 시토신(C)과 비교할 수 있도록 설계되어 있습니다.
이러한 분석을 통해 특정 세포나 조직에서 DNA의 어느 부분이 메틸화되어 있는지 파악할 수 있으며, 이는 유전자 발현 조절과 세포 분화 과정을 이해하는 데 매우 중요한 정보를 제공합니다. 메틸화 패턴은 정상적인 발달 과정뿐만 아니라 질병 상태에서도 중요한 역할을 합니다. 이를 연구하는 것은 생물학적, 의학적으로 큰 의미를 가집니다.