Genomowe zatrzęsienie, cz.2.

Pierwszy genom, drugi Nobel

W pierwszym wpisie z tej serii wspomniałem o tym, że pierwszym zsekwencjonowanym genomem w historii był genom wirusa, bakteriofaga MS2, który opisano w magazynie Nature w roku 1972. W doświadczeniach zreferowanych w tej pracy wykorzystano bardzo wówczas nowatorską metodę wymyśloną zaledwie kilka lat wcześniej przez Freda Sangera.

Frederick Sanger jest wybitnym brytyjskim biochemikiem, jedyną osobą w historii, która otrzymała dwukrotnie Nagrodę Nobla z chemii (pierwszą otrzymał jako zaledwie 30-latek za opisanie struktury pierwszorzędowej insuliny – czyli za jej zsekwencjonowanie). W tej historii jednak znacznie większą rolę odgrywa sekwencjonowanie innego rodzaju, bo nie białek a kwasów nukleinowych. I za tę metodę także nagrodzono go Noblem, prawie ćwierć wieku po pierwszym wyróżnieniu. Jak zatem działa ta magiczna metoda, którą w różnych formach posługiwano się do sekwencjonowania genomów przez kolejne 25 lat?

Sekwnecjonowanie Sangera opiera się na jednym z podstawowych dogmatów biologii molekularnej mówiącym, że możliwe jest kopiowanie niemal w nieskończoność pojedynczej nici DNA bazując na komplementarności zasad azotowych ją budujących. Jak część Czytaczek i Czytaczy będzie pamiętać (a reszta zapewne szybko sobie swoją wiedzę biologiczną odświeży na wiki), zasady azotowe nie wiążą się byle jak: w podwójnej nici DNA naprzeciwko tyminy leży zawsze adenina, zaś naprzeciwko guaniny – cytozyna. Wynika to z kształtu i rozmiaru tych cząsteczek i jest w komórkach wykorzystywane do powielania naszego materiału genetycznego na przykład przy podziale komórki.

Metoda Sangera, zadziwiająca w swej prostocie (jak wszystkie genialne pomysły), wymaga początkowo tylko kilku elementów: fragmentu nici DNA, który chcemy zsekwencjonować, tzw. primera, czyli króciutkiego fragmentu DNA, który jest komplementarny z początkiem naszej nici, enzymu polimerazy DNA, który odwali za nas większość czarnej roboty, i całej masy cegiełek, które enzym ten zastosuje do kopiowania naszej nici DNA.

Cegiełki to połączenie zasad azotowych z resztą cukrową i trzema resztami fosforanowymi. Normalne cegiełki oznacza się jako dATP, dGTP, dCTP oraz dTTP (od ich chemicznych nazw: deoksyadenozynotrifosforan itd.). Do reakcji Sanger dodawał jednak jeszcze cegiełki w wersji zmodyfikowanej – i te zmodyfikowane były dodatkowo znaczone fluorescencyjnie. Za moment przekonamy się dlaczego.

Poniżej zatem obraz tego, co znajduje się na początku sekwencjonowania w garnku. Na dole nić, którą chcemy zsekwencjonować (stosując legendą po prawej stronie można rozszyfrować jej zapis jako TCTCAATAGAGGTGCC). Do mieszanki dodany jest także primer, który jest komplementarny z początkiem naszej nici. I wreszcie mieszanka cegiełek – deoksynukleotydów czterech rodzajów.

faza pierwsza — Zawartość garnka na początku sekwencjonowania metodą Sangera. Dokładny opis w tekście.

Na ilustracji brakuje jednego elementu – enzymu, który rozpoznaje miejsce, w którym primer łączy się z początkiem naszej nici i usadza się w tymże miejscu, po czym rozpoczyna przesuwać się w dół pojedynczej nici DNA dokładając do niej kolejne komplementarne cegiełki, które wyławia z mieszanki. W trakcie sekwencjonowanie przeprowadza się cztery wersje tego procesu – spostrzegawcze Czytaczki i Czytacze dostrzegli bowiem, że jedna z cegiełek pojawia się w dwóch formach, normalnej oraz z gwiazdką symbolizującą tutaj dwie rzeczy: specyficzną modyfikację, która blokuje enzym przed dalszą pracą, oraz fluorescencyjny znacznik.

Polimeraza DNA przesuwając się wzdłuż nici DNA wykonuje zatem kopię naszej nici, która kończy się albo, gdy polimeraza dojdzie do jej końca albo też gdy do mechanizmu wpadnie zmodyfikowana cegiełka, która powoduje blokadę. Niezależnie od tego, z którą sytuacją mamy do czynienia, polimeraza rozpoczyna proces syntezy od nowa. Po wielokrotnym powtórzeniu tego procesu w mieszaninie kończą się wolno pływające cegiełki – zamiast tego otrzymujemy mieszanką wielu nici DNA o różnej długości, które nieodmiennie kończą się oznakowaną fluorescencyjnie cegiełką. W naszym modelu wynik wygląda następująco:

faza druga — Tutaj wynik dla mieszanki z oznakowaną tyminą.

Teraz widać, dlaczego proces prowadzi się w czterech wersjach: w każdej z czterech mieszanin znajduje się inna oznakowana cegiełka. Następnym etapem sekwencjonowanie jest rozdzielenie tych czterech różnych mieszanin na jednym żeli poliakrylamidowych w sąsiednich liniach. Tu już nie będę się zagłębiał w technikalia elektroforezy żelowej (ciekawskich odsyłam jak zwykle do wiki). Dość powiedzieć, że każda z mieszanin rozdziela się według masy cząsteczek: najmniejsze przez żel wędrują najszybciej, dzięki czemu znajdują się na dole żelu, najdłuższe – czyli najcięższe znajdują się na jego szczycie. Na żelu widać tylko te fragmenty, które zwierają oznakowane cegiełki – czyli w naszym przykładzie, rozdział mieszaniny z oznakowaną tyminą pokaże nam tylko te fragmenty nici, które kończą się na tyminie.

Wyobraźmy sobie zatem że mamy jedną mieszaninę zwierającą każdą możliwą do stworzenia na podstawie naszej matrycy nić DNA i że każda z tych nici jest oznakowana. Rozdział takiej mieszaniny dałby nam wówczas taki obraz, jak poniżej w panelu A. Ponieważ jednak nici kończące się poszczególnymi rodzajami cegiełek znajdują się w oddzielnych mieszaninach, w istocie każda z mieszanin da wynik pokazujący miejsce tylko jednego rodzaju cegiełek. Gdy zestawimy koło siebie wyniki dla każdej z nich (panel B), otrzymamy obraz, z którego już z łatwością wydedukować możemy naszą sekwencję (panel C).

faza trzecia — Na tym etapie to już jest jak 50-częściowy puzel – łatwe i przyjemne składanie oczywistych elementów do kupy.

Sekwencjonowanie Sangera zmieniło całą genetykę. Jednak trzeba sobie zdawać sprawę tutaj z kilku problemów, które prześladowały tę technikę przez kolejne dziesięciolecia. Część z nich wynika z samego dezajnu metody: z potrzeby posiadania primerów oraz z ograniczeń związanych z wydajnością poszczególnych reakcji. Ten pierwszy wymóg powoduje, że problematycze może być rozszyfrowanie pierwszych 15-40 zasad sekwencji. To drugie oznacza, że bardzo trudne staje się uzyskanie zapisu dla sekwencji dłuższych niż ok. 1000 zasad. O ile więc w przypadku genomów takich jak fag MS2, którego genom ma raptem trzy i pół tysiąca zasad długości, rozszyfrowanie sekwencji nie jest trudną łamigłówką, o tyle zrobienie tego samego z ludzkim genomem, który – przypominam – ma długość ponad trzech miliardów zasad, jest znacznie, znacznie bardziej skomplikowane. Innym ograniczeniem metody jest też to, że rozdział mieszanin prowadzony jest na żelu – a elektroforeza żelowa metodą jest pracochłonną, czasochłonną, po prostu żmudną. Co w przypadku większych genomów staje się oczywiście ważnym czynnikiem limitującym.

Niemniej jednak w tych pierwszych dniach sekwencjonowania radzono sobie znakomicie stosując tylko sekwencjonowanie Sangera. Pewne etapy tego procesu z czasem stały się łatwiejsze: w 1983 amerykański biochemik Kary Mullis opisał metodę szybkiego powielania DNA – znaną dzisiaj pod nazwą PCR – która pozwoliła na uzyskiwanie dużych ilości kopii materiału genetycznego bardzo szybko. Mullis zresztą został 10 lat później nagrodzony za tę metodę, a jakże, Noblem z chemii. Tradycyjną elektroforezę żelową zastąpiono za to elektroforezę kapilarną – też żelową, ale w bardziej skondensowanej formie, szybszą i łatwiejszą do automatyzacji. Obecnie sekwencery oparte na sekwencjonowaniu Sangera, stosujące takie automatyczne metody rozdziału, znaleźć można w wielu ośrodkach badawczych (chociaż te bogatsze bawią się już innymi zabawkami, o których niedługo w tej serii), a także w placówkach diagnostycznych różnego rodzaju. Zapis zaś z takiego sekwencera wygląda następująco:

sekwencer-wynik — żródło: manual sekwencera Applied Biosystems.

Teraz wszyscy powinniśmy mieć jako takie pojęcie o tym, jak przez dekady sekwencjonowano DNA. O tym, co i jak się zmieniło, gdy postanowiliśmy rozszyfrować ludzki genom, w następnych wpisach.

F. Sanger, A.R. Coulson (1975). A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase Journal of Molecular Biology, 94 (3), 441-446 : 10.1016/0022-2836(75)90213-2

F. Sanger (1980). Determination of nucleotide sequences in DNA, Nobel lecture.

Huang XC, Quesada MA, & Mathies RA (1992). DNA sequencing using capillary array electrophoresis. Analytical chemistry, 64 (18), 2149-54 PMID: 1416049

Genomowe zatrzęsienie, cz.2.

Napisane przez Rafał

1 Comments

Dodaj komentarz Anuluj pisanie odpowiedzi

Udostępnij:

Podobne

Napisane przez Rafał

1 Comments

Dodaj komentarz Anuluj pisanie odpowiedzi