Kwestia rozmiaru

źródło: flickr; Andrew Stawarz (CC BY-ND 2.0) ©2009

W jednym z ostatnich wpisów poruszyłem krótko i chyłkiem temat nieco bardziej naukowy niż moje normalne gaworzenie i anegdocenie o ciekawostkach: a mianowicie, maźnąłem po kwestii ilości białek w naszym organizmie w porównaniu z ilością genów. Dzisiaj więc pozwolę sobie temat nieco rozwinąć (a czytającym molbioli z góry przepraszam, bo zapewne ich to przynudzi).

Zacznijmy więc historycznie: przez dziesięciolecia w XX wieku w biologii molekularnej panował potężny dogmat podsumowany krótką frazą „jeden gen – jedno białko”. A do tego najlepiej by było, gdyby jeszcze można tylko na podstawie rozmiaru genomu (czyt. zawartości DNA w jądrze komórkowym, najlepiej według wagi) określić ilość genów w organizmie. To już w ogóle byłoby cacy.

A, moment. Część z tego da się przecież zrobić. Otóż panie i panowie molbiolowie wymyślili tzw. wartość c (c-value), która odpowiada dokładnie wadze DNA w haploidalnym jądrze. Dzięki temu możemy porównać, ileż to materiału genetycznego mamy na ten przykład my, ludzie, w porównaniu z unymi, robalami, owadami, bakteriami i inszymi stworami.

ResearchBlogging.org I tu, niestety, zaczynają się schody. Po pierwsze bowiem, ilość DNA sama w sobie nijak się ma do ilości genów danego organizmu. Dla przykładu: ludzki genom zawiera około trzech i pół miliarda par zasad. Za to genom paprotki: 20 razy więcej. A istnieją nawet gatunki ameb, które mają ich od ludzi dwustukrotnie więcej! Jak widać więc ilość DNA w komórce nie przekłada się bynajmniej na stopień skomplikowania organizmu.

Do tego dochodzi kolejny problem: ile z tego materiału genetycznego jest właściwie zużyte do kodowania genów? Nędzna, złośliwa, żerująca na hiszpańskich ogórkach od czasu do czasu, Escherichia coli robi ze swojego genomu użytek bardzo efektywny. Ok. 90% bowiem koduje geny. Ale już o nieco bardziej zaawansowanych drożdży jest to zaledwie 50%. A u ludzi – około 2%! Gdyby więc to byłoby wyznacznikiem rozwoju, Ziemią rządziłyby monstra z kolbami kukurydzy w miejsce głowy: kukurydza bowiem robi właściwy użytek z mniej niż jednego procenta swojego materiału genetycznego.

Być może właśnie z tego powodu, że funkcja materiału genetycznego może być tak różna (bo o tym, że pozostałe DNA ma jednak jakąś funkcję, zaczynami się powoli przekonywać i też o tym kilkakrotnie wspominałem), wynika też nieadekwatna do rozmiaru genomu liczba genów. U ludzi na te ryczące trzy i pół miliarda par zasad przypada ich około 25 tysięcy. Muszka owocówka, której genom jest 20 razy mniejszy, genów ma mniej zaledwie o połowę.

Jak więc widać, już sama kwestia tego, ile mamy genów i skąd się biorą, i jak, i po co, i dlaczego kukurydza nie rządzi światem, jest kwestią niebłahą. Do tego jednak dochodzi znacznie poważniejsza kwestia pod tytułem „o tym, co było potem”. Czyli jak liczba genów przekłada się na ilość białek w organizmie. Mit – bo już dłużej nie dogmat – jednego białka przypadającego na jeden gen upadł już jakiś czas temu. Pisałem o tym ostatnio, ale powtórzę się tutaj.

Po pierwsze, już na poziomie transkrypcji, czyli „przepisywania” informacji z DNA na matrycowy RNA, na bazie którego powstają potem białka, dochodzić może do tworzenia kilku różnych kopii RNA z jednego genu. Proces ten nazywany jest alternatywnym splicingiem. Nasze geny nie są zapisane w postaci jednolitych bloków: każdy z nich to ciąg następujących naprzemiennie fragmentów DNA kodującego (egzonów) oraz niekodującego (intronów; waham się nieco przed nazywaniem ich nadal DNA śmieciowym – termin ten moim zdaniem jest przestarzały i nieadekwatny). W trakcie transkrypcji introny są usuwane, a egzony sklejane w jedną nić. I tu właśnie na scenę wkracza alternatywny splicing, w trakcie którego wiele egzonów z jednego genu może być łączone w wiele kombinacji i dać w rezultacie więcej niż jedną nić RNA, a ostatecznie więcej niż jedno białko. Dla przykładu: wirus HIV w trakcie transkrypcji produkuje zaledwie jedną nić RNA. Dzięki alternatywnemu splicingowi jednak, daje ona ponad 40 różnych odcinków matrycowego RNA.

Różne odmiany alternatywnego splicingu. /źródło: wiki, Magnus Manske (CC BY-SA 2.0) ©2005

Kolejnym czynnikiem wpływającym na to, że rodzajów białek w organizmach jest zazwyczaj znacznie, znacznie więcej niż by to wynikało z liczby genów, są tzw. posttranslacyjne modyfikacje. Białka bowiem, ze splicingiem czy bez, są produkowane mimo wszystko na bazie naszego materiału genetycznego. To, co dzieje się po syntezie, nie jest zapisane w postaci twardej kopii w naszym DNA. Albo raczej, nie odkryliśmy jeszcze jak i gdzie jest (bo racej trudno uwierzyć, że te wszystkie zmiany, niejednokrotnie absolutnie witalne dla funkcjonowania organizmu, są losowe i „wiedza” o nich nie jest w żaden sposób dziedziczona).

A jest tych modyfikacji, którym ulegać mogą białka, na tony. Do najpopularniejszych oczywiście należy fosforylacja – czyli dodanie grupy fosforanowej np. do reszt seryny czy tyrozyny, która odpowiada za funkcjonalność wielu enzymów (np. wszechobecnych i niezwykle ważnych kinaz). Inną jest acetylacja, popularna w jądrze komórkowym: aktywność histonów, białek, na które nawinięte jest upakowane DNA, jest regulowana w ten właśnie sposób. Na drodze glikozylacji do białek dołączane są cukry – a wiele ważnych białek błonowych to właśnie tzw. glikoproteiny – białka z dołączonymi resztami cukrowymi (tu znamiennym przykładem są białka zgodności tkankowej). Rodzajów modyfikacji, które zachodzą w białkach, jest conajmniej kilkadziesiąt, a być może nawet kilkaset. I nawet jeśli nie każde białko takiej zmianie ulega, to są białka, które ulagają kilku. I nagle ta pula już zsyntetyzowanych produktów białkowych zaczyna się rozszerzać jeszcze bardziej.

Pozostaje więc postawić tytułowe pytanie: wiemy, że genów w naszym organizmie jest około 25 tysięcy. Ile jednak jest w nim rodzajów białek?

Profesor Andrew Pitt z Uniwersytetu w Glasgow, którego wystąpienia w ciągu ostatnich dwóch lat miałem coraz i coraz mniejszą przyjemność (a bo się trochę powtarzał) słuchać chyba ze cztery razy, lubuje się w takich uproszczonych, back of the envelope, jak to mówią Anglicy, wyliczeniach. Według Pitta ludzki proteom (czyli całokształt białek w ludzkim organizmie) może liczyć nawet cztery i pół miliona różnych protein.

Oczywiście nie wszystkie występowałyby na raz w każdej komórce. Wiele białek jest bardzo specjalistycznych: pojawiają się tylko w określonych rodzajach tkanek albo tylko w określonej fazie cyklu komórkowego itd. itp. Niemniej ta gargantuiczna liczba wciąż powala na kolana.

Już blisko dekadę temu w piśmie Nucleic Acids Research pojawiła się praca, której autorzy pastwili się nad tą kwestią. Poniżej możecie zobaczyć ich analizę (w mojej oprawie graficznej): niebieskie okręgi pokazują szacunki ilości genów wg różnych autorów, okrąg czerwony – szacunek ilości białek wyprodukowanych na bazie tych genów (tylko dla prac 1 – 9). Jest to porównanie jedynie genomu/proteomu ludzkiego.

Porównanie szacunków rozmiaru ludzkiego genomu. Rozmiar okręgów odpowiada szacunkom różnych autorów (a czasem tych samych autorów, ale szacunków robionych różnymi metodami i dla różnych kryteriów). Okręgi linią przerywaną sygnalizują niepewność. To samo dotyczy się szacunków proteomu - tu jednak nie zostały wzięte pod uwagę prace 10 i 11, który wyraźnie zawyżyłyby wynik. Niemniej jak widać, autorzy tych prac uzyskali wyniki, które są bardzo, baaaardzo dalekie od rzeczywistości (zapewne na skutek zastosowania takiej a nie innej metodologii). /nicprostszego ©2011

Jak widać te szacunki dla ludzi były wówczas bardzo konserwatywne. Autorzy stwierdzają, że prawdopodobnie rozmiar ludzkiego proteomu powinien oscylować gdzieś w okolicach dziewięćdziesięciu tysięcy. Wygląda to nieco rozsądniej od szacunków Andrew Pitta, ale z drugiej strony Pitt jest bogatszy o dziesięć lat badań i doświadczenia na szybko rozwijającym się polu proteomiki… Gdybym ja miał zgadywać, to powiedziałbym, że prawda leży pewnie gdzieś po środku – w okolicach kilkuset tysięcy białek. Ile zaś jest ich naprawdę, zapewne nigdy dokładnie się nie dowiemy, właśnie ze wspomnianego przeze mnie powodu: ponieważ proteom, w odróżnieniu od wyrytego w kamieniu genomu, jest tworem płynnym, elastycznym, zmiennym. Ponieważ proteom zależy od tego gdzie i kiedy na niego patrzymy: czy u noworodka, czy u starca, u chorego czy u zdrowego, w wątrobie czy w mózgu, w jądrze komórkowym czy w aparatach Golgiego… Dlatego też próżno będzie Wam szukać późniejszych prac niż ta cytowana powyżej: bo szacunki rozmiarów całkowitego ludzkiego proteomu to dzisiaj rozrywka czysto intelektualna. Prawdziwie przydatne, praktyczne informacje uzyskać można jednak dopiero po doprecyzowaniu, na jaki proteom dokładnie patrzymy.

Harrison, P. (2002). A question of size: the eukaryotic proteome and the problems in defining it Nucleic Acids Research, 30 (5), 1083-1090 DOI: 10.1093/nar/30.5.1083

W kwestii licencji do grafik muszę dodać od siebie: w życiu nie miałem takiego problemu z uzyskaniem zgody na reprint – stąd też brak oryginalnej ilustracji. I chociaż zdaję sobie sprawę, że może sam nie byłem najbardziej pomocny (chociaż starałem się, jak mogłem), oraz że raczej biznesowo jestem nieciekawym partnerem, bo za pracę nie mam jak zapłacić, ale jednak ta totalna zlewka mnie wkurzyła – tym bardziej, że skontaktowano się ze mną w tej sprawie, a potem ukręcono jej, świadomie czy nie, łeb. Pardon za rant, ale gdzieś się musiałem wyżalić.

1 Comment

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s