ABC badań asocjacyjnych

Wraz z blogiem Neurobigos zapraszam do lektury dwuczęściowego artykułu nawiązującego do najnowszego badania nad podłożem genetycznym schizofrenii. W części pierwszej, Neurobigos omawia ogólne znaczenie badania i stara się umieścić je w kontekście poprzednich badań. Poniżej część druga tej współpracy: o tym, czym są badania asocjacyjne, jak się je prowadzi, czemu służą, a czemu nie, oraz czemu badanie w Nature jest tak ważne.

Na początku tego roku grupa badaczy z londyńskiego King’s College doniosła na łamach periodyku Molecular Psychiatry, że udało im się zidentyfikować gen, który odpowiada za inteligencję. Badacze odkryli, że jedna z wielu wersji pewnego genu była skorelowana z cieniejącą korą mózgu w lewej półkuli mózgowej. Okazuje się, że ten wariant oddziałuje z innym genem kodujących białko obecne w błonie komórkowej neuronów. Obecność tego wariantu u dzieci (w badaniu wzięło udział nieco ponad 1,500 uczestników) w większym lub mniejszym stopniu związana była z niewerbalnym IQ oraz, minimalnie, z werbalnym IQ.

Nie jest to pierwsze, i z całą pewnością nie ostatnie, badania próbujące odkryć geny odpowiedzialne za inteligencję. Nie ma w tym nic dziwnego – jest raczej zrozumiałym, bardzo ludzkim odruchem, marzenie nie tylko o znalezieniu źródła inteligencji, ale także o zdobyciu nad nim kontroli. Jest też takie podejście cudownie deterministyczne i całkowicie błędne.

Podobnie jak wiele innych ulotnych cech, inteligencja – jak pokazała inna grupa badaczy w tym samym piśmie zaledwie kilka lat temu – nie jest definiowana przez jeden tylko gen. Autorzy tego badania dość kategorycznie wnioskują: znakomita większość różnic w ludzkiej inteligencji ma podłoże genetyczne, wpływ ten jednak jest wynikiem addytywnego działania wielu genów, z których każdy ma tylko minimalny wpływ.

Oba te badania oparte były na eksperymencie nazywanym badaniem asocjacyjnym – w drugim przypadku było to badanie asocjacyjne całego genomu (z ang. GWAS – genome-wide association study). I właśnie o GWAS chciałbym dzisiaj powiedzieć nieco więcej.

GWAS: z czym to się je?

Zacznijmy od tego, ile wspólnego ma mój i Twój, drogi Czytelniku, genom. Wspólnego ma zapewne więcej niż różnic. Jednak to właśnie różnice odpowiadają za różnorodność kształtów i charakterów. Znakomita większość tych rozbieżności to różnice na poziomie pojedynczych nukleotydów (których nasz genom ma jakieś trzy miliardy). Te pozycje w genomie, które różnią się między ludźmi, nazywa się poetycko polimorfizmami pojedynczych nukleotydów (z ang. SNP – single nucleotide polymorphism; wymawiany ‘snip’).

W zależności od tego, gdzie w genomie taki SNP się znajduje, może on być odpowiedzialny za różnice fenotypowe, poczynając od koloru włosów, poprzez cechy charakteru, aż po klątwę wyczuwania smaku mydła w kolendrze. Wiele różnych SNP odpowiada za różnego rodzaju stany chorobowe – zwiększając ryzyko zachorowania na cukrzycę, na choroby serca, na raka.

Gdybyśmy zatem potrafili powiązać SNP z konkretnym jego skutkiem, moglibyśmy wówczas na przykład lepiej projektować leki, które – zamiast działać jak nalot dywanowy – atakowałyby specyficzne miejsce w genomie. To właśnie robią GWAS – znajdują takie powiązanie.

GWAS na wielką skalę zaczęto robić dopiero w okolicach roku 2000. Stało się to dzięki szybkiemu rozwojowi metod pozwalających na badanie wielu tysięcy SNP w jednym eksperymencie. Problemem jednak jest częstość występowania takich polimorfizmów. Jest ona niewielka, więc żeby odkryć takie powiązanie – i uzyskać sygnał dość silny by wybił się ponad szum, próba badanych musi być spora. I tutaj nasza cudna olbrzymia genetyczna różnorodność jako gatunku staje się przekleństwem: bo i szum jest duży.

Tzw. Manhattan plot, za pomocą którego ilustruje się wyniki badań asocjacyjnych. /Przedruk z Tore et al., PLoS Genet (2011) 7(1): e1001281
Tzw. Manhattan plot, za pomocą którego ilustruje się wyniki badań asocjacyjnych. /Przedruk z Tore et al., PLoS Genet (2011) 7(1): e1001281

Dlatego też dobry GWAS jest badaniem epidemiologicznym, prowadzonym na bardzo dużej populacji. Badanie wygląda następująco: tworzy się dwie grupy badanych. Jedna wyodrębniona jest pod kątem cechy, którą badamy. Mogą to być osoby chore na jakąś rzadką (lub nie) chorobę. Mogą to być osoby otyłe, anorektyczne, ciemnoskóre, jasnowłose, z określoną grupą krwi, z określoną cechą charakteru. Ba, można nawet próbować dobierać tę grupę pod kątem przekonań politycznych. Druga grupa jest grupą kontrolną. Porównanie tych grup pokazuje, które SNP występują znacznie częściej w głównej grupie w porównaniu do reszty populacji.

Gdzie jest haczyk? Haczyk tkwi w tym, jakiego rozmiaru muszą być te grupy, aby badanie dało jakikolwiek wymierny, statystycznie znaczący rezultat (a należy pamiętać, że statystycznie znaczący wcale nie musi oznaczać, że wynik ma jakiekolwiek znaczenie biologiczne). Pierwsze badanie, o którym wspomniałem w tym wpisie, badało 1,500 osób. Większość GWAS w grupie głównej ma co najmniej kilka tysięcy osób. A im bardziej złożona cecha, którą badamy, im większa szansa, że odpowiada za nią wiele różnych genów i wiele różnych polimorfizmów decyduje o jej różnorodności, tym większa musi być próba. W 2011 roku Nature opublikowało badanie poszukujące SNP odpowiedzialnych za regulację ciśnienia krwi oraz za ryzyko chorób układu krążenia. Do badania rekrutowano, bagatela, 200,000 osób.

A wielkość próby to niestety nie jedyny problem.

Od asocjacji do związku przyczynowo-skutkowego

Badania asocjacyjne mają bowiem to do siebie, że – z definicji – znajdują asocjacje, czyli związki zdefiniowane czysto statystycznie. Może więc taki GWAS wykazać, że polimorfizm rs12425791 jest związany z ryzykiem wylewu. Nie oznacza to jednak, że ten wariant wylew powoduje. Może po prostu być związany z innym elementem układanki, który za ryzyko wylewu jest rzeczywiście odpowiedzialny.

Innymi słowy badanie GWAS jest jak Hercules Poirot zbierający wszystkich bohaterów przed kominkiem w salonie wiejskiej rezydencji. Pokazuje w ten sposób czytelnikowi, kto znalazł się na liście podejrzanych. Jednak bycie podejrzanym, a bycie winnym, to dwie zupełnie różne rzeczy. Dopiero dalsze badania tzw. funkcjonalne na tych zidentyfikowanych polimorfizmach mogą dostarczyć dowodów na związek przyczynowo skutkowy. Dopiero te późniejsze badania są odpowiednikiem odkrycia narzędzia zbrodni w schowanej w ogrodowej szopie walizce.

Case study – taniej i łatwiej jest badać… psy

W związku z wymaganą wielkością próby, badanie GWAS nie jest tanie. Załóżmy, że standardowy mikroczip, na którym wykonuje się analizę jednej próbki, kosztuje około $500. Zatem koszt nawet względnie małego badania, w którym obie grupy – badana i kontrolna – mają w sumie 10,000 osób, to wciąż 5 milionów dolarów. Dodajmy, że jest to sam koszt materiału – do tego dochodzą pensje badaczy, lekarzy, administracji, koszty produkcji danych i ich analizy. Część tych problemów obchodzi się obecnie stosując repozytoria danych zbierające wyniki genotypowania ludzi w ramach różnych projektów. Wraz z wynikami eksperymentu, takie bazy danych zawierają też informacje na temat różnych aspektów zdrowia, czy też innych parametrów, które mierzono. Dzięki temu przyszli badacze mogą wykorzystywać już istniejące dane do szukania nowych powiązań.

Są też jednak inne metody. W ciągu ostatniego roku Genome Biology opublikował dwie prace grupy Kerstin Lindblad-Toh, która zajmuje się genetyką kręgowców w ogólności, a psów w szczególności. A sprawa z psami ma się następująco: ponieważ od stuleci, czy nawet tysiącleci, uskuteczniamy na psach chów wsobny w celu pozyskania nowych, wyspecjalizowanych ras, w obrębie tychże ras osobniki są genetycznie niezwykle homogeniczne.

Ma to w badaniach asocjacyjnych niesamowitą zaletę: oznacza bowiem, że ten szum, którego w badaniach na ludziach praktycznie nie da się uniknąć, ani zlikwidować, jest w badaniach na psach znacznie, znacznie mniejszy, a co za tym idzie tam, gdzie do badań u ludzi potrzebna by była próba 20,000 osób, żeby znaleźć jakieś powiązanie, u psów wystarczy ich kilkaset.

Badania w Genome Biology pokazują potęgę tego podejścia. W pierwszym, opublikowanym w grudniu zeszłego roku, badacze szukali czynników ryzyka osteosarkomy. Osteosarkoma to bardzo agresywna forma nowotworu kości, charakteryzująca się wczesnymi przerzutami, tym że atakuje przede wszystkim dzieci i młodzież oraz niemałą śmiertelnością na poziomie 30-40%. U psów choroba pojawia się spontanicznie, a niektóre rasy, np. charty Greyhound, są na nią bardzo podatne. Kerstin Lindblad-Toh przeprowadziła badanie asocjacyjne, w którym wzięło udział około 700 psów, i odkryła 33 snipy związane z ryzykiem występowania tej choroby.

Osobiście bardzo lubię to badanie z innego powodu: badacze bowiem nie poprzestali na zrobieniu GWAS, ale w toku dalszych badań zawęzili grupę podejrzanych do jednego polimorfizmu znajdującego się blisko genu CDKN2A/B, o którym wiemy, że jest związany z ryzykiem różnych innych chorób nowotworowych. Aby potwierdzić, że ten polimorfizm ma funkcję wzmacniającą (ang. enhancer) w stosunku do tego genu, przeprowadzili dalsze eksperymenty na ludzkiej linii komórkowej, będącej modelem osteosarkomy (i rzeczywiście potwierdzili to odkrycie). Oczywiście od tego badania, do pokazania tej samej zależności – i potwierdzenia, że związek jest przyczynowo-skutkowy – jeszcze daleka droga, ale już sama demonstracja tego samego u psów, które są znakomitym modelem wielu ludzkich chorób, jest sporym wyczynem.

Drugie badanie ukazało się w marcu i opierało się na tym samym schemacie. Znacznie ciekawszy, z punktu widzenia laika przynajmniej, był temat badania. Tym razem autorzy szukali bowiem powiązań genetycznych z zaburzeniami obsesyjno-kompulsywnymi (ang. OCD – obsessive-compulsive disorder). Także tutaj udało im się zidentyfikować kilka genów, w obrębie których znajdowały się snipy związane z większym ryzykiem występowania OCD. Pokazali też, że obecność tych właśnie wariantów prowadzi do znacznych zmian w ekspresji genów w ludzkiej linii komórkowej będącej modelem komórek nerwowych.

Pies wykazujący objawy OCD. Przedruk z Karlsson et al., Genome Biology (2014) 15(3):R25 (CC BY)
Pies wykazujący objawy OCD. Przedruk z Karlsson et al., Genome Biology (2014) 15(3):R25 (CC BY)

Ponownie dodać należy, że daleka stąd droga do stwierdzenia czy i w jakim stopniu te warianty odpowiadają za OCD u ludzi, ale oznacza to też, że możemy skupić się właśnie na tych kilku genach i zacząć szukać leków opartych na interakcji z tymi genami, zamiast przeczesywać tysiące innych możliwości u dziesiątek tysięcy ludzi.

Mentalne asocjacje

Wcześniej wspomniałem, że badania asocjacyjne są tym trudniejsze, im bardziej skomplikowany fenomen badamy. Nie powinno zatem być zaskoczeniem, że jednymi z trudniejszych – do przeprowadzenia, do uzyskania jakichkolwiek znaczących wyników i wreszcie do interpretacji – są badania dotyczące jakichkolwiek aspektów działania ludzkiego mózgu. Czy mówimy o inteligencji, o zaburzeniach obsesyjno-kompulsywnych, o tendencjach samobójczych, czy wreszcie o groźnych schorzeniach psychicznych, takich choroba bipolarna czy schizofrenia, badania asocjacyjne są w takich przypadkach po prostu niezwykle trudne.

W tym tygodniu Nature uraczył nas jednak jednym takim badaniem dotyczącym właśnie schizofrenii. W tym gigantycznym badaniu udział wzięło ponad 35 tysięcy pacjentów oraz ponad 110 tysięcy osób w grupie kontrolnej. Autorom udało się zidentyfikować 128 związków dotyczących 108 lokalizacji w naszym genomie, z których ponad 80 nie było wcześniej znanych. Wiele z tych związków dotyczyło genów, które odgrywają ważną rolę w mózgu. Chociaż świadczy to oczywiście na korzyść tych związków, wciąż jednak nie potwierdza związku kauzalnego.

Czy jest się czym zachwycać? Zapewne tak, chociaż osoby poszukujące definitywnych odpowiedzi będą na pewno zawiedzione. Ale podkreślałem w tym wpisie wielokrotnie, że GWAS nie jest odpowiedzią – a tylko skutecznym narzędziem filtrującym, pozwalającym skupić dalsze badania (oraz fundusze) na najbardziej prawdopodobnych kandydatach do tytułu polimorfizmu roku.

6 Comments

Dodaj komentarz