Jak nie pisać publikacji naukowych

ENCODE

Ależ się ostatnimi czasy dzieje! A ja nie mam czasu, żeby o tym wszystkim pisać, nawet gdybym chciał1. W środę w piśmie Genome Biology and Evolution ukazała się jednak praca, na którą nikt nie powinien pozostać obojętny – chociaż to, z jakiego powodu nie powinniśmy pozostawać obojętni może się bardzo różnić. Zacznę jednak od krótkiego wstępu na temat projektu ENCODE, którego dotyczy wzmiankowana praca.

O projekcie ENCODE pisałem we wrześniu, kiedy Nature, Genome Biology oraz Genome Research opublikowały 30 publikacji stanowiących główny trzon prac opisujących, analizujących i interpretujących wyniki projektu. Podstawowym celem tego przedsięwzięcia było zidentyfikowanie funkcjonalnych elementów ludzkiego genomu. ENCODE padł niestety ofiarą potężnego hype’u, skutkiem którego większość pierwotnych doniesień prasowych (mnie także, ze wstydem się przyznam, wliczając) opisując wyniki mówiła o tym, że 80% ludzkiego DNA uważanego pierwotnie za „śmieciowe”, posiada jednak jakąś funkcję.

Chociaż członkowie konsorcjum próbowali te osiemdziesięcioprocentowe plotki szybko zdementować, wieść poszła w świat. Niemniej w ciągu kilku dni pojawiły się mniej lub bardziej przebijające się do mainstreamu sprostowania: wynikiem ENCODE było odkrycie, że 20% tzw. niekodującego DNA (czyli niekodującego białek) można przypisać jakąś funkcję, kolejne 60% zaś ulega transkrypcji (tzn. że DNA jest przepisywany na RNA), ale nie pełni żadnej znanej nam funkcji.

Przede wszystkim jednak ENCODE to nie 30 publikacji z analizami i interpretacjami. ENCODE w pierwszej kolejności był projektem generującym surowe dane. A wyprodukował ich ilość kosmiczną: a ponieważ wszystkie te dane są obecnie publicznie dostępne, dostarczyć one powinny materiału do analiz kolejnym pokoleniom badaczy – zwłaszcza tych, których po prostu nie stać na wyprodukowanie tych czy innych danych, bo potrzebny jest do tego horrendalnie drogi sprzęt lub jeszcze droższe odczynniki.

Nieco przerośnięty prasowy hype to najmniejszy z problemów badaczy związanych z ENCODE. W końcu publikacje obronią się same. Autorzy musieli jednak bronić się przed wieloma innymi krytycznymi komentarzami. Jednym z częściej powtarzanych jest ten o marnotrawieniu pieniędzy – na ENCODE przeznaczono w okolicach 300 milionów dolarów. Suma jest niebagatelna i z całą pewnością mogła być przeznaczona na wiele małych projektów.

Z drugiej strony jednak trudno oprzeć się wrażeniu, że do największych krytyków należą badacze, którzy się na ten kąsek po prostu nie załapali. Warto też te 300 milionów postawić w odpowiednim kontekście: kontekście na przykład Projektu Sekwencjonowania Ludzkiego Genomu, za który amerykańscy podatnicy zapłacili 3 miliardy dolarów, a który wygenerował ilość danych będącą promilem wyników ENCODE. I jak już wcześniej wspomniałem, z danych tych będziemy korzystać przez kolejne dekady (co przekłada się na wiele małych projektów, których nie trzeba będzie finansować właśnie dlatego, że dane już są, dostępne i publiczne).

Część krytyki spadającej na ENCODE dotyczy też technikaliów: tego jakie metody zastosowano, a także na jakich liniach komórkowych. Najwięcej jednak dyskusji toczy się wokół tego, jak ENCODE zdefiniował funkcjonalność. W skrócie, ENCODE definiuje posiadanie funkcji przez fragment genomu, jako posiadanie aktywności biochemicznej. Większość eksperymentów wchodzących w skład projektu polegało np. na sprawdzeniu, które fragmenty naszego DNA reagują z histonami (białkami w jądrach komórkowych, na które nawinięta jest chromatyna), albo które fragmenty DNA są zmodyfikowano poprzez tzw. metylację, czyli dodanie reszty metylowej do cytozyny. Innymi słowy: nie próbowano określać funkcji biologicznej tych fragmentów DNA, które wykazywały aktywność biochemiczną, a jedynie zakładano, że jakaś istnieje.

Jest to oczywiście z jednej strony definicja funkcjonalności dość liberalna; z drugiej jednak definiowanie funkcji DNA jest kwestią w dużej mierze opinii. Bo dla biochemika wyznacznikiem aktywności będzie właśnie aktywność biochemiczna. Biolog molekularny uzna fragment za funkcjonalny, jeśli będzie w stanie wykazać rolę danego fragmentu DNA na poziomie molekularnym – odkryć, że na przykład reguluje on pewne procesy. Zaś biolog ewolucyjny uzna odcinek DNA za funkcjonalny tylko, jeśli będzie w stanie wytłumaczyć jego potencjalną rolę w kontekście teorii ewolucji.

Być może jednak właśnie dlatego, że rozumienie funkcji zależy od kontekstu i od perspektywy, wzbudziła taka a nie inna definicja tak wiele emocji. A było emocji co nie miara, musicie mi uwierzyć na słowo2. Na tym polega jednaj urok nauki, że ludzie nie muszę się ze sobą zgadzać i póki stosują rzeczowe argumenty, mogą nawet z sensem dyskutować. Dyskutowania było oczywiście wiele, sporo jednak było też pieniaczenia – coś, co nie miałoby miejsca 10 lat, nie na taką skalę przynajmniej; dzisiaj jednak, gdy każdy może założyć bloga jednym kliknięciem myszki i od razu zacząć wylewać swoje mniej lub bardziej słuszne żale w internecie, o zajadłe, skropione jadem i przelewające się żółcią tyrady jest wyjątkowo łatwo.

ResearchBlogging.org

Sytuacja jednak powiedziałbym była pod jaką taką kontrolą, dopóki ta zjadliwość ograniczona była do internetu. Tu docieramy jednak do sedna, czyli do środowej publikacji Dana Graura i współpracowników3, która chociaż jest lekturą niezwykle, jak już wspomniałem, rozrywkową, jest jednak znakomitym przykładem tego, jak publikacji naukowej nie powinno się pisać4.

W skrócie: autorzy należą właśnie do grupy badaczy, którym chemiczna definicja funkcjonalności się nie podoba. Powołują się oni na definicję ewolucyjną. Żeby nie wdawać się w zawiłe szczegóły: według tej definicji funkcjonalne są tylko te fragmenty DNA, które są zachowane w obrębie gatunku, a także pomiędzy gatunkami. No bo jeśli coś jest funkcjonalne, to procesy ewolucyjne dopilnują, żebyśmy się tego przypadkiem nie pozbyli. I niektóre z najnowszych badań sugerują, że jedynie 5% ludzkiego genomu zachowuje podobieństwo do innych pokrewnych nam gatunków, zaś kolejne dodatkowe 5% zachowane jest w obrębie naszego własnego gatunku. Co to oznacza?

Otóż to oznaczałoby, że jedynie około 10% naszego genomu jest funkcjonalne – a nie 80%, jak według definicji ENCODE. Z tym że tutaj wiele rozbija się o definicje i o to, jak rozumiana jest funkcja, i gdyby autorzy ograniczyli się do dyskutowania tylko tego aspektu sprawy, to ten wpis nie miałby racji bytu. Autorzy jednak wdają się w długą, zbędną, obraźliwą polemikę, powołując się na źródła w postaci prasy nie tylko nierecenzowanej, ale po prostu nieakademickiej (nie wiem, w jaki sposób to, że Ziutek coś tam bąknął w wywiadzie dla New York Timesa, może być w ogóle brane pod uwagę w pracy naukowej? Według autorów jednak może).

Nie będę tutaj przytaczał samej pracy poza jednym tylko przykładem. Przykładem, który owszem, jest nawet zabawny, gdy się go czyta, ale nijak się ma do tego, jak prowadzony powinien być dyskurs naukowy. Graur ze współpracownikami piszą tak:

Czego zatem dowiedzieliśmy się z wysiłków 442 badaczy, których praca pochłonęła 288 milionów dolarów? Według Erica Landera, jednego z luminarzy Projektu Sekwencjonowania Ludzkiego genomu, ENCODE to „Google Maps ludzkiego genomu”. Ośmielamy się mieć inne zdanie, ENCODE jest zdecydowanie gorszy niż nawet Apple Maps. […] Wysoko-przepustowa genomika oraz scentralizowane finansowanie nauki umożliwiły Wielkiej Nauce [Big Science] produkowanie na pęczki  „wysokiej jakości wyników fałszywie dodatnich”. Ci, którzy związani są z Wielką Nauką powinni pamiętać tę przygnębiająco prawdziwą maksymę: „Jeśli coś jest zbyt piękne, by było prawdziwe, to prawdopodobnie tak właśnie jest”.

Nie potrafię zrozumieć, czemu ma służyć ten poniżający ton wypowiedzi; nie rozumiem tych kolejnych odwołań do Wielkiej Nauki (chodzi o duże konsorcja naukowe, które zazwyczaj zgarniają też spore granty – ale z drugiej strony często odwalają kawał niesamowicie dobrej roboty), trudno oprzeć się wrażeniu, że przez autorów przemawia frustracja osób, które po prostu na grant się nie załapały. Nie rozumiem tego retorycznego pytania, które próbuje nam wmówić, że 300 milionów i praca prawie pół tysiąca osób przez 10 lat nie przyniosła nam żadnych efektów – o tym, jakie efekty przede wszystkich przyniosła wspominałem już wcześniej.

Dan Graur od samego początku należał do zajadłych przeciwników ENCODE. Wciąż jednak nie tłumaczy to tej publikacji. Czytając ją w piątek w redakcji nie mogliśmy też wyjść z podziwu, że po pierwsze, jakikolwiek redaktor zaakceptował tę pracę w obecnej formie, a po drugie, że dział prawny wydawnictwa nie położył na niej kreski, ponieważ jej zawartość nie tyle graniczy z pomówieniem, co się na polu pomówienia dość swobodnie rozpasa. Niejakim wyjaśnieniem jest być może to, że Dan Graur należy do akademickich redaktorów pisma – bo chociaż nie powinno to mieć wpływu na akceptację pracy, często niestety ma.

Można jednak powiedzieć na koniec, że Graurowi się upiekło: ma tę swoją publikację. Ci, którzy uważali go za mesjasza Małej Nauki tylko bardziej będą go teraz czcić. Cała reszta – jak do tej pory – będzie go po prostu traktować jak małostkowego i aroganckiego pieniacza, którym najwyraźniej jest. Jeśli jednak zdarzy się Wam kiedyś być w podobnej sytuacji: stojąc w opozycji do naukowego oponenta znacznie lepiej sytuowanego, wspieranego przez media i fundatorów badań, i będziecie chcieli głośno wyrazić swoje odmienne zdanie, radzę krótko: nie róbcie tego w ten sposób!

Bo Dan Graur i jego podobni cieszyć się będą krótkotrwałym zainteresowaniem. Media mainstreamowe  tematu ich pracy jednak w ogóle nie podchwycą, bo nie ma w niej nic specjalnie ciekawego, a to, co mogłoby być ciekawe ginie pod nawałem obelg. Inni badacze, jak powiedziałem, zapewne ich zignorują. Jedyne miejsce, w którym pył opadać będzie wolniej, to media społecznościowe, ale i tam prędzej czy później temat pójdzie w zapomnienie.

A ENCODE pojawiać się będzie w publikacjach powołujących się na te dane przez kolejne dekady. I nie ma lepszego sposobu, żeby dać się ludziom zapamiętać, niż dzieląc się tym niesamowitym źródłem wiedzy. Nikt w końcu nie pamięta Menojtiosa. Wszyscy zaś – Prometeusza.

Przypisy:

1. Z góry uprzedzę, że czytelnicza posucha będzie niedługo jeszcze większa: poza projektami niepisarskimi pracuję nad dużym projektem okołoblogowym (wspominaną przeze mnie kiedyś na fejsie niespodzianką, dlatego też więcej tutaj nie zdradzę), a w dodatku na początku marca jadę na tydzień na narty, więc ani tuż przed wyjazdem, ani w trakcie, ani zapewne przez co najmniej tydzień po nie będę się raczej udzielał na blogu. Tyle, ostrzec Was tylko chciałem.

2. Jeśli jednak nie wierzycie – wystarczy wygooglać „ENCODE + critique” lub coś w ten deseń. Lektury starczy Wam na następny miesiąc.

3. Graur, D., Zheng, Y., Price, N., Azevedo, R., Zufall, R., & Elhaik, E. (2013). On the immortality of television sets: „function” in the human genome according to the evolution-free gospel of ENCODE Genome Biology and Evolution DOI: 10.1093/gbe/evt028

4. Założę się, że myśleliście, że tytuł dotyczy prac ENCODE – nic z tych rzeczy. Osobiście nie mam tym pracom nic do zarzucenia, bo same publikacje – nie mówię o towarzyszącej „prasie” – stawiają sprawy jasno od samego początku.

5. Na sam koniec dodam – chociaż może nie powinienem zachęcać – że publikacja Graura jest dostępna za darmo, każdy może więc bez problemu rzucić na nią okiem.

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s