Welk deel van het menselijk genoom is functioneel?

by | mei 2, 2024 | Biologie, Genetica

Welk deel van het menselijk genoom is eigenlijk functioneel?

En hoeveel variatie kan het tolereren?

dna genoom

Dank aan: Zephyris, CC BY-SA 3.0, via Wikimedia Commons

Iedereen die zich heeft beziggehouden met de wetenschap van het genoom weet dat er nogal een controverse gaande is rondom de vraag: “Hoe groot is het deel van het genoom dat functioneel is?” De hypothese van het ‘Junk DNA‘ is al decennia lang het heersende paradigma. Recente ontdekkingen die de functionaliteit van niet coderende gebieden binnen het genoom belichten worden maar zeer langzaamaan geaccepteerd. Het is waar dat slechts ongeveer 2% van het genoom codeert voor proteïne, eiwitten. Het is ook waar dat een mutatie binnen dat coderende gebied veel waarschijnlijker zichtbare effecten heeft.

Maar het is ook waar dat het meeste van het onderzoek aan het genoom plaatsvindt op het RNA niveau, niet op het proteïne niveau. Het overgrote gedeelte van het genoom wordt overgezet naar RNA, en dat RNA wordt vervolgens gebruikt om een veelvoud aan functies binnen de cel te besturen. Slechts een klein deel daarvan is betrokken bij de aanmaak van proteïne. Komt dit omdat het genoom veel parasitisch DNA bevat? Dat wil zeggen: functieloos DNA dat alleen maar bewaard wordt omdat het zichzelf kan vermenigvuldigen. Natuurlijk zou dat vanuit creationistisch oogpunt nergens op slaan, maar binnen een evolutionistisch standpunt is dat ook niet echt te begrijpen. Hoe zou het kunnen dat de meeste RNA die wordt aangemaakt niets doet? Erger nog, zou een enorme productie van nutteloos RNA niet een verspilling zijn van kostbare grondstoffen? Zou natuurlijke selectie niet constant het genoom verbeteren door parasiterende rommel te verwijderen?

Het antwoord op deze vraag heeft lang op zich laten wachten. Het was geen kleinigheid om uit te vinden hoeveel van het genoom functioneel is, en we weten nog steeds niet alles. Maar het is ook niet zo dat we helemaal niets weten; genetici hebben zo hun manieren om functionaliteit te beoordelen:

  • De klassieke benadering van evolutionistische wetenschappers was om te zoeken naar regionen binnen het genoom die gedeeld worden door in de verte aan elkaar verwante soorten. Hun redenering was dat als iets al zo lang hetzelfde is gebleven, het wel belangrijk moet zijn. Dit wordt wel de ‘fylogenetische’ methode genoemd. Het is een krachtig gereedschap in de handen van de evolutionistische gemeenschap geweest om mensen ervan te overtuigen dat evolutie waar is. Er zijn beperkingen aan hun redenering, waarover verderop meer, maar kort gezegd: gedeelde DNA elementen kunnen vaak rustig verwijderd worden in voorbeeld organismen, zonder enige of bijna geen merkbaar effect. Als iets verwijderd kan worden, hoe kan iemand dan beweren dat het wel functioneel moet zijn?
  • Een andere manier om functionaliteit in te schatten is door DNA en ziekteverschijnselen te onderzoeken. Dit wordt tegenwoordig vaak gedaan met gebruik van machine learning. Deze genoomwijde associatie studies (GWAS) zijn gebruikt om specifieke mutaties met specifieke ziekten in verband te brengen. Het is geen verrassing dat de meeste ziekteveroorzakende mutaties gevonden werden binnen de regio’s die coderen voor proteïne. Toch zijn GWAS er vaak niet in geslaagd om een specifieke genetische factor te identificeren. We weten nu dat veel eigenschappen worden veroorzaakt door een combinatie van samenwerkende genen. Ook weten we dat er kerngezonde mensen rondlopen die genen bij zich dragen die andere mensen fataal werden, en dat veel ziekten worden veroorzaakt door mutaties binnen de niet coderende gebieden van het genoom.
  • Nog een andere methode is om te kijken naar verschillende gebieden binnen het genoom om te zien welke afwijken van een of ander te verwachten patroon. Toegegeven, het patroon dat iemand verwacht te zien is sterk afhankelijk van een overkoepelend model, maar deze benadering lijkt ten minste redelijk. Ga maar na, het genoom bestaat uit slechts vier letters. De A en de T vormen zo’n 60% ervan en de C en de G nemen de overige 40% voor hun rekening. Wanneer we gebieden ontdekken die van dit basale patroon afwijken dan kunnen we daaruit veel opmaken (proteïne aanmakende genen zijn doorgaans rijk aan GC). Zo ook wanneer we een stuk DNA vinden dat maar weinig variatie toont van persoon tot persoon, kunnen we daaruit opmaken dat dit deel extreem belangrijk is en dat mutaties in die regio met grotere waarschijnlijkheid schadelijke gevolgen voor het individu hebben.

Deze laatste methode om functionele grenzen te identificeren is vergelijkbaar met een inmiddels beroemd verhaal uit de Tweede Wereldoorlog. In 1943 bestudeerden de Geallieerden1 de kogelgaten in vliegtuigen die terugkwamen op de basis. Er ontstond zo een duidelijk patroon, wat in eerste instantie het idee gaf om die gebieden te versterken die meer kans hadden om door kogels geraakt te worden. Totdat iemand zich realiseerde dat het omgekeerde het geval was. De gebieden waar geen kogels in zaten waren de meest vitale delen van het vliegtuig. De reden dat ze bijna nooit vliegtuigen zagen met gaten op die plekken was omdat maar weinig vliegtuigen die daar getroffen werden daadwerkelijk terugkeerden naar basis. Dit heet het overlever effect (survivor bias).

Dank aan: Martin Grandjean (vector), McGeddon (picture), Cameron Moll (concept)

vliegtuig functioneel

Een illustratie van het overlever effect. Deze theoretische reconstructie is gebaseerd op een ongeïllustreerd rapport opgesteld door Abraham Wald in 1943. Afgebeeld is een Lockheed PV-1 Ventura. Als een kritiek gen muteert, dan sterft de cel. Maar dat een of ander gen kan muteren, betekent nog niet dat het geen functie heeft. Dit is een belangrijk onderscheid om in gedachten te houden.

Het zoeken naar gebieden binnen het genoom die minder variatie hebben dan verwacht kan ons zeggen dat deze gebieden belangrijker zijn dan anderen. Wat het ons echter niet kan zeggen is dat de rest dan niet belangrijk is. De specifieke vorm van bijvoorbeeld een hoogteroer op een klein vliegtuigje is misschien niet van kritiek belang, maar de aanwezigheid daarvan toch zeker wel. Een piloot kan handmatig aanpassen aan verschillende vliegomstandigheden, maar zonder iets dat ook maar lijkt op een functioneel hoogteroer is het onmogelijk om de op- en neer beweging van het vliegtuig te besturen. Als een kritiek gen muteert, dan sterft de cel. Maar dat een of ander gen kan muteren, betekent nog niet dat het geen functie heeft. Dit is een belangrijk onderscheid om in gedachten te houden.

Het beoordelen van functionaliteit

Tot voor kort hadden we nog niet veel gegevens om mee te werken. De eerste schets van het menselijk genoom werd pas in 2001 voltooid. En hoewel bedrijven die genetische tests doen miljoenen monsters hebben verzameld, die informatie is zowel privé als onvolledig. Wat we nodig hebben zijn volledige data van hoge kwaliteit. Dan kunnen we gaan kijken welke delen van het menselijk genoom per persoon verschillen en welke niet. En pas dan kunnen we mogelijk een mutatiemodel loslaten op de data om te zien welke plaatsen significant afwijken van dat wat we zouden verwachten. Er zijn echter nog een aantal andere uitdagingen. Een voorbeeld is het feit dat proteïnecoderende gebieden in grote mate oververtegenwoordigd zijn onder de bekende genen die onderhevig zijn aan reinigende selectie2, en de mutatie snelheid binnen het niet-coderende gebied is niet consistent. We hebben dus een heleboel gegevens van genomen van goede kwaliteit nodig en een vernuftig mutatiemodel om zulke onderzoeken te kunnen uitvoeren.

Dat is precies wat het Genome Aggregation Database Consortium heeft gedaan. In een rapport waaraan meer dan 200 auteurs hebben gewerkt doen Chen e.a. verslag van een gecomputeriseerd systeem voor het identificeren van functionele gebieden van het genoom.3 Ze noemen het GNOCCI en gebruikten het om een genoomwijde kaart te maken van wat voor de mens noodzakelijk is. ‘Noodzakelijk’ [Engels: ‘constraint’] is een mate van veranderbaarheid. De onderzoekers werkten onder de redelijke aanname dat gebieden met significant minder mutaties dan verwacht, functioneel moeten zijn.

Ze begonnen met meer dan 150.000 genomen en selecteerden die met de hoogste kwaliteitscore. Dat leverde meer dan 76.000 genomen van mensen van hoge kwaliteit op. Vervolgens werden 644 miljoen plaatsen (van de 3.1 miljard letters) in het genoom waar variatie is vastgesteld. Dat komt neer op één variant voor elke 5 letters en één variant voor elke 8 letters na het verwijderen van die het meest voorkomen.

Toen ze eenmaal deze kaart hadden konden ze beginnen met het identificeren van de afgebakende gebieden, door het toepassen van een vernuftig mutatiemodel. Dit is wat ze zeiden:

Een belangrijke uitdaging bij het kwantificeren van wat onmisbaar is in niet-coderende gebieden is het maken van een schatting van de werkelijke basale mutatiesnelheid. Deze kan worden beïnvloed door verschillende genomische fenomenen, die potentieel op verschillende niveaus opereren.

Hun nieuwe mutatiemodel houdt rekening met elke drieletterige trinucleotide, de locatie van en de hoeveelheid methylatie in verschillende gebieden van het genoom,4 en ‘regionale genomische kenmerken’. De onderzoekers verdeelden het genoom in een grote hoeveelheid niet-overlappende ‘bakken’ van 100-basenparen. Daarna gebruikten ze het model om een voorspelling te maken van het te verwachten niveau van variatie, binnen elke ‘bak’, onder neutrale omstandigheden (dat wil zeggen: er is geen selectie aanwezig.) Dat leverde een consistent signaal op: er bestaat een grotere kans dat de coderende gebieden minder variatie vertoonden (zelfs paren die slechts een enkele coderende nucleotide bevatten). Deze gebieden vertonen een grotere waarschijnlijkheid om “af te wijken van neutraliteit” en zijn “meer begrensd”. De onderzoekers schreven:

Zoals verwacht is de gemiddelde begrenzing voor proteïne aanmakende sequenties sterker dan voor niet-coderende gebieden.

Binnen de niet coderende gebieden van het genoom vonden ze veel “ingeperkte” gebieden. Deze waren verrijkt omwille van bekende regulerende elementen. Met andere woorden: we wisten al iets van de vele belangrijke stukjes binnenin het niet coderende DNA. Maar de onderzoekers hebben ook vastgesteld dat het waarschijnlijk is dat de meest noodzakelijke gebieden van het niet coderende DNA iets te maken hebben met de meer essentiële proteïne aanmakende genen.

Details voor nerds: slechts een kleine fractie van de niet-coderende paren (3.9%) kwam in de buurt van de gemiddelde score van de coderende paren. De allerkleinste fractie van niet-coderende ruimte (0.05%) bleek net zo beperkt als de meest beperkte proteïne producerende gebieden. Men vond dat cis-regulerende elementen significant verrijkt waren in de meest geconserveerde gebieden. Andere significante gebieden waren genpromotors en -versterkers, waarvan respectievelijk 10.2% en 6.3%, onder net zoveel beperking stonden als het gemiddelde proteïne producerende pair. Een veel hoger percentage van sterke beperking (22.2%) werd gevonden in microRNA genen. Slechts 3.7% van de lange niet coderende RNA genen was sterk beperkt, ondanks het feit dat velen daarvan de vorm van proteïne producerende genen hebben, en ondanks het feit dat ze actief getranscribeerd en om en om gesplitst worden.

Toen ze hun aandacht richtten op genetische varianten waarvan bekend is dat die een uitwerking hebben (zoals ziekte veroorzakende mutaties), wisten ze 13.000 bekende eigenschapparen te vinden, plus nog eens 164 die voorheen onbekend waren.

Het falen van de fylogenese

Door hun werk te vergelijken met op fylogenese gebaseerde benaderingen ontdekten ze dat conservatiescores een zwakke correlatie met noodzakeljkheid hebben. Dit is een geweldig resultaat! Dit laat zien dat gedeelde overeenkomsten niets te maken hebben met evolutie en dat al die decennia van speculatie niets meer dan gebakken lucht blijkt te zijn.

[Het nieuwe onderzoek] laat zien dat gedeelde overeenkomsten niets te maken hebben met evolutie en dat al die decennia van speculatie niets meer dan gebakken lucht blijkt te zijn.

Lage sequentiespecificiteit of non-functionaliteit?

Hoe functioneel is de muur van jouw huis? In zekere zin is die zeer functioneel. Tijdens de zomer houdt het de hitte buiten en tijdens de winter de kou. Ook houdt de muur het dak omhoog. Het voorkomt dat je buren je kunnen zien terwijl je slaapt. Oké, maar is de dikte van de muur belangrijk? En de kleur? Hoe zit het met het aantal ramen? Een structureel element kan een hoge graad van aanpassingsmogelijkheid hebben en toch zijn hoofdzakelijke functie(s) uitoefenen.

Dit is ook waar voor de verschillende ontworpen eigenschappen van ons genoom. Er zijn bepaalde gebieden waar variatie simpelweg niet getolereerd wordt. Andere delen laten juist een veelheid aan variatie zien. Er zijn stukken DNA die niet aangeraakt mogen worden en er zijn stukken die als enige doel hebben om de belangrijke delen te ondersteunen. Zoiets als een opbergstelling. Ik leg het je uit. Het genoom is een vierdimensionale entiteit. De lineaire DNA strengen (chromosomen) coderen voor een uitgebreid, tweedimensionaal interactienetwerk, maar ze vouwen zich ook op in driedimensionale vormen die door de tijd heen veranderen (de vierde dimensie). Maar aangezien verschillende genen ontworpen zijn om samen te werken, kom je ze meestal samen tegen. Niet langs dezelfde chromosoom, maar in 3-D ruimte, nadat de chromosomen in positie zijn gevouwen. Een zeer grote fractie van het genoom bestaat dus enkel om de genen op hun plaats te houden. Veel van deze gebieden mogen gerust muteren, maar ze zijn zeker van belang.

Het genoom kent korte secties die de neiging hebben om de verkeerde kant op te draaien. Deze kunnen dan een onregelmatige linkshandige helix vormen, het zogenaamde Z-DNA, in plaats van de klassieke rechtshandige dubbele helix. Recente analyses hebben aangetoond dat kanker veroorzakende mutaties vaak gevonden worden binnen Z-DNA. Z-DNA treft men meestal even verderop ten opzichte van proteïne producerende genen. Het is betrokken bij het natuurlijke immuunsysteem. We produceren ten minste één proteïne (zbp1) die is ontworpen om zich te binden aan DNA in deze Z vorm.5 Iets minder dan 1% van het genoom kan deze vorm aannemen. Deze gebieden kunnen misschien geen proteïne aanmaken, en de exacte sequentie is misschien niet van kritiek belang (behalve in het geval van die letters die bij verandering kanker kunnen veroorzaken), maar ze zijn nog steeds bijzonder functioneel.

Neem eens de functie van de overvloedige niet-coderende RNAs die door onze cellen geproduceerd worden. Aangezien ze geen proteïne aanmaken wordt deze specifieke begrenzing weggenomen. En toch, ook al wordt deze RNA sequentie niet sterk begrensd, het doet zo veel dingen in de cel dat het moeilijk is om ze allemaal op te noemen.6 Sommige RNAs vouwen tot een structuur die bijvoorbeeld wordt gebruikt voor de ribosoom (de machine die boodschapper RNA vertaalt naar proteïnen). Sommigen doen dienst als een brug tussen mRNA en proteïnen (transfer RNAs). Anderen zijn van belang voor het omvormen van chromatine7. Weer anderen dienen als gen regulatoren (versterkers en onderdrukkers van transcriptie, oftewel het proces van RNA uit DNA maken).

Een van de belangrijkste rollen die is weggelegd voor niet-coderende RNA is het reguleren van proteïne synthese. Ze kunnen de transcriptie reguleren door zich aan het DNA te hechten op een complementaire sequentie (bijvoorbeeld de functionele tegenhanger van een pseudogen). Dit voorkomt de transcriptie van DNA naar boodschapper RNA, waardoor de proteïne dus niet kan worden aangemaakt. Ze kunnen ook de vertaling reguleren door ofwel te hechten aan een complementair RNA (om zo de vertaling naar een proteïne te verijdelen), of door toe te staan dat het vertaalapparaat aan zich hecht (waardoor er strijd om de aandacht komt en de snelheid van het vertalen wordt vertraagd). Voor elk van deze gevallen geldt dat de exacte sequentie niet zoveel uitmaakt. Zelfs wanneer verschillende basenparen tussen het RNA en het doel DNA of RNA geen goede match vormen zullen de twee nog steeds uitlijnen en blijven plakken, zolang de sequentie maar lang genoeg is en voldoende basen wel bij elkaar passen. Hier hebben we dus een geval van ontzettend belangrijke functionaliteit, maar met flexibiliteit in de code. Het onderzoek van Chen e.a. was er niet op gericht om zulke dingen te detecteren.

Wat is het antwoord?

Hoe geweldig dit nieuwe onderzoek ook mag zijn, het heeft uiteindelijk alleen kunnen aanwijzen welke delen van het genoom niet vrij zijn om te muteren. Dat is slechts één maat van functionaliteit. Het onderzoek heeft ons niet kunnen zeggen hoe groot het functionele deel is, maar alleen welk deel sterk noodzakelijk is. Het zegt ons ook niet hoeveel mutatie er mag opbouwen voordat het genoom stopt met werken. De slotsom is dat we nog steeds niet weten hoeveel van het genoom functioneel is.

Ons ontwerp getuigt van de genialiteit van onze Schepper. Want hoe kan een blind systeem van toevallige fouten ooit zo’n complex systeem produceren? Een systeem dat zowel robuust is tegen fouten en zich kan aanpassen.

Gevechtsvliegtuigen uit de Tweede Wereldoorlog konden veel klappen verduren, zelfs onderdelen verliezen of gedeeltelijk met kogels doorzeefd worden, en toch voldoende intact blijven om weer naar huis te kunnen vliegen. Waarom? Omdat ze goed ontworpen waren. Zo is ook het menselijk genoom ontworpen om grote klappen op te vangen. De mensheid heeft miljoenen mutaties opgelopen (duizenden per individu, vele miljoenen verspreid over de bevolking) gedurende de afgelopen duizenden jaren, en toch leven we nog. In het hart van het systeem zit redundantie ingebouwd (we hebben twee kopieën van het genoom) en regelmatig kan de cel een kapot systeem vermijden door een alternatieve route te volgen.

We zijn veel ingewikkelder dan welke door de mens gemaakte machine. Ons ontwerp getuigt van de genialiteit van onze Schepper. Het ontwerp van het menselijk genoom, of welk genoom dan ook, pleit dan ook sterk tegen evolutie, want hoe kan een blind systeem van toevallige fouten ooit zo’n complex systeem produceren? Een systeem dat zowel robuust is tegen fouten en zich kan aanpassen. Het leven is niet van onder naar boven gemaakt, maar van boven naar onder. God is de schepper van het leven. Hij ontwierp alle onderdelen, bracht ze samen, vulde de cel met energie en ‘liet het gaan’. Sinds dat moment is het leven steeds draaiende gebleven.

Bronvermelding
Dit artikel is met toestemming overgenomen van Creation Ministries International, Robert Carter, What proportion of the human genome is actually functional?, publicatiedatum: 14 maart 2024.

Voetnoten

  1. De Geallieerden waren een coalitie van landen (voornamelijk het VK, de Sovjet Unie [Rusland + satelliet staten], China en de VS) die vochten tegen de As (voornamelijk Duitsland, Italië en Oostenrijk) tijdens de Tweede Wereldoorlog, die duurde van 1939 tot 1945.
  2. Beweringen van ‘selectie’ zijn vaak gestoeld op evolutionistische aannamen, waaronder grote tijdspannen. Terwijl er duidelijke gevallen zijn waarbij het overleven is gekoppeld aan variaties binnen een bepaald belangrijk gen. Dit is geen probleem vanuit een creationistisch perspectief. Maar er zijn twee vormen van selectie: reinigende en positieve. Reinigende selectie houdt in het verwijderen van slechte allelen; dat is waar dit artikel over gaat. Positieve selectie, de versterking van nieuwe mutaties, is zeldzamer, meer controversieel en ook belangrijker voor het Darwinisme.
  3. Chen, S., et al., A genomic mutational constraint map using variation in 76,156 human genomes, Nature 625:92–100, 2023.
  4. Methylatie is een soort van epigenetische markering die geen wijzigingen aanbrengt in de nucleotide sequentie zelf. Zie Carter, R.W., Darwin’s Lamarckism vindicated?, 1 Maart 2011.
  5. Brazil, R., More than a mirror-image: left-handed nucleic acids, chemistryworld.com, 5 Feb 2024.
  6. Zie bijvoorbeeld Kaikkonen, M.U., Lam, M.T.Y., en Glass, C.K., Non-coding RNAs as regulators of gene expression and epigenetics, Cardiovasc. Res. 90(3):430–440, 2011.
  7. Binnenin de celkern wordt het DNA rondom histoneiwitcomplexen gewikkeld. De combinatie van DNA + proteïne wordt chromatine genoemd.

Abonneer je op onze maandelijkse nieuwsbrief!