• Ei tuloksia

Progesteronin vaikutukset ihmisen siittiöiden geenien ilmentymiseen

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Progesteronin vaikutukset ihmisen siittiöiden geenien ilmentymiseen"

Copied!
48
0
0

Kokoteksti

(1)

PROGESTERONIN VAIKUTUKSET IHMISEN SIITTIÖIDEN GEENIEN ILMENTYMISEEN

ENNI LINNAVIRTA

Pro gradu -tutkielma Itä-Suomen yliopisto Ympäristö- ja biotieteiden laitos

Biologia 2021

(2)

ITÄ-SUOMEN YLIOPISTO

Ympäristö- ja biotieteiden laitos, biologia

LINNAVIRTA, ENNI: Progesteronin vaikutukset ihmisen siittiöiden geenien ilmentymiseen.

Pro gradu -tutkielma (40 op), 39 s., liitteitä 7 Joulukuu 2021

--- avainsanat: geenien ilmentyminen, progesteroni, siittiö, histonimuokkaus

TIIVISTELMÄ

Geenien ilmentymisen epigeneettisellä säätelyllä vaikutetaan geenien toimintaan muuttamatta DNA-sekvenssiä. Epigeneettiseen säätelyyn lukeutuvat erinäiset histonien muokkaukset, joiden avulla vaikutetaan DNA:n kondensoitumisasteeseen ja sitä kautta transkriptiotekijöiden sitoutumiseen. Tietynlaiset muokkaukset geenialueen histoneissa on havaittu liittyvän somaattisilla soluilla kyseisen geenin alueen aktiivisuuteen.

Kypsissä siittiöissä suurin osa histoneista, joiden ympärille DNA on kiertynyt, on korvattu protamiineilla kromatiinin tiiviimmän pakkauksen mahdollistamiseksi. Kromatiinin tiukemman pakkaamisen takia siittiöissä ei ole ajateltu tapahtuvan lainkaan RNA:n aktiivista tuotantoa. Kaikkia histoneita ei kuitenkaan korvata protamiineilla, vaan noin 15 prosenttia genomista säilyy histonien ympärille pakattuna. Nämä histonien ympärillä säilyneet väljemmät kromatiinin alueet voisivat siten mahdollistaa RNA:n tuotannon käynnistymisen somaattisten solujen tapaan.

Siittiöt tulevat hedelmöityskykyisiksi naisen lisääntymiselimistössä tapahtuvan kapasitaation kautta. Kapasitaatio aiheuttaa siittiöissä toiminnallisia muutoksia, joihin kuuluvat siittiöiden hyperaktivaatio, kemotaksia ja akrosomireaktio. Progesteronin tiedetään indusoivan kalsiumin sisään virtausta, joka saa aikaan siittiöiden kapasitaation ja hyperarktivaation. Sen aikaansaamien vasteiden nopeus viittaa kuitenkin sen vaikutukseen siittiön pinnalla eikä geenitasolla. Progesteronin geenitason vaikutuksia siittiöihin ei toistaiseksi tunneta.

Tässä pro gradu -tutkielmassa selvitettiin siittiöiden geenien ilmentymisessä tapahtuvia muutoksia progesteronikäsittelyn jälkeen ja arvioitiin mahdollisten muutosten vaikutusta siittiöiden hedelmöityskykyyn. Tavoitteena oli löytää geenit, joiden ilmentymisessä esiintyy merkittävä ero kontrolli- ja progesteronikäsiteltyjen siittiöiden välillä. Näytteissä havaittu DNA-kontaminaatio kuitenkin vääristi geenien ilmentymisarvoja.

Erilailla ilmentyvien geenien selvittämisen lisäksi tarkasteltiin kolmen epigeneettisen histonimuokkauksen sijoittumista geenien alueille. Tarkasteltavat muokkaukset olivat histoni H3:n asetylaatio (H3K27ac) ja kaksi eri metylaatiota (H3K4me1 ja H3K36me3), jotka somaattisissa soluissa on yhdistetty kyseisen geenialueen aktiivisuuteen. Lisäksi DNA- kontaminoituneiden näytteiden ilmentymisarvojen luotettavuutta arvioitiin vertaamalla niitä yhden miehen kontaminaatiovapaan näyteparin kanssa.

Viiden geenin ilmentymisessä havaittiin merkitsevä muutos progesteronikäsittelyn jälkeen, joista yhden geenin ilmentyminen lisääntyi ja neljän vähentyi. Histonimuokkauksista ainoastaan H3K36me3 havaittiin kahden geenin alueella, joiden ilmentyminen oli vähentynyt käsittelyn myötä. DNA-kontaminoituneiden ja kontaminaatiovapaiden näytteiden väliset korrelaatiokertoimet viittasivat vahvaan positiiviseen lineaariseen riippuvuuteen.

Kokonaisuutena saadut tulokset viittaavat progesteronin mahdollisiin geenitason vaikutuksiin siittiöissä ja tukevat oletusta siitä, etteivät siittiöt olisikaan välttämättä täysin inaktiivisia RNA:n tuotannon osalta. DNA-kontaminaatiosta johtuen saadut tulokset eivät kuitenkaan välttämättä edusta progesteronin todellisia vaikutuksia siittiöiden geenien ilmentymiseen.

(3)

UNIVERSITY OF EASTERN FINLAND

Department of Environmental and Biological Sciences, biology

LINNAVIRTA, ENNI: Effects of progesterone on sperm gene expression in humans MSc Thesis (40 cp), 39 pp., Appendices 7

December 2021

--- key words: gene expression, progesterone, spermatozoon, histone modification

ABSTRACT

The epigenetic regulation of gene expression affects gene function without altering the DNA sequence. The epigenetic regulation includes various histone modifications that affect the condensation state of DNA and, thus, the binding of transcription factors on DNA. Histones with certain type of modifications have been observed to be enriched at specific genomic regions with distinct activity state of somatic cells.

In mature spermatozoa the majority of DNA-binding histones have been replaced with protamines to promote more condense chromatin packaging. Due to the condensed chromatin state, spermatozoa have been thought to be transcriptionally inactive. However, all histones are not replaced with protamines, but approximately 15 percent of the genome remains bound around histones. Thus, chromatin regions with more relaxed nucleosomal configuration could enable transcription initiation as in somatic cells.

Spermatozoa gain their fertilization ability through capacitation that occurs in the female reproductive tract. Capacitation causes physiological changes in spermatozoa which include sperm hyperactivation, chemotaxis and acrosome reaction. Progesterone is known to induce calcium influx in sperm, which causes sperm capacitation and hyperactivation. The rapidity of the response that it induces, indicates that it acts via non-genomic signalling and not at the genomic level. The genomic effects of progesterone on spermatozoa have remained unknown.

In this Master Thesis project, changes in sperm gene expression as a response to progesterone treatment were studied and effects of possible changes on sperm fertilization ability were evaluated. The aim was to identify genes of which expression shows the most significant difference between control and progesterone-treated samples. However, the observed DNA contamination of samples biased gene counts.

In addition to finding differentially expressed genes, the presence of three epigenetic histone modifications across genomic regions were examined. The selected modifications were histone H3 acetylation (H3K27ac) and two different methylations (H3K4me1 and H3K36me3), which are associated with transcriptional activity in somatic cells. Furthermore, the reliability of counts of the DNA contaminated samples were evaluated by comparing them with one male’s non-contaminated sample pair.

The expression of five genes significantly changed as a response to progesterone treatment:

one gene’s expression was upregulated and other four’s downregulated. Of the histone modifications only H3K36me3 was observed at two genomic regions of two genes with downregulated expression. The correlation coefficients of DNA contaminated and non- contaminated samples indicated a strong positive linear correlation between samples. The results indicate to progesterone’s potential genomic effects on spermatozoa and support the assumption that spermatozoa would be transcriptionally active. However, due to the DNA contamination, the results do not necessarily represent the true effects of progesterone on sperm gene expression.

(4)

SISÄLLYSLUETTELO

1 JOHDANTO ... 4

2 GEENIEN ILMENTYMINEN JA SEN SÄÄTELY HISTONIMUOKKAUKSILLA ... 5

2.1 Geenien ilmentyminen ... 5

2.1.1 Geenien ilmentymisen säätely histonimuokkauksilla ... 6

2.1.2 Transkriptio ... 7

2.1.3 Translaatio ... 8

3 IHMISEN SIITTIÖT ... 9

3.1 Siittiöiden rakenne, kypsyminen ja fysiologiset muutokset ennen hedelmöitystä ... 9

3.2 Genomin pakkautuminen ja geenien ilmentyminen siittiöissä ... 10

3.3 Progesteroni ja sen fysiologiset vaikutukset siittiöihin ... 12

4 TAVOITTEET JA HYPOTEESIT ... 13

5 AINEISTO JA MENETELMÄT ... 13

5.1 Aineiston tarkastelu ... 14

5.2 DE-analyysi ... 18

5.3 Geeniontologian ja histonimuokkausten tarkastelu ... 21

5.4 DNA-kontaminoituneiden näytteiden ja kontaminaatiovapaan näyteparin väliset korrelaatiot ... 23

6 TULOKSET ... 24

6.1 Erilailla ilmentyneet geenit ja histonimuokkausten sijoittuminen ... 24

6.2 DNA-kontaminoituneiden ja kontaminaatiovapaiden näytteiden väliset korrelaatiot sekä erot DE-geenien ilmentymisarvoissa ... 27

7 TULOSTEN TARKASTELU ... 28

8 JOHTOPÄÄTÖKSET ... 33

KIITOKSET ... 34

LÄHDELUETTELO ... 34 LITTEET

(5)

4 1 JOHDANTO

Yleinen oletus on ollut, että kaikki terveet siittiöt ovat hedelmöityskyvyltään tasavertaisia (Alavioon ym. 2017). Tämän näkemyksen mukaan olisi siten samantekevää, mikä siittiö lopulta hedelmöittää munasolun. Yksilötasolla tapahtuva parinvalinta olisi tällöin päätekijä sopivimman lisääntymiskumppanin valinnassa. Viimeaikaiset tutkimustulokset ovat osoittaneet, että parinvalinta voi jatkua naisen lisääntymiselimistön ja siittiöiden välisen kemiallisen kommunikaation kautta (Fitzpatrick ym. 2020, Jokiniemi ym. 2020a, b). Tämä hedelmöityksen kannalta välttämätön viestintä munasolun ja siittiöiden välillä voisi tarjota naiselle mahdollisuuden harjoittaa niin sanottua naaraan piilovalintaa sopivimman siittiön valikoimiseksi munasolun hedelmöittämiseen (Kekäläinen & Evans 2018). Naaraan piilovalinnalla tarkoitetaan naaraan lisääntymiselimistössä tapahtuvaa seksuaalivalintaa, joka johtaa sukusolujen väliseen ei-satunnaiseen pariutumiseen (Firman ym. 2017). Naisella voisi siten olla piilovalinnan kautta mahdollisuus säädellä selektiivisesti siittiöiden geenien ilmentymistä ja sitä kautta niiden uintikäyttäytymistä.

Siittiöiden RNA:n on perinteisesti ajateltu olevan peräisin niiden kehityksen aikaisesta geenien ilmentymisestä (Ren ym. 2017). Somaattisissa soluissa genomi on pakkautunut histoniproteiinien ympärille, jotka kypsyvissä siittiöissä korvataan protamiineilla, joiden avulla genomi mahtuu pienempään tilaan (Miller ym. 2010, Alberts ym. 2015). Genomin pakkauksessa tapahtuvien muutosten takia siittiöitä on pidetty geenien ilmentymisen suhteen inaktiivisina soluina (Bailey 2010). Siittiöiden genomista noin 15 prosenttia säilyy kuitenkin histonien ympärille pakattuna, jolloin nämä väljemmät genomin alueet voisivat mahdollisesti toimia templaattina RNA:n tuotannolle (Hammoud ym. 2009, Das ym. 2013).

Geenien ilmentymistä säädellään proteiinien translaation jälkeisten muokkausten avulla (Sonenberg & Hinnebusch 2009). Muokkaukset, jotka vaikuttavat geenien toimintaan muuttamatta DNA-sekvenssiä, tunnetaan epigeneettisinä muokkauksina (Ioannou & Tempest 2018). Geenien ilmentymisen epigeneettiseen säätelyyn lukeutuvat erinäiset histonien muokkaukset, jotka vaikuttavat DNA:n kondensoitumisasteeseen (Kouzarides 2007).

Somaattisissa soluissa histonien sisältämät muokkaukset vaihtelevat geenin alueen aktiivisuuden mukaan (Kimura 2013).

Progesteroni on koko naisen lisääntymiselimistössä yleisimpänä esiintyvä steroidihormoni (Teves ym. 2006). Sen tiedetään indusoivan kalsiumin sisään virtausta siittiöiden pinnan CatSper-kanavien kautta, mikä stimuloi siittiöiden kapasitaatiota ja hyperaktivaatiota (Lishko ym. 2011, Tamburrino ym. 2020). Siittiöiden toiminnan säätely progesteronin kautta uskotaan

(6)

5

olevan muuten kuin geenien ilmentymisen kautta tapahtuvaa (Baldi ym. 2009). Progesteronin mahdollisia geenitason vaikutuksia siittiöihin ei toistaiseksi tunneta.

Tässä tutkielmassa selvitettiin progesteronin vaikutuksia siittiöiden geenien ilmentymiseen.

Tavoitteena oli löytää progesteronikäsittelyn vaikutuksesta mahdollisesti aktivoituvat ja inaktivoituvat geenit sekä tarkastella niiden biologista merkitystä siittiöiden hedelmöityskyvyn kannalta. Lisäksi tarkasteltiin kolmen epigeneettisen histonimuokkauksen sijoittumista näiden geenien alueille. Tarkastelun kohteena olivat histoni H3:n lysiinissä 36 oleva trimetylaatio (H3K36me3), lysiinissä 4 oleva monometylaatio (H3K4me1) ja lysiinissä 27 oleva asetylaatio (H3K27ac). Kaikki kolme muokkausta assosioituvat kyseisen geenin alueen aktiivisuuteen.

H3K36me3:n esiintyminen liitetään alueen aktiiviseen RNA:n tuotantoon ja H3K4me1 sekä H3K27ac paikantuvat ilmennettävää geeniä säätelevälle tehostaja-alueelle (Barski ym. 2007, Kimura 2013). Tavoitteena oli selvittää geenien alueilla mahdollisesti havaittujen muokkausten yhteys ilmentymisessä tapahtuviin muutoksiin.

2 GEENIEN ILMENTYMINEN JA SEN SÄÄTELY HISTONIMUOKKAUKSILLA

2.1 Geenien ilmentyminen

Kromatiinin rakenneyksikkö on nukleosomi, joka muodostuu 147:stä DNA:n emäsparista kiertyneenä 1,7 kierrosta oktameerisen ydinpartikkelin ympärille (Alberts ym. 2015).

Nukleosomit ovat sijoittuneet kromatiinille noin 160-200 emäsparin välein (Ventres & Pugh 2009). Nukleosomi sisältää kaksi kopiota jokaisesta neljästä oktameerin muodostavasta histonimolekyylistä H2A, H2B, H3 ja H4. Viides histonimolekyyli, H1, yhdistää vierekkäiset nukleosomit toisiinsa ja edistää siten kromatiinin tiiviimpää pakkausta (Govin ym. 2004).

Ihmisen genomista arviolta noin 1,5 prosenttia koodaa noin 22 000 geeniä (Ioannou &

Tempest 2018). Geenien ilmentämiseksi DNA:n sisältämä geneettinen informaatio on ensin kopioitava lähetti-RNA:ksi (mRNA), ennen kuin siitä voidaan tuottaa translaatiolla toiminnallinen proteiini (Alberts ym. 2015).

Geenien ilmentymisen epigeneettinen säätely tapahtuu usealla eri tasolla (Sonenberg &

Hinnebusch 2009): erinäisillä histonien translaation jälkeisillä muokkauksilla, DNA:n metylaatiolla ja ei-koodaavien RNA-molekyylien kautta (Miller ym. 2010). Epigeneettisen säätelyn avulla rajoitetaan tai edistetään transkriptiotekijöiden sitoutumista DNA:han, säätelemällä DNA:n kondensoitumisastetta. DNA:n metylaatiolla tarkoitetaan sytosiinin 5’- paikan peruutettavissa olevaa metylaatiota, joka muodostaa 5-metyyli-sytosiinin (Gibney &

(7)

6

Nolan 2010). DNA:n metylaatio yhdistetään usein metyloidulla alueella olevien geenien hiljentämiseen, mutta joissakin tapauksissa se voi myös edistää proteiinien sitoutumista DNA:han. Noin kolme prosenttia sytosiineista on metyloitu ihmisen DNA:ssa (Nafee ym.

2008). Ei-koodaavat RNA:t (ncRNA) sisältävät lukuisia lopetuskodoneita ja niiltä puuttuu laajalti avoimia lukukehyksiä eli translaatioon tarvittavia ohjeita (Biermann & Steger 2007).

ncRNA:t osallistuvat geenien ilmentymisen hiljentämiseen muokkaamalla kromatiinin järjestäytymistä tai vaikuttamalla mRNA:iden stabiiliuteen ja kontrolloimalla proteiinisynteesiä.

2.1.1 Geenien ilmentymisen säätely histonimuokkauksilla

Histonit eivät ainoastaan auta DNA:n pakkaamisessa, vaan osallistuvat myös geenien ilmentymisen säätelyyn (Bannister & Kouzarides 2011). Nukleosomeja muodostavilla histoneilla on niin kutsuttu häntä niiden N-terminaalisessa päässä, joka työntyy nukleosomin ulkopuolelle ja voi olla kontaktissa viereisiin nukleosomeihin. Histonien N-terminaalinen häntä on kohde useille translaation jälkeisille muokkauksille (Rathke ym. 2013). Nämä epigeneettiset muokkaukset sisältävät muun muassa histonien asetylaation, metylaation ja fosforylaation, joiden läsnäolosta seuraa kromatiinin avoimempi tai sulkeutuneempi tila. Jokaisella histonilla on useampi mahdollinen kohta muokkauksille (Govin ym. 2004). Histonien muokkaukset voivat vaikuttaa suoraan kromatiinin rakenteeseen, häiritä proteiinien sitoutumista tai edistää muita kuin histoniproteiineja sitoutumaan kromatiiniin (Kouzarides 2007).

Geenien aktiiviset promoottorialueet sisältävät usein muokattuja histoneita, mikä viittaa siihen, että jotkin muokkaukset voivat olla välttämättömiä transkription aloittamiseksi (Kimura 2013). Histonien asetylaatiolla on positiivinen vaikutus transkriptioon (Gibney & Nolan 2010).

Asetylaatio kohdistuu histonien lysiineihin, mikä neutralisoi niiden positiivisesti varautuneet sivuryhmät, heikentäen histonien sitoutumisen voimakkuutta DNA:han ja avaamalla siten kromatiinin rakennetta. Histonien metylaatio on ainoa muokkaus, joka ei muuta histonien kokonaisvarausta (Bannister & Kouzarides 2011). Metylaatio kohdistuu pääsääntöisesti lysiineihin ja arginiineihin. Lysiinit voidaan joko mono-, di- tai trimetyloida, kun taas arginiinit voidaan monometyloida tai dimetyloida symmetrisesti tai epäsymmetrisesti. Metylaation vaikutus transkriptioon voi olla joko negatiivinen tai positiivinen, riippuen metyloitavasta kohdasta ja metylaatioasteesta (Barski ym. 2007).

(8)

7 2.1.2 Transkriptio

Geenien ilmentymisen alussa DNA:n kaksoisjuosteeseen koodattu informaatio kopioidaan sitä vastaavaksi RNA-kopioksi, jota kutsutaan geenien transkriptioksi (Gibney & Nolan 2010).

RNA-molekyylien synteesistä vastaa RNA-polymeraasientsyymi (Han & He 2016). RNA- polymeraaseja on kolmea alatyyppiä, joista jokainen syntetisoi eri RNA-molekyylejä.

Polymeraasi I syntetisoi suurten ribosomaalisten RNA:iden (rRNA) esiasteita, polymeraasi II syntetisoi kaikkia mRNA:ita ja polymeraasi III katalysoi pieniä RNA:ita, kuten siirtäjä-RNA:ita (tRNA). RNA-polymeraasi II muodostuu kahdentoista alayksikön polymeraasista, joka syntetisoi RNA:ta ja oikolukee muodostuvaa transkriptiä (Boeger ym. 2005).

Transkription alussa aktivaattorit sitoutuvat geenin ilmentymisen aktivoivalle ei- koodaavalle DNA-alueelle, joka tunnetaan tehostaja-alueena (Panigrahi & O'Malley 2021).

Tehostaja-alueelle sitoutuneet aktivaattorit edistävät transkriptiokoneistoon kuuluvien tekijöiden sitoutumista promoottorialueelle (Li ym. 2007). Promoottorialue sisältää transkription aloituskohdan ja siitä noin 30-60 emäsparin päässä olevan TATA-laatikon (Ventres & Pugh 2009). Transkriptiokoneistoon kuuluvat tekijät tunnistavat promoottorialueen ja sitoutuvat TATA-laatikkoon (Han & He 2016). Vastaavat tekijät avaavat DNA:n kaksoiskierteen promoottorin kohdalta ja avustavat RNA-polymeraasi II sitoutumaan siihen aloituskompleksin muodostamista varten (Boeger ym. 2005, Wade & Struhl 2008).

Sitouduttuaan transkription aloituskohtaan RNA-polymeraasi II alkaa syntetisoimaan mRNA:ta, joka on komplementaarinen mallina käytettävälle DNA-juosteelle (Gibney & Nolan 2010). mRNA:n syntetisointi tapahtuu sen 5’-päästä kohti 3’-päätä, jolloin mallijuosteen lukeminen tapahtuu vastakkaiseen suuntaan (Alberts ym. 2015). RNA-polymeraasi II:n liikkuessa pois promoottorialueelta RNA siirtyy pitenemisvaiheeseen ja samalla irrottautuu transkriptiokoneistoon kuuluvista tekijöistä (Wade & Struhl 2008). RNA-polymeraasi II:n karboksyylipään fosforylointi siirtymävaiheessa johtaa osan transkriptiokoneistoon kuuluvien tekijöiden vaihtamiseen muihin tekijöihin, jotka ovat tärkeitä pitenemisen ja mRNA:n prosessoinnin kannalta (Pokholok ym 2002). Transkription päätyttyä mRNA:n 5’-päähän liitetään sitä suojaava metyloitu guanosiini-rakenne (eng. cap) ja silmukoinnilla poistetaan juosteen intronisekvenssit sekä eksonit liitetään toisiinsa (Gibney & Nolan 2010). Silmukoinnin jälkeen mRNA:n 3’-pää leikataan pois ja tilalle liitetään mRNA:n kuljettamiselle tumasta sytoplasmaan välttämätön adenosiinitähde, joka tunnetaan poly-A häntänä. Muodostetun mRNA:n 3’-pään muokkaus tapahtuu geenin poly-A-kohdissa (Soles & Shi 2021). Eri poly-A-

(9)

8

kohtia käyttämällä voidaan tuottaa erilaisia mRNA:n isoformeja. Metyloidun guanosiini- rakenteen ja poly-A hännän liittämisen jälkeen mRNA on valmis translaatioon.

2.1.3 Translaatio

Translaatio voidaan jakaa kolmeen vaiheeseen: aloitus, piteneminen ja lopetus (Gibney &

Nolan 2010). Sen aikana syntetisoidaan polypeptidejä N-terminaalisesta päästä C- terminaaliseen päähän mRNA:n kuljettaman geneettisen koodin mukaan. mRNA:n sisältämä geneettinen koodi luetaan kodoneina eli kolme nukleotidia kerrallaan (Alberts ym. 2015).

Translaatio alkaa aloituskodonin tunnistamisella, joka on tavallisesti ensimmäinen AUG- tripletti mRNA:n 5’-pään metyloidusta guanosiini-rakenteesta lukien (Pestova ym. 2001).

Aloituskodoni sijaitsee noin 50-100 nukleotidin päässä guanosiini-rakenteesta. Aloituskodonin tunnistaminen tapahtuu pienen (40S) ribosomaalisen alayksikön, translaation aloitukseen erikoistuneen siirtäjä-RNA-metioniini kompleksin (Met-tRNAi) ja eukaryoottisten aloitustekijöiden (eIF) muodostaman esialoituskompleksin toimesta (Sonenberg & Hinnebusch 2009). Esialoituskompleksi sitoutuu lähelle mRNA:n 5’-päätä eIF:en tunnistettua guanosiini- rakenteen ja skannaa transloimattoman alueen AUG-kodonin varalta (eng. 5’ untranslated region, 5’UTR). Aloituskodonin tunnistamisen jälkeen eIF:t avustavat suuren (60S) ribosomaalisen alayksikön liittämisessä osaksi aloituskompleksia, jonka jälkeen aloitustekijät irtautuvat kompleksista (Pestova ym. 2001). Muodostetussa kahden alayksikön ribosomissa on sitoutumiskohdat aminoasyyli-tRNA:lle (A-paikka), peptidyyli-tRNA:lle (P-paikka) ja deasyloidulle tRNA:lle (E-paikka) (Wilson & Doudna Cate 2012). Met-tRNAi sitoutuu suoraan ribosomin P-paikkaan ja sen antikodoni emäspariutuu aloituskodonin kanssa (Dever & Green 2012). Avoimen lukukehyksen toinen kodoni on ribosomin A-paikassa odottamassa sitä vastaavan aminoasyyli-tRNA:n sitoutumista.

Translaation pitenemisvaihe alkaa toisen kodonin kanssa emäspariutuvan aminoasyyli- tRNA:n kuljettamisella ribosomin A-paikkaan (Dever ym. 2018). Aminoasyyli-tRNA:n sitoutumisen jälkeen peptidyylitransferaasi muodostaa peptidisidoksen P- ja A-paikassa olevien tRNA:iden kuljettamien aminohappojen välille (Dever & Green 2012). Sidoksen muodostuminen saa aikaan konformaation muutoksen ribosomissa, mikä liikuttaa tRNA:n P- paikasta E-paikkaan ja A-paikasta P-paikkaan, vapauttaen A-paikan seuraavalle aminoasyyli- tRNA:lle. Sidoksen muodostamisen yhteydessä aluilla oleva peptidi siirretään peptidyyli- tRNA:lta aminoasyyli-tRNA:n aminoryhmälle (Dever ym. 2018). Translaatio jatkuu, kunnes yksi kolmesta lopetuskodonista (UAA, UAG tai UGA) päätyy ribosomin A-paikkaan ja

(10)

9

signaloi ribosomille translaation lopetuksesta (Gibney & Nolan 2010). Valmis polypeptidiketju vapautetaan ja ribosomaaliset alayksiköt irrotetaan toisistaan, jolloin myös mRNA ja deasyloitu tRNA vapautetaan uuteen translaatioon tarvittavien komponenttien kasausta varten.

3 IHMISEN SIITTIÖT

3.1 Siittiöiden rakenne, kypsyminen ja fysiologiset muutokset ennen hedelmöitystä

Siittiöt ovat hyvin erikoistuneita soluja, joiden tehtävänä on kuljettaa isänpuoleinen genomi munasoluun (Ioannou & Tempest 2018). Ne muodostuvat kolmesta osasta: pää, keskiosa ja häntä (Georgadaki ym. 2016). Siittiöiden pää on ovaalinmuotoinen, jonka pituus on noin 3-5 µm, leveys noin 2-3 µm ja paksuus noin 1,5 µm, ja koostuu tumasta ja akrosomista. Tuma sisältää geneettisen materiaalin ja akrosomi proteolyyttisiä entsyymeitä siittiöiden munasoluun tunkeutumista varten. Siittiön pään ja hännän yhdistävän keskiosan pituus on noin 7,5 µm ja leveys noin 1 µm. Se sisältää runsaasti mitokondrioita liikkumista varten tarvittavan energian tuotantoon. Siittiöiden hännän pituus vaihtelee 40-50 µm välillä ja se on leveydeltään noin 0,25 µm (Smith ym. 2009, Georgadaki ym. 2016).

Siittiöiden kypsyminen, eli spermatogeneesi, tapahtuu kivesten siementiehyissä ja se kestää noin 74 vuorokautta (Chen ym. 2017, Ioannou & Tempest 2018). Spermatogeneesi alkaa kivesten ituradan kantasolujen mitoottisella jakautumisella tyypin A ja B spermatogonioiksi (Chen ym. 2017). Spermatogoniot ovat kypsien siittiöiden diploidisia esiasteita, joilla on munanmuotoinen tuma ja tiiviissä sytoplasmassa pieni Golgin laite, muutamia mitokondrioita ja useita vapaita ribosomeja (Neto ym. 2016). Tyypin A spermatogoniosta kehittyy kantasoluja ja tyypin B spermatogonioista tuotetaan mitoosilla primäärisiä spermatosyyttejä (Chen ym.

2017). Primääriset spermatosyytit jakautuvat meioottisesti; ensimmäinen jakautuminen tuottaa kaksi sekundaarista spermatosyyttiä, jotka toisessa jakautumisessa tuottavat kaksi haploidista pyöreää spermatidia. Pyöreistä spermatideista muodostuu hännällisiä siittiösoluja spermiogeneesiksi kutsutussa prosessissa (Neto ym. 2016). Spermiogeneesin aikana kypsyvien siittiöiden tuma tiivistyy ja muodostuva siittiösolu omaksuu sille tyypillisen pään muodon.

Mikrotubulusten avulla muodostetaan keskusjyväsestä alkunsa saava siittiön häntä. Lisäksi siittiön akrosomi muodostetaan Golgin laitteesta.

Siittiöiden erilaistumisen loppuvaiheessa histoniproteiinien ja DNA:n muodostamat nukleosomit hajotetaan vaiheittain ja korvataan siirtymäproteiineilla, jotka vaihdetaan lopulta protamiineihin (Oliva 2006). Protamiinien avulla siittiöiden genomi saadaan pakattua

(11)

10

pienempään tilaan (Rathke ym. 2014). Genomin tiiviimmän pakkauksen takia siittiöitä on pidetty RNA:n tuotannon osalta lepotilassa olevina soluina (Bailey 2010). Siittiöt kuitenkin sisältävät tuhansia eri RNA-molekyylejä (Hosken & Hodgson 2014). Osa siittiöiden sisältämästä RNA:sta on jäänteitä spermatogeneesistä, mutta siittiöt kykenevät myös ottamaan sisäänsä RNA-molekyylejä ympäristöstään (Boerke ym. 2007, Jodar ym. 2013). Yksi siittiösolu sisältää arviolta noin 50 fg yli 200 nukleotidin pituista koodaavaa ja ei-koodaavaa RNA:ta sekä 0,3 fg alle 200 nukleotidin pituista ei-koodaavaa RNA:ta (Jodar ym. 2013). Siittiöiden sisältämästä RNA:sta noin 5-10 fg päätyy munasoluun hedelmöityksen yhteydessä, jossa ne vaikuttavat alkion kehitykseen (Boerke ym. 2007). Loput siittiöiden sisältämästä RNA:sta hajotetaan hedelmöittyneessä munasolussa.

Siemensyöksyssä olevat siittiöt ovat liikkumiskykyisiä, mutta eivät vielä hedelmöityskykyisiä (Tamburrino ym. 2020), sillä ne saavuttavat hedelmöityskykynsä vasta naisen lisääntymiselimistössä tapahtuvan aktivaation (kapasitaatio) jälkeen (Bailey 2010).

Kapasitaatiolla tarkoitetaan siittiöiden läpikäymiä fysiologisia muutoksia munasolun hedelmöittämistä varten. Siittiöiden kapasitoitunut tila on väliaikainen ja kestää tyypillisesti 50 minuutista neljään tuntiin (Cohen-Dayag ym. 1995). Kapasitaatio aiheuttaa myös siittiöiden uintiradan ja –nopeuden muuttumisen, joka tunnetaan hyperaktivaationa (Georgadaki ym.

2016). Hyperaktivaatio kuluttaa runsaasti energiaa ja sen seurauksena siittiön uintirata muuttuu epäsäännöllisemmäksi ja niiden uintinopeus kasvaa (Lishko ym. 2011, Tamburrino ym. 2020).

Kapasitaatio saa aikaan myös siittiöiden kemotaksian (Cohen-Dayag ym. 1995). Kemotaksian avulla siittiöt pystyvät reagoimaan munasolun ja naisen lisääntymiselimistön vapauttamiin kemiallisiin signaaleihin ja löytämään niiden avulla munasolun luo (Fitzpatrick ym. 2020, Jokiniemi ym. 2020a, b). Ainoastaan noin 2-12 prosenttia siemensyöksyssä olevista kapasitoituneista siittiöistä on kemotaksisia (Jaiswal ym. 1999). Kapasitoituneiden siittiöiden kohdatessa munasolun keton, eli munasolua ympäröivän glykoproteiinikerroksen, ne käyvät läpi akrosomireaktion, joka mahdollistaa yhdistymisen munasolun kanssa (Bailey 2010).

Akrosomireaktio on eksosytoottinen tapahtuma, jonka aikana akrosomin ulompi kalvo yhdistyy siittiön solukalvon kanssa ja akrosomin sisältämät proteolyyttiset entsyymit, kuten trypsiini ja proteaasit, vapautetaan (Georgadaki ym. 2016).

3.2 Genomin pakkautuminen ja geenien ilmentyminen siittiöissä

Siittiöiden kypsyessä suurin osa niiden histoniproteiineista korvataan niin sanotuilla siirtymäproteiineilla TP1 ja TP2, jotka lopulta vaihdetaan protamiineihin (Gaucher ym. 2010,

(12)

11

Miller ym. 2010). Kaikkia histoneita ei kuitenkaan korvata protamiineilla, vaan noin 15 prosenttia siittiöiden genomista säilyy väljemmin pakattuna histonien ympärillä (Hammoud ym. 2009). Histonien on havaittu säilyvän siittiöiden spesifisillä geenien alueilla, kuten geenien promoottorialueilla (Hammoud ym. 2009, Hammoud ym. 2011). Ihmisellä kahdenlaiset protamiinit osallistuvat DNA:n uudelleen pakkaukseen: protamiini 1 ja protamiini 2 perheen protamiinit (Oliva 2006). Kumpaakin protamiiniluokkaa koodaa yksi geeni. Protamiini 1 syntetisoidaan valmiina proteiinina, kun taas protamiini 2 muodostetaan ensin esiasteena (pre- P2), josta voidaan proteolyysillä tuottaa P2, P3 tai P4 protamiini.

Histonien korvaaminen protamiineilla, eli protaminaatio, on monivaiheinen prosessi (Goudarzi ym. 2014). Spermiogeneesin aikana pyöreissä spermatideissa syntetisoidut H2B:n histonivariantit korvaavat nukleosomeja muodostavat H2B histonit (Ren ym. 2017). H2B:n variantit kykenevät avaamaan kromatiinia ja muodostamaan vähemmän stabiileja nukleosomeja, mikä edistää histonien asetylaatiota ja siten niiden poistamista. Protaminaation alussa tapahtuva genominlaajuinen histonien hyperasetylaatio vähentää sitoutuneiden histonien affiniteettia DNA:han, pienentämällä niiden välistä varauseroa (Miller ym. 2010). Histonien hyperasetylaatio toimii signaalina bromo-alueita sisältävälle proteiinille, BRDT:lle, joka aloittaa histonien korvaamisen siirtymäproteiineilla TP1 ja TP2 (Pivot-Pajot ym. 2003, Gaucher ym. 2012). Siirtymäproteiinit ovat keskeisiä kromatiinin rakenteen säätelyssä (Rathke ym.

2014). Protamiinit ovat emäksisiä, runsaasti arginiinia ja kysteiiniä sisältäviä proteiineja (Miller ym. 2010). Protamiinien korkea arginiinipitoisuus neutralisoi DNA:n fosfaattiryhmien negatiivisen varauksen, mikä edistää protamiinien vahvaa sitoutumista DNA:han. Kysteiinit stabiloivat rakennetta entisestään muodostamalla disulfidisidoksia protamiinien välille (Oliva 2006). Protamiinien avulla DNA voidaan pakata kymmenen kertaa pienempään tilaan verrattuna histonien ympärille pakkaamiseen (Miller ym. 2010). Protaminaatio auttaa optimaalisen siittiön pään muodon saavuttamisessa ja varmistaa geneettisen materiaalin turvallisen kuljetuksen suojaamalla sitä fysikaalisia ja kemiallisia vaurioita vastaan (Rathke ym.

2014).

Aiemmin kuvattu spermatogeneesi koostuu useammasta erilaistumisvaiheesta, joissa jokaisessa ilmennetään juuri sille vaiheelle tarpeellisia geenejä oikeanlaisesti erikoistuneiden siittiösolujen tuottamiseksi (Zhu ym. 2016, Pandey ym. 2019). Spermatidit ovat transkription osalta aktiivisimpia soluja siittiöiden kypsymisen aikana (Pandey ym. 2019). Pyöreissä ja pitenevissä spermatideissa tapahtuu siirtymäproteiineja ja protamiineja koodaavien geenien transkriptiota (Steger 1999). Muodostuvat transkriptit varastoidaan ribonukleoproteiini (RNP) -partikkeleina pitenevissä ja pidentyneissä spermatideissa tapahtuvaa translaatiota varten

(13)

12

(Steger 2001). Nykykäsityksen mukaan geenien ilmentäminen lopetetaan vaiheittain spermatidien erikoistuessa hännällisiksi siittiösoluiksi (Miller & Ostermeier 2006).

Genomin pakkauksessa tapahtuvat muutokset ovat johtaneet oletukseen, että transkriptio olisi tukahdutettu kokonaan kypsissä siittiösoluissa (Ren ym. 2017). Niissä ei ole ajateltu tapahtuvan translaatiotakaan, sillä kypsillä siittiöillä ei ole ajateltu olevan riittävästi sytoplasman ribosomaalisia komplekseja translaation mahdollistamiseksi (Miller & Ostermeier 2006). Kypsien siittiöiden sisältämiä RNA-molekyylejä onkin siten pidetty yksinomaan sattumanvaraisina jäänteinä spermiogeneesistä (Das ym. 2013). Toisaalta kypsien siittiöiden mitokondrioissa on kuitenkin osoitettu tapahtuvan transkriptiota (Miller & Ostermeier 2006).

3.3 Progesteroni ja sen fysiologiset vaikutukset siittiöihin

Progesteroni, eli keltarauhashormoni, on steroidihormoni, jota syntetisoidaan kolesterolista munasarjoissa (Gellersen ym. 2009). Rasvaliukoisen luonteensa ansiosta progesteroni pystyy kulkeutumaan diffuusiolla solukalvon läpi ja sitoutumaan tumareseptoreihin, vaikuttaen siten geenien transkriptioon (Taraborrelli 2015). Progesteroni on yleisin hormoni, jota esiintyy naisen koko lisääntymiselimistössä ja sen pitoisuus on korkeimmillaan munasolun läheisyydessä ovulaation aikaan (Tamburrino ym. 2020). Munasolu ja sitä ympäröivät glykoproteiinit vapauttavat progesteronia, mikä houkuttelee siittiöitä munasolun luo (Lishko ym. 2011).

Progesteroni aktivoi suurimman osan siittiön kapasitaatioon liittyvistä signalointireiteistä (Tamburrino ym. 2020). Se indusoi kalsiumin virtausta siittiösoluun aktivoimalla CatSper- kalsiumkanavia siittiön hännän pinnalla (Lishko ym. 2011). Kalsiumin sisään virtaus laukaisee useita hedelmöityksen kannalta välttämättömiä fysiologisia vasteita siittiöissä. Solunsisäinen kalsiumpitoisuuden kohoaminen saa aikaan siittiön kapasitaation, joka johtaa siittiön hyperaktivaatioon. Progesteroni tukee siittiön hyperaktivaatiota suoraan aktivoimalla CatSper- kanavia ja epäsuorasti inhiboimalla kaliumkanavien toimintaa, mikä johtaa solukalvon depolarisoitumiseen ja edistää siten CatSper-kanavien aktivoimista (Brown ym. 2019).

Progesteronin on osoitettu ohjaavan siittiöitä kemotaksian avulla in vitro, mutta sen mahdollisesta roolista siittiöitä houkuttelevana aineena in vivo on heikompia todisteita (Villanueva-Díaz ym. 1995, Jaiswal ym. 1999). Progesteronin stimuloima kalsiumpitoisuuden kohoaminen siittiön hännässä aiheuttaa sen kohoamista myös siittiön päässä, mikä voi käynnistää kalsium-riippuvaisen akrosomireaktion (Tamburrino ym. 2020). Vasteiden nopeus

(14)

13

viittaa progesteronin vaikutuksen saavan alkunsa siittiön pinnalla tai solulimassa sijaitsevien reseptorien aktivoimisesta eikä geenitasolta (Villanueva-Díaz ym. 1995).

4 TAVOITTEET JA HYPOTEESIT

Tutkimuksen tavoitteena oli selvittää progesteronin vaikutuksia siittiöiden geenien ilmentymiseen ja arvioida mahdollisten muutosten biologista vaikutusta siittiöiden hedelmöityskykyyn. Ilmentymisessä tapahtuvien muutosten selvittämiseksi vertailtiin neljän eri miehen progesteroni- ja kontrollikäsiteltyjen siittiöiden geenien ilmentymistä. Geenien koodaamien proteiinien tehtävät selvittämällä pohdittiin erilailla ilmentyneiden geenien mahdollista roolia siittiöiden toiminnassa. Hypoteeseina olivat, että progesteroni aktivoi geenien ilmentymisen siittiöissä ja geenien tuottamat proteiinit vaikuttavat siittiön toimintaan vaikuttavilla signalointireiteillä. Lisäksi tarkasteltiin kolmen epigeneettisen histonimuokkauksen sijoittumista geenien alueille, joiden ilmentymisessä havaittiin merkitsevä muutos progesteronikäsittelyn jälkeen. Hypoteesina oli, että geenien alueet, joihin progesteroni vaikutti, sisältävät somaattisten solujen tapaan aktiiviseen RNA:n tuotantoon liitettyjä histonimuokkauksia. Tutkimuksessa käytetyn aineiston analysointia hankaloitti siinä havaittu genomisen DNA:n aiheuttama kontaminaatio. Ilmentymisarvojen vääristyminen kontaminaatiosta johtuen pyrittiin huomioimaan analyyseissa. Analysoidun aineiston luotettavuutta arvioitiin vertaamalla sitä yhden miehen näytteistä myöhemmin tuotetun aineiston kanssa, jossa ei ollut kontaminaatiota.

5 AINEISTO JA MENETELMÄT

Tutkimuksessa selvitettiin progesteronin vaikutuksia geenien ilmentymistasoihin siittiöissä.

Ilmentymisessä tapahtuvien muutosten selvittämiseksi vertailtiin progesteroni- ja kontrollikäsiteltyjen siittiöiden transkriptiprofiileja eli kunkin geenin alueelta tuotettuja RNA:n määriä. Tutkimuksessa käytetty aineisto oli tuotettu valmiiksi tutkielman aloittamista varten.

Aineisto sisälsi kahdeksan näytettä neljän eri miehen siittiöistä. Jokaisen miehen siittiönäytteille oli tehty progesteronikäsittely ja kontrollikäsittely siittiöiden pesuliuoksella.

Ennen progesteronikäsittelyä siittiöt oli eroteltu gradienttipesumenetelmällä, joten saadut tulokset eivät edustavat siemennesteessä ollutta koko siittiöpopulaatiota. Siittiöt oli altistettu 10M progesteronille kolmen tunnin ajan +37C:ssa. Näytteistä oli eristetty kaikki yli 200

(15)

14

nukleotidiä pitkät mRNA:t ja pitkät ei-koodaavat RNA:t. Jokaisen näytteen geenikohtaiset ilmentymisarvot, eli rinnastuneiden sekvenssien määrät (eng. counts), oli koottu taulukoksi.

Kaiken kaikkiaan transkriptejä oli 28 395. Näytteissä havaitun DNA-kontaminaation vuoksi aineistolle tehtiin taustankorjaus, jolla pyrittiin vähentämään kontaminaation aiheuttamaa virheellistä tulkintaa geenien ilmentymisessä. Käytännössä jokaiselle näytteelle määritettiin korjauskerroin, jonka avulla kunkin geenin ilmentymisarvoista huomioitiin 75 prosenttia sen alueelle rinnastuneista sekvensseistä. Korjauskerroin, eli vähennettävien rinnastuneiden sekvenssien määrä per emäs, laskettiin vähentämällä kaikista kyseisen näytteen genomiin rinnastuneista sekvensseistä geenien eksonien alueille rinnastuneiden sekvenssien määrät ja jakamalla erotus genomin emäsmäärällä.

Aineiston analysoinnissa käytettiin RStudiota (versio 4.0.4), johon oli asennettuna Bioconductor-projektin julkaisemaan BiocManager-pakettiin (versio 1.30.10) kuuluvat edgeR- (versio 3.32.1), limma- (versio 3.46.0), ComplexHeatmap- (versio 2.8.0) ja Homo.sapiens (versio 1.3.1) R-paketti (Robinson ym. 2010, Ritchie ym. 2015, Team BC 2015, Gu 2016).

Kuvaajien piirtämiseen käytettiin ggplot2 R-pakettia (versio 3.3.5) (Wickham 2016).

Analysoitu aineisto oli tuotettu koko genomin kattavalla RNA-sekvensointimenetelmällä (RNA-seq). RNA-seq mahdollistaa biologisen näytteen transkriptiprofiilin selvittämisen ja siten vertailun geenien ilmentymisessä kahden tai useamman erilaisen biologisen olosuhteen välillä (Mao ym. 2014, Law ym. 2018). RNA-seq määrittää geenien ilmentymisen rinnastamalla prosessoidut ja fragmentoidut transkriptit referenssigenomin kanssa, joka sisältää sekä eksoni- että intronisekvenssit. Koska rinnastetaan prosessoituja transkriptejä, joista on silmukoinnilla poistettu intronisekvenssit, tulisi fragmentoituneiden sekvenssien rinnastua ainoastaan referenssigenomin eksonialueille. Erilailla ilmentyvien geenien selvittäminen suoritettiin RNA-seq data-analyysilla. RNA-seq data-analyysi voidaan jakaa kolmeen vaiheeseen: aineiston alkuprosessointi, erilailla ilmentyvien geenien selvittäminen, eli DE- analyysi, sekä tulosten tulkinta (Law ym. 2018). Alkuprosessoinnilla varmistetaan sekvensoimalla saatujen sekvenssien luotettavuus ja poistetaan ne sekvenssit, jotka eivät täytä luotettavuusvaatimuksia. Alkuprosessointi oli tehty valmiiksi tätä tutkielmaa varten, joten analyysi aloitettiin DE-analyysista Law ym. (2018) mukaisesti.

5.1 Aineiston tarkastelu

Ennen DE-analyysin aloittamista tarkasteltiin geenien ilmentymisarvot sisältävää aineistoa.

Tarkastelulla kartoitettiin RNA-seq aineiston mahdolliset huomattavasti poikkeavat näytteet.

(16)

15

Tarkastelussa käytettiin alkuperäistä aineistoa, jolle ei ollut tehty taustankorjausta. Näytteiden kirjastokokoja, eli rinnastuneiden sekvenssien kokonaismääriä, tarkasteltiin geom_bar- komennolla (ggplot2) luodulla pylväsdiagrammilla (kuva 1) (Wickham 2016).

Pylväsdiagrammilla selvitetään mahdolliset huomattavat kirjastojen kokoerot näytteiden välillä. Ideaalitilanteessa vertailtavien kirjastojen koot tulisi olla lähellä toisiaan, sekä suoraan toisiinsa verrattavissa olevilla näytteillä, että myös koko aineistolla.

Kuva 1. Näytteiden kirjastokoot. Pylväsdiagrammi osoittaa, että kaikkien muiden suoraan toisiinsa verrattavien ryhmien kirjastokoot ovat lähellä toisiaan, paitsi mies 1:n kohdalla progesteronikäsitellyn näytteen kirjastokoko on lähes kaksinkertainen kontrollinäytteeseen verrattuna.

Rinnastuneiden sekvenssien määriä näytteissä tarkasteltiin laatikko-jana –kuviolla (kuva 2), käyttämällä geom_boxplot-komentoa (ggplot2) (Wickham 2016). Laatikko-jana –kuvio hyödyntää viittä tunnuslukua: minimi, maksimi, mediaani, alakvartiili ja yläkvartiili. Näiden avulla havaintoarvot jaetaan neljään yhtä suureen osaan. Puolet havainnoista ovat laatikon sisällä ja laatikon poikki kulkeva viiva osoittaa mediaanin. Janan ulkopuolelle jäävät arvot, jotka ovat alakvartiilia pienempiä tai yläkvartiilia suurempia, esitetään erillisinä pisteinä.

Laatikko-jana –kuviota varten geenien ilmentymisarvot muutettiin logaritmiasteikolle.

Logaritmimuunnoksella pienennetään arvojen vaihteluväliä, jolloin kuvaajasta saadaan havainnollisempi ja sitä on helpompi tulkita. Laatikko-jana –kuvion avulla havainnollistetaan, mikäli aineiston normalisointi vähensi näytteiden ilmentymisarvojen jakaumien erilaisuutta.

(17)

16

Ideaalitilanteessa ilmentymisarvot olisivat jakautuneet lähes samalla tavalla näytteiden kesken ja niiden mediaanit olisivat lähellä toisiaan.

Kuva 2. Rinnastuneiden sekvenssien määrät jokaisessa näytteessä logaritmiasteikolle muunnettuina. Mies 1:n kohdalla huomattava osa geenien ilmentymisarvoista on hyvin matalia.

Osana aineiston tarkastelua tehtiin pääkomponenttianalyysi eli PCA (eng. principal component analysis) käyttämällä prcomp-komentoa ja sovittamalla saadut ominaisarvot pistekuvaajaksi plot-komennolla (kuva 3A) (R Core Team 2021). PCA:n avulla voidaan visualisoida aineistossa ilmenevää vaihtelua, kun muuttujia jokaista näytettä kohden on useampi, eikä niiden sovittaminen yhdelle kuvaajalle ole mahdollista. Tässä tapauksessa jokainen transkripti edustaa yhtä muuttujaa eli ulottuvuutta kuvaajalla ja PCA:n avulla nämä ulottuvuudet voidaan esittää kaksiulotteisena kuvaajana. Toisin sanoen, PCA tiivistää aineistoa, määrittämällä sille uudet muuttujat, eli pääkomponentit, jotta geenin ilmentymisen välinen vaihtelu voidaan selittää pienemmällä muuttujamäärällä, säilyttämällä kuitenkin mahdollisimman paljon alkuperäisestä informaatiosta. PCA-kuvaajalla havainnoidaan, mitkä näytteet ovat eniten samankaltaisia keskenään kahden merkitsevimmän pääkomponentin suhteen, sillä ne ryhmittäytyvät lähekkäin. Mitä kauempana näytteet ovat toisistaan, sitä suurempi ero on niiden geenien ilmentymisessä. prcomp-komento suorittaa syötetylle matriisille pääakselihajotelman, jonka avulla aineistosta pyritään löytämään komponentit, jotka aiheuttavat siinä suurinta vaihtelua (R Core Team 2021). prcomp-komennon suorittamalla

(18)

17

pääakselihajotelmalla muodostetaan pääkomponentit, eli PC:t, jotka asetetaan tärkeysjärjestykseen siten, että PC1 selittää suurimman osan aineistossa ilmenevästä vaihtelusta. PC-arvoja tarkasteltiin summary-komennolla (taulukko 1). Aineistolle suoritettiin myös moniulotteinen skaalaus (eng. multidimensional scaling, MDS) käyttämällä plotMDS- komentoa, joka laskee jokaisen näyteparin välisen etäisyyden määritetyllä menetelmällä ja muuntaa etäisyydet kaksiulotteiseksi kuvaajaksi (kuva 3B) (Ritchie ym. 2015). Etäisyydet kuvaajalla arvioivat ilmentymisen eroja näytteiden välillä.

Taulukko 1. PC-arvojen keskihajonnat ja vaikutukset varianssiin. PC-arvot kuvaavat vaikutusta näytteiden väliseen vaihteluun siten, että PC1 selittää suurimman osan vaihtelusta ja PC- arvojen kasvaessa vaikutus vaihteluun pienenee. PC-arvojen varianssin osuus ilmaisee, kuinka monta prosenttia näytteiden välisestä vaihtelusta on selitettävissä kyseisellä PC-arvolla.

A. B.

Kuva 3. (A) PCA-kuvaaja, jossa keskenään samanlaiset näytteet ovat ryhmittyneet lähekkäin.

PC1:n suuntainen etäisyys merkitsee merkittävämpää vaihtelua näytteiden välillä kuin PC2:n suuntainen etäisyys. (B) MDS-kuvaaja, jossa etäisyydet ilmentävät näytteiden välisiä ilmentymiseroja.

Aineiston tarkastelussa tehdyt kuvaajat osoittavat, että mies 1:n näytteet eroavat muista saman aineiston näytteistä. Kuvan 1 pylväsdiagrammi osoittaa, että mies 1:n kohdalla rinnastuneiden sekvenssien kokonaismäärä progesteronikäsitellyssä näytteessä on lähes kaksinkertainen kontrollinäytteeseen verrattuna. Käytännössä tämä tarkoittaa sitä, että

(19)

18

progesteronikäsitellystä näytteestä onnistuttiin eristämään enemmän RNA:ta sekvensoitavan näytteen tuottamiseksi ja lopulliseen aineistoon päätyi noin puolet enemmän alkuprosessoinnin luotettavuuskriteerit täyttäviä sekvenssejä kuin kontrollinäytteeseen. Kuvan 2 laatikko-jana – kuvio havainnollistaa, että mies 1:n näytteissä on huomattavasti enemmän geenejä, joiden ilmentymisarvo on nolla, verrattuna aineiston muihin siittiönäytteisiin, joiden kohdalla ilmentymisarvot ovat korkeammat ja samankaltaisemmat keskenään. Mikäli geenin ilmentymisarvo on nolla, ei siitä olisi hyötyä päätelmiä tehdessä, sillä ilmentymättömät ja matalasti ilmentyneet geenit poistetaan aineistosta myöhemmässä vaiheessa. Mies 1 näytteiden säilyttäminen aineistossa saattaisi siten johtaa keskeisten geenien poistamiseen, mikäli geenit hyvin alhaisilla ilmentymisarvoilla tulkittaisiin ilmentymättömiksi heikosta sekvenssimäärästä johtuen. Näistä syistä mies 1:n näytteet poistettiin aineistosta, eikä niitä otettu mukaan jatkoanalyyseihin. Aineiston tarkastelu suoritettiin uudelleen ilman mies 1:tä ja kuvaajat tehtiin käyttämällä taustakorjattua aineistoa. Tarkastelu suoritettiin seuraamalla samoja vaiheita kuin yllä. Näytteiden kirjastojen kokoprofiileista tehtiin uusi pylväsdiagrammi. Geenien ilmentymisarvojen jakautumista tarkasteltiin laatikko-jana –kuviolla ja ilmentymisen samankaltaisuutta näytteiden välillä tarkasteltiin PCA:lla sekä MDS-kuvaajalla (liite 1, 2 ja 3).

5.2 DE-analyysi

Ilmentymisarvot sisältävä taulukko muutettiin DGEList-objektiksi, joka on edgeR-paketin käyttämä aineistomuoto, käyttämällä DGEList-komentoa (Robinson ym. 2010). DGEList- objekti sisältää useita taulukoita, joita käytetään säilömään DE-analyysissa käytettävät geenien ilmentymisarvot ja niihin liittyvää muuta informaatiota. DGEList-objektiin lisättiin erillinen taulukko geenien nimien symboleista ja geenit sisältävistä kromosomeista, käyttämällä select- komentoa tietojen poimimiseksi Homo.sapiens-paketista (Bioconductor Core Team 2015, Wickham ym. 2021). Kaksoiskappaleina esiintyvien geenien tarkastamiseksi ja poistamiseksi käytettiin duplicated-komentoa (R Core Team 2021).

DE-analyysin alussa luotiin design-matriisi model.matrix-komennolla, joka määrittää kuinka näytteet ovat jakautuneet ryhmien välillä (R Core Team 2021). Käsittelyjen välistä parittaista vertailua varten luotiin contrasts-matriisi makeContrasts-komennolla, jonka avulla määritellään vertailtavat ryhmät (Ritchie ym. 2015). Ilmentymättömät ja matalasti ilmentyneet transkriptit poistettiin käyttämällä filterByExpr-komentoa, joka määrittää, millä geeneillä on riittävän korkea ilmentymisarvo tilastollisia analyyseja varten (Robinson ym. 2010).

filterByExpr-komento säilyttää geenit, joiden count per million (CPM) –arvo on korkeampi

(20)

19

kuin määritetty minimiarvo riittävän monessa näytteessä. Lineaarimallinnusta varten transkriptien ilmentymisarvot muutettiin log2-count per million (logCMP) –arvoiksi.

filterByExpr-komennon suorittamaa suodatusta matalasti ilmentyneiden geenien poistamiselle tarkasteltiin käyttämällä voom-komentoa (Ritchie ym. 2015). voom-komento arvioi logCMP- arvojen keskiarvon ja varianssin välisen suhteen, jonka avulla se laskee havaintotason painoarvot ja luo samalla kuvaajan geenien ilmentymistasoista (kuva 4). Tyypillisesti voom- kuvaajassa on havaittavissa laskeva trendi keskiarvon ja varianssin välillä. Suuri näytteiden välinen varianssi johtaa tasaisempaan käyrään, kun taas pieni vaihtelu aiheuttaa jyrkästi laskevan käyrän. Mikäli matalasti ilmentyvien geenien suodatus ei ole ollut riittävä, voi voom- kuvaajassa havaita ilmentymisasteikon alkupäässä pudotuksen varianssitasoissa pienistä ilmentymisarvoista johtuen.

Kuva 4. voom-kuvaaja logCPM-arvojen keskiarvon ja varianssin välisestä suhteesta. X-akseli esittää logCMP-arvojen keskiarvoa ja Y-akseli niiden varianssia. Pisteet kuvaajalla edustavat transkriptejä ja punainen käyrä logCMP-arvojen keskiarvo-varianssi trendiä.

voom-komennon luoma kuvaaja ei osoita näkyvää pudotusta varianssitasoissa ilmentymisasteikon alkupäässä, joten filterByExpr-komennon suorittama geenien poisto on siten ollut riittävä. Lineaarimallinnus suoritettiin käyttämällä lmFit- ja contrasts.fit-komentoa.

lmFit sovittaa lineaarimallin jokaiselle geenille hyödyntämällä painotettua pienintä neliösummaa ja contrasts.fit muuttaa lmFit-komennon laskemat design-matriisin mukaiset kertoimet, jäännösvarianssit ja keskihajonnat vastaamaan vertailtavia ryhmiä (Ritchie ym.

(21)

20

2015). eBayes komennon avulla laskettiin geenien p-arvot. plotSA-komennolla piirrettiin mallin jäännösvarianssit ilmentymisarvojen keskiarvon funktiona (kuva 5). Kuvaaja havainnollistaa, että varianssi ei ole enää riippuvainen ilmentymistason keskiarvosta.

Kuva 5. Kuvaaja jäännösvariansseista logaritmiasteikollisen ilmentymistason keskiarvon funktiona.

Ryhmien välillä erilailla ilmentyvien geenien, eli DE-geenien, alustavaa tarkastelua varten käytettiin decideTests-komentoa asettamalla p-arvo 0,05:ksi. decideTests-komento määrittää, mikäli geenien ilmentymisen muutos vertailtavien ryhmien välillä on tilastollisesti merkitsevä ja jaottelee jokaisen geenin yhteen kolmesta ryhmästä annetun p-arvon perusteella:

ilmentyminen lisääntynyt, ilmentyminen vähentynyt tai ei merkitsevää muutosta (Ritchie ym.

2015). Tavallisesti decideTest-komentoa käytettäessä tilastollinen merkitsevyys määritellään korjatulla p-arvolla (eng. adjusted p-value) virheellisten positiivisten löydösten kontrolloimiseksi. Tässä analyysissä geenejä, joiden korjaamaton p-arvo oli alle 0,05, pidettiin kuitenkin merkitsevinä. Merkitsevästi erilailla ilmentyneitä geenejä tarkasteltiin käyttämällä topTable-komentoa (Ritchie ym. 2015). topTable-komennolla pystytään geenien p-arvojen lisäksi tarkastelemaan niiden logFC-arvoja (log fold change), jotka kertovat, moninko kertaisesti geenin ilmentyminen muuttui kontrollinäytteeseen verrattuna. LogFC-arvo lasketaan jakamalla geenin normalisoitujen ilmentymisarvojen keskiarvo käsittelynäytteissä sen ilmentymisarvojen keskiarvolla kontrollinäytteissä ja laskemalla saadun osamäärän kaksikantainen logaritmi. Positiiviset logFC-arvot tarkoittavat, että geenin ilmentyminen on

(22)

21

lisääntynyt kontrollinäytteeseen verrattuna ja negatiiviset arvot viittaavat puolestaan ilmentymisen vähentymiseen. Esimerkiksi logFC-arvon ollessa yksi, on geenin ilmentyminen kaksinkertaistunut ja sen ollessa miinus yksi, on ilmentyminen puolittunut kontrollinäytteeseen verrattuna.

Geenien ilmentymisarvot muutettiin normalisoiduiksi RPKM-arvoiksi (reads per kilobase million). RPKM-arvojen laskemiseksi RPKM-arvojen laskukaava (kaava 1) sovellettiin R- funktioksi, jonka avulla ilmentymisarvot muutettiin RPKM-arvoiksi (Robinson ym. 2010).

Normalisoitujen rinnastuneiden sekvenssimäärien kuten RPKM-arvojen käytöllä huomioidaan muun muassa geenien pituus ja kirjastokoko, mikä on tarpeen vertailtaessa geenien ilmentymistä eri näytteissä. P-arvoiltaan merkitsevien geenien ilmentymisessä tapahtuvia muutoksia visualisoitiin lämpökartalla käyttämällä Heatmap-komentoa (Gu ym. 2016).

RPKM = geenin ilmentymisarvo

(geenin pituus 1000 ∗ näytteen kirjastokoko 1 000 000)⁄ ⁄

Kaava 1. Laskukaava RPKM-arvojen laskemiseksi yksittäiselle geenille.

Siittiöille tyypillisten geenien ilmentymisessä tapahtuvien muutosten tarkastelua varten Flegel ym. (2013, 2016a, b) julkaisemista tutkimuksista katsottiin siittiöille tyypilliset geenit, joihin lukeutui muun muassa G-proteiineihin liittyviä reseptoreja ja hajureseptoreja koodaavia geenejä. Vastaavien geenien p-arvot poimittiin eBayes-komennolla luodusta taulukosta ja niiden RPKM-arvot koottiin erilliseksi taulukoksi (R Core Team 2021).

5.3 Geeniontologian ja histonimuokkausten tarkastelu

Geeniontologiaa, eli geenien toiminnallisia ryhmiä, tarkasteltiin g:Profiler-sivuston g:GOSt- työkalulla, joka määrittää merkitsevimmät toiminnalliset ryhmät työkaluun listatuille geeneille (Raudvere ym. 2019). g:GOSt käyttää merkitsevien toiminnallisten ryhmien selvittämisessä hypergeometrista testiä ja suorittaa moninkertaisia testauskorjauksia (eng. multiple testing corrections) testien p-arvoille virheellisten positiivisten löydösten kontrolloimiseksi.

Tarkasteluun valittiin geenit, jotka olivat DE-analyysin perusteella havaittu tilastollisesti merkitseviksi. Toiminnallisen ryhmän merkitsevyyden rajana käytettiin g:GOSt:in käyttämää oletusrajaa eli 0,05:tä. Kaikille geeneille ei kuitenkaan löydetty toiminnallisia ryhmiä, joten hakuparametrejä laajennettiin näyttämään kaikki vastaavuudet, eikä ainoastaan merkitseviksi

(23)

22

määriteltyjä ryhmiä. Geenien koodaamien proteiinien tietojen selvittämisessä hyödynnettiin UniProt-tietokantaa (The UniProt Consortium 2021).

Geenien ilmentymiseen vaikuttavista epigeneettisistä histonimuokkauksista valittiin kolme, joiden sijoittumista geenien alueille tarkasteltiin. Tarkasteltavat muokkaukset olivat histoni H3:n lysiineihin kohdistuvia muokkauksia, jotka somaattisissa soluissa assosioituvat kyseisen alueen aktiivisuuteen esimerkiksi RNA:n tuotannon mallina. Muokkaukset olivat (1) lysiini 27:n asetylaatio (H3K27ac), joka indikoi avoimempaa genomin aluetta, jolla on esimerkiksi jonkin ilmentyvän geenin ilmentymistä sääteleviä tehostaja-alueita (Kimura 2013). (2) Lysiini 36:n trimetylaatio (H3K36me3), jonka esiintyminen geenin alueella assosioituu alueen aktiivisen RNA:n tuotannon kanssa, ja (3) lysiini 4:n monometylaatio (H3K4me1), joka paikantuu jonkin sillä hetkellä ilmennettävän geenin ilmentymistä säätelevälle tehostaja- alueelle (Barksi ym. 2007).

Hammoud ym. (2018) tutkimuksessa on määritetty useiden histonimuokkausten rikastumisalueita ihmisen siittiöiden genomissa kromatiini-immunosaostussekvensointi (ChIP- seq) -analyysilla. Kyseisen tutkimuksen määrityksiä muokkausten rikastumisalueista hyödynnettiin tässä tutkielmassa tarkasteluun valittujen histonimuokkausten sijoittumisen selvittämisessä DE-analyysissa saatujen erilailla ilmentyneiden geenien alueilla. Tarkastelun kohteeksi valittujen kolmen muokkauksen rikastumisalueet ladattiin Gene Expression Omnibus (GEO) -tietokannasta (Hammoud ym. 2018; GSE40195).

Histonimuokkausten rikastumisalueiden päällekkäisyyksien vertaaminen geenien alueiden kanssa vaati komentorivillä käytettävän BEDTools-työkalun (versio 2.27.1) hyödyntämistä (Quinlan & Hall 2010). BEDTools-työkalu ei sovellu käytettäväksi Windows 10 – käyttöjärjestelmän komentorivillä, joka oli tutkielman teon aikana ainoa käytössä oleva käyttöjärjestelmä. Vaihtoehtoisesti luotiin virtuaalinen Ubuntu-käyttöjärjestelmä (versio 20.04) Oracle VM VirtualBox -ohjelmalla (versio 6.1.26), jonne BEDTools-työkalu saatiin asennettua.

GEO-tietokannasta ladatut kolmen histonimuokkauksen rikastumisalueet sisältävät tiedostot purettiin tekstimuotoon käyttämällä komentorivin gunzip-komentoa ja muokattiin BED- tiedostoiksi RStudiossa. BEDTools-työkalu vaatii vähintään tiedot tarkasteltavan alueen sisältävästä kromosomista sekä alueen aloitus- ja lopetuskohdat. Vastaavat tiedot sisältävistä sarakkeista luotiin erillinen taulukko jokaiselle histonimuokkaukselle ja taulukkoon lisättiin alueiden ID, score-arvo ja juosteen suunta (eng. strand) eli missä suunnassa alue luetaan.

Histonimuokkaukset eivät ole riippuvaisia DNA-juosteen suunnasta, joten jokaisen kohdalla käytettiin koodaavan juosteen eli (+)-juosteen suuntaa. Vastaavanlainen taulukko muodostettiin

(24)

23

DE-analyysissa saaduista geeneistä, joiden kohdalla juosteen suunta huomioitiin. Score-arvo oli jokaisen geenin ja muokkauksen kohdalla nolla.

Histonimuokkausten sijaintien koordinaatit olivat genomiversion 18 (NCBI36/hg18) mukaiset, mutta ne muutettiin uudemman genomiversion 38 (GRCh38/hg38) mukaisiksi.

Muunnos tehtiin UCSC Genome Browser –genomitietokannan sivulta löytyvän Lift Genome Annotations –työkalun avulla (Kent ym. 2002). Muuntaminen epäonnistui H3K4me1 kohdalla 24, H3K27ac kohdalla viiden ja H3K36me3 kohdalla yhdentoista koordinaatin osalta. Syynä tähän oli todennäköisesti genomiversioiden välinen ero niiden pituuksissa. Transkriptien koordinaatit olivat valmiiksi hg38:n mukaiset. Jokaisen BED-tiedoston sisältämät koordinaatit histonimuokkauksille ja geenien alueille järjestettiin kromosomeittain sekä aloituskohdan mukaan kasvavaan järjestykseen komentorivillä käytettävällä sort-komennolla. Geenien alueiden päällekkäisyyksiä verrattiin erikseen jokaisen histonimuokkauksen kanssa käyttämällä BEDToolsin intersect-komentoa (Quinlan & Hall 2010).

5.4 DNA-kontaminoituneiden näytteiden ja kontaminaatiovapaan näyteparin väliset korrelaatiot

Taustakorjatun aineiston näytteiden RPKM-arvoja verrattiin toisen aineiston kontaminaatiovapaan näyteparin kanssa (liite 4). Toisen aineiston näytteet oli tehty saman henkilön siittiönäytteestä vastaavalla tavalla kuin tässä tutkielmassa käytetyn aineiston mies 3 näytteet. Näytepari oli osa suurempaa näytekokoelmaa, josta vain yksi näytepari sekvensointiin, jotta pystyttiin toteamaan, että DNA-kontaminaatio on onnistuttu poistamaan. Näyteparin kontrollikäsittelyn kirjastokoko oli 16 695 289 ja progesteronikäsittelyn 25 010 301. RPKM- arvoja verrattiin erikseen kontrolli- ja progesteronikäsittelyjen välillä. Näytteiden vertaaminen suoritettiin laskemalla niiden välinen Pearsonin korrelaatiokerroin käyttämällä cor-komentoa (R Core Team 2021). Pearsonin korrelaatiokerroin kuvaa kahden muuttujan välisen lineaarisen riippuvuuden voimakkuutta. Muuttujien välinen korrelaatio testataan sovittamalla jana muuttujien havaintoarvojen poikki ja laskemalla, kuinka kaukana havaintoarvot ovat sovitetusta janasta. Korrelaatiokerroin saa arvoja väliltä -1 ja 1, joista 1 tarkoittaa täydellistä positiivista lineaarista riippuvuutta ja vastaavasti -1 täydellistä negatiivista lineaarista riippuvuutta. Korrelaatiokertoimen ollessa nolla ei muuttujien välillä ole lainkaan lineaarista riippuvuutta.

(25)

24

Saman miehen näytteiden, eli mies 3:n, väliset korrelaatiot laskettiin ensin käyttämällä ilmentymättömien ja matalasti ilmentyneiden geenien poistamisen jälkeen jäljelle jääneitä geenejä. Seuraavaksi korrelaation laskeminen suoritettiin käyttämällä sataa ja tuhatta pienimmän p-arvon saanutta geeniä. Näiden lisäksi käytettiin vielä DE-analyysissa saatuja erilailla ilmentyneitä geenejä ja siittiöille tyypillisiä geenejä korrelaation laskemiseen. Mies 2 ja 4 kanssa lasketut korrelaatiot laskettiin käyttämällä ainoastaan geenejä, jotka jäivät jäljelle ilmentymättömien ja matalasti ilmentyneiden geenien poistamisen jälkeen. Kahden aineiston ilmentymisarvojen väliset korrelaatiot laskemalla pystyttiin selvittämään, mikäli niiden välillä oli lineaarista riippuvuutta ja siten arvioida, kuinka samankaltaisia ne olivat keskenään. Suuret positiiviset korrelaatiokertoimet viittaisivat siten aineistojen väliseen samankaltaisuuteen.

6 TULOKSET

6.1 Erilailla ilmentyneet geenit ja histonimuokkausten sijoittuminen

DE-analyysin alussa transkriptejä oli 28 395, joiden määrä väheni 3311:a ilmentymättömien ja matalasti ilmentyneiden transkriptien poistamisen jälkeen. Jäljelle jääneistä geeneistä viisi havaittiin tilastollisesti merkitseviksi korjaamattoman p-arvon perusteella, kun merkitsevyyden rajana käytettiin 0,05:tä (taulukko 2, 3 ja kuva 6). Korjattu p-arvo oli kaikkien geenien kohdalla yli 0,99. Geenejä, joiden ilmentyminen oli lisääntynyt kontrolliryhmään verrattuna, oli yksi (logFC > 0) ja vähentyneen ilmentymistason omaavia geenejä neljä (logFC < 0). Siittiöille tyypillisistä geeneistä yhdenkään p-arvo ei saavuttanut tilastollisen merkitsevyyden rajaa, mutta niiden ilmentymisarvot olivat osan geeneistä kohdalla hyvin suuret (liite 5).

Taulukko 2. Geenit, joiden ilmentymisarvot erosivat käsittelyiden välillä.

(26)

25 Taulukko 3. DE-geenien RPKM-arvot näytteittäin.

Kuva 6. Lämpökartta-kuva DE-geenien RPKM-arvoista.

Erilailla ilmentyneistä geeneistä DBT oli ainoa, jonka ilmentyminen lisääntyi progesteronikäsittelyn myötä. Mies 3 ja 4 kohdalla DBT ei ilmentynyt lainkaan kontrolliryhmissä (RPKM = 0). Mies 2 kohdalla ilmentyminen oli erittäin vähäistä sekä kontrolli- että käsittelynäytteissä. Mies 3 käsittelyn kohdalla DBT:n ilmentyminen oli lisääntynyt vain vähän. SIK3, PMS1, SESN1 ja LRRC6 ilmentyivät enemmän

(27)

26

kontrollinäytteissä. SIK3, PMS1 ja SESN1 ilmentymistä ei havaittu progesteronikäsittelyn jälkeen mies 3 ja 4 kohdalla (RPKM = 0). LRRC6 ei puolestaan ilmentynyt lainkaan mies 4 kohdalla progesteronikäsittelyn jälkeen ja mies 3 käsittelyn kohdalla sen ilmentyminen oli lähellä nollaa (RPKM = 0,29).

Geeniontologia-analyysissa DBT sijoittui ontologialtaan kahteen molekulaariseen toimintaan: lipoiinihapon sitominen (eng. lipoic acid binding, padj = 0,049) ja dihydrolipoyylilysiini (2-metyylipropanyyli) transferaasiaktiivisuus (eng. dihydrolipoyllysine- residue (2-methylpropanoyl) transferase activity, padj=0,049) (Raudvere ym. 2019). DBT koodaa mitokondriaaliseen kompleksiin kuuluvaa asetyylitransferaasi aktiivisuuden omaavaa proteiinia (eng. lipoamide acetyltransferase component of branched-chain alpha-keto acid dehydrogenase complex) (The UniProt Consortium 2021). SIK3 ja SESN1 sijoittuivat TORC1 signaloinnin säätelyyn (padj=0,039) ja PMS1 MutL-beta proteiinikompleksiin (padj= 0,04995) (Raudvere ym. 2019). SIK3 koodaa sytoplasmassa olevaa seriini/treoniini-proteiinikinaasia, joka säätelee positiivisesti rapamysiinin nisäkäskohteen eli mTOR (eng. mammalian target of rapamycin) signalointia (The UniProt Consortium 2021). SESN1:n geenituote Sestrin-1 toimii solunsisäisenä leusiini-sensorina tumassa ja sytoplasmassa, jossa se säätelee negatiivisesti TOR kompleksi 1 (TORC1) signalointireittiä. PMS1:n koodaama proteiini PMS1 proteiinihomologi 1 on osa tumassa toimivaa DNA:n väärin pariutuneita emäksiä korjaavaa kompleksia. LRRC6 ei sijoittunut mihinkään ryhmään. Kun hakuparametrejä laajennettiin näyttämään kaikki vastaavuudet, LRRC6 sijoittui muun muassa prosessiin, joka osallistuu proteiinien lokalisoimiseen siittiön häntään (padj = 0,484) (Raudvere ym. 2019). Kyseisen ryhmän padj-arvo oli kaikista pienin, mutta ei yltänyt saavuttamaan g:GOSt:in määrittelemää toiminnallisen ryhmän merkitsevyyttä. LRRC6 koodaa leusiini-rikkaan toistojakson sisältävää proteiinia (eng.

leucine-rich-repeat (LRR) containing protein), joka osallistuu siittiön hännän muodostamiseen (The UniProt Consortium 2021).

Ilmentymisarvoiltaan käsittelyjen välillä merkitsevästi erilaisten geenien alueiden ja histonimuokkausten rikastumisalueiden päällekkäisyyksien vertailussa tarkastelun kohteeksi valittiin H3K4me1-, H3K27ac- ja H3K36me3-muokkaukset. H3K4me1- ja H3K27ac- muokkausten rikastumisalueet eivät sijoittuneet minkään geenin alueelle. H3K36me3- muokkaus havaittiin sijoittuvan kahden eri geenin alueelle, jotka olivat SESN1 ja LRRC6.

Molempien geenien ilmentyminen oli vähentynyt progesteronikäsittelyn seurauksena ja osan näytteiden kohdalla loppunut jopa kokonaan. Päällekkäisten alueiden pituudet olivat SESN1:n kohdalla 729 nukleotidia ja LRRC6:den kohdalla 593 nukleotidia. Alueiden visuaalisella tarkastelulla todettiin H3K36me3-muokkauksen sijoittuneen molempien geenien 3’-päähän.

(28)

27

6.2 DNA-kontaminoituneiden ja kontaminaatiovapaiden näytteiden väliset korrelaatiot sekä erot DE-geenien ilmentymisarvoissa

Kaikkien DNA-kontaminoituneiden näytteiden ilmentymisarvoja verrattiin mies 3 näytteistä tuotetun kontaminaatiovapaan näyteparin kanssa. Lasketut korrelaatiokertoimet osoittivat näytteiden RPKM-arvojen välillä olevan lineaarista riippuvuutta (taulukko 4). Mies 3 näytteiden väliset Pearsonin korrelaatiokertoimet viittasivat vahvaan positiiviseen lineaariseen riippuvuuteen geenien ilmentymisessä aineistojen välillä. Progesteronikäsitellyistä näytteistä laskettu korrelaatio (n=5 geeniä) erilailla ilmentyneiden geenien välillä oli ainoa, jonka kohdalla riippuvuus oli vahvasti negatiivinen (r=-0,9407). Mies 2 näytteet ja kontaminaatiovapaa näytepari eivät osoittaneet vahvaa lineaarista riippuvuutta kontrolli- tai käsittelynäytteiden välillä (kontrolli: r=0,65; progesteroni: r=0,57). Mies 4 näytteiden ja kontaminaatiovapaan näyteparin välinen korrelaatio osoitti ainoastaan heikkoa positiivista lineaarista riippuvuutta (kontrolli: r=0,14; progesteroni: r=0,12).

Taulukko 4. DNA-kontaminoituneiden näytteiden ja kontaminaatiovapaan näyteparin RPKM- arvojen väliset Pearsonin korrelaatiokertoimet.

DE-geenien ilmentymisarvot DNA-kontaminoituneessa ja kontaminaatiovapaassa aineistossa olivat ristiriitaisia (taulukko 5). DNA-kontaminoituneesta aineistosta tulkittuna DBT oli ainoa geeni, jonka ilmentyminen kasvoi progesteronikäsittelyn seurauksena.

Kontaminaatiovapaan aineiston perusteella progesteroni aktivoi sekä SESN1 että LRRC6

(29)

28

geenien ilmentymistä. DBT ja SIK3 ilmentymiseen progesteronikäsittelyllä ei ollut vaikutusta kontaminaatiovapaan aineiston perusteella, mutta PMS1-geenin ilmentyminen väheni.

Kontrollikäsittelyjen ilmentymisarvot olivat lähellä toisiaan. Progesteronikäsittelyjen kohdalla geenien, joiden ilmentymistä ei ollut havaittu DNA-kontaminoituneessa näytteessä, havaittiin ilmentyneiksi kontaminaatiovapaassa näytteessä.

Taulukko 5. DE-geenien RPKM-arvot DNA-kontaminoituneissa ja kontaminaatiovapaissa siittiönäytteissä.

7 TULOSTEN TARKASTELU

Tutkimuksessa analysoidussa aineistossa havaittiin genomisen DNA:n aiheuttama kontaminaatio, joka vääristi geenien ilmentymisarvoja (liite 6). Kontaminaation aiheuttamaa virheellistä geenien ilmentymisen tulkintaa pyrittiin vähentämään huomioimalla geenien alueille rinnastuneista sekvensseistä ainoastaan 75 prosenttia. Kontaminaation aiheuttamasta ongelmasta huolimatta suoritettiin DE-analyysi (liite 7), joka havaitsi viisi geeniä (DBT, PMS1, SESN1, SIK3 ja LRRC6), joiden ilmentyminen oli muuttunut merkitsevästi progesteronikäsittelyn myötä. Havaitut geenien ilmentymisen muutokset saattavat siten indikoida progesteronin mahdollisista geenitason vaikutuksista siittiöihin ja siittiöissä tapahtuvasta RNA tuotannosta. Viidestä DE-geenistä kahden alueella havaittiin RNA:n aktiiviseen tuotantoon viittaava H3K36me3-muokkaus, mikä on yhdenmukainen löydös aikaisemmin tehtyjen tutkimusten kanssa siittiöiden epätäydellisestä protaminaatiosta (Hammoud ym. 2009, Hammoud ym. 2011).

Toistaiseksi ei ole aikaisempia tutkimuksia, joissa olisi tehty vastaavanlainen taustankorjaus DNA-kontaminoituneelle RNA-seq aineistolle. Toisaalta esimerkiksi ChIP-seq analyyseissä ongelmana usein on vasta-aineiden epäspesifinen sitoutuminen, jonka aiheuttamaa taustan vaikutusta pystytään korjaamaan (Nakato & Sakata 2021). Ilmentyvää taustaa on siten mahdollista ainakin teoriassa huomioida myös RNA-seq aineistossa.

Viittaukset

LIITTYVÄT TIEDOSTOT

Tässä pro gradu -tutkimuksessa selvitettiin iän ja elinikäisen fyysisen aktiivisuuden yhteyttä OGT- ja OGA-geenien ilmentymiseen sekä proteiinien kokonais-O- GlcNAcylaatiotasoon

rmmunohistokemiallisista leikkeistä voidaan todeta, että maksa - akinuksen PV -aluee11e rajoittunut CYP2BI/2 levisi kohti PP -aluerra hypofysektomian jälkeen sekä

Aivolis en poÍston vaikuÈus sytokroroi P450 2BL/2:n ja sytokroni P450 2E1:n ilmentymiseen maksan

- Kotoa pitkäaikaishoitoon siirtymiseen yhteydessä olevat tekijät n=25 - Teknologian vaikutukset turvallisuuden tunteeseen

Yhteiskuntatieteiden filosofiasta ja ihmisen asemasta kiinnostuneena en kuitenkaan malta olla mainitsematta, että ainakin ihmisen asemaa koskeva valinta geenien ja ympäristön

Jos teollisuuspolitiikkana pidetään kaikkea, mi- kä vaikuttaa teollisuuden kehitykseen, sisäl- tyvät teollisuuspolitiikkaan silloin lähes kaikki julkisen vallan talous-

Asiakkaat odottavat tuotteelta mutkatonta toimi- vuutta, ja voidaan myös olettaa, että MatkaTV ei täyttä arvosanaa voi saada, koska käyttäjät ovat monesti todella kriittisiä

(2010) tutkimuksessa havaittiin, että keinotekoinen AKR1C3 yli-ilmentyminen rintakudoksessa johtaa tehostettuun testosteroni- ja estradiolituotantoon sekä progesteronin