Information

Hur reglerar budbärar-RNA varandras uttrycksnivåer?

Hur reglerar budbärar-RNA varandras uttrycksnivåer?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Jag vet att forskare lär sig genreglerande nätverk från mikroarrayexperiment som mäter mRNA-expressionsnivåerna. Jag förstår dock inte hur mRNA reglerar varandras nivåer. Påverkar de transkriptionssteget eller översättningssteget? Jag vet att det finns transkriptionsfaktorer som påverkar transkriptionssteget, men det är inte mRNA utan proteiner. Hur påverkar ett mRNA (produkten före translation) ett annat mRNA:s uttrycksnivå? Är denna regleringsprocess mycket lik regleringen av mikroRNA?


Vanligtvis tänker dessa experimentörer inte att mRNA direkt reglerar varandras uttrycksnivåer, utan snarare att proteinerna de kodar för påverkar uttrycket. De är bara mRNA som en proxy för motsvarande protein.


Hur reglerar budbärar-RNA varandras uttrycksnivåer? - Biologi

Du har begärt en maskinöversättning av valt innehåll från våra databaser. Denna funktion tillhandahålls enbart för din bekvämlighet och är inte på något sätt avsedd att ersätta mänsklig översättning. Varken BioOne eller ägarna och utgivarna av innehållet gör, och de avsäger sig uttryckligen, några uttryckliga eller underförstådda utfästelser eller garantier av något slag, inklusive, utan begränsning, utfästelser och garantier beträffande översättningsfunktionens funktion eller riktigheten eller fullständigheten av översättningarna.

Översättningar sparas inte i vårt system. Din användning av denna funktion och översättningarna är föremål för alla användningsbegränsningar som finns i Användarvillkoren för BioOne-webbplatsen.

Uppskattad mångfald av budbärar-RNA i varje murin spermatozo och deras potentiella funktion under tidig zygotisk utveckling

Peng Fang, 1 Piao Zeng, 1 Zhaoxia Wang, 1 Miao Liu, 2 Wangjie Xu, 1 Jingbo Dai, 1 Xianglong Zhao, 1 Dong Zhang, 1 Dongli Liang, 1 Xiaohui Chen, 1 Shi Shi, 1 Meixing Zhang W, 1 Lianyun , 1 Zhongdong Qiao, 1,* Huijuan Shi 1,**

1 5School of Life Science and Biotechnology, Shanghai Jiao Tong University, Shanghai, Folkrepubliken
2 6National Population and Family Planning Key Laboratory of Contraceptive Drugs and Devices, Shanghai

* Korrespondens: Zhongdong Qiao, School of Life Science and Biotechnology, Shanghai Key Laboratory of Reproductive Medicine, Shanghai Jiao Tong University, 800 Dongchuan Rd., Shanghai 200240, Folkrepubliken Kina. E-post: [email protected]
** Korrespondens: E-post: [email protected]

Inkluderar PDF och HTML, när tillgängligt

Denna artikel är endast tillgänglig för abonnenter.
Den är inte tillgänglig för individuell försäljning.

För att studera mångfalden av mRNA i murina spermier och deras potentiella funktion under zygotisk utveckling, sekvenserades totala RNA i murina spermier via RNA-Seq och analyserades genom bioinformatiska tekniker. Leveransen och translationen av spermieburet mRNA i befruktad oocyt detekterades med användning av RT-PCR (omvänd transkription-polymeraskedjereaktion), Western blot och immunfluorescens. Totalt erhölls 35 288 825 läsningar som matchade 33 039 avskrifter, inklusive 27 310 kodningsavskrifter. Baserat på våra analyser antog vi att transkripten med RPKM (avläsningar per kilobas exonmodell per miljon kartlagda läsningar) högre än sex kan existera i varje spermiecell som konsekvent bibehållna transkript. Det fanns 4885 konsekventa transkript i varje sperma, och resten behölls slumpmässigt. Om baslinjens RPKM ökade var de återstående kodande transkripten mer sannolikt relaterade till reproduktion och utveckling. De spermieburna avskrifterna Wnt4 och Foxg1 levererades till befruktade oocyter vid befruktning. Vidare, Wnt4 översattes till protein i zygoter, medan Foxg1 översattes inte. Sammanfattningsvis var ungefär 4885 mRNA närvarande i varje murin spermatozoon, och de spermatozoala mRNA:n relaterade till reproduktion och utveckling behölls mer sannolikt. Det spermieburna mRNA:t Wnt4 levererades till den befruktade oocyten och översattes, bevis på en faderlig effekt på zygotisk utveckling.

Mottaget: 19 januari 2014 Godkänd: 1 mars 2014 Publicerad: 26 mars 2014

Denna artikel är endast tillgänglig för prenumeranter.
Den är inte tillgänglig för individuell försäljning.


MikroRNA-medierad överhörning mellan transkript

Ett enda mikroRNA har potential att sänka nivåerna av många transkript, och måligenkänning tros minska mikroRNA-koncentrationen. Detta tyder på att transkript som delar MREs samreglerar varandra genom kompetitiv mikroRNA-bindning [6]. Det första beviset för överhörning mellan endogena RNA som delar MRE hittades i växter. I Arabidopsis thaliana, ett icke-proteinkodande transkript, IPS1 (INDUCERAD AV FOSFATSVält1), och ett mikroRNA, miR-399, induceras efter fosforsvält. De IPS1 transkriptet innehåller en konserverad MRE för miR-399, som binder mikroRNA:t och därigenom frisätter PHOS2, en proteinkodande gen involverad i fosforrespons, från dess post-transkriptionella reglering av detta mikroRNA [7]. Ytterligare exempel på icke-kodande RNA som fungerar som svampar för endogena mikroRNA har rapporterats och kompletterar tidigare observationer att mikroRNA-aktivitet kan regleras effektivt och specifikt genom uttrycket av exogena RNA-svampar (granskas i [8]).

Mer nyligen, en retrotransponerad genkopia, PTENP1, visade sig konkurrera om mikroRNA med sin föräldragen, PTEN, en känd tumörsuppressorgen [9]. Transkriptionsnivåer av detta paraloga genpar är starkt korrelerade i mänskliga normala och cancervävnader, vilket tyder på deras snäva samreglering [9]. Givet att PTENP1 uppstod från omvänd transkription av PTEN mRNA och efterföljande insättning i en annan kromosom, dess transkription kommer sannolikt inte att regleras av duplicerad cis-reglerande element. MRE-sekvenser för fem av de mikroRNA som reglerar PTEN är perfekt bevarade i PTENP1, vilket tyder på att den observerade uttryckskorrelationen härrör från regleringen av de två transkripten av dessa mikroRNA [9]. Två observationer överensstämmer med konkurrens om mikroRNA genom dessa två paraloga transkript: (i) exogent överuttryck av PTENP1 3' UTR leder till ökad PTEN uttryck i vildtypsceller, medan detta inte observeras för celler som saknar DICER, en väsentlig komponent i mikroRNA-biogenesvägen [1] och (ii) minskat uttryck av PTENP1 har motsvarande effekt på PTEN uttryck och resulterar i liknande cellulära fenotyper [9]. Analys av andra cancerrelaterade proteinkodande/retrokopipar visade att mikroRNA-bindningsställen vanligtvis bevaras efter duplicering. Till exempel överuttryck av 3' UTR av KRASP1, a KRAS retrokopiering med konserverade MRE, leder till ökade transkriptnivåer av föräldragenen [9]. Trots den uppenbara bristen på en proteinkodande öppen läsram, transkriberas och konserveras vissa pseudogener över olika arter, vilket tyder på att de kan ha viktiga funktionella roller. Med tanke på att de uppstod genom duplicering är det troligt att dessa retrokopior har bevarade förfäders icke-kodande roller, som också finns i deras föräldragener. Därför kommer många MRE-innehållande transkript att vara bifunktionella och koda för både en primär, ibland proteinmedierad funktion och en tidigare oväntad post-transkriptionell trans-reglerande roll.


Material och metoder

Mänskliga bröstvävnader och tumörcellinjer.

Femtiotre fall valdes ut från National Cancer Institute of Canada-Manitoba Breast Tumor Bank (Winnipeg, Manitoba, Kanada). Som rapporterats tidigare har alla ärenden i banken behandlats för att tillhandahålla paraffininbäddade vävnadsblock och spegelbildsfrusna vävnadsblock (22) . Histopatologisk analys utfördes på H&E-färgade snitt från paraffinvävnadsblocket för att uppskatta, för varje fall, proportionerna av tumörceller och normala epitelceller, fibroblaster och fett samt för att bestämma nivåerna av inflammation och Nottingham-poäng (23) . Patienternas ålder varierade mellan 39 och 87 år (n = 53, median = 67 år). Tumörer sträckte sig över ett brett spektrum av ER (från 0 till 159 fmol/mg protein, n = 53, median = 9 fmol/mg protein) och PR (från 0 till 285 fmol/mg protein, n = 53, median = 10 fmol/mg protein), mätt med ligandbindningsanalys. Dessa tumörer täckte också ett brett spektrum av grader (Nottinghams betyg från 1 till 9, n = 47, median = 7). Inflammationsnivåer bedömdes för 51 fall genom att poängsätta omfattningen av lymfo-histocystiska infiltrat genom hela sektionen med hjälp av en semikvantitativ skala från 0 (låg till minimal infiltration) till 5 (markerad infiltrat). För 13 fall fanns även matchade intilliggande normala vävnadsblock tillgängliga. Egenskaperna för denna undergrupp av 13 tumörer var följande: ER-status varierade från 0 till 159 fmol/mg protein (median = 3,5 fmol/mg protein), PR-status varierade från 4,9 till 134 fmol/mg protein (median = 8,5), Nottingham-betygen varierade från 5 till 9 (median = 7), inflammationsnivåerna varierade från 1 till 5 (median = 3) och patienterna var mellan 39 och 75 år gamla (medianålder = 54 år).

MDA-MB-231, MDA-MB-468, ZR-75, BT-20, T-47D och MCF-7 bröstcancerceller odlades och poly(A)-mRNA erhölls som beskrivits tidigare (24). Totalt RNA extraherades från frusna bröstvävnadssnitt med hjälp av Trizol-reagens (Life Technologies, Inc., Grand Island, NY) enligt tillverkarens instruktioner och kvantifierades spektrofotometriskt. En μg totalt RNA transkriberades omvänt i en slutlig volym på 25 μl som beskrivits tidigare (25).

Primers och PCR-förhållanden.

De använda primrarna bestod av ER-β1U-primer (5'-CGATGCTTTGGTTTGGGTGAT-3'-sens, belägen i exon 7, positioner 1400–1420, GenBank accessionsnr AB006590), ER-β1L-primer (5'-β1L-primer (5′-CTTTTACTCTTTTG3-CTTACTCTCTTTG3). lokaliserad i exon 8, positionerna 1667–1648, GenBank accessionsnummer AB006590) och ER-β2L (5'-CTTTAGGCCACCGAGTTGATT-3' antisense, lokaliserad i ER-β2 extrasekvenser, positionerna 1933–19413, AF51 accession nr. 8). PCR-amplifieringar utfördes och PCR-produkter analyserades som beskrivits tidigare, med mindre modifieringar (25). Kortfattat amplifierades 1 μl omvänd transkriptionsblandning i en slutlig volym på 15 μl, i närvaro av 1 μCi av [α-32 P]dCTP (3000 Ci/mmol), 4 ng/μl varje primer (ER-β1U, ER-β1L och ER-β2L), och 0,3 enheter Taq DNA-polymeras (Life Technologies, Inc.). Varje PCR bestod av 30 cykler (30 s vid 60°C, 30 s vid 72°C och 30 s vid 94°C). PCR-produkter separerades sedan på 6% polyakrylamidgeler innehållande 7 m urea. Efter elektrofores torkades gelerna och autoradiograferades. Förstärkning av det allestädes närvarande uttryckta glyceraldehyd-3-fosfatdehydrogenas cDNA utfördes parallellt och PCR-produkter, separerade på agarosgeler, färgades med etidiumbromid såsom beskrivits tidigare (25). Identiteten för PCR-produkter bekräftades genom subkloning och sekvensering, som rapporterats tidigare (25).

TP-PCR-validering.

Den första serien av experiment, utförd med cDNA framställda från bröstcancercellinje-mRNA, visade att ER-β1, -β2 och -β5 cDNA kan samamplifieras, och de ledde till produktionen av tre PCR-produkter som subklonades och sekvenserades som beskrivits tidigare (25). Spetsade cDNA-preparat innehållande 1 fg renade PCR-produkter, motsvarande ER-β1 och -β5 mRNA, amplifierades tillsammans med ökande mängder ER-β2 PCR-produkt (0, 0,2, 0,4, 1, 4 och 8 fg) i en ett enda PCR-rör med användning av de tre primrarna (ER-β1U, ER-β1L och ER-β2L), som beskrivits ovan. Liknande experiment utfördes med användning av konstanta mängder av ER-β1 och ER-β2 eller av ER-β2 och ER-β5, med ökande mängder av ER-β5 respektive ER-β1 PCR-produkter. Parallellt amplifierades också preparat innehållande 1 fg av varje PCR-produkt ensam. I varje fall separerades PCR-produkter på 6% polyakrylamidgeler innehållande 7 m urea. Efter elektrofores torkades gelerna och autoradiograferades. Signaler kvantifierades genom excision av de lämpliga banden och räkning i en scintillationsräknare (Beckman). För varje prov uttrycktes ER-β1-, -β2- och -β5-signaler som en procentandel av summan av alla uppmätta signaler (ER-β1 + ER-β2 + ER-β5-signaler). Experiment har utförts i duplikat och medelvärdet av de relativa signalerna har beräknats. För varje ER-β-isoform analyseras regressions mellan den erhållna relativa signalen och den relativa initiala ingången (dvs.ER-β isoform input uttryckt som en procentandel av ER-β1 + ER-β2 + ER-β5 input) utfördes med användning av GraphPad Prism programvara.

Kvantifiering och statistiska analyser.

För att kvantifiera det relativa uttrycket av ER-β1, -β2 och -β5 mRNA inom varje bröstvävnadsprov använde vi TP-PCR som beskrivs ovan. Kvantifiering av ER-β1-, -β2- och -β5-signaler utfördes genom excision av banden och scintillationsräkning. För varje prov uttrycktes ER-β1-, -β2- och -β5-signaler som en procentandel av summan av alla uppmätta signaler (ER-β1 + ER-β2 + ER-β5-signaler). Tre oberoende PCR utfördes och medelvärdet av de relativa uttrycken beräknades. Skillnader mellan ER-β1, -β2 och -β5 relativa uttryck inom den studerade kohorten testades med Wilcoxon signed rank test (tvåsidigt). Korrelationer med tumöregenskaper testades genom beräkning av Spearman-koefficienten (r).


Resultat

För att identifiera proteinkomplex av vilka flera distinkta komponenter är koordinerat reglerade av miRNA, sammanställde vi ett miRNA-proteinmålnätverk för 677 mänskliga miRNA och 18 880 mål som är listade i TargetScan http://www.targetscan.org databasen. Målen kartlades till en icke-redundant uppsättning av 2 177 experimentellt verifierade proteinkomplex från CORUM-databasen [20]. Vi sammanställde proteinkomplexen, som är mer signifikant associerade med måluppsättningarna av miRNA än förväntat för slumpmässiga mållistor baserat på Fishers exakta test (se Metoder). Analysen resulterade i 722 miRNA-reglerade proteinkomplex (P-värde < 0,05 Fishers exakta test med Bonferroni-korrigering för flera tester), som innehöll minst två mål av ett individuellt miRNA. Hela listan över miRNA-reglerade proteinkomplex finns i Ytterligare fil 1, Tabell S1 online. Dessutom reglerades 140 proteinkomplex signifikant av miRNA-kluster (P-värde < 0,05, Fishers exakta test med Bonferroni-korrigering för flera tester). Listan över proteinkomplex som regleras av kluster av miRNA finns i ytterligare fil 2, Tabell S2. De högst rankade komplexen listas i Tabell 1 och Tabell 2.

Funktionellt spektrum av miRNA-reglerade proteinkomplex

Vi analyserade sedan spektrumet av funktioner som täcks av vår uppsättning miRNA-reglerade proteinkomplex. Vi identifierade de biologiska processerna (genontologikategorier [15]) och vägar som representerar de molekylära interaktionerna och reaktionsnätverken (KEGG [16]), som är berikade inom den totala uppsättningen av 810 miRNA-riktade komponenter i proteinkomplexen (Ytterligare fil 3 , Tabell S3 och Ytterligare fil 4, Tabell S4 online). Som visas i figur 1a är de miRNA-reglerade proteinkomplexen huvudsakligen involverade i reglering av RNA-metabolisk process, reglering av transkription och kromatinmodifiering. Omvänt är hushållsfunktioner, såsom translationell förlängning och ATP-syntes kopplad elektrontransport underrepresenterade. Resultaten bekräftar tidigare undersökningar [21] som visar att miRNA mindre ofta riktar sig mot gener som är involverade i väsentliga cellulära processer. Intressant nog finns det en överrepresentation av gener involverade i G1-fasen av mitotisk cellcykel, medan gener som är involverade i S-fasen och M/G1-övergången av mitotisk cellcykel är underrepresenterade. Experimentella bevis har redan rapporterats för reglering av signaltransduktion i flera metazoanarter [22-26] och cellcykeln [27, 28] av miRNA. Regleringen av cellcykeln av miRNA stöds ytterligare av starka korrelationer av miRNA-överuttryck med olika typer av cancer [29].

Funktionsanalys och validering av miRNA-reglerade proteinkomplex. Funktionsanalys: Anrikning av Gene Ontology (GO) termer och KEGG-vägar i målsubenheterna av proteinkomplex. Storleken på staplarna för varje term indikerar den negativa logaritmen för P-värdet. Endast meningsfulla och icke-redundanta termer valdes ut för illustration. Se ytterligare fil 3 &4, Tabell S3&S4 för en fullständig och detaljerad lista över viktiga termer.

Dessa observationer motsvarar överrepresentationen av riktade gener som finns i vägar från KEGG (se figur 1b). En hög överrepresentation av gener kunde observeras i "Pathways in cancer". Också många signalvägar är överrepresenterade, nämligen Wnt-signalering, TGF-beta-signalering, insulinsignalering, Notch-signalering, ErbB-signalering, MAPK-signalering, T- och B-cellsreceptorsignalering och Chemokine-signalering. Gener involverade i hushållsfunktioner var underrepresenterade även i KEGG-vägar, nämligen RNA-polymeras, RNA-transport, proteasom, oxidativ fosforylering och ribosom.

Validering av förutsagda miRNA-mål i proteinkomplex

Två nyare proteomikstudier mätte förändringarna i syntesen av proteiner som svar på miRNA-överuttryck eller knockdown på en genomomfattande skala för utvalda miRNA [6, 7]. Vi inkorporerade data från dessa studier för att validera våra förutsägelser. För att bestämma effekten av proteinnedreglering av miRNA, som har mål i proteinkomplex, jämfördes nivån av nedreglering av målkomponenter och icke-riktade komponenter. Vi ansåg både signifikant och obetydligt reglerade komplex, eftersom mängden signifikant reglerade komplex för de undersökta miRNA:erna i proteomikstudien är för låg för att ge statistisk signifikans. De negativa veckändringarna av de riktade komponenterna var signifikant högre än de negativa veckändringarna av de icke-riktade komponenterna (se tabell 3 och figur 2) för varje analyserad miRNA. Till exempel visade våra data att LARC-komplexet (LCR-associerad ombyggnad) [30] har två (av 19) komponenter, som är beräkningsmässigt förutspådda mål för let-7. Dessa två komponenter, nämligen DPF2 (zinkfingerprotein ubi-d4) och SMARCC1 (SWI/SNF-relaterad matrisassocierad aktinberoende regulator av kromatinunderfamilj C-medlem 1) var blygsamt nedreglerade (faldiga förändringar på -0,38, och - 0,2, respektive), när let-7b överuttrycktes i HeLa-celler [7]. LARC binder till det DNas-överkänsliga 2-stället i den humana β-globin locus control region (LCR) och transaktiverar β-liknande globingener [30]. Genom att samtidigt nedreglera två komponenter i LARC-komplexet kan let-7b bidra till det övergripande transkriptionella repressionen av det humana β-globinlokuset.

Validering av riktade komplexa komponenter. Vik förändringsfördelningar av riktade och icke-riktade proteiner i komplex för varje undersökt miRNA. (*) indikerar hög signifikans i Kolmogorov-Smirnov-testet.

PAR-CLIP (Photoactivatable-Ribonucleoside-Enhanced Crosslinking and Immuno-precipitation) är ett kraftfullt verktyg för att detektera segment av RNA bundna av RNA-bindande proteiner (RBP) och ribonukleoproteinkomplex (RNP). Vi bekräftade miRNA-målplatserna som identifierats av PAR-CLIP [13] med proteomikdata [6, 7]. 55% av proteinerna med miRNA-målplatser som förutspåddes baserat på PAR-CLIP-data var måttligt nedreglerade (log2-faldig förändring < -0,1). 413 proteinkomplex innehöll miRNA-målplatser i minst två underenheter (ytterligare fil 5, tabell S5 online). Intressant nog, av de 5 185 unika proteinerna med miRNA-målplatser som identifierats baserat på PAR-CLIP-data, är 607 (12%) medlemmar av proteinkomplex (med minst två distinkta mål för en miRNA i samma proteinkomplex). Som jämförelse täcker den manuellt kurerade samlingen av humana proteinkomplex i CORUM-databasen 2 780 unika proteiner (2 % av UniProt-proteinerna). Detta innebär att miRNA-mål identifierade från PAR-CLIP-data är mer sannolikt att finnas i ett proteinkomplex från CORUM-databasen (12%) jämfört med proteiner i allmänhet (2%). Medan miRNA ofta riktar sig mot flera gener med isolerade funktioner, tyder dessa oberoende data, men endast genom en enkel uppskattning, att det också finns en betydande andel miRNA-mål, som är distinkta medlemmar av proteinkomplex (hypergeometiskt P-värde 1.23e-11) .

Proteinkomplex och miRNA-uttryck

Vi testade sedan om miRNA, som riktar sig mot olika komponenter i samma proteinkomplex, är mer benägna att samuttryckas. Den genomsnittliga uttryckskorrelationen (Co-expression beräknat av Pearson korrelationskoefficienter, nedan kallade PC-värden) av miRNA undersöktes baserat på parvisa korrelationsberäkningar av miRNA-expressionsprofiler som erhållits för 26 olika organsystem och celltyper [31]. För att testa för statistisk signifikans kombinerade vi alla parvisa PC-värden erhållna från uppsättningarna av miRNA som signifikant riktar sig mot samma komplex. Dessa PC-värden jämfördes sedan med alla andra parvisa PC-värden som fanns i datamängden från [31]. Vi utförde ett ensidigt Kolmogorov-Smirnov (KS) test för de två PC-värdefördelningarna och erhöll ett signifikant (P-värde 6.106e-24) högre samuttryck inom uppsättningarna av miRNA som riktar sig mot samma komplex. Eftersom vi är intresserade av samuttryck av miRNA som inte finns i en transkriptionsenhet, testade vi också för ökad korrelation endast för miRNA av olika transkriptionsenheter. Endast ett fåtal (3,3%) av de korrelerade miRNA:erna fanns faktiskt i en transkriptionsenhet. Därför förblir resultatet mycket signifikant (P-värde 2.11e-18). En annan fördom i våra resultat kan uppstå på grund av att alla miRNA från en familj måste rikta in sig på samma komplex eftersom de riktar sig mot samma uppsättning mRNA. Vi jämförde endast miRNA inom ett komplex som tillhör olika familjer. KS-testet resulterade i ett P-värde på 0,0058. Sammantaget indikerar vårt statistiska test att miRNA som riktar sig mot olika komponenter i ett proteinkomplex är signifikant samuttryckta. De genomsnittliga Pearson-korrelationerna av miRNA som samtidigt riktar sig mot ett specifikt komplex kan hittas i ytterligare fil 6, Tabell S6 online1).

Proteinkomplexa nätverk koordinerat reglerade av kluster av miRNA

Vi karakteriserade systematiskt proteinkomplexnätverken, som samtidigt regleras av klustrade miRNA i 154 transkriptionsenheter som erhållits från miRBase [1]. Sammankopplingen av måluppsättningarna för miRNA-genklustren utvärderades först enligt följande: antalet protein-proteininteraktioner mellan måluppsättningarna för varje par miRNA i klustret räknades, och dessa värden jämfördes med 1 000 slumpmässigt provtagna uppsättningar av miRNA. För att undvika miRNA-målförutsägelseförändringar som härrör från redundant förutsägelse av klustrade miRNA-familjemedlemmar, räknades endast mål för en familjemedlem inom varje kluster. Den statistiska analysen avslöjade 35 kluster, vars mål är signifikant sammankopplade i protein-protein-interaktionsnätverket (P-värde < 0,05, permutationstest, 1 000 prover, tabell 1). Att jämföra det observerade antalet interaktioner (Figur 3b) med motsvarande fördelningar av slumpmässigt provtagna uppsättningar av miRNA ger en stark indikation på att en betydande del av miRNA i kluster kan samordna mål (P-värde < 0,02, Wilcoxon signerat rangtest, Ytterligare fil 7, Tabell S7 online). För att stödja detta fynd använde vi också Fishers exakta test för att testa om det globala antalet målinteraktioner från miRNA-kluster är högre än förväntat av en slump. Detta test resulterade i ett P-värde < 2e-16.

Statistiska bevis på koordinatreglering av miRNA. a, Pearson-korrelationsfördelningar av miRNA som riktar sig mot samma komplex (röd linje) plottas mot fördelningen av alla observerade Pearson-korrelationsvärden (svart prickad linje). Även fördelningarna av uteslutna Pearson-korrelationer av miRNA från samma familj (blå) och samma kluster (grön) plottas. b, Boxplot för direkta interaktioner av proteiner som riktar sig till N miRNA inom ett kluster jämfört med en nollmodell av N slumpmässigt provtagna miRNA.

CtBP/ZEB-komplex regleras av miR-141-200c-klustret

Nätverksperspektivet ger fascinerande insikter om genreglering av miRNA-genkluster, vars måluppsättningar ännu inte har analyserats på systemnivå. För att utforska detta i detalj undersökte vi proteinkomplexen som förutspåddes vara koordinerat reglerade av miR-141-200c klunga. De miR-141 och miR-200c gener är lokaliserade på kromosom 12p 13.31, separerade av en 338bp spacer-sekvens miR-141 och miR-200c tillhöra miR-200 familj. Fröregionen av miR-141 skiljer sig från miR-200c med en nukleotid vid position 4 i miRNA:t, därför, miR-141 och miR-200c har, baserat på "seed"-regeln, olika beräkningsmässigt förutsagda mål. Ändå fann vi att målen för miR-141-200c kluster är signifikant sammankopplade (P-värde < 0,02, tabell 4).

Mycket färska rapporter har visat att miR-200 familjen reglerar epitelial till mesenkymal övergång (EMT) genom att rikta in sig på transkriptionsrepressorn zink-finger E-box-bindande homebox 1 (ZEB1) och ZEB2[4, 32–35]. Under EMT, miR-141-200c kluster och tumörinvasionssuppressorgenen E-cadherin är nedreglerade av ZEB1/2[35]. ZEB1 och ZEB2 undertrycker transkription genom interaktion med corepressor CtBP (C-terminalt bindande protein) [36]. Intressant nog är flera väsentliga komponenter i CtBP/ZEB-komplexet, nämligen ZEB1/2, CtBP2, RCOR3 (REST-corepressor 3) och CDYL (Chromodomain Y-liknande protein), förutspådda mål för miR-141-200c-klustret. CtBP2 har en miR-141 målplats och en miR-200c-målplats, medan ZEB1 och CDYL har två miR-200c-målplatser. RCOR3 har en miR-141-målplats. CtBP/ZEB-komplexet förmedlar transkriptionsförtrycket av dess målgener genom att binda till deras promotorer och förändra histonmodifieringen [37].

Vi visade att överuttryck av miR-141 och miR-200c ledde till minskat uttryck av CtBP2 och ZEB1 i humana pankreascancerceller (PANC-1) (Figur 4a). Luciferasreporteranalys visade minskad aktivitet av CtBP2 och ZEB1 3'UTR-luciferasreportrar med ökade nivåer av miR-141 och miR-200c (ytterligare fil 8, figur S1 online). Dessa resultat bekräftas också på proteinnivå genom immunoblots (Figur 4b). För att utesluta möjligheten att stabiliteten hos ZEB1 och CtBP2 är beroende av varandra, slog vi ner ZEB1 och CtBP2 separat av siRNA i PANC-1-celler och observerade ingen förändring i proteinnivåerna hos respektive komplexpartner (Figur 4c) . Även om uttrycket av CDYL och RCOR3 är mindre uppenbart påverkat av överuttryck av miR-141 och miR-200c i PANC-1-celler jämfört med CtBP2 och ZEB1 (data visas inte), observerade vi en nedreglering av CDYL och RCOR3 på proteinnivån , när miR-141 eller miR-200c transienterades i PANC-1-celler (Figur 4d), vilket tyder på att CDYL och RCOR3 också är mål för miR141-200c-klustret. Tillsammans visar dessa experiment, för första gången, att CtBP2, CDYL och RCOR3 kan regleras av miR141-200c-kluster post-transkriptionellt. Som den funktionella konsekvensen av miRNA-överuttryck, uttrycket av E-cadherin mRNA är kraftigt uppreglerat (Figur 4a), vilket indikerar att repressionsaktiviteten av CtBP/ZEB komplexet äventyras. Samspelet mellan miR-141-200c kluster och flera komponenter i CtBP/ZEB komplex föreslår en samordnad reglering av repressionsaktiviteten för CtBP/ZEB komplex. Spännande nog miR-141-200c kluster också mål p-catenin, som är en delad komponent av cellvidhäftning och Wnt signalering [38]. β-catenin finns i plasmamembranet, där det främjar celladhesion genom att binda till E-cadherin, i cytoplasman, där det lätt fosforyleras och bryts ner i frånvaro av en Wnt-signal, och i kärnan, där det binder till TCF-transkriptionsfaktorer och inducerar transkriptionen av Wnt-målgener. De flesta proteininteragerande motiv av β-catenin överlappar varandra på ett sådant sätt att dess interaktioner med var och en av dess proteinpartners är ömsesidigt uteslutande [38]. Eftersom miR-141-200c-klustret och E-cadherin båda nedregleras under EMT, är det frestande att spekulera i att mer β-catenin skulle göras tillgängligt för att delta i transaktivering av nedströmsgener, vilket kan bidra till cancerutvecklingen [4] .

Proteinkomplex regleras av miR-141-200c klunga. a, Realtids omvänd transkription-PCR av CtBP2 och ZEB1 efter transfektion av de angivna miRNA i odifferentierade cancerceller (PANC-1). Uttrycksnivåerna för E-cadherin (varav transkriptionen är förträngd av CtBP/ZEB-komplex) ingår som positiva kontroller. b, Bekräftelse av regleringen av CtBP2 och ZEB1 genom miR-141 och miR-200c på proteinnivåer genom immunoblots. c, ZEB1 och CtBP2 slår ner av siRNA, ingen förändring i proteinnivåer hos respektive komplex partner observeras. e, nedreglering av CDYL och RCOR3 på proteinnivå när miR-141 eller miR-200c transfekterades övergående.


Slutsatser och framtida riktningar

På grund av den väsentliga fysiologiska funktionen hos PTEN spelar ncRNA som kontrollerar PTEN-uttryck avgörande roller i olika biologiska aktivering, såsom autofagi och cellstamhet. PTEN inducerar autofagi genom att undertrycka PI3K/Akt-väg, medan miR-21-höjning hittades i mänskliga degenerativa nucleus pulposus-vävnader, vilket hämmar autofagi och inducerar ECM-nedbrytning via undertryckande PTEN-uttryck [137] Human aorta glattmuskelcell-härledd exosomal miR-221/ 222 undertryckte autofagin i humana navelvenendotelceller genom att reglera PTEN/Akt-signalvägen i ett samodlingssystem [138] MiR-21-5p ökar signifikant cellstamheten hos keloidkeratinocyter, medierad av PTEN-repression och AKT-aktivering, vilket kan förklara för invasionen och återkomsten av keloider [139]. MiR-10b främjar cellulär självförnyelse och uttryck av stammarkörer i bröstcancerstamceller genom negativ reglering av PTEN och ihållande aktivering av AKT [140].

Egentligen fokuserar terapeutiska strategier för flera sjukdomar på PI3K/Akt-väghämmare. Den terapeutiska fördelen är dock blygsam på grund av nätverkets komplexitet [141, 142]. PTEN-modulering har ansetts vara ett möjligt tillvägagångssätt för tumörer och andra sjukdomar. NcRNA inklusive lncRNA och miRNA verkar ensamma eller interagerar med varandra för att reglera PTEN-uttryck. Belysning av detaljerna som ncRNA modulerar PTEN-uttryck kan ge nya insikter i regleringsnätverket för PTEN, vilket kan föreslå möjliga strategier för att rikta PI3K/Akt-vägen.

Primära terapeutiska försök riktade mot ncRNA för att förändra PTEN-uttrycket har visat effekter. Sofokarpin, en tetracyklisk quinolizidinalkaloid som härrör från Sophora alopecuroides L, has shown inhibitory effects on HNSCC progression via the downregulation of miR-21 and the upregulation of PTEN in vivo and in vitro [53]. Ursolic acid exerted protective action on high glucose-induced cell podocyte injury via decreasing miR-21 expression, which resulted in an increase of PTEN level [143]. Combination of STAT3 inhibitor and DDP treatment led to a notable reduction of STAT3/miR-21 axis and an increase of PTEN level, repressing oral squamous cell carcinoma (OSCC) cell proliferation, migration and invasion [144].

As-miR-21 treatment presented an obvious inhibition on established glioma tumor growth and an increase in PTEN expresson. Coincidently, in a prostate xenograft model, injection of as-miR-4534 led to a significant reduction in tumor volume, which increased the expression level of PTEN [145]. In a spontaneously developed lung tumors mouse model, treatment with the miR-214 antisense oligonucleotides microvesicles displayed promotion of PTEN levels and reduction of growth of spontaneous lung tumors [68]. Furthermore, administration of LNA-antimiR-19a increased the sensitivity of multidrug resistant MCF-7 cells to Taxol in vivo, with an upregulation of PTEN verified [146]. The growth of human LSCC xenograft was remarkably inhibited by HOTAIR shRNA lentivirus treatment [135], and injection of the PTENP1-expressing baculovirus effectively mitigated the HCC xenograft tumor growth, which was associated with the increase of PTEN [97].

In term of the importance of PTEN expression level in physiological situation and pathogenesis of various diseases, modulating PTEN level could be considered as potential approaches for multiple diseases, while clarifying the regulation network of PTEN including ncRNAs is predicted to be able to provide novel strategies.


Functions of circRNAs

Given their dynamic and cell type-specific expression patterns during development, many studies have focused on the potential developmental roles and functions of circRNAs. Although some studies are beginning to point towards some generalized functions for circRNAs, a unified explanation for the functions of the vast majority of circRNAs is lacking.

The function of specific circRNAs in development

Almost a decade ago, the Drosophila muscleblind (mbl) gene was found to give rise to developmentally regulated, highly abundant transcriptional products now known to be circRNAs (Ashwal-Fluss et al., 2014 Houseley et al., 2006). Eftersom mbl is an essential gene in Drosophila and human (Artero et al., 1998 Begemann et al., 1997), future studies may reveal if and how the circular isoform contributes to this essentiality or plays a role in development. Som nämnts ovan, circMbl might exert these effects by tuning the expression of the mbl transcript, competing with the production of mRNA and binding to MBL protein.

CircRNA from the mouse Sry gene is another early key example of developmentally regulated circRNA splicing. In this case, the linear Sry isoform is expressed in the developing genital ridge where it plays a fundamental role as a transcription factor in sex determination, whereas the circular isoform is expressed in adult testes (Capel et al., 1993). The circularization of the Sry transcript is dictated by promoter usage: the use of a promoter proximal to the coding region gives rise to a linear translated transcript, whereas the use of a distal promoter gives rise to a linear RNA containing long inverted repeats that is spliced to form a circRNA (Fig. 6) (Hacker et al., 1995). These complementary sequences are required for splicing the Sry circRNA (Dubin et al., 1995). Indeed, complementary sequence-mediated circularization appears to be a more general phenomenon it has been corroborated for several circRNAs in recent years and is now the basis of many circRNA overexpression vectors (Kramer et al., 2015 Liang and Wilusz, 2014 Zhang et al., 2014). Although no function could be ascribed to the Sry circRNA at the time of its discovery, there is now evidence that it might function as a miRNA sponge for miR-138, binding up to 16 molecules of this miRNA per circRNA (Fig. 6 Fig. 7A) (Hansen et al., 2013).

Developmentally regulated expression of SRY. (A) In the genital ridge of the developing mouse embryo, the Sry transcription start site (TSS) occurs proximal to the open reading frame (ORF), yielding a translatable mRNA that gives rise to SRY protein, a transcription factor involved in sex determination. (B) In the adult testis, the TSS occurs far upstream, yielding a long transcript containing large inverted repeats (green arrows). This transcript is backspliced to form a circRNA, which might function as a miR-138 sponge. SA, splice acceptor SD, splice donor.

Developmentally regulated expression of SRY. (A) In the genital ridge of the developing mouse embryo, the Sry transcription start site (TSS) occurs proximal to the open reading frame (ORF), yielding a translatable mRNA that gives rise to SRY protein, a transcription factor involved in sex determination. (B) In the adult testis, the TSS occurs far upstream, yielding a long transcript containing large inverted repeats (green arrows). This transcript is backspliced to form a circRNA, which might function as a miR-138 sponge. SA, splice acceptor SD, splice donor.

Another circRNA named ciRS-7, or sometimes simply CDR1as, which is derived from the Cdr1 antisense locus, also probably functions as a miRNA sponge (Hansen et al., 2013 Memczak et al., 2013). ciRS-7 is very highly expressed in the mammalian brain, is induced during neuronal development (Rybak-Wolf et al., 2015) and has >70 potential miRNA-binding sites for miR-7, most of which are conserved across eutherian mammals (Hansen et al., 2013 Memczak et al., 2013). When ciRS-7 is ectopically expressed in zebrafish, which normally do not express this circRNA but do express miR-7, defects in midbrain development are observed (Memczak et al., 2013), suggesting that this RNA might play a role in the development of the mammalian brain where ciRS-7 and miR-7 are co-expressed (Hansen et al., 2013).

Broad classes of circRNA function

The discovery that ciRS-7 och Sry may serve as miRNA sponges (Fig. 7A) generated great excitement that circRNAs might play a general role in post-transcriptional regulation. However, the analysis of AGO2 crosslinking to circRNAs, as well as computational searches for enrichment of miRNA seed matches in exons contained in circRNA versus neighboring non-circularized exons, has revealed only a few other candidate circRNAs that might function in this manner, none of which has yet been validated (Guo et al., 2014 You et al., 2015). Indeed, both Sry och ciRS-7 are exceptional in their primary sequence: both are circular RNAs hosted in genes with single exons, and both are derived from genomic regions with a highly repetitive sequence. The analysis of circRNA expression in organisms lacking siRNA pathways, namely, S. cerevisiae och P. falciparum, also supports additional functions for circRNA aside from a function as a miRNA sponge (Wang et al., 2014).

circRNA functional classes. (A) circRNAs can function as a sponge containing several binding sites for a particular miRNA/RBP and can compete a miRNA/RBP away (dashed arrows) from its mRNA targets, altering gene expression. (B) Through an interaction with U1 snRNP, exon-intron circRNAs (EIciRNAs) can interact with transcription complexes at host genes to induce their transcription (adapted from Li et al., 2015).

circRNA functional classes. (A) circRNAs can function as a sponge containing several binding sites for a particular miRNA/RBP and can compete a miRNA/RBP away (dashed arrows) from its mRNA targets, altering gene expression. (B) Through an interaction with U1 snRNP, exon-intron circRNAs (EIciRNAs) can interact with transcription complexes at host genes to induce their transcription (adapted from Li et al., 2015).

Similarly, the function of circMbl i Drosophila to sequester the MBL protein might also be exceptional (Ashwal-Fluss et al., 2014). Supporting the function of circRNAs as an RBP sponge, an analysis of mined photoactivatable ribonucleoside-enhanced crosslinking and immunoprecipitation (PAR-CLIP) data from 20 RBPs revealed slightly higher cluster density for circularized exons than for a control cohort of neighboring exons (Guo et al., 2014). However, a bioinformatic analysis of 38 RBP sequence motifs found that circularized exons contained a lower RBP-binding density than did the coding sequence or 3′ UTRs of mRNAs (You et al., 2015). It is important to note that these results are not necessarily contradictory as circRNAs are not translated, RBPs may not be easily displaced, accounting for high experimentally observed cluster densities despite bioinformatic predictions. Still, in order to have an appreciable effect on the concentration of an RBP in the cell without an enrichment of RBP-binding sites, a circRNA would have to be very highly expressed, making an RBP or miRNA sponge function unlikely for most circRNAs (Denzler et al., 2014), but, of course, rare cases may exist.

Another potential function of circRNAs could be to compete with the splicing of an mRNA, as in the case of mbl (Fig. 5A) (Ashwal-Fluss et al., 2014). As circRNAs almost always consist of exons that are also included in mRNA, the production of a circRNA would be expected to interrupt or compete with the splicing of the linear mRNA in most cases (unless a stable exon-skipped transcript can be formed). Whether this ‘function’ is merely a by-product of circRNA biogenesis remains to be tested. Although not a strict requirement, a feedback mechanism between the gene product and the splicing of its pre-mRNA would argue in favor of such a function.

Some circRNAs have also been implicated in transcriptional or post-transcriptional gene regulation of their host genes. De CDR1as circRNA is purported to promote the expression of CDR1 sense mRNA, but the precise mechanism by which this is achieved is unknown (Hansen et al., 2011). More recently, a class of regulatory circRNAs, named exon-intron circRNAs (EIciRNAs), has been identified and appears to play a role in transcriptional regulation (Li et al., 2015). Such EIciRNAs are multiexon circRNAs containing one or more unspliced intervening introns. Unlike most circRNAs, some EIciRNAs have been shown to be localized to the nucleus, and through an interaction with the U1 small nuclear ribonucleoprotein (snRNP), a spliceosomal component, can promote transcription of their parental genes (Fig. 7B). In this way, circRNA might function as a scaffold for RBPs regulating transcription. This example suggests a provocative hypothesis for a potential broader role for circRNAs as stable molecular scaffolds, much like some long noncoding RNAs (e.g. HOTAIR) (Tsai et al., 2010 Yoon et al., 2013).


LncRNAs in ES cell maintenance and differentiation

Embryonic stem (ES) cells are unique in their ability to generate all terminally differentiated cells derived from all three primary germ layers—ectoderm, endoderm and mesoderm. Maintaining this pluripotent state requires precise and delicate transcriptional regulation mediated by key transcription factors, such as Oct4, Sox2 and Nanog [ 70 ]. In addition to these protein components, lncRNAs are also involved in maintaining the ‘stemness’ of ES cells (Fig 2A). Guttman et al systematically performed loss-of-function studies on 147 lincRNAs expressed in mouse ES cells by using lentiviral-based shRNAs [ 11 ]. For 90% of the lincRNAs, knockdown resulted in significant changes in ES cell gene expression. Interestingly, 26 lincRNAs were found to be involved in the maintenance of ES cell pluripotency, whereas 30 lincRNAs acted to repress specific gene expression programmes associated with differentiation. Importantly, expression of most of these lincRNAs is regulated by ES-cell-specific transcription factors, and many lincRNAs seem to bind to diverse chromatin regulatory proteins, potentially giving rise to specific nuclear RNA–protein complexes. Similarly, Lipovich's group identified four conserved lincRNAs that are regulated by the ES-cell-specific transcriptional factors Oct4 and Nanog [ 10 ]. Importantly, inhibition or misexpression of two of these lincRNAs impaired the ‘stemness’ state of ES cells. Collectively, these results implicate lincRNAs in the regulatory networks that maintain ES cell identity. One caveat in interpreting these data, however, is the uncertainty as to whether all of the studied transcripts are truly non-coding. Although the coding potential of these transcripts was computationally evaluated, experiments are required to verify this important point.

LncRNAs also regulate differentiation of ES cells (Fig 2A). One well-characterized example is the role of Xist in X-chromosome inactivation in mammalian females [ 51 ]. To equalize the dosage of X-chromosome-encoded genes between female and male cells, expression from one of two copies of the X chromosome must be silenced this is achieved by formation of heterochromatin early during ES cell differentiation. A non-coding RNA transcript, Xist, is important in this developmental process. Xist is exclusively expressed from a region of the inactive X chromosome called the X-inactivation centre. Despite undergoing splicing, Xist remains in the nucleus to coat the inactive X chromosome, and to recruit—through its structured RNA domain termed Repeat A—the chromatin regulator PRC2 to this chromosome [ 71 ]. PRC2 facilitates the formation of heterochromatin through histone modifications, specifically H3K27. Således, Xist-mediated recruitment of PRC2 contributes significantly to X-chromosome inactivation. Interestingly, the generation and the activity of Xist are regulated by several other lnc transcripts, such as Tsix och Xite [ 51 ]. Clearly, regulatory networks of lncRNAs are important in this differentiation process, even when the transcripts themselves show limited conservation in primary sequence between species [ 72 ].

In addition to modulating ES cell differentiation, lncRNAs are also involved in the generation of induced pluripotent stem (iPS) cells (Fig 2A). iPS cells can be derived from terminally differentiated somatic cells by ectopic expression of key pluripotency-associated transcription factors, such as Oct4, Nanog, Sox2 and c-Myc [ 73 ]. This cellular reprogramming is accompanied by an extensive global remodelling of the epigenome [ 74 ]. Loewer et al found that several lincRNAs contribute to this dedifferentiation process [ 75 ]. By comparing lincRNAs expressed in iPS cells with those expressed in ES cells, they identified 28 lincRNAs that are specifically enriched in iPS cells. These lincRNAs are regulated by pluripotency-associated master transcription factors (Oct4 and Nanog), suggesting a potential involvement in the generation of iPS cells. In particular, inhibition of one such lincRNA, lincRNA-RoR, impairs iPS cell formation. Conversely, overexpression of this lincRNA leads to an approximate 2.5-fold increase in cellular reprogramming, a modest yet significant effect. Collectively, these observations indicate that lncRNAs can activate or repress transcriptional programmes associated with ES cell pluripotency or differentiation, and that their impact on these processes can range from essential to subtle but detectable.


Dynamic regulation of Gata factor levels is more important than their identity

Three Gata transcription factors (Gata1, -2, and -3) are essential for hematopoiesis. These factors are thought to play distinct roles because they do not functionally replace each other. For instance, Gata2 messenger RNA (mRNA) expression is highly elevated in Gata1-null erythroid cells, yet this does not rescue the defect. Here, we test whether Gata2 and -3 transgenes rescue the erythroid defect of Gata1-null mice, if expressed in the appropriate spatiotemporal pattern. Gata1, -2, and -3 transgenes driven by beta-globin regulatory elements, directing expression to late stages of differentiation, fail to rescue erythropoiesis in Gata1-null mutants. In contrast, when controlled by Gata1 regulatory elements, directing expression to the early stages of differentiation, Gata1, -2, and -3 do rescue the Gata1-null phenotype. The dramatic increase of endogenous Gata2 mRNA in Gata1-null progenitors is not reflected in Gata2 protein levels, invoking translational regulation. Our data show that the dynamic spatiotemporal regulation of Gata factor levels is more important than their identity and provide a paradigm for developmental control mechanisms that are hard-wired in cis-regulatory elements.


Diskussion

Extensive-Existing Coding Transcripts in Murine Spermatozoa

Compared with conventional strategies, RNA-Seq can provide a much more intact picture of the transcripts in sperm, allowing for the identification, quantification, and characterization of both known and unknown RNAs, including coding RNAs and noncoding RNAs [ 22]. RNA-Seq has been used to survey the selective retention of transcripts in human sperm [ 16]. In human mature sperm, approximately 22 302 unique transcripts were surveyed, including transcripts linked to the testes, spermatids, spermatogenesis, and infertility [ 15]. In our RNA-Seq results of pooled mouse sperm collected from 200 adult mice, more than 33 000 different transcripts, including 27 310 coding transcripts, were obtained, a number that is far beyond our original prediction. Considering the sensitivity and depth of RNA-Seq, some extremely low abundance transcripts could be sequenced [ 23]. To confirm the sequencing accuracy, sperm were purified strictly to eliminate contaminant cells, and all the sequencing processes were under strict quality control. The results of the real-time PCR used to verify the RNA-Seq data indicated that they generally corresponded with each other. In addition, we did another RNA-Seq of mouse sperm treated with a certain chemical, and the result was consistent with that of the normal sperm except for some transcripts (unpublished results). As a result, the RNA-Seq data were reliable.

According to the RNA-Seq results of human spermatozoa, more than 80% of the RNAs were fragmented ribosomal RNAs [ 15]. However, our RNA-Seq results and a previous report [ 24] showed that murine spermatozoa contained abundant transcripts with few or even no rRNA background. We divided these transcripts into two groups: randomly remnant transcripts and persistent transcripts. In a simplified mathematical model, the average numbers of these two types of transcripts in a single sperm cell are less than one and more than one. Based on two estimated results, namely, that a single sperm cell contains approximately 84 310 mRNAs (previously mentioned methods) and that RPKM indicates the abundance of a transcript without the effect of its length [ 20], we hypothesized that a transcript with RPKM ≥ 6 is a persistent transcript in sperm. In our RNA-Seq results, the number of transcripts with RPKM ≥ 6 was 5826, including 4885 coding transcripts, which corresponded with Ostermeier's [ 13] estimation. Although 4885 coding transcripts were estimated to exist in each sperm cell, it should be noticed that 4885 was an average number. Thus, the transcript with RPKM slightly more than six was possibly not retained in each sperm cell. The number of transcripts with RPKM six to eight was 1216, and the number of transcripts with RPKM 6–10 was 1923, which is a greater number of transcripts than found with RPKM of slightly more than six. Thus, the number of actually stable mRNA in a single sperm was surely less than 4885.

Our analyses focused mainly on the coding transcripts. Through gene ontology and phenotype analyses of the coding transcripts, we found that some of the transcripts were involved in reproduction and development, but these showed no significant bias compared with other biological processes. Through pathway analysis, 54 mRNAs were linked to the gonadotropin-releasing hormone receptor pathway, which plays a critical role in fertility [ 25], and 52 mRNAs were linked to the Wnt signaling pathway, which is related to the differentiation of Sertoli cells and spermatogonial stem/progenitor cells [ 26, 27]. The pathway analysis results indicated that these transcripts may encode proteins that play an important role in spermatogenesis and reproduction.

Because the transcripts with RPKM < 6 most likely did not exist in every spermatozoon, these were assumed to be randomly residual transcripts that did not function in postspermatogenesis. Among the transcripts with RPKM ≥ 6, we hypothesized that most of them were also residual of spermatogenesis-function transcripts. Those two types of spermatozoal transcripts may simply be remnants of prior functional transcripts involved in spermatogenesis and sperm maturation [ 28, 29].

It was noteworthy that 142 of the transcripts with RPKM ≥ 6 were expressed in spermatids during postmeiosis according to the results of Spermatogenesis online. In the last phase of spermatogenesis, both the nucleus and the cytoplasm of spermatids are condensed to form elongated spermatids [ 30]. During this process, the transcription in spermatids is shut down, and almost all of the cytoplasm is discarded meanwhile, the spermatids undergo morphological transformations, which still require the participation of many proteins [ 31]. These two processes are paradoxical in time thus, some transcripts are transcribed long before translation and wait in the cytoplasm to be translated [ 32]. In our opinion, the 142 transcripts involved in postmeiosis remained in the spermatozoa due to the limited time for discarding or degrading those transcripts. Of these transcripts, some showed a higher RPKM value compared with others. Till exempel, Prm1 (RPKM = 273) and Prm2 (RPKM = 1667), which code for protamine-1 and protamine-2, respectively, are specifically expressed before and during the DNA condensation phase in spermatids. The condensation phase is first characterized by abundant protamine expression and later results in the transition of DNA chromatin with protamine to replace histone [ 31]. Another example is Tnp1 (RPKM = 56) and Tnp2 (RPKM = 4365), encoding transition nuclear protein-1 and -2, which are arginine- and lysine-rich basic proteins, respectively, that strongly bind to DNA and are expressed exclusively in postmeiotic spermatids. In mouse, Tnp2 transcript is first detected in step 7 round spermatids and then degraded at steps 13 and 14 [ 33]. TNP1 and TNP2 play an important role in the spermatid chromatin condensation process through their phosphorylation by sperm-specific protein kinase A [ 34]. Similarly, the transcripts Fank1 (RPKM = 2027) [ 35], Spem1 (RPKM = 75) [ 36], and Klhl10 (RPKM = 130) [ 37] are also involved in spermiogenesis, such as in the processes of chromatin condensation and cytoplasm removal. Meanwhile, the works of Kobayashi et al. [ 38] showed that the gene expression level in mouse sperm was negatively correlated to the promoter methylation but positively correlated to the gene-body methylation in the genome [ 38]. As a consequence, the expression level of gene was also related to the methylation level in the genome.

Another group of highly retained transcripts is related to mitochondria, which are among the few organelles retained in mature spermatozoa. In total, 464 transcripts with RPKM ≥ 6 are related to the mitochondria. Of these, some transcripts showed an extremely high expression level, such as Mrpl27 (RPKM = 2500), Cox7b (RPKM = 2496), and Lars2 (RPKM = 2324). Although there is still debate on whether sperm mitochondria can translate nucleus-transcribing mRNA into protein via mitochondrial ribosomes, it has been reported that some coding transcripts are translated in mature spermatozoa after capacitation by mitochondrial ribosomes [ 39, 40].

The subset of transcripts that interested us most were those related to zygotic and/or embryonic development. It has been reported that the sperm-borne mRNA Akap4, which encodes for AKAP4, a protein involved in signaling cascades that are likely relevant in initial oocyte activation after fertilization, entered the fertilized oocyte [ 41]. In 2004, Ostermeier et al. [ 17] found that some human spermatozoal transcripts coding for proteins involved in fertilization, stress response, embryogenesis, morphogenesis, and implantation were delivered into the fertilized oocyte. In our RNA-Seq results, there were also many transcripts linked to development in particular, 42 transcripts with a relatively high expression level (RPKM ≥ 30) were involved in zygotic and/or embryonic development, and these included some of the transcripts reported by Ostermeier et al., such as Foxg1 och Clusterin, though the results of mouse were not the same as with human. We thus performed some in-depth studies of these transcripts to determine whether they entered the fertilized oocyte and were further translated these studies are described in detail below.

Abundant Coding Transcripts in Spermatozoa

A total of 635 coding transcripts with RPKM ≥ 60 were considered to be representative of the set of highly abundant transcripts. Of these highly abundant transcripts, 257 were located in reproductive tissues (testes and epididymis) and cells (spermatocyte, spermatids, and spermatozoa), indicating that these mRNAs encoded proteins with critical functions in spermatogenesis and sperm maturation, including the previously described processes of spermatid chromosome packing and cytoplasm discarding. It was notable that 55 were related to male infertility, which indicated that these transcripts played a critical role in male function and suggested that these might provide a resource of markers for the diagnosis of male infertility [ 42]. The gene ontology analysis showed that more than one in six transcripts were related to reproduction, including multicellular organismal reproductive process, gamete generation, fertilization, and the development of primary sexual characteristics, indicating that these transcripts might encode proteins that function in spermatogenesis.

More than one in four transcripts were related to development in particular, 33 were linked to embryonic development, including embryonic morphogenesis embryo development ending in birth or egg hatching and embryonic organ development, hinting that these transcripts may encode proteins that function in zygotic and/or embryonic development [ 43]. The increase in the ratio of development and reproduction in the gene ontology and phenotype analyses with an increase in the RPKM baseline (6, 60, and 600) indicated that the transcripts related to development and reproduction were more likely to be retained in sperm. Furthermore, it could be speculated that the transcripts in sperm are selectively rather than randomly reserved.

Delivery and Translation of Sperm-Borne mRNAs in the Fertilized Oocyte

To study the biological function of coding transcripts in zygotic development, the transcripts (RPKM ≥ 30) that may participate in zygotic and/or embryonic development were screened. In total, 11 of these were found to exist in sperm but not in oocyte. Furthermore, these 11 transcripts were tested in one- and two-cell zygotes, showing that only two coding transcripts were present in the one-cell zygote: Wnt4 och Foxg1. Because the transcription of zygote was shut down until it reached the two-cell stage [ 44, 45] and due to the absence of Wnt4 och Foxg1 in the oocyte, those two coding transcripts were confirmed to be delivered by sperm. The sperm-delivered Wnt4 was detected in the one-cell zygote but not in the two-cell zygote, whereas the coded WNT4 protein was found in both one- and two-cell zygotes. Because both the spermatids in testes and mature spermatozoa do not contain WNT4 protein (see Fig. 3, C and D), it was confirmed that the WNT4 protein in the fertilized oocyte was not delivered by sperm. Summarizing the previously described results, it could be speculated that the spermatozoal Wnt4 mRNA was sent into the oocyte, where it was immediately translated and degraded, and that the coded protein existed until at least the two-cell-zygote stage. Nevertheless, the sperm-delivered Foxg1 transcript was not translated in the fertilized oocyte but existed until the two-cell-zygote stage thus, it might be translated in a later development stage, which was not studied in this work.

Franco et al. [ 46] proved that WNT4 plays a critical role in progesterone signaling during embryo implantation and decidualization. Jordan et al. [ 47] showed that WNT4 inhibits steroid biosynthesis in mouse testicular Leydig cells. In our study, the results indicated that Wnt4 transcript delivered by sperm is translated in the zygote and then is degraded and that the coded WNT4 protein may function in initial zygotic development. The WNT4/β-catenin signaling pathway has been demonstrated to be a regulator in myogenic proliferation and vascular smooth muscle cell proliferation [ 48], suggesting that WNT4 in the zygote may play a similar role in cell division and proliferation. As a fibroblast growth factor signaling-regulating protein, FOXG1 has been reported to be an important regulator in embryo neurogenesis [ 49]. However, in this study, Foxg1 mRNA was not translated into protein in the one- and two-cell zygotes. Further studies are required to determine whether Foxg1 is translated and during which stage of development this occurs. It must be emphasized that although only two sperm-delivered transcripts were detected in the zygote in this study, there might be more transcripts delivered by spermatozoa during fertilization. It is possible that some transcripts were missed in our study due to the extremely low amount of sperm-delivered transcripts. The delivery of some transcripts that exist in both oocyte and sperm cannot be detected either because it is hard to determine whether these transcripts are contributed by sperm or by oocyte.

In classical concepts, oocyte provides almost all the necessary cytoplasmic components for early zygotic development, and paternal contribution is thought to be no more than genomic DNA. Recently, the paternal effects on embryonic development have attracted more and more attention, and the contribution of the parent in fertilization may be more than paternal genomic DNA. The entire contents of the sperm are released into the ooplasm on fertilization [ 50], followed by degradation of paternal mitochondria and sperm tail structures [ 51], whereas some sperm components are required for further development, such as the spermatozoal centriole [ 52], various transcription factors, and signaling molecules. However, the function of sperm-borne transcripts in regulating zygotic development has rarely been reported, though 380 RNAs have been proven to be delivered into the oocyte by sperm through comparing the RNA profiles of fertilized oocytes and parthenogenetic oocytes [ 53]. Sone et al. [ 54] demonstrated that sperm-specific phospholipase Cζ (PLCζ) transcript injected into the mouse oocyte could be translated into a functional protein to yield a functional calcium oscillator. Yao et al. [ 55] found that sperm-borne Dby mRNA was transferred into the oocyte during fertilization and regulated zygotic development. Meanwhile, some noncoding RNAs that appear during the last stage of sperm maturation play a potential role in early zygotic and development [ 56]. The results of present and previous studies and our results here strongly hint that some of the sperm-delivered transcripts may have paternal effects that are associated with the regulation of zygotic development, which remains to be explored.

Fastän Wnt4 was delivered and translated in the fertilized oocyte, it was unclear whether WNT4 was involved in zygotic development and in which process. Some efforts have been made to investigate the effect of the loss of WNT4 on early zygotic development. We tried to prepare conditional Wnt4-knockout mice in testis but failed because we could not get suitable Cre-mouse for conditional knockout in testis. Perhaps some work will be carried out on interfering WNT4 and FOXG1 expression, such as shRNA and siRNA, to confirm the function in early zygotic development. On the other hand, some work is now being carried out to seek clinical implications. Human sperm samples from both fertile and infertile donors have been collected for RNA-Seq to analyze the differences of the RNA profiles, and the two transcripts Foxg1 och Wnt4, identified in mouse sperm, have also been detected in human sperm.

In conclusion, the transcripts with RPKM ≥ 6 in our RNA-Seq results may exist in each murine sperm. A total of 5826 RNAs, including 4885 mRNAs, are consistently retained in each sperm, whereas the remaining 27 213 RNAs with RPKM < 6 are randomly retained. Most of the spermatozoal transcripts are residual transcripts with no biological function in postspermatogenesis, whereas the transcripts related to reproduction and development, which represent the function of spermatozoal RNA pre- and postfertilization, respectively, were more likely to be retained. Thus, the transcripts in sperm are selectively rather than randomly retained. In particular, the sperm-borne Wnt4 mRNA was found to be delivered and translated in the fertilized oocyte. This result indicates that some sperm-borne transcripts can enter the oocyte and be translated, which is new evidence of paternal effects on zygotic development. However, the function of sperm-delivered transcripts during early zygotic development requires further investigation.


Titta på videon: mRNA, tRNA, and rRNA function. Types of RNA (Augusti 2022).