Uniwersytet im. Adama Mickiewicza w Poznaniu Wydział Biologii Instytut Biologii Molekularnej i Biotechnologii Zakład Ekspresji Genów Rozprawa doktorska Zależność biogenezy cząsteczki miR-21 od dojrzewania jej prekursorów na poziomie alternatywnego splicingu oraz poliadenylacji mgr Michał Sekrecki Promotor: prof. dr hab. Krzysztof Sobczak Poznań 2021 2 Finansowanie Niniejsza rozprawa doktorska zrealizowana została ze wsparciem finansowym: Paszport do przyszłości -Interdyscyplinarne studia doktoranckie na Wydziale Biologii UAM POWR.03.02.00-00-I006/17 Specjalne stypendium naukowe z dotacji podmiotowej w ramach Krajowego Naukowego Ośrodka Wiodącego „Poznańskie Konsorcjum RNA” Narodowego Centrum Nauki (NCN), w ramach projektu pt. Mechanizmy prowadzące do zmian poziomu ekspresji i aktywności mikroRNA w dystrofii miotonicznej na podstawie decyzji nr 2014/15/B/NZ2/02453 3 Podziękowania Serdeczne podziękowania dla prof. dr hab. Krzysztofa Sobczaka ze te wszystkie lata współpracy, dzielenia się swoją wiedzą, uwagami oraz merytorycznym wsparciem podczas trwania całego doktoratu. Narzeczonej Agacie za silną wiarę w moje dążenie do celu oraz nieocenione wsparcie w trudnych chwilach. Bez Ciebie na pewno ta praca by nie powstała. Mojej Rodzinie, a zwłaszcza Rodzicom, którzy swoją ciężką pracą i dużym zaangażowaniem odpowiednio przygotowali mnie do dorosłego życia. Koleżankom oraz Kolegom, tym obecnym oraz byłym, z Laboratorium prof. Sobczaka za przyjazną oraz twórczą atmosferę w laboratorium oraz poza nim. W szczególny sposób chciałbym podziękować dr Agnieszce Piaseckiej za wspólną walkę na tym samym miRNA-froncie. Wszystkim Koleżankom i Kolegom z Instytutu Biologii Molekularnej i Biotechnologii za tworzenie tak ciekawego oraz inspirującego miejsca pracy naukowej. Pracownikom Instytutu Biologii Molekularnej i Biotechnologii za ich merytoryczną, techniczną oraz administracyjną pracę na rzecz całego Instytutu. Pani dr Karolinie Cerbin za jej nieocenioną pracę oraz pomoc w załatwianiu wszystkich formalności. 4 Dedykacja Moim Bliskim 5 Wykaz skrótów 2′-OMe-RNA-PS analog RNA ze szkieletem tiofosforanowym (PS, ang. phosphorothioate) oraz podstawioną grupą metylowa przy atomie węgla 2′ rybozy 3’ss miejsce splicingu intronu po stronie 3’ (ang. 3’ splice site) 5’ss miejsce splicingu intronu po stronie 5’ (ang. 5’ splice site) AA aminokwas (ang. amino acid) AON antysensowny oligonukleotyd (ang. antisense oligonucleotide) APAS alternatywne miejsce sygnału poliadenylacji (ang. alternative polyadenylation site) CAGE analiza ekspresji genów opierająca się na strukturze cap (ang. Cap Analysis of Gene Expression) cDNA komplementarny DNA (ang. complementary DNA) CDS sekwencja kodująca białko (ang. coding sequence) CR-APA alternatywna poliadenylacja wewnątrz sekwencji kodującej białko (ang. coding region-APA) ENST numer transkryptu wg. bazy Ensembl (ang. Ensembl transcript) ER retikulum endoplazmatyczne (ang. endoplasmic reticulum) GFP białko zielonej fluorescencji (ang. green fluorescent protein) HeLa ludzka, nabłonkowa linia komórkowa, wyizolowana z szyjki macicy HSkM ludzka mioblastyczna linia komórkowa (ang. human skeletal myoblast) kpz tysięcy par zasad lncRNA długie, niekodujące RNA (ang. long noncoding RNA) mRNA RNA informacyjne (ang. messenger RNA). ncRNA niekodujące RNA (ang. noncoding RNA) nt nukleotyd (ang. nucleotide) pA poliadenylowany (ang. poliadenylated) PAS miejsce sygnału poliadenylacji (ang. polyadenylation signal) PAS dyst. dystalne miejsce sygnału poliadenylacji (ang. distal polyadenylation signal) 6 PAS proks. proksymalne miejsce sygnału poliadenylacji (ang. proximal polyadenylation signal) piRNA cząsteczki RNA związane z białkiem Piwi (ang. Piwi interacting RNA) PR punkt rozgałęzienia (ang. branch point) PTBP białko wiążące się do traktu polipirymidynowego (ang. polypirimidine tract binding protein) RACE technika mapowania końców transkryptów cDNA (ang. Rapid amplification of cDNA ends) RBP białko wiążące się do RNA (ang. RNA binding protein) RNAi interferencja RNA (ang. RNA interference) RNA-seq sekwencjonowanie RNA (ang. RNA-seq) siRNA małe interferujące RNA (ang. small interfering RNA) sncRNA krótkie, niekodujące RNA (ang. short noncoding RNA) snRNP małe jądrowe nukleoproteiny (ang. small nuclear ribonucleoproteins) TPM normalizacja - transkrypty na million (ang. Transcripts Per Million) TSS miejsce startu transkrypcji (ang. transcription start site) U2AF czynnik pomocniczy U2 (ang. U2 auxilary factor) UCSC Genome Browser internetowa przeglądarka genomowa (ang. University of California Santa Cruz) UTR region nie ulegający translacji (ang. untranslated region) 3’UTR region nie ulegający translacji poniżej ORF 5’UTR region nie ulegający translacji powyżej ORF UTR-APA alternatywna poliadenylacja wewnątrz sekwencji niekodującej białko (ang. untranslated region-APA) VMP1 wakuolarne białko membranowe 1 (ang. Vacuole membrane protein 1) WES sekwencjonowanie całych eksonów (ang. whole-exome sequencing) WGS sekwencjonowanie całego genomu (ang. whole-genome sequencing) 7 Spis treści Finansowanie .......................................................................................................................................... 2 Podziękowania ........................................................................................................................................ 3 Dedykacja ................................................................................................................................................ 4 Wykaz skrótów ........................................................................................................................................ 5 Spis treści................................................................................................................................................. 7 Streszczenie ........................................................................................................................................... 10 Abstract ................................................................................................................................................. 12 1. Wstęp ............................................................................................................................................ 14 1.1. Świat RNA .............................................................................................................................. 14 1.1.1. Dojrzewanie cząsteczek prekursorowych RNA ............................................................. 16 1.1.1.1. Splicing RNA ........................................................................................................... 16 Rola rybonukleoprotein (snRNP) w procesie splicingu pre-mRNA ....................................... 18 1.1.1.2. Alternatywne splicing RNA (AS) ............................................................................ 20 1.1.1.3. Poliadenylacja na końcu 3’ RNA – dobudowanie ogona poli(A) ........................... 23 1.1.1.4. Alternatywna poliadenylacja (APA) ....................................................................... 24 1.1.1.5. Zależność pomiędzy splicingiem, a poliadenylacją ............................................... 26 1.2. Długie niekodujące RNA (lncRNA) ......................................................................................... 27 1.3. Krótkie niekodujące RNA (sncRNA) ....................................................................................... 28 1.3.1. mikroRNA ...................................................................................................................... 29 1.3.1.1. Biogeneza miRNA - klasyczna droga powstawania miRNA ................................... 30 1.3.1.2. Mirtrony – alternatywna ścieżka biogenezy miRNA ............................................. 31 1.3.1.3. Badania genomowe oraz identyfikacja kanonicznych cząsteczek miRNA............. 32 1.3.1.4. Genomowa lokalizacja miRNA ............................................................................... 33 1.3.1.5. Mechanizm działania miRNA ................................................................................. 35 1.3.1.6. Znaczenie cząsteczek miRNA w rozwoju oraz w chorobie .................................... 36 1.3.2. mikroRNA-21 ............................................................................................................. 37 1.3.2.1. Genomowa lokalizacja oraz regulacja biogenezy miR-21 ..................................... 37 1.3.2.2. Znaczenie miR-21 podczas rozwoju embrionalnego ............................................. 38 1.3.2.3. miR-21 w kancerogenezie ..................................................................................... 39 2. Cel pracy ........................................................................................................................................ 42 3. Materiały i metody ........................................................................................................................ 43 3.1. Konstrukty genetyczne GFP_pri-miR-21 ............................................................................... 43 8 3.2. Hodowle bakteryjne .............................................................................................................. 46 3.3. Eksperymenty na liniach komórkowych ................................................................................ 46 3.3.1. Spis stosowanych linii komórkowych ............................................................................ 46 3.3.2. Hodowla oraz różnicowanie komórek ........................................................................... 47 3.3.3. Transfekcje komórek ..................................................................................................... 47 3.3.4. Spis stosowanych oligonukleotydów ............................................................................ 47 3.3.5. Izolacja RNA i odwrotna transkrypcja ........................................................................... 49 3.3.6. Odwrotna transkrypcja dla cząsteczek miRNA .............................................................. 49 3.4. Analiza danych z portalu GTEx .............................................................................................. 50 3.5. Analizy RT-PCR oraz RT-qPCR ................................................................................................ 50 3.5.1. Lista starterów ............................................................................................................... 51 3.6. Western blot.......................................................................................................................... 53 3.7. Frakcjonowanie komórek ...................................................................................................... 54 4. Wyniki ............................................................................................................................................ 55 4.1. Transkrypty pri-miR-21 powstają niezależnie z własnych miejsc promotorowych, a terminacja transkrypcji zachodzi w alternatywnych miejscach poliadenylacji ................................. 55 4.1.1. Gen VMP1 oraz jego izoformy splicingowe ................................................................... 55 4.1.2. Pierwotne prekursory pri-miR-21 .................................................................................. 59 4.1.3. Poziom ekspresji VMP1, lncVMP1 oraz pri-miR-21 jest znacząco odmienny w różnych tkankach człowieka ....................................................................................................................... 61 4.1.4. Komórki z wyciszeniem genu DROSHA stanowią model w badaniu krótko żyjących prekursorów pri-miRNA ................................................................................................................ 64 4.1.5. Zjawisko alternatywnej poliadenylacji prowadzi do powstania poliadenylowanych transkryptów pri-miR-21 ............................................................................................................... 65 4.1.6. Poziom expresji VMP1, pri-miR-21 oraz miR-21 ulega istotnemu podwyższeniu podczas proliferacji mioblastów ................................................................................................................. 68 4.1.7. Brak zmian poziomu mRNA VMP1 w komórkach z niedoborem DROSHA ................... 70 4.1.8. Podwyższona aktywność transkrypcyja prowadzi do podwyższonegp poziomu miR-21 w komórkach raka piersi ............................................................................................................... 72 4.2. Alternatywna poliadenylacja ma bezpośredni wpływ na biogenezę miR-21........................ 75 4.2.1. Komórki z wyciszeniem CPSF3 jako potencjalny model badania wpływu alternatywnej poliadenylacji VMP1/pri-miR-21 na biogenezę miR-21 ................................................................ 75 4.2.2. Stworzenie konstruktu genetycznego do badań wpływu dojrzewania prekursora pri- mir-21 na biogenezę miR-21 ......................................................................................................... 77 4.2.3. Aktywność PAS proks. w RNA VMP1/pri-miR-21 ma bezpośredni wpływ na biogenezę miR-21 ....................................................................................................................................... 79 4.3. Zależność pomiędzy aktywnością czynników splicingowych działających w 3’ss ostatniego intronu, a zajściem procesu cięcia i poliadenylacji w pri-miR-21 ...................................................... 82 9 4.3.1. Blokowanie PAS proks. VMP1/pri-miR-21 oraz jego delecja wpływają na zwiększoną retencję ostatniego intronu .......................................................................................................... 82 4.3.2. Izoformy pri-miR-21 z i bez retencji intronu są prekursorami miR-21 .......................... 84 4.3.3. Obecność miejsca splicingu 3’ (3’ss) ostatniego intronu pri-miR-21 ma wpływ na biogenezę miR-21 .......................................................................................................................... 85 5. Dyskusja ......................................................................................................................................... 88 6. Wnioski ........................................................................................................................................ 100 7. Bibliografia .................................................................................................................................. 101 8. Spis rycin i tabel ........................................................................................................................... 116 10 Streszczenie Cząsteczki mikroRNA (miRNA) stanowią ważny element regulatorowy utrzymujący homeostazę w organizmach żywych. Te krótkie (20-22 nukleotydów), niekodujące RNA regulują poziom ekspresji niemal wszystkich genów kodujących białka, na drodze interferencji RNA. Na dzień dzisiejszy zidentyfikowanych jest blisko 2000 ludzkich miRNA. Jednym z lepiej poznanych jest miR-21. Cząsteczka ta od lat stanowi obiekt badań pod kątem jej roli w procesie rozwoju zwierząt, jak również w patogenezie chorób takich jak nowotwory. Pomimo dość dobrze opisanych szlaków w których zaangażowany jest miR-21, nadal słabo poznane są mechanizmy kontrolujące proces jego biogenezy. Alternatywny splicing (AS) oraz alternatywna poliadenylacja (APA) pierwotnych transkryptów są niezwykle ważnymi mechanizmami w regulacji ekspresji większości genów kodujących białka. Procesy te zachodzą podczas transkrypcji i są ze sobą ściśle związane i wzajemnie na siebie wpływają. Na dzień dzisiejszy niewiele prac badawczych skupiało się na udziale tych procesów w regulacji ekspresji genów miRNA. Głównym celem niniejszej rozprawy doktorskiej było zbadanie zaangażowania AS oraz APA w proces biogenezy miR-21. Podczas pierwszego etapu badań wykazano, że pierwotny transkrypt pri-miR-21 powstaje niezależnie od pre-mRNA swojego genu-gospodarza VMP1 i może podlegać charakterystycznym dla pre-mRNA VMP1 procesom składania. W pracy, dzięki analizie danych z sekwencjonowania RNA, określono dużą zmienność w poziomie ekspresji pri-miR-21 w różnych ludzkich tkankach. Wyniki te wskazują na obecność precyzyjnych mechanizmów, bezpośrednio regulujących transkrypcję pri-miR-21, ale również sugerują zachodzenie wariantywnego splicingu tego prekursorowego RNA, co przypuszczalnie przekłada się na zróżnicowany poziom ich ekspresji w ludzkich tkankach. Wykorzystując model komórkowy ze znacznie ograniczonym tempem przetwarzania transkryptów pri-miRNA scharakteryzowano rozmaite izoformy pri-miR-21 w tym izoformy z retencją intronu 11. Dodatkowo poprzez zastosowanie blokera oligonukleotydowego wiążącego się do określonych sekwencji RNA lub poprzez mutację tego miejsca w konstrukcie genetycznym wykazano, że aktywność alternatywnych sygnałów poliadenylacji (APAS) występujących w 3’UTR VMP1, ma wpływ na efektywność biogenezy miR-21. Na podstawie przeprowadzonych analiz można wnioskować, że powstawanie kilku różnych izoform pri-miR-21 odgrywać może ważną rolę w procesie biogenezy miR-21. Dodatkowo badania 11 wykazały bezpośredni wpływ PAS zlokalizowanego przed sekwencją kodującą miR-21 na ilość dojrzałej cząsteczki miR-21. Uwzględniając obecność powszechnej izoformy pri-miR-21 z retencją intronu, w ostatnim etapie pracy postanowiono sprawdzić zależność efektywności biogenezy miR-21 od splicingu pri-miR-21. Poprzez zablokowanie lub mutagenezę miejsca składania RNA zlokalizowanego po stronie 3’ doprowadzono do zaburzenia splicingu pri-miR-21 oraz zaobserwowano istotny wzrost poziomu tej cząsteczki RNA, co przełożyło się na zwiększenie liczby dojrzałych cząsteczek miR-21. Uzyskane wyniki dowodzą, że obecność izoformy z retencją intronu poprzez bezpośredni wpływ na aktywność miejsca 3’ splicingu w 11 intronie VMP1, pozytywnie wpływa na biogenezę miR-21. Uzyskane w pracy wyniki przyczynią się do lepszego zrozumienia mechanizmów, jakie zaangażowane mogą być w regulację poziomu cząsteczki miR-21. Opisywane w pracy zależności stanowią solidną podstawę do twierdzenia, że w globalne zmiany ilości cząsteczek miRNA zaangażowane są liczne mechanizmy po- i ko-transkrypcyjne. Taka wiedza może przyczynić się do wyjaśnienia mechanizmów prawidłowej regulacji ekspresji genów miRNA, ale również patomechanizmów wielu chorób oraz w dalszej kolejności do opracowania potencjalnych strategii terapeutycznych, w tym terapii celujących w dojrzewanie prekursorowych pri-miRNA lub biogenezę miRNA. Słowa kluczowe: miR-21, pri-miR-21, alternatywna poliadenylacja, alternatywny splicing, VMP1, biogeneza miRNA 12 Abstract MicroRNAs (miRNAs) are an important regulatory element maintaining homeostasis in living organisms. These short (20-22 nucleotides), non-coding RNAs regulate the expression level of almost all protein-coding genes through RNA interference mechanism. For now, nearly 2,000 human miRNAs have been identified. One of the well-known is the miR-21. This molecule has been an object of research for many years in terms of its role in the process of animal development, as well as in the pathogenesis of diseases such as cancer. Despite the fairly well-described pathways in which miR-21 is involved, the mechanisms controlling the process of its biogenesis are still poorly understood. Alternative splicing (AS) and alternative polyadenylation (APA) of primary transcripts are extremely important mechanisms in regulating the expression of most protein-coding genes. These processes take place during transcription and are closely related and influence each other. As of today, little research has focused on the involvement of these processes in regulating miRNA biogenesis. The main purpose of the dissertation was to investigate the involvement of AS and APA in the miR-21 biogenesis process. During the first stage of the research, it was shown that the primary transcript of pri-miR-21 is generated independently of the pre-mRNA of its host gene VMP1 and may undergo splicing processes characteristic of VMP1 pre-mRNA. Due to the analysis of RNA sequencing data, the study revealed a high variability in the expression level of pri-miR-21 in various human tissues. These results indicate the presence of precise mechanisms directly regulating the transcription of pri-miR-21, but also suggest the occurrence of variant splicing of precursor RNA, which may have an impact on varying levels of expression in human tissues. Using a cell model with a significantly reduced processing rate of pri-miRNA transcripts, various isoforms of pri-miR-21 were characterized, including isoforms with intron 11 retention. Alternative polyadenylation signals (APAS) which are present in the 3'UTR of VMP1 have an impact on the efficiency of miR-21 biogenesis. On the basis of the conducted analyses, it can be concluded that the formation of several different isoforms of pri-miR-21 may play an important role in the process of miR-21 biogenesis. In addition, studies have shown a direct effect of PAS located upstream of the miR-21 coding sequence on the amount of the mature miR-21 molecule. 13 Taking into account the presence of the common pri-miR-21 isoform with an intron retention, in the last stage of the work, it was decided to check the dependence of the effectiveness of miR-21 biogenesis on pri-miR-21 splicing. By blocking or mutagenesis of the RNA splice site located on the 3' side (3’ss), pri-miR-21 splicing was disturbed and a significant increase in the level of this RNA molecule was observed, which have an impact on increase in the number of mature miR-21 molecules. The obtained results prove that the presence of the intron retention isoform positively influences the biogenesis of miR-21 by directly affecting the activity of the 3 'splicing site in intron 11 of VMP1. The results obtained in this study will contribute to a better understanding of the mechanisms that may be involved in the regulation of the miR-21 biogenesis. The dependencies described in the paper provide a solid basis for the statement that numerous post-and co-transcriptional mechanisms are involved in global changes in the number of miRNA molecules. Such knowledge may help to elucidate the mechanisms of the correct regulation of miRNA gene expression, but also the pathomechanisms of many diseases, and subsequently to the development of potential therapeutic strategies, including therapies targeting the maturation of pri-miRNAs or miRNA biogenesis. Key words: miR-21, pri-miR-21, alternative polyadenylation, alternative splicing, VMP1, miRNA biogenesis 14 1. Wstęp 1.1. Świat RNA Budowa i funkcjonowanie każdego żywego organizmu, a także wirusów opiera się na informacji genetycznej zapisanej w genomie. Przeważająca część genomów, w tym genomu człowieka, jest zbudowana z DNA (kwasu deoskyrybonukleinowego) a w przypadku niektórych wirusów z RNA (kwasu rybonukleinowego). Oba kwasy zbudowane są bardzo podobnie z dwoma głównymi różnicami. Pierwszą jest budowa cukru wchodzącego w skład danego kwasu nukleinowego, w przypadku RNA jest to ryboza, w przypadku DNA deoksyryboza. Drugą różnicą jest obecność w RNA uracylu, w miejscach gdzie w DNA znajdowała by się tymina. Grupę czterech nukleozydów tworzących łańcuch RNA stanowią: adenozyna (A), cytydyna (C), guanozyna (G) oraz urydyna (U). Ponadto poszczególne części nukleozydów mogą być modyfikowane, co zwiększa zmienność strukturalną i funkcjonalną cząsteczek RNA. W obu kwasach nukleinowych nukleozydy łączone są dzięki wiązaniom 3’-5’ fosfodiestrowym. Jednakże stabilność cząsteczek RNA jest znacznie mniejsza, co wynika z obecności grupy hydroksylowej przy węglu 2’ rybozy. RNA swoją długością rzadko przekraczają kilka, kilkanaście tysięcy nukleotydów. Pomimo tego, że w cząsteczkach RNA często występują wiązania wewnątrzcząsteczkowe, to łańcuchy RNA zazwyczaj mają formę jednoniciową. Co również charakterystyczne, cząsteczki RNA mogą przyjmować rozmaite struktury II- i III-rzędowe, w tym konformacje globularne. Za oddziaływania wewnątrzcząsteczkowe głównie odpowiedzialne są wiązania wodorowe tworzone przez komplementarne reszty nukleotydowe. RNA powstaje na bazie matrycy kodującej ją sekwencji DNA podczas procesu zwanego transkrypcją. Przeprowadzana jest ona przez enzymy nazwane polimerazami RNA zależnymi od DNA, skrótowo nazywanymi polimerazami RNA. Transkrypcja w bakteriach oraz organizmach eukariotycznych przebiega w bardzo podobny sposób. Podstawą polimeryzacji RNA, wśród wszystkich typów organizmów, stanowi identyczna reakcja chemiczna. Każda z trzech eukariotycznych polimeraz RNA strukturalnie przypomina polimerazę bakterii E. coli. Oprócz podobieństw, transkrypcja u eukariontów i bakterii ma cechy specyficzne dla danej grupy organizmów. W przypadku bakterii nowopowstałe transkrypty, na bazie których w późniejszym etapie powstawać będą białka, nie ulegają żadnym procesom obróbki potranskrypcyjnej. Powstający transkrypt stanowi dojrzały mRNA, czyli RNA informacyjne 15 (ang. messenger RNA). W przypadku organizmów eukariotycznych, powstający transkrypt musi ulec szeregowi modyfikacji zanim posłuży jako matryca dla rybosomów biorących udział w syntezie białka. Wszystkie eukariotyczne mRNA posiadają strukturę tzw. czapeczki na swoim końcu 5’, a w większości przypadków są także poliadenylowane (pA, ang. poliadenylated) na końcu 3’. Prekursorowe transkrypty (pre-mRNA) również podlegają bardzo często składaniu (ang. splicing), czyli wycinaniu intronów i łączeniu eksonów. Warto zauważyć, że wszystkie te procesy zachodzą jeszcze w trakcie trwania syntezy nowo powstającego RNA na matrycy DNA (1). Czapeczka na końcu 5’ jest dodawana zaraz po tym, jak zainicjowana zostanie transkrypcja. Składanie i redagowanie pre-mRNA odbywa się w podczas działania polimerazy RNA. Natomiast poliadenylacja końca 3’ transkryptu jest nieodłącznym elementem terminacji transkrypcji. Ilość RNA w typowej bakterii wynosi między 0,05-0,10 pg, co odpowiada około 6% całkowitej masy. W przypadku komórek ssaków, które są znacznie większe od komórek bakteryjnych, ilość RNA jest większa i jest to 20-30 pg. Mimo, że jest to ilość większa to stanowi zaledwie 1% całkowitej masy komórki. Rycina 1 Podział RNA występujący w komórkach. Schemat przedstawia ogólny podział RNA występujących we wszystkich organizmach z zaznaczeniem frakcji RNA, których występowanie odnotowano jedynie u organizmów eukariotycznych. Wartość 100% stanowi całą pulę RNA znajdującego się w komórce. Podziałów RNA na typy, można przeprowadzić na wiele sposobów. Jednym z najpowszechniejszych jest podział ze względu na pełnione funkcje w komórce (Ryc. 1). Podstawowy podział to: RNA kodujący i RNA niekodujący. W obrębie RNA kodujących wyróżniamy jedynie mRNA. mRNA są dojrzałymi transkryptami genów, które w procesie translacji ulegają przepisaniu na białka. Zawartość mRNA w komórce wynosi ok. 4% z całości RNA znajdującego się w komórce. Cząsteczki te cechują się dosyć krótkim okresem półtrwania 16 i są szybko degradowane. W komórkach eukariotycznych znaczna część mRNA ulega degradacji w ciągu kilku godzin. Są jednak i takie, których okres półtrwania wynosi kilka minut. Mała stabilność komórkowa cząsteczek mRNA wskazuje na dużą dynamikę i zmienność całego transkryptomu w komórce. Drugim rodzajem opisywanych RNA są RNA niekodujące (ncRNA, ang. noncoding RNA). Cząsteczki te nie ulegają translacji na białka. Inną stosowaną nazwą dla tych cząsteczek jest RNA funkcjonalny, gdyż biorą aktywny udział w wielu istotnych procesach w komórce, innych niż kodowanie sekwencji białkowej. Dwie główne kategorie niekodujących RNA stanowią RNA rybosomowe (rRNA) oraz RNA transportujące (tRNA). rRNA zidentyfikować można we wszystkich organizmach i stanowią one najliczniejszą grupą RNA w komórce. rRNA są budulcem rybosomów, odpowiedzialnych za syntezę białek. tRNA, podobnie jak rRNA biorą udział w powstawaniu białek i ich rola polega na dostarczaniu aminokwasów do rybosomu w procesie syntezy białek. Poza dwoma opisanymi rodzajami niekodujących RNA, rozróżniamy wiele innych rodzajów cząsteczek RNA odgrywających znaczące funkcje w komórkach eukariotycznych. Cząsteczki te sklasyfikowane są jako krótkie niekodujące RNA (sncRNA, ang. short noncoding RNA), nieprzekraczające 200 nukleotydów długości, oraz długie niekodujące RNA (lncRNA, ang. long noncoding RNA), których długość szacowana jest na ponad 200 nukleotydów. Te klasy RNA również mogą powstawać jako cząsteczki prekursorowe i podlegać licznym procesom dojrzewania, w tym splicingowi i poliadenylacji. 1.1.1. Dojrzewanie cząsteczek prekursorowych RNA 1.1.1.1. Splicing RNA Niemalże do końca lat 70. XX wieku naukowcy na całym świecie nie zdawali sobie sprawy z istnienia intronów. Dopiero w roku 1977, w trakcie sekwencjonowania DNA genów eukariotycznych, okazało się że geny te w swojej budowie zawierają tzw. sekwencje “wtrącone” (ang. intervening sequences). Sekwencje te w charakterystyczny sposób oddzielały fragmenty kodu genetycznego, które w dalszych etapach były odpowiedzialne za kodowanie sekwencji białkowej. Składanie RNA (ang. RNA splicing) stanowi nieodłączny etap w dojrzewaniu prekursorowego RNA (pre-mRNA). Polega na usunięciu niekodujących informacji fragmentów, tzw. intronów. Proces splicingu bazuje na reakcjach cięcia i łączenia się eksonów, w wyniku czego powstaje dojrzała cząsteczka RNA kodująca białko - mRNA. Proces splicingu pre-mRNA stanowi podstawę różnorodności w powstawaniu białek w komórkach eukariotycznych. 17 U człowieka blisko 95% genów podlega bowiem również alternatywnemu splicingowi (2). Charakterystyczną cechą pre-mRNA u eukariotów jest to, że może ono zawierać wiele, w niektórych przypadkach ponad 100 intronów, które stanowią znaczącą część całego prekursorowego transkryptu. Zaraz po tym jak odkryto istnienie intronów, naukowcy zaobserwowali zakonserwowane motywy, które jak się okazało w istotny sposób warunkują proces ich prawidłowego wycinania intronów z pre-mRNA. Na chwilę obecną opisanych zostało siedem odrębnych rodzajów intronów wśród organizmów eukariotycznych. W przeważającej liczbie intronów, w genach kodujących białka, pierwszymi dwoma nukleotydami są 5’-GU-3’. Natomiast na końcu intronu, znajduje się sekwencja 5’-AG-3’. Introny takie określa się intronami “GU-AG” i stanowią one jeden z najpopularniejszych typów. W miarę postępów badań nad budową intronu okazało się, że powtarzające się motywy na początku oraz na końcu stanowią jedynie część zakonserwowanych sekwencji. Po stronie 3’ intronu, przed sekwencją 5’-AG-3’, występuje trakt polipirymidynowy, czyli rejon bogaty w pirymidyny (nukleotyd U lub C). Dodatkowo w odległości około 10-40 nt powyżej traktu polipirymidynowego znajduje się sekwencja zwana sekwencją rozgałęzienia (ang. branch point). Dla kręgowców kanoniczny wariant tej sekwencji to 5’-CURAY-3’, gdzie “R” to puryna, a “Y” pirymidyna. W latach 1990. badania prowadzone na całym świecie wykazały, że wycinanie intronów z pre-mRNA jest procesem wieloetapowym. Pierwszym krokiem jest cięcie w miejscu splicingu 5’ intronu (5’ss, ang. 5’ splice site). Następuje to poprzez reakcję transestryfikacji - zaangażowanie grupy hydroksylowej przyłączonej od węgla 2’ nukleotydu adenozynowego w punkcie rozgałęzienia (PR, ang. branch point), znajdującego się wewnątrz intronu. Skutkiem takiego “ataku” jest przecięcie wiązania 3’-5’ fosfodiestrowego po stronie 5’ intronu i powstanie nowego wiązania 5’-2’ fosfodiestrowego. Reakcja ta skutkuje utworzeniem się charakterystycznego struktury, tzw. lassa (ang. lariat), składającego się z intronu, oraz eksonu leżącego po jego 3’ stronie. Druga reakcja transestryfikacji, przeprowadzona po 3’ stronie intronu (3’ss, ang. 3’ splice site) uwalnia intron w postaci lassa, który zostaje przekształcone w liniową formę i ulega degradacji. W tym samym momencie uwolniony koniec 5’ eksonu, który znajdował się poniżej intronu zostaje połączony z 3’ końcem eksonu leżącego przed intronem. 18 Rola rybonukleoprotein (snRNP) w procesie splicingu pre-mRNA Z punktu widzenia biochemicznego, dwie reakcje transestryfikacji jakie maja miejsce podczas wycinania intronu i składania eksonów, nie stanowią dla komórki dużego wyzwania. Jednakże, do przeprowadzenia tego na pozór prostego procesu, zaangażowana musi być liczna grupa białek, które ściśle nadzorują ten proces. Nierzadko zdarza się, że dwa eksony oddalone są od siebie o nawet kilkadziesiąt tysięcy nukleotydów. Taka sytuacja wymaga obecności całej maszynerii białek, która będzie w stanie w odpowiedni sposób zbliżyć do siebie miejsca istotne w procesie splicingu. Pamiętać należy, że miejsca składania eksonów w genie są bardzo do siebie podobne. Gdyby nie zaangażowanie odpowiednich białek, dochodziłoby do połączenia się nieodpowiednich miejsc i tym samym do pominięcia niektórych eksonów. Innym znanym zaburzeniem podczas składania eksonów jest wybór miejsc kryptycznych, czyli miejsc znajdujących się w intronie bądź eksonie, które swoją sekwencją przypominają właściwe miejsca składania pre-mRNA Zadaniem białek kontrolujących proces splicingu jest rozpoznawanie takich miejsc i skuteczne ich pomijanie. 19 Rycina 2 Schemat splicingu RNA z zaznaczeniem zaangażowanych snRNP przeprowadzających cały proces. Zaznaczone na rycinie zostały najważniejsze białka bezpośrednio zaangażowane w proces splicingu. Kluczowym momentem jest przyłączenie się kompleksów U1 oraz U2, dzięki którym dochodzi do zbliżenia się fragmentów eksonowych. Końcowymi produktami składania są związane ze sobą eksony oraz wypięty intron, który przyjmuje formę lassa. W procesie splicingu uczestniczy znacznie więcej białek, które nie zostały przedstawione na schemacie. Reakcja składania RNA przeprowadzana jest przez kompleksy rybonukleoprotein (snRNP), którym towarzyszy ponad 100 innych białek związanych z procesem splicingu (3) (Ryc. 2). Kompleks ten nazywany jest spliceosomem. W jego podstawowym składzie zawartych jest 5 kompleksów U1, U2, U4, U5 oraz U6 snRNP. Głównym zadaniem wymienionych rybonukleoprotein jest rozpoznawanie charakterystycznych miejsc na końcach 5’ oraz 3’ intronów, traktów polipirymidynowych oraz miejsc rozgałęzienia w intronie. Aby doszło do utworzenia się spliceosomu, U1 snRNP przyłącza się do miejsca splicingu w części 5’ intronu, 20 a w części 3’ intronu wiąże się czynnik pomocniczy U2 (U2AF, ang. U2 auxilary factor). U2AF jest heterodimerem składającym się z podjednostek U2AF65 oraz U2AF35. Obie rozpoznają miejsce składania na 3’ końcu intronu wraz z traktem polipirymidynowym. W międzyczasie czynnik białkowy SF1 przyłącza się do miejsca rozgałęzienia wewnątrz intronu aby wspólnie z U1 oraz U2AF65 i U2AF35 utworzyć kompleks E. Kolejnym etapem jest przekształcenie kompleksu E w kompleks A, poprzez zamianę SF1 na U2 snRNP w miejscu rozgałęzienia. Duże powinowactwo U1 oraz U2 snRNP wymusza przyciągnięcie miejsca donorowego U1 w kierunku punktu rozgałęzienia. Po przyłączeniu się U4, U5 oraz U6 snRNP do intronu powstaje kompleks B. W tym momencie dochodzi do zbliżenia miejsca akceptorowego splicingu do miejsca donorowego i punktu rozgałęzień. Po uwolnieniu U1 i U4 snRNP tworzy się kompleks składania, a miejsca 5’ oraz 3’ wraz z punktem rozgałęzień znajdują się na tyle blisko siebie, że dochodzi do reakcji cięcia i łączenia RNA katalizowanych przez U2 i U6 snRNP. Po wycięciu intronu, produktem jest transkrypt zawierający połączone eksony. 1.1.1.2. Alternatywne splicing RNA (AS) Na podstawie analiz masowego sekwencjonowania RNA (RNA-seq) zakłada się, że zjawisko alternatywnego składania RNA dotyczyć może blisko 95% ludzkich, wieloeksonowych genów (2)(37). Pomimo wspomnianego wcześniej faktu, że proces składania RNA z punktu widzenia biochemicznego jest prostą reakcją, to precyzja jaką wykazać musi się cała maszyneria splicingowa jest zdumiewająca. Kluczowym momentem jest rozpoznanie właściwych miejsc splicingu po 5’ oraz 3’ stronie intronu, w szczególności w przypadku genów kodujących białko. Wystarczy przesunięcie miejsca złączenia się eksonów o kilka nukleotydów, a doprowadzić to może do zmiany całej ramki odczytu (ang. frameshift) i w konsekwencji najczęściej do szybkiej degradacji całego nowopowstałego transkryptu na drodze rozpadu NMD (ang. nonsense-mediated decay). Ponieważ w powstającym transkrypcie znajduje się wiele miejsc rozpoznawanych przez spliceosom, proces składania musi być poddany ścisłej kontroli przez wiele czynników promujących bądź hamujących zajście składania w konkretnym miejscu. Okazuje się, że na wybór wpięcia bądź wypięcia alternatywnego eksonu ma wpływ także polimeraza II RNA odpowiedzialna za proces transkrypcji, który odbywa się w tym samym czasie co proces splicingu (4). Dzięki zachodzącym procesom alternatywnego składania możliwości powstawania różnorodnych transkryptów stają się praktycznie nieograniczone. Wyodrębniono kilka typów zachodzących procesów, prowadzących do powstania 21 alternatywnych izoform mRNA. Przykładem jest wyłączenie pierwszego (AFE, ang. exclusion of first exon) oraz ostatniego eksonu (ALE, ang. exclusion of last exon). Wypinaniu z transkryptu mogą podlegać również eksony (alternatywne) znajdujące się pomiędzy konstytutywnymi eksonami. Innymi wariantami są: wybór alternatywnych miejsc 5’ i 3’ splicingu czy retencja intronu (5) (Ryc. 3). Rycina 3 Schematyczne przedstawienie możliwych procesów alternatywnego składania RNA. Wyłączanie, bądź włączanie eksonów alternatywnych może odbywać się na kilka różnych sposobów. (A,B) Poprzez aktywacje alternatywnych miejsc startu transkrypcji, bądź włączanie ostatniego eksonu z aktywnym PAS. (C,F) Włączanie lub wyłączanie eksonów alternatywnych znajdujących się wewnątrz genu. (D,E) Pojawienie się dodatkowych miejsc 3’ i 5’ skutkuje powstaniem skróconej wersji alternatywnego eksonu. (G) Część intronów może zostać nie wycięta. Główne znaczenie i wpływ na zachodzący proces alternatywnego splicingu mają konkurujące ze sobą miejsca splicingowe. O wyborze konkretnych miejsc decydują odpowiednie czynniki białkowe wiążące się w regionach cis RNA, a rozpoznające ulokowane w intronach bądź eksonach miejsca SRE (ang. splicing regulatory elements). Poprzez interakcje z konkretnymi czynnikami działającymi w trans, miejsca wiązania się białek SRE modulują przebieg splicingu. Do czynników działających w trans zalicza się grupę białek SR (ang. Ser/Arg- rich proteins) oraz hnRNP (ang. heterogeneous ribonucleoprotein). W skład SRE wchodzą czynniki pełniące funkcję promującą zachodzenie splicingu, wiążące się w intronach (ISE, ang. intron splicingu enhancer) lub w eksonach (ESE, ang. exon splicingu enhancer). Oprócz istnienia wzmacniaczy, w rejonach intronowych przyłączają się również inhibitory splicingu (ISS, ang. intron splicingu silencer). Podobnie jest w rejonach eksonowych (ESS, ang. exon splicingu silencer) (6) (Ryc. 4). 22 Rycina 4 Białka regulujące proces składania RNA, w tym alternatywny splicing. Procesu składania RNA stanowi kluczowy element w dojrzewaniu prekursorów RNA, który musi podlegać istotnej regulacji. Do najpopularniejszych białek kontrolujących splicingu zaliczane są białka hnRNP oraz SR, które łącząc się do odpowiednich regionów w eksonach oraz intronach mogą wpływać negatywnie lub pozytywnie na cały proces. ISE – intronowy wzmacniacz splicingu; ISS – intronowy wyciszacz splicingu; ESE- eksonowy wzmacniacz splicingu; ESS – eksonowy inhibitor splicingu;PR – punkt rozgałęzień; Py – trakt polipirymidynowy. Białka hnRNP zostały zaznaczone schematycznie jako czynniki inhibujące a SR jako aktywujące. Tak jest w większości przypadków, jednak często te klasy białek mogą pełnić przeciwstawne funkcje. W przypadku zachodzenia alternatywnego splicingu, podstawową rolę odgrywa definiowanie odpowiednich regionów w nowopowstającym RNA, które fragmenty będą stanowić introny, a które eksony. U ssaków, fragmenty eksonowe są istotnie krótsze niż intronowe. Przeważa definiowanie tych pierwszych i z dużo większą częstotliwością dochodzić może do usunięcia alternatywnego eksonu niż do retencji intronu (7). Do głównych czynników mających bezpośredni wpływ na zajście alternatywnego splicingu należą białka SR oraz hnRNP. Poprzez oddziaływanie z elementami ISE i ESE, aktywują składanie RNA w konkretnych lokalizacjach. Białka SR i hnRNP uczestniczą ponadto w formowaniu się spliceosomu. Przykładowo, promowanie łączenia się U1 snRNP determinuje wybór miejsca splicingowego 5’, a działanie U2AF determinuje wybór miejsca splicingowego 3’ (8, 9). Związane białka SR z miejscami ESE wzmacniają łączenie się U2 snRNP do miejsc rozgałęzień (10). Białka hnRNP są dużą grupą regulatorowych białek wiążących się z RNA, których aktywność głównie wiązana jest z wyciszaniem splicingu. Charakteryzują się one zróżnicowanym modelem działania. Dla przykładu, udowodniono, że białka hnRNP wchodzić mogą w interakcję z czynnikami regulującymi splicing, tj. SC35 i ASF/SF2 (8). Jednym z lepiej poznanych przedstawicieli grupy białek hnRNP są białka PTBP (ang. polypirimidine tract binding protein). Białko PTBP1, znane również pod nazwa hnRNP-I, łącząc się do fragmentów nowopowstającego, niedojrzałego transkryptu, bogatych w reszty C i U powoduje zahamowanie przebiegu splicingu. Jednocześnie siła działania PTBP może być modulowana poprzez specyficzną lokalizację traktów polipirymidynowych. Pojawienie się 23 dodatkowych miejsc wiązania dla PTB przy końcu 3’ alternatywnie usuwanego eksonu, to wzmacnia ono wydajne wycięcie go ze składanego RNA (11). 1.1.1.3. Poliadenylacja na końcu 3’ RNA – dobudowanie ogona poli(A) Obróbka końca 3’ nowopowstałego transkryptu jest jednym z najważniejszych procesów zapewniających integralność cząsteczki RNA. Dodanie ogona poli(A) na końcu RNA jest zjawiskiem zachodzącym potranskrypcyjnie, dzięki któremu transport do cytoplazmy i proces translacji jest bardziej wydajny. Dodatkowo ogon poli(A) zabezpiecza nową cząsteczkę RNA przed degradacją (12). Zjawisko cięcia oraz poliadenylacji jest przeprowadzane przez duży kompleks białkowy, zawierający cztery główne subkompleksy – czynnik specyficzności cięcia i poliadynelacji (CPSF, ang. Cleavage and poliadenylation specific factor), czynnik stymulujący cięcie (CsfF, ang. Cleavage stimulation factor), czynnik cięcia I (CF Im, ang. Cleavage factor I) oraz czynnik cięcia II (CF IIm, ang. Cleavage factor II) (13). Oprócz tego, w reakcji poliadenylacji końca 3’ uczestniczą również polimerazy poliadenylowe (PAP, ang. Poli(A) polymerase), jądrowe białko wiążące się do poli(A) (PABPN, ang. Nuclear poly(A) binding protein) i białko Symplekin. Czynnik CPSF poprzez wiązanie się do sygnału poliadenylacji 5’-AAUAAA-3’ (PAS, ang. poliadenylation signal) stanowi niezbędny element w procesie cięcia RNA (12). Miejsce PAS zlokalizowane jest w odległości 10-30 nukleotydów od miejsca, w którym zachodzi proces cięcia transkryptu. CstF rozpoznaje region bogaty w U bądź G i U. CstF swoją obecnością stabilizuje przyłączenie się CPSF do miejsca PAS (14). Czynnik cięcia CF Im wiąże się do motywów 5’-UGUA-3’ znajdującymi się przed miejscem PAS. Dzięki zaangażowaniu wszystkich wyżej wymienionych czynników (Ryc. 5) możliwe jest endonukleolityczne cięcie RNA, i w następnej kolejności dobudowanie do wolnego końca 3’ ogona poli(A) przez PAP. Rycina 5 Kompleksy białkowe zaangażowane w proces poliadenylacji. Schematyczny obraz regionu niekodującego po stronie 3’ (3’UTR) z zaznaczonymi sekwencjami do których wiążą się kompleksy białek zaangażowane w cały proces cięcia nowopowstałego RNA, a następnie poliadenylacji. 24 1.1.1.4. Alternatywna poliadenylacja (APA) Zjawisko APA zostało po raz pierwszy odnotowane w roku 1980. Badanie opisywało geny kodujące immunoglobulinę M (IgM) (15) oraz reduktazę dihydrofolianowej (DHFR) (16). Od tamtego momentu, do roku 1997 naukowcom z całego świata udało się opisać jeszcze około 95 genów posiadających APA (17). Dzięki rozwojowi bioinformatyki oraz metod analiz całotranskryptomowych takich jak RNA-seq wiedza na temat procesów APA jest stale poszerzana i uzupełniana. Rycina 6 Schematyczne przedstawienie możliwych procesów alternatywnej poliadenylacji. W sytuacji kiedy wybrane zostanie miejsce PAS wewnątrz sekwencji kodującej białko (CR-APA) prowadzić to może do powstania białka o zmienionej budowie. Aktywność PAS w 3’UTR skutkuje powstawaniem 3’UTR o różnej długości (UTR- APA), co prowadzić może do wzmożonej regulacji konkretnej izoformy przez takie cząsteczki jak miRNA. Niemal wszystkie mRNA powstające w komórkach eukariotycznych oraz wiele niekodujących RNA to cząsteczki poliadenylowane (18). Wiele genów na końcu 3’ posiada kilka alternatywnych miejsc poliadenylacji (APAS, ang. alternative polyadenylation sites). Aktywność alternatywnych miejsc prowadzi do powstawania izoform, mogących różnić się długością 3’UTR (19). Uwzględniając lokalizacje miejsc poliadenylacji, zjawisko APA można podzielić na dwie główne kategorie (Ryc. 6). W pierwszej z nich poliadenylacja będzie zachodzić wewnątrz sekwencji kodującej eksony bądź introny i poprzez swoją aktywność prowadzić do istotnego skrócenia transkryptu kodującego białko skrócone o koniec karboksylowy. Ten typ APA nazwany jest alternatywną poliadenylacją regionów kodujących (CR-APA, ang. coding region-APA) (20). W drugiej sytuacji alternatywne miejsca poliadenylacji zlokalizowane są w 3’UTR. Ich zmienna aktywność prowadzi do powstawania transkryptów o różnej długości 3’UTR (UTR-APA, ang. untranslated region-APA). Wyróżnia się PAS proksymalne (PAS proks.), które poprzez swoją aktywność istotnie skracają 3’UTR. Natomiast aktywność PAS dystalnych skutkuje wydłużeniem 3’UTR. UTR-APA nie prowadzi do zmian w 25 sekwencji kodującej białko. Zmiany w długości 3’UTR mogą mieć jednak istotny wpływ na stabilność mRNA, efektywność z jaką mRNA będzie przepisywane na białko i transport. Dłuższe 3’UTR podlegać mogą częściej regulacji przez cząsteczki miRNA (ang. microRNA), oraz białka wiążące się do RNA (RBP, ang. RNA binding protein). Badania prowadzone w ciągu ostatnich dwóch dekad wykazały tysiące przypadków, w których izoformy APA ulegają różnej ekspresji w różnych warunkach komórkowych. Globalna analiza sekwencjonowania z wykorzystaniem specjalnie zaprojektowanych bibliotek cDNA, takich jak EST (ang. expressed sequence tag) wykazała zmienność w częstości występowania APA w różnych tkankach (21). W części analizowanych tkanek dominował konkretny wariant RNA wynikający z wyboru odpowiedniego miejsca poliadenylacji, który z kolei w innych typach komórek występował rzadko. Dla przykładu PAS dystalne są preferowane w tkankach neuronalnych, gdy w przypadku komórek krwi obserwowany jest odwrotny trend (21). Również w przypadku różnych etapów procesu spermatogenezy zaobserwowano zmiany w wyborze PAS. W przypadku komórek nowotworowych zaobserwowano globalny trend występowania krótkich 3’UTR (22). Badanie zmian długości 3’UTR w nowotworach o różnym stopniu zaawansowania wykazało charakterystyczne zmiany w aktywności APA (23). Takie zjawisko wskazuje na bezpośrednie zaangażowanie procesu APA w zwiększony potencjał podziałów komórek nowotworowych oraz ich rozwój. Taka wiedza może służyć jako parametr prognostyczny oraz być wykorzystana jako ważny indykator stopnia zaawansowania choroby w diagnostyce nowotworów. Dzieje się już tak w przypadku badania komórek nowotworowych gruczołu piersiowego, gdzie okazało się, że różne typy komórek nowotworowych mogą wykazywać inne aktywności APA (24). W przypadku powszechnie stosowanych w badaniach modelowych komórek raka piersi MCF-7 dochodziło do skracania 3’UTR w porównaniu do komórek prawidłowych. Z kolei w innym modelu, komórkach MB231, wykazano obecność dłuższych 3’UTR w przypadku większości analizowanych mRNA. Okazuje się, że procesowi APA podlegać mogą nie tylko pre-mRNA, ale również prekursorowe długie niekodujące RNA. Badanie oparte na analizie mysich lncRNA wykazało, że w przypadku co najmniej 66% znanych cząsteczek lncRNA zachodzi proces APA, jednak w odróżnieniu od APA w genach kodujących białko, w większości przypadków zachodził na początku transkryptów wywołując istotne skrócenie izoform lncRNA (25). Dla przykładu, 26 transkrypt NEAT1 (ang. nuclear paraspeckle assembly transcript 1) ma dwie izoformy – dłuższą (23000 nt) oraz istotnie skróconą (3700 nt). Długość skróconej izoformy wynika z aktywności PAS w początkowym rejonie transkryptu. W rezultacie występowanie różnych izoform NEAT1 wpływał na wydajność tworzenia się skupisk jądrowych (ang. paraspeckles) (26). Regulacja aktywności APA zależeć może w dużej mierze od działania RBP (27). Niektóre RBP hamują terminację transkrypcji w poszczególnych PAS poprzez blokowanie wiązania się podstawowych czynników związanych z procesem poliadenylacji, a niektóre zwiększają wybór odpowiednich PAS poprzez rekrutację kluczowych czynników dla terminacji i poliadenylacji. Oba kierunki działania mogą być regulowane przez to samo białko w różnych kontekstach, jak pokazano dla neuronalnego RBP NOVA. Jego wiązanie w pobliżu PAS inhibuje proces poliadenylacji, podczas gdy wiązanie w innym miejscu RNA promuje ten proces (28). 1.1.1.5. Zależność pomiędzy splicingiem, a poliadenylacją Główne mechanizmy, tj. splicing oraz poliadenylacja, będące podstawą w dojrzewaniu transkryptów RNA, bardzo często są ze sobą ściśle powiązane i wzajemnie na siebie wpływają. Jednym z przykładów jest bezpośrednia zależność pomiędzy jednym z głównych czynników odpowiedzialnych za cięcie transkryptu – CPSF-160 – a białkiem U1A snRNP. Poprzez bezpośrednią interakcję białko-białko, U1A wzmacnia wiązanie się CPSF-160 do PAS i tym samym podnosi wydajność procesu cięcia i poliadenylacji (29). Inną wcześniej opisaną zależnością jest oddziaływanie pomiędzy kompleksem CPSF a U2 snRNP (30) oraz U2AF65 a CF Im (31). Okazuje się, że sekwencje intronowe zaangażowane w definiowanie ostatniego eksonu, a zlokalizowane w pobliżu PAS mogą istotnie wpłynąć na aktywność procesu poliadenylacji (32). Delecja miejsc splicingowych 5’ nie wpływa na wydajność poliadenylacji, podczas gdy wprowadzenie mutacji 3’ miejsc splicingowych może blokować ten proces, potwierdzając że aktywność miejsc 3’ss oraz czynników splicingowych wiążących się z tymi miejscami jest ważna dla stymulacji procesu poliadenylacji. Zależność ta może również działać w przeciwną stronę. Mutacja w proksymalnym PAS prowadzić może do istotnych zaburzeń związanych z wycięciem ostatniego intronu w genach wieloeksonowych (33). 27 1.2. Długie niekodujące RNA (lncRNA) Klasyczne postrzeganie ekspresji genów w dużej mierze opierało się na znanym dogmacie, opisującym szlak DNA - mRNA - białko. Jednakże, na przestrzeni ostatnich dekad, bazując na wynikach analiz RNA-seq okazało się, że aż 75% ludzkiego genomu podlega transkrypcji. Dodatkowo ilość transkryptów niekodujących białka, tzw. długich niekodujących RNA (lncRNA), jest 4 razy większa niż transkryptów, z których to białka powstają (34). Udowodniono również, że lncRNA stanowią bardzo zróżnicowaną grupę cząsteczek, również pod względem ich powstawania. Sekwencje dla lncRNA mogą być zlokalizowane w wielu miejscach w genomie, tj. wewnątrz intronów genów kodujących pre-mRNA, w samych eksonach jak również w przestrzeniach międzygenowych. Tak duża różnorodność utwierdza w przekonaniu o modularnym modelu organizacji genów, w którym to możliwe jest przepisywanie sekwencji na wiele transkryptów sensowych, antysensowych, kodujących oraz niekodujących białko z jednego locus. Tak duża liczba zidentyfikowanych cząsteczek lncRNA rodzi zatem pytanie: skoro komórka zużywa tak dużo energii na biosyntezę tych cząsteczek, to w jaki sposób mogą być one przydatne dla jej funkcjonowania? Początkowo uznawano, że mnogość powstających lncRNA bierze się z mało specyficznego działania polimerazy II RNA (35). Na to mógłby dodatkowo wskazywać fakt bardzo niskiego poziomu zakonserwowania sekwencji lncRNA. Możliwym wytłumaczeniem jest to, że lncRNA w swojej sekwencji nie posiadają otwartej ramki odczytu (ORF, ang. open reading frame). Jednakże występują również takie cząsteczki lncRNA, które posiadają w swojej sekwencji krótkie zakonserwowane fragmenty, pełniące znaczącą rolę w procesach komórkowych. Przykładem może być gen Xist, który odpowiedzialny jest za wyciszanie ekspresji genów pochodzących z jednego z chromosomów X, w przypadku komórek żeńskich. W komórkach męskich pełni rolę regulatorową (36). Okazuje się jednak, że więcej lncRNA zaangażowanych jest w istotne procesy komórkowe, tj. różnicowanie, rozwój czy podziały komórkowe (37). Ich działanie opiera się na kontrolowaniu ekspresji genów poprzez wpływ na miejsca promotorowe (38), piętnowanie genomowe (ang. genome imprinting) (39) czy utrzymanie odpowiedniego uformowania chromatyny w jądrze komórkowym (40). 28 1.3. Krótkie niekodujące RNA (sncRNA) Do tej grupy zalicza się klasę małych jądrowych RNA (snRNA, small nuclear RNA), które tworzą cząsteczki RNA o długości nieprzekraczającej 200 nukleotydów. Zlokalizowane są głównie w jądrze komórkowym organizmów eukariotycznych. Do ich podstawowych funkcji należy regulacja ekspresji genów. Podczas tego procesu snRNA związane są z zestawem specyficznych białek, których kompleksy nazywane są jako małe jądrowe rybonukleoproteiny (snRNP, ang. small nuclear ribonucleoprotein). Podklasa snRNP nazywana jest małymi jąderkowymi RNA (snoRNA, ang. Small nuleolar RNA), które zlokalizowane są w jąderku i biorą udział w procesach dojrzewania takich cząsteczek jak rRNA, tRNA czy snRNA. Kolejną klasę tworzą cząsteczki RNA związane z białkiem Piwi (piRNA, ang. Piwi interacting RNA). Stanowią liczną grupę krótkich niekodujących RNA występujących w komórkach eukariotycznych (41). Ze swoją długością wynoszącą 25-30 nukleotydów są nieznacznie większe niż inne regulatorowe krótkie RNA. Poprzez formowanie kompleksów RNA-białko, piRNA zaangażowane są w epigenetyczne jak i potranskrypcyjne wyciszenie retrotranspozonów oraz innych elementów genetycznych w komórkach biorących udział podczas procesu spermatogenezy (42). Krótkie interferujące RNA (siRNA, ang. small interfering RNA) stanowią kolejną grupę krótkich, dwuniciowych cząsteczek RNA, których długość wynosi od 20-25 nukleotydów. SiRNA odgrywają istotną rolę w szlaku interferencji RNA (RNAi, ang. RNA interference) (43). Poprzez w pełni komplementarne wiązanie się jednej z nici siRNA, będącej elementem kompleksu wyciszającego indukowanego przez RNA (RISC, ang. RNA induced silencing complex), do mRNA prowadzą do jej degradacji i tym samym regulują poziom ekspresji genów. Mechanizm działania siRNA po raz pierwszy został odkryty w komórkach roślinnych (44), po czym prawie natychmiast został on wykorzystany jako molekularne narzędzie do kontrolowania poziomu ekspresji konkretnych genów w innych organizmach (45). Działanie siRNA oparte jest na podobnych zasadach jak w przypadku trzeciego reprezentanta grupy krótkich niekodujących RNA – miRNA. 29 1.3.1. mikroRNA W roku 1993, Victor Ambros wraz z Rosalind Lee oraz Rhondą Feinbaum, badając rozwój embrionalny C. elegans, odnotowali nowe zjawisko. Gen lin-4, pełniący istotną rolę podczas rozwoju badanego organizmu, okazał się nie być matrycą do produkcji białka, a lncRNA (46). Dodatkowo, z transkryptu tego powstawała para krótkich cząsteczek RNA. Jak się później okazało, posiadająca komplementarność do wielu miejsc w 3’UTR. Zależność poziomu mRNA genu lin-14, poprzez bezpośrednie działanie lin-4 została opisana (47), a następnie funkcjonalnie potwierdzona poprzez wykazanie negatywnego wpływu lin-4 na poziom białka lin-14, przy jednoczesnym braku obniżenia mRNA lin-14 (48). Wyniki te po raz pierwszy zaprezentowały model działania krótkich, niekodujących cząsteczek RNA – mikroRNA (miRNA), które poprzez wiązanie się do regionu 3’UTR mRNA regulują ich poziom ekspresji, a w następstwie także ilość powstających na bazie tych mRNA białek. Po prawie trzech dekadach badań wiemy, że lin-4 okazał się być pierwszym reprezentantem bardzo licznej grupy RNA nazwanych miRNA (49). Jest to rodzina krótkich (21-25 nt), niekodujących cząsteczek RNA, których obecność została potwierdzona w wielu różnych organizmach. Wysoki stopień zakonserwowania ewolucyjnego tych cząsteczek wskazuje na ich istotną rolę w toku ewolucji (50). miRNA stanowią ważny element w prawidłowym funkcjonowaniu komórek roślinnych oraz zwierzęcych. Szacuje się, że ok 50% genów kodujących białka jest pod kontrolą tych krótkich cząsteczek regulatorowych. Badania funkcjonalne wskazują, że niemal każdy znany proces komórkowy zależny jest od miRNA, co przekłada się na rolę regulatora komórkowej homeostazy. Przeprowadzone badania na modelach zwierzęcych, a w szczególności na myszach, polegające na wyłączaniu aktywności poszczególnych miRNA wykazały wpływ na działanie wielu narządów. Były to między innymi takie organy jak: układ szkieletowy (51), mózg (52), oczy (53), neurony (54), serce (55), mięśnie szkieletowe (56), płuca (57), nerki (58), wątroba (59) czy trzustka (60). Mając na uwadze istotną rolę, jaką odgrywają cząsteczki miRNA, można przypuszczać że jakakolwiek nieprawidłowość w powstawaniu bądź działaniu miRNA, będzie miała konsekwencje w funkcjonowaniu komórki, następnie tkanki, a w rezultacie całego organizmu. Przykładem takiego zaburzenia jest zmieniony profil ekspresji miRNA i jego następstwa obserwowane w komórkach nowotworowych. 30 1.3.1.1. Biogeneza miRNA - klasyczna droga powstawania miRNA Rycina 7 Schematyczne przedstawienie procesu biogenezy miRNA miRNA powstają ze swoich pierwotnych transkryptów zwanych pri-miRNA (ang. primary microRNA). Transkrypty te tworzone są w wyniku działania polimerazy II RNA, jako takie opatrzone są czapeczką na końcu 5’ (61), lecz nie zawsze poliadenylowane na końcu 3’. Może mieć to związek z aktywnością działania mikroprocesora zaangażowanego w dojrzewanie miRNA, który może wymuszać wcześniejszą terminację transkrypcji (62). Utworzona wewnątrz pri-miRNA krótka struktura typu spinki do włosów (ang. hairpin structure) rozpoznawana jest przez oraz białko rozpoznające podwójną nić RNA - DGCR8 (ang. DiGeorge critical region 8) oraz białko z rodziny RNaz III – DROSHA. Razem białka te tworzą kompleks mikroprocesora, którego produktem działania jest ok. 70 nukleotydowa cząsteczka pre-miRNA, ciągle tworząca strukturę typu spinki do włosów. W naturze występują tysiące cząsteczek RNA, które tworzą strukturę przypominającą spinkę do włosów. Jednak tylko cześć z nich jest rozpoznawana jako cząsteczka prekursorowa w pri-miRNA i przetwarzana dalej w w kolejnych etapach biogenezy miRNA. Jest to wynikiem ścisłej kontroli biogenezy miRNA przez mikroprocesor. Kompleks ten faworyzuje pojedynczą strukturę spinki, której długość wynosi około 35 par zasad, oflankowaną z obu stron jednoniciowymi sekwencjami RNA (63). Nowopowstałe pre-miRNA następnie zostaje przetransportowane z jądra do cytoplazmy przez Eksportynę 5 (XPO5) (64, 65). W cytoplazmie na skutek działania kolejnej RNazy typu III – Dicer, 31 z pre-miRNA wycinany jest dwuniciowy, 20-25 nukleotydowy dupleks miRNA/miRNA* (66)(8). W biologii stosuje się dodatkową nomenklaturę miRNA opierającą się o nić, z które wywodzi się dojrzała cząsteczką miRNA. Wyróżniamy w takim wypadku cząsteczkę miRNA z nici od strony 5’ - miRNA-5p oraz strony 3’ - miRNA-3p. Co charakterystyczne, u człowieka DICER współpracuje razem z innym białkiem wiążącym się do dwuniciowej formy RNA – TRBP (ang. dsRBP trans-activation-responsive RNA-binding protein). Jedna z nici w dupleksie, reprezentująca dojrzałą formę miRNA, rozpoznawana przez białko Argonaute (AGO), wprowadzana jest do kompleksu wyciszającego ekspresję genów przez aktywność miRNA (miRISC, ang. miRNA-inducetd silencing complex). Druga z nici – miRNA* – zostaje zdegradowana i w tym układzie nie odgrywa ważnej roli w procesie kontroli ekspresji genów (67). MiRNA będąc kluczowym elementem w kompleksie miRISC, mimo niepełnej komplementarności (w odróżnieniu do siRNA) do docelowego regionu w mRNA (68), naprowadza oraz powoduje związanie całego kompleksu i prowadzi w ten sposób do zablokowania translacji bądź do deadenylacji i degradacji związanej cząsteczki mRNA (Ryc. 7). Potencjalnie oba miRNA, powstające z dupleksu pre-miRNA (miRNA oraz miRNA*) stanowić mogą funkcjonalną cząsteczkę. W ostatnich latach wykazano pewne wyjątki od reguły, w których to białka DROSHA, DICER1 oraz XPO5 stanowią niezbędny element podczas biogenezy miRNA. W przeprowadzonym w 2016 roku badaniu (69), po inaktywacji każdego z tyk białek z osobna i sekwencjonowaniu całej puli krótkich RNA (ang. small RNA-seq) okazało się, że gdy usunięcie Droshy skutkuje istotnym spadkiem poziomu wszystkich miRNA, tak w przypadku zablokowania białka Dicer poziom niektórych z miRNA pozostaje niezmieniony. Rezultat ten świadczyć może o istnieniu alternatywnych dróg powstawania miRNA, niezależnych od kanonicznej ścieżki biogenezy. Pełen proces dojrzewania miRNA może okazać się dużo bardziej złożony niż postrzegano do tej pory. 1.3.1.2. Mirtrony – alternatywna ścieżka biogenezy miRNA W 2007 roku udokumentowano istnienie nowej grupy miRNA, tzw. mirtrony (70). Istnienie tej puli, 14 miRNA u muszki owocowej oraz 4 miRNA u nicieni, stanowiło niezwykłe odkrycie ze względu na fakt, że zlokalizowane są one w intronach genów kodujących białko i co najistotniejsze mogą powstawać bez udziału DROSHA. Sytuacja taka jest możliwa dzięki zachodzącemu procesowi składania eksonów przy jednoczesnym wycinaniu intronów z pre- 32 mRNA. W tym właśnie momencie z wyciętego intronu, tzw. lariatu formuje się pre-miRNA, który następnie jest przetwarzany w dalszych etapach biogenezy miRNA. W konsekwencji powstaje dojrzała cząsteczka. Istotnym elementem w tym systemie jest odpowiednia długość intronu, który po wycięciu z pre-mRNA swoją długością zbliżony jest do naturalnie występujących pre-miRNA. 1.3.1.3. Badania genomowe oraz identyfikacja kanonicznych cząsteczek miRNA Pomimo, że cząsteczki miRNA odkryte zostały na początku lat 90. XX wieku, to dopiero po około 15 latach technika masowego sekwencjonowania krótkich RNA zrewolucjonizowała badania nad miRNA (71, 72). Należy jednak pamiętać, że nie każda odkryta w sekwencjonowaniu krótka cząsteczka jest cząsteczką miRNA. Wiele z wyników RNA-seq może stanowić, np. wchodzące w interakcje z białkami Piwi krótkie RNA (piRNA, ang. Piwi- interacting RNA) oraz endogennie występujące krótkie interferujące RNA (siRNA, ang. small interfering RNA) (72). W celu uniknięcia takich fałszywie pozytywnych odkryć nowych miRNA, postanowiono wprowadzić jasne i klarowne wytyczne co do definicji czy odkryta cząsteczka faktycznie jest miRNA. Przede wszystkim koniec 5’ takiego RNA musi być zgodny z przypisaną annotacją. Dodatkowo sekwencja musi być ściśle komplementarna z miejscem w genomie, gdzie przewidywana jest charakterystyczna struktura spinki do włosów i być komplementarna z drugą nicią RNA, wspólnie tworząc dupleks RNA (73). Stale rosnąca liczba nowo odkrywanych miRNA wymusiła stworzenie baz danych zbierających te wszystkie informacje. Jedną z najpopularniejszych baz jest miRBase (http://microrna.sanger.ac.uk) (74), obecnie zawierająca 1917 ludzkich prekursorów miRNA oraz 2656 dojrzałych cząsteczek miRNA (wersja V22) (75). Ze względu na ciągłe pojawianie się nowych cząsteczek, dużym wyzwaniem stała się weryfikacja tych doniesień. W 2019 J. Alles wraz z współpracownikami przeprowadziła eksperyment, mający na celu potwierdzenie ile tak naprawdę zdeponowanych krótkich cząsteczek w najpopularniejszej bazie danych miRBase jest rzeczywiście cząsteczką miRNA. W badaniu przeanalizowano 28 866 dostępnych sekwencjonowań krótkich RNA, zawierających niemal 364 miliardy odczytów. Wyniki analiz bioinformatycznych zidentyfikowały 65% z 24 127 potencjalnych cząsteczek miRNA, jako wyniki fałszywie pozytywne. Ostatecznie wyniki grupy potwierdziły istnienie 2300 cząsteczek miRNA, z czego 1115 znajduje się w bazie danych miRBase V22 (76). http://microrna.sanger.ac.uk/ 33 Oprócz bazy danych miRBase istnieje jeszcze kilka innych baz, zbierających informację o istniejących miRNA. Jednym z takich zbiorów jest miRGenDB (http://mirgenedb.org) – baza danych zawierająca mniejsza liczbę zdeponowanych cząsteczek, ale z dużą pewnością co do jakości wyników (77). Inną bazą jest miRCarta (https://mircarta.cs.uni-saarland.de). Zbiór ten charakteryzuje się również zweryfikowanymi eksperymentalnie danymi oraz zestawieniem literaturowo-potwierdzonych cząsteczek miRNA (78). 1.3.1.4. Genomowa lokalizacja miRNA Obecnie mechanizm biogenezy miRNA z ich prekursorów jest już dość dobrze opisany. Jednakże wpływ oraz kontrola mechanizmów transkrypcyjnych oraz potranskrypcyjnych na wydajność biogenezy miRNA nadal wymaga dalszej analizy i badań. Genomowa lokalizacja genów kodujących prekursory miRNA jest główną determinantą, sugerującą jakie procesy będą zaangażowane, jak wydajnie biogeneza tych cząsteczek będzie przebiegać i jaki wpływ może mieć to na poziom ich ostatecznej ilości w komórce. Opierając się na genomowej lokalizacji, miRNA możemy ogólnie sklasyfikować jako “wewnątrzgenowe” (ang. intragenic) oraz “pozagenowe” (ang. intergenic). MiRNA wewnątrzgenowe zlokalizowane są najczęściej w intronach genów kodujących białko oraz lncRNA. Sekwencje kodujące miRNA zlokalizowane również mogą być w częściach eksonowych swoich genów-gospodarzy (ang. host gene). W dużej części przypadków podlegają tej samej regulacji transkrypcyjnej, co geny wewnątrz których się znajdują. Jednak badania wysokoprzepustowe wykazały, że miRNA wewnątrzgenowe, zlokalizowane w intronach swoich genów-gospodarzy, mogą powstawać jednocześnie jako niezależne jednostki transkrypcyjne, z wykorzystaniem własnych miejsc promotorowych (79, 80). Faktem jest, że około 20% miRNA znajdujących się w intronowych częściach genów-gospodarzy, poprzez sprzężenie zwrotne reguluje ich własny poziom ekspresji (81). Oprócz tego wyróżniamy miRNA znajdujące się na połączeniu intron-ekson oraz miRNA, których transkrypcja przebiega na nici antysensownej. miRNA pozagenowe, zlokalizowane pomiędzy zdefiniowanymi genami, posiadają swoje własne miejsca promotorowe i powstają również przy udziale polimerazy II RNA oraz w rzadkich przypadkach polimerazy III RNA. Z przeprowadzonych badań wynika, że miRNA pozagenowe mogą powstawać przy udziale dwóch dodatkowych mechanizmów (80). Pierwszy, nazwany “przeciekiem” (ang. readthrough), bazuje na zjawisku, podczas którego transkrypcja genu przebiega jeszcze kilka tysięcy par zasad za miejscem PAS, w którym dochodzi do przecięcia http://mirgenedb.org/ https://mircarta.cs.uni-saarland.de/ 34 RNA i dobudowania ogona poli(A). Przykładem miRNA, którego biogeneza może zależeć od opisanego przecieku transkrypcji, jest miR-21 (82). Drugim z mechanizmów, który odpowiedzialny jest za powstawanie prekursorów miRNA jest mechanizm “rozbieżnej transkrypcji” (ang. divergent transcription). W czasie tego procesu, ze wspólnego miejsca promotorowego dwie polimerazy RNA przeprowadzają niezależnie od siebie transkrypcję genów nici sens oraz antysens (83). Według miRBase (miRBase v.20, N=1,870; http://www.mirbase.org/) około 39% ludzkich miRNA stanowi grupę miRNA pozagenowych, a zatem w przybliżeniu 61% zdeponowanych w bazie danych miRNA stanowią cząsteczki wewnątrzgenowe. Wśród nich, około 86% zlokalizowanych jest w genach kodujących białko, a 84% z nich transkrybowana jest na tej samej nici kodującej, co pre-mRNA ich genu-gospodarza. Zdecydowana większość wewnątrzgenowych miRNA zlokalizowana jest w intronach – 90%. Pozostałe 10% przypisane zostało jako miRNA eksonowe, przy czym 80% eksonowych miRNA lokalizuje w niekodujących fragmentach genów (5’ oraz 3’ UTR, ang. untranslated region) (84) (Ryc. 8). http://www.mirbase.org/ 35 Rycina 8 Genomowy podział cząsteczek miRNA. 1.3.1.5. Mechanizm działania miRNA Działanie miRNA rozpoczyna się od załadowania pojedynczej cząsteczki miRNA do kompleksu RISC. Będąc związany w kompleksie, miRNA nakierowuje RISC na mRNA poprzez komplementarne połączenie z niekodującym regionem w 3’UTR. Uznaje się, że fragment pomiędzy nukleotydami 2 i 8 w cząsteczce miRNA stanowi niezbędny element dla jego wiązania się do regulowanego miejsca w mRNA i nazywany jest miejscem źródłowym (ang. seed region) (68). Działanie miRNA można podzielić na dwa główne etapy. We wczesnej fazie działania regulatorowego miRNA następuje zablokowanie procesu translacji, przy braku zmian w stabilności docelowego mRNA. W kolejnych etapach dochodzi do degradacji takiego mRNA (85, 86). Uwzględniając bardzo krótką sekwencję wymaganą do związania się miRNA z docelowym miejscem w 3’UTR regulowanego transkryptu, można przyjąć że cząsteczki miRNA odgrywają szczególną rolę w kształtowaniu profilu ekspresji większości powstających genów. Biorąc do analizy zidentyfikowane regiony 3’UTR w ludzkim transkryptomie okazuje się, że w przypadku każdej z 90 silnie zakonserwowanych ewolucyjnie rodzin miRNA, współdzielących region źródłowy, istnieje średnio ponad 300 miejsc w 3’UTR do których będą wiązać się miRNA 36 na zasadzie 7-8 nukleotydowego sparowania. Jeżeli uwzględni się wiązanie regionu 6-nukleotydowego, to liczba potencjalnie regulowanych regionów wzrasta średnio do 500 dla jednej rodziny miRNA (87). Do niektórych 3’UTR jedna cząsteczka miRNA może przyłączyć się w kilku miejscach, jak również jeden 3’UTR w swojej sekwencji może zawierać zakonserwowane ewolucyjnie miejsca wiązania dla kilku różnych rodzin miRNA. Po związaniu się miRNA z docelowym miejscem w mRNA, białko Argonaut (AGO) rekrutuje reprezentanta z grupy białek z licznymi powtórzeniami glicynowo-tryptofanowymi (GW). W przypadku ssaków jest to białko TNRC6. Białka te mają duże powinowactwo do AGO oraz zawierają domenę wyciszającą. Domena ta posiada reszty tryptofanowe, niezbędne do wiązania się z rybonukleazami specyficznymi dla miejsc poli(A) - PARN2 lub dla represora katabolitów węglowych (CCR4). CCR4 jest negatywnym regulatorem transkrypcji - jego działanie polega na skracaniu ogonów poli(A) w mRNA. Dodatkowym czynnikiem wpływającym na obniżenie poziomu regulowanego RNA jest rekrutacja kolejnych białek wiążących się do ogona poli(A), które prowadzą do deadenylacji i w następstwie do degradacji cząsteczek mRNA. Skrócone, bądź pozbawione całkowicie ogonów poli(A) cząsteczki mRNA zostają pozbawione czapeczki na końcu 5’, co skutkuje aktywacją egzonukleazy 1 (XRN2), która degraduje mRNA z aktywnością 5’-3’ (68). 1.3.1.6. Znaczenie cząsteczek miRNA w rozwoju oraz w chorobie miRNA stanowią cząsteczki regulujące liczne procesy wewnątrzkomórkowe, a ich obecność jest niezbędna do prawidłowego rozwoju organizmu. Wykazano, że nokaut genu Dicer w mysim modelu prowadzi do śmierci organizmu w 7. dniu rozwoju embrionalnego (88). Oprócz rozwoju embrionalnego udowodniono, że miRNA kontrolują metabolizm, podziały komórkowe czy dojrzewanie komórek nerwowych (89). Do procesów, w których miRNA pełnią znaczącą funkcje regulatorową zaliczone są rozwój mózgu (90), różnicowania komórek mięśniowych (91) czy prawidłowe różnicowanie komórek macierzystych (92). Zaburzenia w ilości oraz funkcjonowaniu cząsteczek miRNA prowadzić może do licznych patologii, z pośród których dużą grupę stanowią różne etapy nowotworzenia. Ponad 50% miRNA zlokalizowanych jest we wrażliwych miejscach w genomie, w których obserwowane są częste delecje lub insercje. Potwierdzają to wyniki badań prób pochodzących od pacjentów onkologicznych (93). miRNA, w zależności od pełnionej roli, dzieli się na dwie kategorie: onkogeny (ang. OncomiR) oraz supresory nowotworzenia (94). OncomiR poprzez blokowanie działania czynników 37 supresorowych promują rozwój nowotworów. Przykładami oncomiR są miR-221/222 (95), miR-27a (96) czy miR-21 (97–99). W odróżnieniu od oncomiR, istnieje grupa miRNA których rolą jest blokowanie powstawania nowotworów, poprzez bezpośrednią supresję działania onkogenów. Przykładami takich miRNA są miR-145 (100), miRNA z rodziny let-7 (101) oraz miR-205 (102). 1.3.2. mikroRNA-21 miR-21 już niemal od dwóch dekad stanowi cel badań wielu naukowców na całym świecie (103). Ilość i powszechność występowania tej cząsteczki w komórkach różnego typu daje podstawy do twierdzenia, iż zaangażowany jest w istotne procesy komórkowe. miR-21 występuje niemalże w każdym typie komórek ssaczych i odgrywa szczególną rolę w takich procesach jak rozwój komórki, jej podziały czy apoptoza. miR-21 jako jeden z pierwszych był intensywnie badany i analizowany pod kątem procesów biogenezy i dojrzewania. Podwyższony poziom tego miRNA obserwowany jest w większości nowotworów, jak również chorób układu sercowo-naczyniowego. Przykładowo, badania przeprowadzone na myszy z podwyższoną ekspresją miR-21 wykazały, że ten miRNA bierze czynny udział w powstawaniu chłoniaka złośliwego (ang. Malignant B-cell lymphoma) (104). Pomimo intensywnych badań, pozostaje wciąż wiele niewiadomych dotyczących biogenezy miR-21, a przede wszystkim mechanizmów regulujących ten proces. Poznanie ich może stanowić możliwość do opracowania narzędzi pozwalających wpłynąć bezpośrednio na procesy w które zaangażowane jest miR-21. 1.3.2.1. Genomowa lokalizacja oraz regulacja biogenezy miR-21 Gen kodujący miR-21 zlokalizowany jest na chromosomie 17 (17q.23.1), w intronie 11. genu kodującego wakuolarne białko membranowe VMP1 (ang. Vacuole membrane protein 1). Prowadzone badania wykazały, że w obrębie genu kodującego pri-miR-21 znajdują się silnie zakonserwowane miejsca promotorowe (105). W 2008 roku została przeprowadzona dokładna analiza miejsc promotorowych dla transkrypcji prekursora miR-21 (miPPR-21) (106)(50). Miejsce to zawiera charakterystyczne sekwencje promotorowe dla polimerazy RNA II, tj. TATA, CCAAT oraz motywy bogate w GC. Dodatkowo zidentyfikowano miejsca wiązania dla czynników transkrypcyjnych, tj. białko aktywatorowe 1 (AP-1, ang. Activator protein 1), Ets/PU.1, białko alfa wiążące się do motywu CCAAT (C/EBPα, ang. CCAAT/enhancer-binding protein alfa,), czynnik jądrowy 1 (NF1, ang. Nuclear factor I), czynnik odpowiedzi na surowicę 38 (SRF, ang. Serum response factor), białko p53 oraz przekaźnik sygnałów i aktywator transkrypcji 3 (STAT3, ang. Signal transducer and activator of transcription 3) (107). Potencjalne miejsca wiązania dla tak wielu czynników transkrypcyjnych, zaangażowanych w szlaki sygnałowe różnego typu stymulacji po raz kolejny dowodzą istotności miR-21 i jego zaangażowania w odpowiedzi na zmieniające się warunki w komórce. Transkrypcyjna kontrola poziomu miR-21 wydaje się być swego rodzaju fenomenem. Dla większości badanych miRNA, których poziom ulega istotnej zmianie w nowotworach, nie zaobserwowano zmian w ilościach ich prekursorów. Taka obserwacja wskazuje na to, że w zmienny poziom miRNA w przypadku nowotworów, zaangażowany musi być mechanizm potranskrypcyjny. W opisanej analizie, w przypadku miR-21 odnotowano silną korelację między wzrostem poziomu transkryptu pri-miR-21, a ilością dojrzałej cząsteczki miRNA (108). Badanie z 2007 roku wykazało z kolei, że poziom miR-21 może być także uzależniony od hipometylacji DNA, wywołanej np. w nowotworowych komórkach jajnika (OVCAR3) (109). Coraz więcej dowodów wskazuje na to, że poziom miR-21 kontrolowany jest nie tylko na poziomie transkrypcyjnym, ale również potranskrypcyjnym. Dla przykładu, w komórkach mięśni gładkich, białka morfogenetyczne kości (BMP, ang. Bone morphogenic proteins) wspólnie z transformującym czynnikiem wzrostu beta (TGF-β, ang. Transforming growth factor beta) przyczyniają się do zwiększonego poziom miR-21 poprzez rekrutację RNA helikazy p68 (DDX5) do pri-mir-21, która stabilizuję działanie białka DROSHA (110). 1.3.2.2. Znaczenie miR-21 podczas rozwoju embrionalnego Tuż po zapłodnieniu, komórka embrionalna z powodu braku odpowiednich czynników transkrypcyjnych, zależna jest od RNA pochodzącego od matki. W momencie, gdy genom komórki embrionalnej jest w pełni aktywny, RNA matczyne ulega stopniowej degradacji. Dokładnie w tym momencie zaangażowanie cząsteczek miRNA staje się dominujące (111). W badaniu przeprowadzonym na modelu zwierzęcym Danio pręgowany (ang. Zebrafish), okazało się że miR-21 był obserwowany już we wczesnym stadium rozwoju embrionalnego. Badacze zaobserwowali, że w 12-tej godzinie od zapłodnienia poziom tego miRNA stanowił 40% wszystkich badanych cząsteczek miRNA (112). W innym doświadczeniu, pracując na modelu pstrąga tęczowego (ang. Rainbow trout), naukowcy zaobserwowali istotny przyrost ilości miR-21, jak również zwiększoną ekspresję genu Stat3 (czynnika transkrypcyjnego 39 zaangażowanego w transkrypcję pri-miR-21), podczas rozwoju embrionalnego (113). Podobnie jak w analizie przeprowadzonej na Danio pręgowanym, również i w tym przypadku wysoki poziom miRNA odpowiedzialny był za degradację matczynego mRNA. Represor neuronalny REST (wyciszający czynnik transkrypcyjny RE1, ang. RE1-silencing transcription factor) ulega wysokiej ekspresji w mysich komórkach macierzystych. Heterozygotyczna delecja tego czynnika, bądź jego wyciszenie przy pomocy siRNA prowadzi do zaburzeń w procesie samoodnowy tych komórek. Profilowanie poziomu miRNA wykazało, że białko Res wpływa negatywnie na poziom wielu miRNA, w tym miR-21. W takim przypadku, brak miR-21 wpływa na zaburzenia poziomu ekspresji czynników kluczowych podczas samoodnowy komórek macierzystych, którymi są Oct4, Nanog oraz Sox2. Nadekspresja miR-21 obniża możliwości samoodnowy komórek niemalże o 60% (114). Badanie te pokazują, że w prawidłowym funkcjonowaniu embrionalnych komórek macierzystych, istotną rolę odgrywa prawidłowy poziom miR-21. Morfogeneza rozgałęzień (ang. branching morphogenesis) stanowi podstawowy proces w rozwoju organów, tj. gruczołów zewnątrzwydzielniczych, płuc czy nerek. Badanie mysich embrionalnych gruczołów podżuchwowych stanowi podstawę w badaniu rozwoju organów, w tym również morfogenezy rozgałęzień. Wykazano, że degradacja macierzy zewnątrzkomórkowej wywołana przez metaloproteinazy macierzy (MMP, ang. matrix metalloproteinases) prowadzi do wzmocnienia morfogenezy rozgałęzień, ponieważ macierz zewnątrzkomórkowa w mezenchymie ulega przebudowie podczas rozwoju ślinianki podżuchwowej. Białko RECK stanowi inhibitor dla MMP i jego inhibicja prowadzi do przyspieszenia zajścia morfogenezy. W 2011 roku Hayashi i wsp. wykazali, że miR-21 poprzez oddziaływanie na MMP wpływa pośrednio na proces morfogenezy rozgałęzień (115). 1.3.2.3. miR-21 w kancerogenezie Naukowcy na całym świecie zaczęli uważniej przyglądać się udziałowi miRNA w chorobach nowotworowych, w momencie odkrycia globalnych zmian w poziomie ekspresji wielu reprezentantów tej grupy w materiale pochodzącym z guzów od pacjentów onkologicznych (116). Biorąc po uwagę, jak znaczące są zmiany obserwowane w poziomie przeważającej liczby miRNA w tkankach nowotworowo zmienionych, uznano, że muszą być one zaangażowane w procesy karcynogenezy. W przeprowadzonym wielkoskalowym badaniu, w którym uczestniczyło 540 badanych okazało się, że miR-21 jako jedyny ma podwyższony 40 poziom w większości badanych typów nowotworów takich jak, rak płuca, sutka, prostaty, jelita grubego czy trzustki. W kolejnych badaniach miR-21 uzyskał już miano onkogennego miRNA (ang. oncomiR) co potwierdził podwyższony poziom tej cząsteczki w przeważającej liczbie nowotworów (97–99). Badania funkcjonalne wykazały, że rola miR-21 w genezie chorób nowotworowych opiera się na jego bezpośrednim zaangażowaniu w procesy proliferacji komórek, zahamowanie procesów apoptotycznych, zwiększenie potencjału inwazyjności komórek i tworzenia przerzutów (117–120) (Tabela 1). 41 Typ nowotworu Poziom miR-21 Rola miR-21 Geny regulowane przez miR-21 Referencje Rak żołądka Podwyższony Promuje podziały komórek oraz możliwość ich przerzutów PTEN, PDCD4, RECK (121, 122) Rak jelita grubego Podwyższony Formowanie się guza, metastaza SMAD7, SMAD6, ITGβ4, PDCD4 (97, 123) Glejak Podwyższony Wzrost komórek, przyspieszone podziały komórkowe, różnicowanie komórek macierzystych w nowotworowe PTEN, RECK, FasL, PDCD4, Bcl2 (124) Rak piersi Podwyższony Zwiększona przeżywalność komórek, zmniejszone procesy apoptotyczne, oporność na leczenie PTEN, PDCD4, TPM1, RTN4, LZTFL1 (125, 126) Rak płuc Podwyższony Zmniejszone procesy apoptotyczne, przyspieszone podziały komórkowe, blokowanie aktywacji czynnika NF-κB PTEN, PDCD4, Smad7, Bcl2, EGFR, Cas8, TGFβ (127, 128) Rak prostaty Podwyższony Zwiększona inwazyjność, przerzuty, zmniejszone procesy apoptotyczne, niezahamowany wzrost RECK, MARCKS, PDCD4, TPM1, PTEN (129) Tabela 1 Znaczenie miR-21 w różnych typach nowotworów 42 2. Cel pracy Cząsteczka regulatorowa miR-21 jest jedną z najpowszechniej występujących form miRNA w komórkach zwierzęcych. Odgrywa ważną rolę w rozwoju embrionalnym oraz uczestniczy w utrzymaniu homeostazy komórek w dojrzałym organizmie. Jej znacząco podwyższony poziom obserwowany jest w większości nowotworów. Mimo dosyć dobrze poznanej funkcji jaką pełni miR-21, nadal nie wiadomo jakie procesy molekularne mogą być bezpośrednio zaangażowane w regulację poziomu tego miRNA. Zasadniczym celem niniejszej pracy było określenie zależności pomiędzy potranskrypcyjnymi mechanizmami biorącymi udział w dojrzewaniu pierwotnych transkryptów pri-miR-21, takich jak alternatywny splicing (AS) oraz alternatywna poliadenylacja (APA), a efektywnością biogenezy miR-21. Te potranskrypcyjne procesy są nieodłącznymi elementami dojrzewania niemal wszystkich prekursorowych RNA, w tym prekursorów miRNA. Potranskrypcyjne mechanizmy obróbki pri-miR-21 mogą mieć istotne znaczenie w fizjologicznej regulacji poziomu miR-21 oraz w patogenezie wielu chorób. Sekwencja kodująca miR-21 zlokalizowana jest w regionie 3’UTR genu wakuolarnego białka membranowego 1 (VMP1). W literaturze opisanych jest wiele zależności pomiędzy poziomem ekspresji genu-gospodarza, a biogenezą zakodowanych w nim miRNA. Dlatego pierwszym celem pracy była ocena zależności transkrypcji genu VMP1, a biogenezą miR-21. Aktywność alternatywnych miejsc poliadenylacji (APAS) genu VMP1 oraz pri-miR-21 może mieć istotne znaczenie dla biogenezy miR-21. Dlatego też drugim celem pracy doktorskiej było określenie znaczenia APAS w transkryptach powstających z locus VMP1 w kształtowaniu ilości dojrzałej cząsteczki miR-21. Prekursor pri-miR-21, obejmuje obszar kilku eksonów VMP1, w związku z czym może podlegać procesowi składania RNA podobnie jak pre-mRNA jego genu-gospodarza. Uwzględniając istnienie zależności pomiędzy procesami splicingu oraz poliadenylacji, postanowiono również zbadać potencjalny wpływ alternatywnego splicingu pri-miR-21 na wybór APAS i tym samym wydajność biogenezy miR-21. 43 3. Materiały i metody 3.1. Konstrukty genetyczne GFP_pri-miR-21 Jako matrycy do uzyskania konstruktu GFP_pri-miR-21 zastosowano szkielet wektora pEGFP-C1 (Addgene; 6084-1). Na potrzeby badań wektor ten najpierw został odpowiednio zmodyfikowany poprzez usunięcie miejsca SV40pA (miejsce sygnałowe dla terminacji transkrypcji). Do uzyskania wszystkich konstruktów, jak również do wprowadzenia zaplanowanych mutacji korzystano z zestawu NEBUilder HiFi DNA Assembly Cloning Kit (New England Biolabs; E5520), który bazuje na metodzie klonowania Gibsona (ang. Gibson assembly). Metoda ta jest bardzo wydajną i efektywną techniką klonowania. Opiera się na aktywności egzonukleazy, która poprzez swoje działanie tworzy, tzw. “Lepkie końce” od 5’ strony dwuniciowej części DNA, a następnie zawarta w mieszaninie ligaza łączy nowo powstałe lepkie końce. Podstawą prawidłowego działania tej metody jest takie zaprojektowanie wstawianej części, aby posiadała ona przynajmniej 15-20 komplementarnych nukleotydów do wcześniej zlinearyzowanego wektora. Linearyzacja wektora może przebiegać w różny sposób, tj. cięcie enzymami restrykcyjnymi bądź reakcja łańcuchowa polimerazy (PCR, ang. polymerase chain reaction) z wykorzystaniem odpowiednio wydajnego enzymu polimerazy (ang. High fidelity polymerase). Do linearyzacji wektora pEGFP-C1 używano CloneAmp HiFi PCR Premix (Takara Bio; 639298). Dzięki działaniu odpowiednio zaprojektowanym starterom możliwe było usunięcie danych fragment z wektora. Razem z usunięciem sekwencji SV40pA, do wektora wprowadzona została sekwencję pri-miR-21 (4469 pz). Sekwencja została namnożona z genomowego DNA z komórek HeLa, z wykorzystaniem wysokowydajnej polimerazy Q5® High-Fidelity DNA Polymerase (New England Biolabs; M0491). Lp. Nazwa Wielkość konstruktu (pz) 1 GFP_pri-miR-21_wt 8885 2 GFP_pri-miR-21_wt_miR-21_mut 8885 3 GFP_pri-miR-21_∆3ss_miR-21_mut 8874 4 GFP_pri-miR-21_∆PAS proks.1_miR-21_mut 8881 Tabela 2 Spis konstruktów używanych w pracy doktorskiej. 44 Rycina 9 Schematyczne przedstawienie konstruktów genetycznych GFP_pri-miR-21 stosowanych w pracy doktorskiej. Starter forward do namnożenia pri-miR-21 5’-ACGAGCTGTACAAGTGACAAGTCAGAGAGAGGGCG-3’ Starter reverse do namnożenia pri-miR-21 5’-TCAGTTATCTAGATCGACTAGAGGCTGACTTAGAAATTT-3’ Uzyskany wektor GFP_pri-miR-21_wt dodatkowo został zmodyfikowany w taki sposób, aby móc być w stanie zliczyć poziom egzogennej cząsteczki miR-21, przy zachowaniu niezmienionej struktury drugorzędowej RNA. W tym celu wprowadzono 3 mutacje punktowe w miejscu kodującym dojrzałą cząsteczkę miR-21-5p. Mutacje te uzyskano przy użyciu starterów: Starter forward do wprowadzenia mutacji miR-21-5p w GFP_pri-miR-21 5’-ATCGGACTGCTGTTGGCTGTTGAATCTCATGGCAACACCA-3’ Starter reverse do wprowadzenia mutacji miR-21-5p w GFP_pri-miR-21 45 5’-CAACAGCAGTCCGATAAGCTACCCGACAAGGTGGTAC-3’ W celu uzyskania plazmidu z usuniętym miejscem poliadenylacji (AATAA), który znajduje się 198 pz przed sekwencją kodującą miR-21 (PAS proks.) ponownie zastosowano zestaw NEBuilder HiFi DNA Assembly Cloning Kit (New England Biolabs; E5520) z zaprojektowanymi starterami w taki sposób, aby usunąć dany fragment wektora. Reakcje przeprowadziłem na bazie wektora GFP_pri-miR-21_miR-21_mut ze zmienioną sekwencją kodującą miR-21-5p. Starter forward do delecji fragmentu PAS proks. z wektora GFP_pri-miR-21_miR-21_mut 5’-GGGAGGAACAATTTTACTTTTTTCCTTTAGGAG-3’ Starter reverse do delecji fragmentu PAS proks z wektora GFP_pri-miR-21_miR-21_mut 5’-AAAATTGTTCCTCCCAAGCAAAACA-3’ W celu uzyskania plazmidu z usuniętym miejscem 3’ splicingu (3’ss) (CTACAGGGAGA), ponownie użyto zestawu NEBUilder HiFi DNA Assembly Cloning Kit (New England Biolabs; E5520) z zaprojektowanymi starterami w taki sposób, aby usunąć dany fragment wektora. Reakcje przeprowadzono na bazie wektora GFP_pri-miR-21_miR-21_mut ze zmienioną sekwencją kodującą miR-21-5p. Starter forward do przeprowadzenia delecji fragmentu 3’ splicingowego z wektora GFP_pri-miR-21_miR-21_mut 5’-ATTTATTTAAACTGGTTGTCCTGGATGTTTGA-3’ Starter reverse do przeprowadzenia delecji fragmentu 3’ splicingowego z wektora GFP_pri-miR-21_miR-21_mut 5’-CCAGTTTAAATAAATGCAGAACAATGCAATGA- 3’ 46 Produkty PCR wizualizowane były w żelu agarozowym z bromkiem etydyny (Sigma; E1510). Następnie wycięte kawałki żelu agarozowego z produktem PCR oczyszczone zostały na kolumnach membranowych Gel-Out Concentrator (A&A Biotechnology;023-50). Do reakcji ligacji użyto 100ng, zlinearyzowanego plazmidu, który ligowany był z odpowiednią wstawką, w molarnym stosunku 1:2 (plazmid:wstawka). Proces ligacji trwał przez 45 minut, w temperaturze 50°C. Po tym czasie transformowałem komórki kompetentne E. Coli DH5α stosując protokół szoku cieplnego. 3.2. Hodowle bakteryjne Rozmrożone na lodzie komórki kompetentne E. Coli DH5alfa zmieszano z połową wcześniej przygotowanej mieszaniny ligacyjnej. Następnie całość inkubowano na lodzie przez 30 min. Po tym czasie komórki zostały umieszczone w termobloku ustawionym na 42°C na 2 min, a następnie od razu przełożone komórki do lodu na kolejne dwie minuty. Po inkubacji na lodzie do komórek dodano podgrzaną do 37°C pożywkę LB (1% Bacto Tryptone, 0,5% Yeast Extract, 1% NaCl) i inkubowano całość w 37°C przez 2 h. Po inkubacji bakterie wysiano na szalki z LB z dodatkiem agaru oraz obecnością odpowiedniego antybiotyku (ampicylina 100 mg/ml; kanamycyna 50 mg/ml). Po całonocnej inkubacji w cieplarce nastawionej na temperaturę 37°C, wyselekcjonowano pojedynczą kolonię bakteryjną i przy użyciu PCR kolonijnego wstępnie weryfikowano jej zawartość (ang. colony PCR). Kolonie z pozytywnym wynikiem na zawartość konstruktu z insertem umieszczano w płynnej pożywce LB z dodatkiem antybiotyku i inkubowano kolejną noc w 37°C. 3.3. Eksperymenty na liniach komórkowych 3.3.1. Spis stosowanych linii komórkowych Nazwa Krótki opis Organizm Numer ATCC HeLa Rak szyjki macicy Homo sapiens (ATCC® CRM-CCL-2) NIH3T3 Embrionalne komórki skóry Mus musculus (ATCC® CRL-1658) HSkM Pierwotne komórki mięśniowe Homo sapiens (ATCC® PCS-950- 010) MCF-12A Komórki niezmienione gruczołu piersiowego Homo sapiens (ATCC® CRL-10782) MCF-7 Komórki nowotworowe gruczołu piersiowego Homo sapiens (ATCC® HTB-22) Tabela 3 Linie komórkowe używane w pracy doktorskiej 47 3.3.2. Hodowla oraz różnicowanie komórek Do hodowli komórek HeLa, NIH3T3, Cos7, A549 używane było pełne medium hodowlane DMEM z L-glutaminą I 4,5g/l glukozą (ang. Dulbecco's Modified Eagle's Medium) z dodatkiem 10% bydlęcej surowicy płodowej (FBS, ang. Fetal Bovine Serum) oraz 1% antybiotykiem- antymykotykiem (Sigma). Komórki MCF-7 oraz MCF-12A hodowane były w pożywce EMEM (ang. Eagle's Minimal Essential Medium; Lonza) suplementowanej do 10% FBS, 1% roztworem modyfikowanej ludzkiej insuliny (Insulin, human recombinant), 1% antybiotykiem- antymykotykiem. Komórki HSkM hodowane były w pożywce HAM-F10, suplementowanej do 20% FBS, 1% antybiotykiem-antymykotykiem, 10 ng/ml EGF (ang. Epidermal Growth Factor), 0,4 μg/ml deksametazonem (ang. Dexamethasone). Różnicowanie komórek HSkM wykonane zostało poprzez zmianę pożywki na różnicującą - DMEM z 4,5 g/l glukozy i suplementowanym do 2% końską surowicą, 1% antybiotykiem- antymykotykiem. Wszystkie hodowle komórkowe prowadzone były w inkubatorze, w standardowych warunkach (37°C i 5% CO2). 3.3.3. Transfekcje komórek Do transfekcji komórek siRNA wykorzystano Lipofektamine RNAiMAX (ThermoFisher; 13778100). Do transfekcji konstruktami genetycznymi oraz antysensownymi oligonukleotydami (AON) wykorzystano Lipofektamine 3000 (ThermoFisher; L3000150). Transfekcje wykonywane były zgodnie z protokołami producentów. Informacje dotyczące stężeń siRNA/AON oraz czasu traktowania komórek zamieszczone zostały w podpisach do odpowiednich rycin. W przypadku eksperymentów z konstruktami genetycznymi, do transfekcji używano ilości plazmidu wynoszącego 1-2 µg. 3.3.4. Spis stosowanych oligonukleotydów Oznaczenia stosowane w zapisie mieszanych oligonukleotydów. d DNA r RNA m 2′-O-metylo-RNA (2′OMe-RNA) * szkielet tiofosforanowy (PS, ang. phosphorothioate) P fosforan 48 Antysensowne oligonukleotydy (AON) Nazwa Sekwencja CTRL AON 5'-mC*mC*mA*mG*mC*mA*mA*mG*mC*mA*mC*mA*mG*mG*mC *mA*mG*mC*mG*mG*mG-3' (Eurogentec) PAS proks. AON 5’-mU*mU*mG*mU*mU*mU*mA*mU*mU*mU*mU*mC*mC* mU*mC*mC*mC*mA*mA*mG*mC-3’ (Eurogentec) 3’ss AON 5’-mU*mG*mU*mA*mG*mA*mA*mA*mU*mA*mA*mA*mU* mG*mC*mA*mG*mA*mA*mC*mA-3’ (Eurogentec) Tabela 4 Antysensowne oligonukleotydy (AON) stosowane w pracy doktorskiej Dupleksy siRNA Nazwa Sekwencja siCTRL_S 5’-P-rUrArArGrGrCrUrArUrGrArArGrArGrArUrArCdTdT-3’ (Future Synthesis) siCTRL_AS 5’-P-rGrUrArUrCrUrCrUrUrCrArUrArGrCrCrUrUrAdTdT-3’ (Future Synthesis) siDROSHA_S 5’-P-rCrGrArGrUrArGrGrCrUrUrCrGrUrGrArCrUrUdTdT-3’ (Future Synthesis) siDROSHA_AS 5'-P- rArArGrUrCrArCrGrArArGrCrCrUrArCrUrCrGdTdT-3' (Future Synthesis) siCPSF3 SMART Pool ON-TARGETplus siRNA, Human CPSF3 (51692) (Dharmacon nr kat. L-006365-01-0005) (GTGTCATTATAGCGGGAT, GTTCATAATCCTCGGAATA, CGATGAATCCCTCCGAGAA, TGAGAAACGTGAAGAGCGA) Tabela 5 Dupleksy siRNA stosowane w pracy doktorskiej 49 3.3.5. Izolacja RNA i odwrotna transkrypcja Całkowity RNA z komórek izolowany był przy użyciu TRIzol™ Reagent (ThermoFisher; 15596018) oraz oczyszczany na minikolumnach (AABiotech; 043-100). Dodatkowo w trakcie oczyszczania na kolumnach, RNA było trawione DNazą. Do reakcji odwrotnej transkrypcji używane było 500-1000 ng całkowitego RNA, z wykorzystaniem zestawu TranScriba Kit (AABiotech; 4000-100). W reakcji odwrotnej transkrypcji używano starterów losowych heksametrów lub startera oligo-dT. 3.3.6. Odwrotna transkrypcja dla cząsteczek miRNA Do uzyskania materiału, niezbędnego do analiz poziomu ilości miRNA, zastosowano zestaw qScript microRNA cDNA Synthesis Kit (Quantabio; 95107-100). W celu utrzymania cDNA z krótkich fragmentów RNA, w zestawie wykorzystano metodę dołączenia uniwersalnego adaptera na 3’ końcu każdej cząsteczki miRNA, po uprzednim dobudowaniu ogona poli(A), przez działanie PAP. Do reakcji używano 1000ng całkowitego RNA, zawierającego również pulę krótkich RNA. Dzięki dobudowanemu adapterowi na końcu każdej z krótkich cząsteczek RNA, możliwa była analiza wielu różnych miRNA, z tej samej puli matrycy (Ryc. 10). Rycina 10 Schemat procedury odwrotnej transkrypcji otrzymania cDNA z krótkich RNA jako matrycy 50 3.4. Analiza danych z portalu GTEx Dane RNA-Seq użyte do analizy poziomów ekspresji genu VMP1 i jego transkryptów w tkankach ludzkich zostały pobrane z portalu The Genotype-Tissue Expression (GTEx) Project (wersja bazy danych phs000424.v8.p2 z 01.06.2020) (The Genotype-Tissue Expression (GTEx) Project was supported by the Common Fund of the Office of the Director of the National Institutes of Health, and by NCI, NHGRI, NHLBI, NIDA, NIMH, and NINDS.). Dane RNA-Seq zostały pobrane w formie znormalizowanej w postaci transkryptów na milion (TPM, ang. Transcript per Milion). TPM oblicza się w następujący sposób: 1. Surowe wartości odczytów zostają podzielone przed długość transkryptu (wyrażoną w tysiącach par zasad (kpz)). Otrzymujemy odczyty na tysiąc par zasad (RPK, ang. Reads per Kilobase). 2. Wartości RPK w jednej próbce zostają zsumowane i podzielone przez 1,000,000. Otrzymujemy czynnik skalujący „na milion”. 3. Wartości RPK zostają podzielone przez czynnik skalujący „na milion”. Otrzymujemy TPM 4. Poziom ekspresji genu otrzymuje się przez dodanie wszystkich wartości TPM transkryptów pochodzących z jednego genu 3.5. Analizy RT-PCR oraz RT-qPCR Wszystkie RT-PCR były przeprowadzane z użyciem GoTaq Flexi DNA Polymerase według zalecanej procedury (Promega; M3001). Produkty PCR rozdzielane były na żelu agarozowym (1-1,5%) z bromkiem etydyny (Sigma; E1510). Do wizualizacji korzystano z systemu G:BOX (Syngene), a do analizy poziomu intensywności sygnału używano oprogramowania GeneTools (Syngene). W przypadku analiz RT-qPCR, do reakcji używano Maxima SYBR Green/ROX qPCR Master Mix (ThermoFisher; K0223). Reakcje oraz analizy były przeprowadzane w aparacie QuantStudio™ 7 Flex Real-Time PCR System (ThermoFisher; 4485701). 51 Rycina 11 Schemat prezentujący lokalizacje starterów do badania poziomu zmian VMP1/pri-miR-21. 3.5.1. Lista starterów Nazwa Symbol Sekwencja 5’-> 3’ Analizy zmian VMP1/pri-miR-21 (Ryc. 11) mRNA_VMP1_F F1 TTTCCCGAACCACCCTATCC mRNA_VMP1_R R1 CAGACTCTGCATGTTCCAGC VMP1_PASproks._F F2 TGAAACTGGGCTGCTGCATA VMP1_PASproks._R1 R2 ACACTTACAGAACGGCAAGA VMP1_PASproks._R2 R3 GCAGACAGTCAGGCAGGATT pri-miR-21_F F3 GGGTTCGATCTTAACAGGCC pri-miR-21_R R4 AATGTCAGACAGCCCATCGA VMP1/pri-miR-21_intron_F F4 CTCGAGGGAAGCACAGGTTT VMP1/pri-miR-21_intron_R R5 CGTGCCTGGAATCACAGCTA lncVMP1/pri-miR-21_F F5 TATCCAATCCCTGCCTTTTG lncVMP1/pri-miR-21_R R6 AATGGCTTCTGCAGAGATGG pri-miR-21_ret#1_intron_F F5 TATCCAATCCCTGCCTTTTG pri-miR-21_ret#1_intron_R R7 TTAAGGCAGAACCCATCCAC pri-miR-21_ret#2_intron_F F5 TATCCAATCCCTGCCTTTTG pri-miR-21_ret#2_intron_R R8 AAGGTGGTACAGCCATGGAG Analizy poziomu ekspresji genów regulowanych przez miR-21 TGFBR2_F TGFBR2_F CAAAGGTCCCATTTGCAGTT TGFBR2_F TGFBR2_F GAGACCTTCCACCATCCAAA PTEN_F PTEN_F ACCAGGACCAGAGGAAACCT 52 PTEN_R PTEN_R GCTAGCCTCTGGATTTGACG BTG2_F BTG2_F AGTCTCCAGCTAGGCCCTTC BTG2_R BTG2_R CACGCAACAGTTCTCTCCAA ICAM1_F ICAM1_F AGTCCAGTACACGGTGAGGA ICAM1_R ICAM1_R TGTGACCAGCCCAAGTTGTT NFIB_F NFIB_F CACCAAGCAGCAAAAGACCC NFIB_R NFIB_R CAGGTATTCCGGGATGGTGG Poziom pri-miRNA pri-miR-23b_F pri-miR-23b_F GAAGCCCAGTGTGTGCAGA pri-miR-23b_R pri-miR-23b_R GACCACGGTTTCTGGAGGAG pri-miR-27b_F pri-miR-27b_F CTGAGGAAGATGCTCACCGG pri-miR-27b_R pri-miR-27b_R CCAGCGGCTCCAACTTAACT pri-miR-24-1_F pri-miR-24-1_F CTGAGGCGCTGCTTCTCC pri-miR-24-1_R pri-miR-24-1_R CCTCGGGCACTTACAGACAC pri-miR-30d_F pri-miR-30d_F TGTCTGTGAATAGCCGGTAGC pri-miR-30d_R pri-miR-30d_R AGCTGAAGATGATGACTGGCA Badanie poziomu miRNA miR-21-5p miR-21-5p TAGCTTATCAGACTGA miR-21-5p_mut miR-21-5p_mut TAGCTTATCGGACTGC miR-16 miR-16 GGATGACACGCAAATTCGTG miR-378a-3p miR-378a-3p ACTGGACTTGGAGTCAGAAG miR-23b-3p miR-23b-3p ATCACATTGCCAGGGATTACCAC miR-27b miR-27b TTCACAGTGGCTAAGTTCTGC U6 U6 GGATGACACGCAAATTCGTG Uniwersalny starter_R Universal_R GCATAGACCTGAATGGCG