Informacija

Koji su ograničavajući čimbenici za duljinu gena i broj egzona?

Koji su ograničavajući čimbenici za duljinu gena i broj egzona?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Nedavno sam preuzeo genetske napomene za Homo sapiens iz Ensembla za neku bioinformatičku analizu. Velika većina genskih bilješki ima 20 egzona ili manje, iako postoje neki koji imaju čak 250. Znam dovoljno o genskim napomenama da uzmem ova predviđanja s rezervom, ali to me natjeralo na razmišljanje... što su biološki relevantni čimbenici koji mogu ograničiti duljinu, broj egzona itd. gena? Postoji li realna mogućnost da gen ima 50 egzona? 100 egzona? 250 egzona? S biološkog stajališta, gdje je povučena crta i zašto?


Ovo pitanje čvrsto pada u krilo molekularne evolucije i ograničenja koja na gene postavljaju sile mutacije, selekcije, pomaka i rekombinacije.

Postoje brojne situacije, posebno umnožavanje gena, koje mogu rezultirati genom koji je oslobođen selektivnih ograničenja svog roditelja, od kojih će mnoge akumulirati toliko štetnih mutacija kao rezultat stohastičkih procesa da će postati nefunkcionalne, npr. psuedogenes. Neki se mogu mijenjati i preuređivati, akumulirajući egzone i introne, a ako zaključe o dobrobiti fitnessa za organizam, mogu se premjestiti na fiksaciju unutar populacije.

Evolucija je proces populacijske genetike i postoje mnoge varijable koje mogu utjecati na ishod, a ne samo razlika u veličini populacije. Čini se da genomi većih populacija (kao što su oni bakterija) imaju mnogo manje genome, i naravno da nema (barem ne spliceosomalnih) introna, možda kao rezultat povećane sposobnosti zbog smanjenog vremena generiranja organizma s više vitki genom. Bilo bi dobro pročitati The Origins of Genome Architecture Michaela Lyncha, jer mislim da on odgovara na vaša pitanja, bolje nego ja.

Mnogi geni koje dohvatite iz EnsEMBL-a će naravno imati eksperimentalne dokaze koji ih podržavaju. Gene koji se predviđaju u tijeku može se gledati s manje povjerenja, ali naravno možete pogledati usklađenja s blisko srodnim vrstama kako biste vidjeli misle li da su introni/egzoni doista održivi. Primjer gena sa 79 egzona je gen za distrofin (DMD), najduži označeni gen na 2 217 347 bp (vidi Roberts i sur., 1993. i Nishio i sur., 1994.).


Sumnjam da stvarno postoji bilo kakvo izravno ograničenje; najbolji test bi bio provjeriti odgovara li veličina, tj. da bi gen od 1 kbp sa 100 egzona radije morao imati prekratke introne.

Brza pretraga preko NCBI gena pokazuje čak i gen od 317 egzona, iako se čini da su svi ti rubni slučajevi neka nejasna braća i sestre titina koji je sam po sebi ogroman.


Slažem se s mbq - titan je najduži gen za koji znam i ima više od 100 egzona. Titin i distrofin su genetski dobro okarakterizirani, a ne predviđanja. titin je prvak exoner sa 363 egzona.

Mislim da su jedini primjeri poput ovog koji mogu dopustiti da prediktori gena rade koliko god to rade jer su predviđanja heuristički obrezana kako bi nalikovala poznatim genskim strukturama/duljinama/spojnicama itd.


Koji su ograničavajući čimbenici za duljinu gena i broj egzona? - Biologija

Molekularne baze tipa 1a GSD: (G6PC) nedostatak

Gen G6PC, koji kodira jetrenu katalitičku podjedinicu glukoza-6-fosfataze, nalazi se na kromosomu 17 na vrpci q21. Ima pet egzona i dugačak je 12,5 kb. Kodira protein od 35,5 kDa koji se sastoji od 357 aminokiselina bez poznatih varijanti spajanja. Do danas je više od 75 različitih mutacija u G6PC pronađeno u pacijenata s GSD1a i odgovorne su za 80% slučajeva. Pronađene su mutacije u svih pet egzona i na granicama intron-egzon. Identificirani su polimorfizmi promotora koji utječu na stupanj ekspresije G6PC i mogu biti odgovorni za neke od preostalih slučajeva. Mutacije u katalitičkom centru enzima ukidaju svaku aktivnost, dok mutacije u transmembranskim domenama destabiliziraju protein i čine ga osjetljivim na brzu razgradnju. Neke mutacije proizvode enzime s rezidualnom aktivnošću. Poremećaj je autosomno recesivan, tako da mutacije moraju biti prisutne na obje kopije gena da bi osoba bolovala od GSD1a.

Dva druga vrlo srodna gena, G6PC2 i G6PC3, nedavno su identificirana. Tri G6PC gena imaju različite tkivno specifične obrasce ekspresije. Samo G6PC je izražen u značajnim razinama u jetri odraslih. G6PC2 je izražen pretežno u gušterači, a mutacije u ovom genu dovode do aberantne signalizacije glukoze i izlučivanja inzulina. G6PC3 je izražen u svim do sada ispitivanim tipovima tkiva. Najveće razine su u mozgu, mišićima, posteljici i tkivima fetusa, a vrlo niske razine u jetri. Nedavno su opisane mutacije G6PC3 i mogu objasniti mnoge od simptoma GSD1b opisanih naknadno, a koji se ne nalaze u GSD1a, uključujući izraženu neutropeniju i osjetljivost na infekciju.


Eukariotska epigenetska genska regulacija

Ljudski genom kodira preko 20.000 gena, svaki od 23 para ljudskih kromosoma kodira tisuće gena. DNK u jezgri je precizno namotana, presavijena i zbijena u kromosome tako da će stati u jezgru. Također je organiziran tako da se određenim segmentima može pristupiti prema potrebi određenoj vrsti ćelije.

Prva razina organizacije, ili pakiranja, je namotavanje lanaca DNK oko histonskih proteina. Histoni pakiraju i raspoređuju DNK u strukturne jedinice zvane nukleosomski kompleksi, koji mogu kontrolirati pristup proteina regijama DNA (slika 1a). Pod elektronskim mikroskopom, ovo namotavanje DNK oko histonskih proteina za formiranje nukleosoma izgleda kao male kuglice na niti (slika 1b). Ove kuglice (histonski proteini) mogu se kretati duž niza (DNA) i mijenjati strukturu molekule.

Slika 1. DNA je presavijena oko histonskih proteina kako bi se stvorili (a) nukleosomski kompleksi. Ovi nukleosomi kontroliraju pristup proteina osnovnoj DNK. Kada se promatraju kroz elektronski mikroskop (b), nukleosomi izgledaju kao perle na niti. (zasluga "mikrografija": modifikacija djela Chrisa Woodcocka)

Ako se DNA koja kodira određeni gen treba transkribirati u RNA, nukleosomi koji okružuju tu regiju DNK mogu kliziti niz DNK kako bi otvorili tu specifičnu kromosomsku regiju i omogućili transkripcijskom stroju (RNA polimeraza) da započne transkripciju (slika 2). Nukleosomi se mogu pomaknuti kako bi otvorili strukturu kromosoma kako bi otkrili segment DNK, ali to čine na vrlo kontroliran način.

Pitanje za vježbanje

Slika 2. Nukleosomi mogu kliziti duž DNK. Kada su nukleosomi međusobno raspoređeni (gore), faktori transkripcije se ne mogu vezati i ekspresija gena je isključena. Kada su nukleosomi daleko jedan od drugog (odozdo), DNK je izložena. Transkripcijski čimbenici se mogu vezati, omogućujući ekspresiju gena. Modifikacije histona i DNK utječu na razmak nukleosoma.

U ženki je jedan od dva X kromosoma inaktiviran tijekom embrionalnog razvoja zbog epigenetskih promjena na kromatinu. Što mislite kakav bi utjecaj ove promjene imale na pakiranje nukleosoma?

Kako se proteini histona kreću ovisi o signalima koji se nalaze i na histonskim proteinima i na DNK. Ovi signali su oznake dodane histonskim proteinima i DNK koje histonima govore treba li neka kromosomska regija biti otvorena ili zatvorena (Slika 3. prikazuje modifikacije histonskih proteina i DNK). Ove oznake nisu trajne, ali se po potrebi mogu dodati ili ukloniti. To su kemijske modifikacije (fosfatne, metilne ili acetilne skupine) koje su vezane za specifične aminokiseline u proteinu ili na nukleotide DNA. Oznake ne mijenjaju sekvencu baze DNA, ali mijenjaju koliko je DNK čvrsto omotana oko proteina histona. DNK je negativno nabijena molekula, stoga će promjene u naboju histona promijeniti koliko će čvrsto namotana molekula DNK biti. Kada su nemodificirani, histonski proteini imaju veliki pozitivan naboj dodavanjem kemijskih modifikacija poput acetilnih skupina, naboj postaje manje pozitivan.

Sama molekula DNK također se može modificirati. To se događa unutar vrlo specifičnih regija zvanih CpG otoci. To su dionice s visokom učestalošću parova DNA citozina i guanin dinukleotida (CG) koji se nalaze u promotorskim regijama gena. Kada ova konfiguracija postoji, citozinski član para može se metilirati (doda se metilna skupina). Ova modifikacija mijenja način interakcije DNK s proteinima, uključujući histonske proteine ​​koji kontroliraju pristup regiji. Visoko metilirane (hipermetilirane) regije DNA s deacetiliranim histonima su čvrsto smotane i transkripcijski neaktivne.

Slika 3. Histonski proteini i DNA nukleotidi mogu se kemijski modificirati. Modifikacije utječu na razmak nukleosoma i ekspresiju gena. (zasluga: izmjena rada od strane NIH)

Ova vrsta regulacije gena naziva se epigenetska regulacija. Epigenetički znači "oko genetike". Promjene koje se javljaju na histonskim proteinima i DNK ne mijenjaju nukleotidni slijed i nisu trajne. Umjesto toga, te su promjene privremene (iako često traju kroz više krugova stanične diobe) i po potrebi mijenjaju kromosomsku strukturu (otvorenu ili zatvorenu). Gen se može uključiti ili isključiti ovisno o lokaciji i modifikacijama histonskih proteina i DNA. Ako se gen treba transkribirati, histonski proteini i DNK modificiraju se oko kromosomske regije koja kodira taj gen. To otvara kromosomsku regiju kako bi se omogućio pristup RNA polimerazi i drugim proteinima, zvanim transkripcijski čimbenici, da se vežu na regiju promotora, smještenu odmah uzvodno od gena, i započnu transkripciju. Ako gen treba ostati isključen ili utišan, histonski proteini i DNK imaju različite modifikacije koje signaliziraju zatvorenu kromosomsku konfiguraciju. U ovoj zatvorenoj konfiguraciji, RNA polimeraza i transkripcijski faktori nemaju pristup DNA i transkripcija se ne može dogoditi (slika 2).

Pogledajte ovaj video koji opisuje kako epigenetska regulacija kontrolira ekspresiju gena.

Poput prokariotskih stanica, transkripcija gena kod eukariota zahtijeva djelovanje RNA polimeraze da se veže na sekvencu uzvodno od gena kako bi se pokrenula transkripcija. Međutim, za razliku od prokariotskih stanica, eukariotska RNA polimeraza zahtijeva druge proteine ​​ili čimbenike transkripcije kako bi olakšali inicijaciju transkripcije. Transkripcijski čimbenici su proteini koji se vežu na promotorski slijed i druge regulatorne sekvence za kontrolu transkripcije ciljnog gena. RNA polimeraza sama po sebi ne može pokrenuti transkripciju u eukariotskim stanicama. Transkripcijski čimbenici se prvo moraju vezati na promotorsku regiju i regrutirati RNA polimerazu na mjesto da bi se transkripcija uspostavila.

Pogledajte proces transkripcije – stvaranje RNA iz DNK predloška:

Promotor i transkripcijski strojevi

Geni su organizirani kako bi se olakšala kontrola ekspresije gena. Promotorsko područje je odmah uzvodno od kodirajuće sekvence. Ova regija može biti kratka (duljina samo nekoliko nukleotida) ili prilično duga (dugačka stotine nukleotida). Što je promotor duži, to je više raspoloživog prostora za vezanje proteina. Ovo također dodaje više kontrole procesu transkripcije. Duljina promotora je specifična za gen i može se dramatično razlikovati između gena. Posljedično, razina kontrole ekspresije gena također se može prilično dramatično razlikovati između gena. Svrha promotora je vezati faktore transkripcije koji kontroliraju inicijaciju transkripcije.

Slika 1. Pojačivač je DNK sekvenca koja potiče transkripciju. Svaki pojačivač se sastoji od kratkih DNK sekvenci koje se nazivaju distalni kontrolni elementi. Aktivatori vezani za distalne kontrolne elemente stupaju u interakciju s posredničkim proteinima i transkripcijskim faktorima. Dva različita gena mogu imati isti promotor, ali različite distalne kontrolne elemente, omogućujući diferencijalnu ekspresiju gena.

Unutar regije promotora, odmah uzvodno od mjesta početka transkripcije, nalazi se TATA kutija. Ova kutija je jednostavno ponavljanje timinskih i adenin dinukleotida (doslovno, TATA se ponavlja). RNA polimeraza se veže na kompleks inicijacije transkripcije, omogućujući transkripciju. Za pokretanje transkripcije, faktor transkripcije (TFIID) se prvi veže za TATA kutiju. Vezanje TFIID regrutira druge faktore transkripcije, uključujući TFIIB, TFIIE, TFIIF i TFIIH za TATA okvir. Jednom kada se ovaj kompleks sastavi, RNA polimeraza se može vezati na svoju uzvodnu sekvencu. Kada se veže zajedno s transkripcijskim faktorima, RNA polimeraza se fosforilira. Ovo oslobađa dio proteina iz DNA kako bi aktivirao kompleks inicijacije transkripcije i postavlja RNA polimerazu u ispravnu orijentaciju za početak transkripcije Protein koji savija DNK dovodi pojačivač, koji može biti prilično udaljen od gena, u kontakt s transkripcijskim čimbenicima i proteina medijatora (slika 1).

Osim općih transkripcijskih čimbenika, na promotor se mogu vezati i drugi faktori transkripcije kako bi regulirali transkripciju gena. Ti se transkripcijski čimbenici vežu na promotore specifičnog skupa gena. Oni nisu opći transkripcijski čimbenici koji se vežu na svaki promotorski kompleks, već se regrutiraju za specifičnu sekvencu na promotoru specifičnog gena. Postoje stotine transkripcijskih čimbenika u stanici od kojih se svaki specifično veže za određeni motiv DNA sekvence. Kada se transkripcijski čimbenici vežu na promotor neposredno uzvodno od kodiranog gena, to se naziva cis-djelujući element, jer se nalazi na istom kromosomu odmah do gena. Područje na koje se veže određeni faktor transkripcije naziva se mjesto vezanja transkripcijskog faktora. Transkripcijski čimbenici reagiraju na podražaje iz okoline koji uzrokuju da proteini pronađu svoja vezna mjesta i pokreću transkripciju gena koja je potrebna.

Pojačivači i transkripcija

U nekim eukariotskim genima postoje regije koje pomažu povećati ili pojačati transkripciju. Ove regije, nazvane pojačivači, nisu nužno bliske genima koje pojačavaju. Mogu se nalaziti uzvodno od gena, unutar kodirajuće regije gena, nizvodno od gena ili mogu biti udaljene tisuće nukleotida.

Regije pojačivača su vezne sekvence, ili mjesta, za faktore transkripcije. Kada se protein koji savija DNK veže, oblik DNK se mijenja (slika 1). Ova promjena oblika omogućuje interakciju aktivatora vezanih za pojačivače s transkripcijskim faktorima vezanim za promotorsku regiju i RNA polimerazu. Dok se DNK općenito prikazuje kao ravna linija u dvije dimenzije, ona je zapravo trodimenzionalni objekt. Stoga se nukleotidni slijed udaljen tisućama nukleotida može preklopiti i stupiti u interakciju sa specifičnim promotorom.

Isključivanje gena: transkripcijski represori

Poput prokariotskih stanica, eukariotske stanice također imaju mehanizme za sprječavanje transkripcije. Represori transkripcije mogu se vezati na promotorske ili pojačivačke regije i blokirati transkripciju. Poput aktivatora transkripcije, represori reagiraju na vanjske podražaje kako bi spriječili vezanje aktivacijskih transkripcijskih čimbenika.

Pitanja za vježbanje

Za početak transkripcije potrebno je uvezivanje ________.

Što će rezultirati vezanjem faktora transkripcije na područje pojačivača?

  1. smanjena transkripcija susjednog gena
  2. povećana transkripcija udaljenog gena
  3. promjena translacije susjednog gena
  4. početak regrutacije RNA polimeraze

Mutacija unutar promotorske regije može promijeniti transkripciju gena. Opišite kako se to može dogoditi.

Što bi se moglo dogoditi ako stanica ima previše prisutnog faktora aktivacije transkripcije?


Rezultati

Dva do četiri posto gena RefSeq su kandidati za raspad posredovani besmislicom i nisu objašnjeni kao rijetki aleli ili artefakti sekvenciranja

Kandidati za NMD identificirani su kod ljudi i miša iz RefSeq mRNA baza podataka [45, 46]. Baza podataka RefSeq sadrži mnoge djelomično ručno odabrane sekvence mRNA, posebno za one s prefiksom 'NM_', koje općenito imaju eksperimentalnu podršku. Na temelju ovih mRNA s prefiksom 'NM_' i slijedeći pravilo NMD 55-nt [16], identificirali smo 701 i 498 gena kandidata za NMD u ljudi i miša (Tablica 1). Oni predstavljaju 3,9% odnosno 2,8% gena ispitanih kod ljudi i miša. Proporcije su na donjoj granici prethodnih izvješća [4, 9–12]. To može djelomično odražavati isključenje mnogih izoforma spajanja, zbog nedostatka adekvatne eksperimentalne potpore, u bazi podataka RefSeq [47]. S druge strane, prethodno prijavljeni udjeli reguliranih gena uglavnom su se temeljili na modulaciji profila ekspresije i trebali bi odražavati izravne i neizravne učinke NMD-a [31, 39, 48]. Apriorno Očekuje se da će takve metode precijeniti broj pravih NMD ciljeva [37].

Pozivajući se na podatke cDNA pune duljine zbirke gena sisavaca [49, 50] i dbSNP [51] (tablica S1 u dodatnoj datoteci 1), nalazimo da kandidati za NMD imaju istu kvalitetnu podršku kao i drugi geni, što ukazuje da su ti kandidati nije rezultat artefakata sekvence ili rijetkih alela. Također smo otkrili da su ljudski kandidati za NMD ovdje obogaćeni za potencijalne ciljeve NMD, prethodno utvrđene u studiji koju je proveo Mendell et al [10] (Tablica S2 u Dodatnoj datoteci 1). Kao što je prikazano u Tablici 1, kandidati za NMD općenito kodiraju kraće proteine ​​i duže introne i UTR u usporedbi s genima koji nisu NMD.

Nekoliko gena je besmisleno posredovano kandidati za raspad i kod miša i kod ljudi

Model buke spajanja predviđa da NMD gen u jednoj vrsti ne mora biti meta NMD-a u drugoj. Model regulacije to ne predviđa nužno. Na temelju ortoloških parova identificiranih programom Inparanoid [52], izbrojali smo broj ortoloških parova koji su bili kandidati za NMD u obje vrste (Tablica 2). Samo 24 para ortologa (6,70% odnosno 8,22% kandidata za NMD ljudi i miša) bila su kandidati za NMD u obje vrste (pogledajte Dodatni fajl 2 za potpuni popis konzerviranih kandidata za NMD).

Budući da je vjerojatno da su neki NMD transkripti izostali iz analize zbog strogog odabira podataka, ponovili smo analizu koristeći sve RefSeq mRNA, uključujući predviđene mRNA (s prefiksom 'XM_'). Broj kandidata za NMD u oba genoma povećao se prema očekivanjima u ovom drugom krugu. Međutim, raskrižje između NMD ortologa i dalje je bilo malo (vidi tablicu S3 u Dodatnoj datoteci 1). Rezultat je u skladu s prethodnom usporedbom čovjeka, voćne mušice D. melanogaster i S. cerevisiae Kandidati za NMD [4, 9–12]. Također možemo pokazati da niske stope očuvanja NMD nisu u skladu s normalnim stopama prometa stop kodona (vidi tablicu S4 u Dodatnoj datoteci 1). Naš nalaz pokazuje da, čak i kada mehanizam PTC regulacije nije varijabilan, deterministička regulacija NMD općenito nije selektivno favorizirana tijekom dugoročnog razdoblja ili nije ispravno objašnjenje za većinu PTC-a.

Eksoni raspadanja posredovani besmislicom obično nisu višestruki od tri duga

Ako je egzon uključen bučnim spajanjem, tlak koji se ne treba translirati trebao bi biti veći ako egzon nije višestruki od tri, nego ako je višestruk od tri. Uključivanje takvih egzona će inducirati pomak okvira ako se prevede, što će promijeniti kodirane aminokiseline nizvodno od uključenih eksona. Ako je tako, to će rezultirati proteinima koji su u najboljem slučaju skupi za proizvodnju i nefunkcionalni, au najgorem su toksični za stanice. Nasuprot tome, uključivanje egzona koji je višestruko od tri obično će rezultirati malim peptidnim umetkom, ali ne mora poremetiti cjelokupnu funkciju tog proteina. Troškovi bučnog spajanja mogu se donekle smanjiti degradacijom tih bučnih transkripata korištenjem sustava raspada mRNA, kao što je NMD. Budući da egzoni koji nisu višestruki od tri nameću veći trošak, očekujemo jači odabir za PTC u egzonima koji nisu višekratnici tri u usporedbi s onima koji ne induciraju pomake okvira, uz pretpostavku jednake stope pogrešnog spajanja. Regulacijski model ne predviđa pristranost.

Eksone u kandidatima za NMD klasificirali smo kao egzone specifične za NMD (egzone uočene samo u NMD transkriptima) i NMD-nespecifične egzone (lijeve egzone u genima kandidata za NMD) (tablica 3). Počeli smo s genima koji imaju najmanje dvije RefSeq mRNA i dobili 36 643 eksona internog kodiranja iz 3 362 gena (uključujući 252 kandidata za NMD i 3 110 gena koji nisu NMD) (Tablica 3). Među njima smo identificirali 278 NMD-specifičnih egzona i 2353 NMD-nespecifičnih egzona. Budući da egzoni specifični za NMD mogu imati tendenciju da budu u vlasništvu samo jednog transkripta, radi bolje usporedbe klasificirali smo egzone u kandidatima koji nisu NMD kao pojedinačne ne-NMD (egzone opažene samo u jednoj RefSeq mRNA) i ne-NMD-više egzone ( preostali egzoni u genima kandidatima koji nisu NMD) (tablica 3). Usredotočili smo se na NMD-specifične egzone kasetnog tipa, jer se ti egzoni nisu preklapali s regijama u ne-NMD transkriptima i bili su prikladniji za našu svrhu.

Kao što je prikazano u četvrtom stupcu Tablice 3, duljine egzona kaseta specifičnih za NMD nisu djeljive s tri u više slučajeva (60,3%) od ne-NMD kasetnih egzona (52,7% i 49,1% za ne-NMD-pojedinačne i ne-NMD kasete). -NMD-višestruki, odnosno hi-kvadrat test, P vrijednosti: 0,09616 i 0,01388). Ovo podržava bučni model spajanja. Također imajte na umu da NMD egzoni očuvani od čovjeka i miša pokazuju manju tendenciju da ne budu višekratnici od tri (14 od 23 = 60,8%) od NMD egzona stvorenih nakon podjele miš-ljud (7 od 9 = 78%), iako je veličina uzorka su premalene da bi se donijeli konačni zaključci (vidi tablicu 4 za konzervirane egzone).

Eksoni specifični za raspad posredovani besmislicom obično su u kategoriji niske uključenosti i novonastali

Prema modelu bučnog spajanja, NMD transkript je alternativno spojeni neželjeni prijepis. Regulacijski model ne zahtijeva da transkripti NMD budu alternativno spojeni transkripti, niti, ako jesu, moraju biti manjinski oblik (izoforma transkripta koja čini mali dio (manje od jedne trećine) transkripata istog gena). Je li onda vjerojatnije da će geni NMD biti alternativno spojeni nego slučajni geni i jesu li izoforme NMD transkripta rijetke? Da bismo to istražili, mapirali smo naše popise gena u Ensembl gene s BioMartom [53] i izvukli informacije o izoformi spajanja iz ASD baze podataka [54, 55].

Otkrili smo da 419 od 458 i 271 od 347 (za ljude i miševe), kandidatski geni za NMD imaju najmanje dvije poznate izoforme spajanja u ASD-u [54, 55] (Tablica 5). Općenito, jedan gen kandidat za NMD može imati i varijante NMD i ne-NMD transkripta. U usporedbi s nasumično odabranim genima, otkrivamo da su kandidati za NMD češće podložni alternativnom spajanju kod ljudi (P = 0,0007832). Međutim, nema razlike u mišu (P = 0,8705). To je vjerojatno uzrokovano: 1) pogrešnom klasifikacijom nekih pravih NMD ciljeva u ne-NMD postavljene kod miša zbog manjeg broja RefSeq mRNA s prefiksom 'NM_' (19 083 i 23 839 RefSeq mRNA u našem skupu podataka za miševe i ljude, respektivno) i 2) niža stopa detekcije alternativnog spajanja za miševe (79%) nego za ljude (86%) u bazi podataka ASD [54, 55]. Također imajte na umu da su Xing i Lee otkrili da su kod glodavaca kandidati za NMD podložni alternativnom spajanju češće nego što se očekivalo [44].

Kao što se i očekivalo od modela bučnog spajanja, otkrili smo da je veći udio egzona specifičnih za NMD (48%) spojen u manjem obliku (uključeno u manje od jedne trećine transkripata transkribiranih iz ovog gena) u usporedbi s pojedinačnim egzonima koji nisu NMD ( 26,1%) (Slika 2) (Jednostrani Kolmogorov-Smirnov test, P = 0,02443). To je u skladu s prethodnim izvješćima da je većina navodnih NMD transkripata izražena u maloj količini u ispitivanim tkivima [41] i s nalazom da i kod ljudi i kod miševa manji transkript ima PTC češće od glavnog oblika (11,1% protiv 3.7%) [44].

Razine uključivanja egzona u različite klase egzona kaseta. Eksoni specifični za raspad mRNA posredovani besmislicom obogaćeni su u manjem obliku (razina uključenosti < 33%) inkluzijskom kategorijom i osiromašeni u kategoriji glavnog oblika (razina uključenosti > 67%).

Jesu li egzoni NMD stari ili novi? Da bismo istražili ovo pitanje, ispitali smo događaje stvaranja i gubitka egzona za svaki egzon kasete specifičan za NMD. Da bismo dobili ove informacije, započeli smo mapiranjem naših egzona na one iz ASAP2 i VEEDB baza podataka [56, 57]. VEEDB baza podataka pruža informacije o očuvanju egzona za svaki dati egzon na temelju očuvanja mjesta spajanja, a to se izdvaja iz UCSC višegenomskog poravnanja 17 kralježnjaka [57]. Koristeći ove podatke o očuvanju egzona, mogli bismo utvrditi je li dati ljudski egzon konzerviran ili odsutan u miša i psa (van grupe). Nažalost, samo je mali dio egzona mapiran u VEEDB bazu podataka [57]. Kao što je prikazano u tablici 4, 9 od 35 egzona specifičnih za NMD stvoreno je nakon razdvajanja čovjeka i miša. Ovaj udio (25,7%) značajno je veći od onog egzona jedne klase koji nisu NMD (11,9%) (Fisherov točan test, P = 0,0315) (vidi Dodatnu datoteku 2 za ljudske egzone specifične za NMD konzervirane u miševa). Kad smo usporedili ljude s Rhesus makakima (Macaca mulatta) s miševima kao vanjskom grupom, razlika je značajnija (dodatna datoteka 1, tablica S5, NMD-specifično 21,2%, ne-NMD-single 4,5%, P = 0,001139). Ovi nalazi su u skladu s činjenicom da egzoni koji induciraju NMD često nisu konzervirani među vrstama [41]. Stope gubitka egzona su mnogo manje i nije bilo razlike između NMD i ne-NMD eksona.

Povezanost između novih i alternativno spojenih egzona vjerojatno također može objasniti brzu promjenu gena podložnih NMD-u. Mogu se definirati dvije vrste alternativnih događaja spajanja specifičnih za vrstu [58, 59]. Jedan tip, koji se naziva 'specifično alternativno spajanje konzerviranih egzona', predstavljen je konzerviranim egzonom koji je alternativno spojen u jednoj vrsti, ali konstitutivno spojen u drugoj vrsti. Drugi tip, koji se naziva 'genom-specifično alternativno spajanje', predstavljen je alternativnim egzonom u jednoj vrsti koji se ne može detektirati u ortologu druge vrste (vidi sliku 3 u [41] za dijagrame). Više od 41% alternativnih događaja spajanja specifičnih za vrstu konzerviranih egzona i 61% događaja alternativnog spajanja specifičnih za genom imali su potencijal da izazovu NMD, dok je stopa očuvanih događaja alternativnog spajanja između ljudi i miševa koja inducira NMD bila mnogo niža (< 31%) [41]. Bez obzira o kojem se obliku radi, oba tipa uzrokuju da se NMD češće javlja samo u jednoj od dviju vrsta nego u obje vrste, te stoga mogu objasniti u značajnoj mjeri divergenciju statusa NMD-a.

Gdje se može pronaći ortologni egzon, egzon specifičan za raspad posredovan besmislom je ili je bio pod selekcijom pročišćavanja

Oba modela (regulacija buke i ekspresije) predviđaju da eksoni NMD mogu biti pod nižim selektivnim ograničenjem od eksona koji nisu NMD. Međutim, bučni model predviđa neutralnu evoluciju za egzone specifične za NMD (zbog toga što nisu prevedeni), dok model regulacije predviđa da će selekcija pročišćavanja još uvijek djelovati. Kako bismo ispitali evoluciju egzona specifičnih za NMD, spojili smo poravnanja egzona kaseta specifičnih za NMD na temelju CDS poravnanja čovjeka-miša i psa i izračunali smo K a/K s omjeri (ω) nesinonimne stope zamjene (K a) na sinonimnu stopu zamjene (K s) za svaku lozu koristeći PAML paket [60] prema modelu grane slobodnog omjera [61], koji pretpostavlja da se svaka loza razvijala neovisno. Kao što se očekivalo (tablica 6), K a/K s omjer u egzonima kasete specifičnih za NMD veći je od onog u drugim regijama kandidata za NMD (0,3432 naspram 0,2627). To je u skladu sa slabijim negativnim selekcijskim pritiskom na eksone NMD. Također je veći od omjera za ortologni egzon u drugim lozama (0,1082 odnosno 0,0884 za miša i psa).

Usporedba alternativnih egzona kasete s drugim dijelovima istog gena može biti test sklon pogreškama jer egzoni kazete općenito mogu imati slabije evolucijske pritiske zbog svojih isključenja u nekim izoformama spajanja. Doista, promatramo više K a/K s omjer u ne-NMD-jednoj klasi egzona nego u drugim regijama (tablica 6). Kako bismo isključili učinak ovoga, usporedili smo NMD-specifične K a/K s omjer prema pojedinačnim egzonima koji nisu NMD. A viši K a/K s omjer za klasu specifičnu za NMD još uvijek je opažen (tablica 6, 0,3423 naspram 0,2554).

Iako su ovi rezultati u skladu s modelom reguliranog izražavanja, potpunija interpretacija rezultata nije trivijalna. Prvo, sposobnost detekcije ortolognih egzona predisponira pronalaženju egzona koji funkcioniraju u regulaciji. Drugo, čak i ako je lažni model prijepisa točan za lozu sa stopom, nula za K a/K s nije 1. Ključno je kada je egzon bio podvrgnut NMD-u i koji je oblik selekcije djelovao prije toga. Ako je egzon nedavno bio podvrgnut NMD-u, tada se većina evolucijske povijesti egzona niza ljudske loze nije razvijala kao odgovor na prisutnost zaustavljanja. Samo ako je egzon uvijek bio lažan, malo vjerojatno s obzirom da se taj egzon nalazi u više udaljenih svojti, K a/K s = 1 se očekuje za dotičnu lozu. Ukratko, na temelju činjenice da možemo pronaći udaljene ortologne egzone, mi gotovo sigurno pristranimo skup podataka na egzone koji su bili i vjerojatno su još uvijek funkcionalni. S obzirom na to K a/K s < 1 možemo biti sigurni da neko vrijeme egzon nije bio lažan.

Kandidati za raspad posredovani besmislicom brzo se razvijaju, ali nisu žarišta za adaptivnu evoluciju

Brža evolucija za egzone specifične za NMD i više K a/K s omjeri za NMD kandidate (čak i kada se kontrolira profil ekspresije) (Slika S1 i Tablica S6 u Dodatnoj datoteci 1) naveli su nas da se zapitamo je li evolucijski način ovih gena pročišćavajuća selekcija, neutralna evolucija ili adaptivna evolucija. Budući da je većina kandidata za NMD pokazala K a/K s < 1 (slika S2 u dodatnoj datoteci 1), ti su geni u cjelini bili pod selekcijom pročišćavanja. U skladu s tim, otkrili smo da egzoni kasete specifični za NMD odbacuju model neutralne evolucije (K a/K s = 1) pomoću testa omjera vjerojatnosti [61] (Tablica 7, P = 1,77 × 10 -8), iako su se brzo razvijale u usporedbi s drugim regijama u NMD kandidatima (Tablica 6).

S obzirom na to da se kandidati za NMD razvijaju brže u vlastitoj lozi od ortologa (test relativne brzine, tablica S7 u dodatnoj datoteci 1), vjerojatno zbog smanjenih selektivnih ograničenja, primamljivo je pretpostaviti da se genima i egzonima NMD-a potencijalno daje puno više slobode kretanja prostor sekvence od egzona, na primjer, gena za održavanje kućanstva. Može li to predisponirati NMD gene da budu žarišta za adaptivnu evoluciju?

Provjerili smo je li bilo slučajeva opuštene selekcije ili pozitivne selekcije za kandidate za NMD na temelju podataka iz prethodne studije [62], koja je koristila osjetljivu metodu (model podružnice u PAML-u [63, 64]) za otkrivanje pozitivnih selekcijskih mjesta u genima čovjeka i čimpanze. Kao što je prikazano u Tablici 8, od 8.824 gena 104 gena su smatrana pozitivnom selekcijom u ljudskoj lozi. Četiri od 254 kandidata za NMD otkrivena su kao kandidati za pozitivno odabrane. Ovaj udio (1,6%) nešto je veći od onog (1,2%) ne-NMD gena, ali nije statistički značajan (P vrijednost = 0,5453). Ne nalazimo dokaza da su kandidati za NMD pod opuštenom selekcijom (Tablica S8 u Dodatnoj datoteci 1) za 254 ispitana kandidata za NMD, što ukazuje da su, kao i većina drugih gena, pod pročišćavajućom selekcijom.

Nedovoljna zastupljenost nekih funkcionalnih klasa gena u skupu raspadanja posredovanog besmislicom u skladu je s bučnim spajanjem

Gore navedeni rezultati sugeriraju da je za moderne egzone prikladan model bučnog spajanja. Jedan rezultat u ovom kontekstu je znatiželjan. Iako je malo vjerojatno da će gen koji je kandidat za NMD biti kandidat za NMD u drugim vrstama, vidimo da su neke funkcionalne klase gena dosljedno nedovoljno zastupljene kao kandidati za NMD (Tablica 9 i Dodatna datoteka 3) i udio kandidata za NMD unutar bilo koje dane genske ontologije (GO) klasa je uglavnom nepromijenjena između miša i čovjeka (vidi Dodatnu datoteku 4). Na prvi pogled ovo očuvanje funkcije i iskrivljenost u predstavljanju izgledaju kao dokaz za regulirano spajanje koji predviđa da bi regulacija NMD-a mogla biti posebna za određene vrste gena (na primjer, geni specifični za gladovanje ili hipoksiju). Međutim, primjećujemo da je ova iskrivljenost također potencijalno u skladu s modelom bučnog spajanja, ako postoji kovarijansa između klasa gena i stopa alternativnog spajanja.

To examine the skew we employed tools of PANTHER database [65, 66]. The biological processes with Bonferroni-corrected P values < 0.1 in either species are listed in Table 9. About half of the NMD candidates were classified as Biological process unclassified. This was the only set showing over-representation with the NMD class. The only other classes showing significant deviation from expected showed under-representation, these being Developmental processes, Cell-surface receptor-mediated signal transduction, Sensory perception, Signal transduction, Chemosensory perception, i Olfaction. The functional distributions of NMD candidates in humans and mice were quite similar. Of the top six most significant GO terms from either species, five (Biological process unclassified, Developmental processes, Sensory perception, Signal transduction, Chemosensory perception) also appeared in the list of the most significant in the other species (Table 9).

To further determine whether the divergence of orthology in NMD candidates also led to functional divergence, we compared the functional distributions of human and mouse NMD candidates using the FatiGO web tool [67], which is able to detect particular GO terms for which the two lists of genes have different proportions of genes. For feasibility, the GO terms for mouse genes were deduced from the corresponding human orthologs. No significant GO terms were detected at any level (GO levels 3 to 9 see Additional file 4). To exclude the effect of orthologs that are NMD candidates in both species, we repeated the analysis after removing these orthologs from either or both species. As before there was no GO term showing a significant difference between mice and humans in the regularity of NMD (data not shown). This indicates that there is no functional class in which there are significantly more or fewer human NMD candidates compared against mouse NMD candidates.

These results suggest that NMD targets different genes in the two species, but ones largely in the same functional categories (Table 9 and Additional file 4). While superficially this looks like evidence for regulated splicing, if alternatively spliced genes are more prone to incorrect splicing, we expect, under the noisy splicing model, that the NMD-under-represented functional classes will have fewer alternatively spliced genes than other classes.

To test this, we extracted the genes associated with each functional class in Table 9 (excluding the Biological process unclassified class) for humans from the PANTHER database [65, 66]. Then, we compared the proportion of alternatively spliced genes in each class against the rest. As shown in Table 10, in total 12,466 out of 14,492 (86%) genes are alternatively spliced based on the ASD database [54, 55], while the proportions for classes Developmental processes, Cell-surface receptor-mediated signal transduction, Sensory perception, Signal transduction i Chemosensory perception are significantly smaller. Repeating the same analysis after removing all the NMD genes we find the same result (Table 10). These results suggest that covariation of functional class with NMD is consistent with the noisy splice model and different regularities of alternative splicing.


3 The Number of Human Protein-Coding Genes Went Up and Down in the Pre-Genome Era

Estimating the number of human genes dates back to the 1940s when the genetic code and even the structure of DNA were unknown. In 1948, James N. Spuhler estimated the number of genes a) to 42 000 by assuming human genes occupying the same mean chromosomal length than fruit fly genes and b) to 19 890–30 420 by extrapolating the number of loci in the nonhomologous segment of the sex chromosome derived from X-linked lethal mutations (Lik 1 and Box 2). 25 At about the same time, Hermann J. Muller estimated the frequency of mutations in humans resulting in 5000 to 20 000 human genes, 26 which is, on the upper limit, very close to the numbers discussed today. Later, Friedrich Vogel for the first time used physical entities estimating the number of genes based on the weight of genes of average length extrapolated to the weight of one human haploid chromosome set. 27 He calculated two numbers: one number he based on the length of haemoglobin genes resulting in 6.7 Mio genes, which he already dismissed as disturbingly high. Unfortunately, this number was nevertheless presented by Pertea and Salzberg as Vogel's number of genes, 28 which likely caused others to later cite this wrong number as well. 11, 29 The number Friedrich Vogel considered more reliable, 60 000 human genes, he derived by dividing the length of the human genome by the gene-length of 50 000 nucleotides inferred from the length of genes in Dipteran giant chromosomes. 27 In 1966, Muller revised his earlier estimate to “not much more than 30 000” genes. 30 These early estimates of 20 000–40 000 human genes based on genetic load arguments became the reference in textbooks and publications for the next 25 years, although the respective primary publications did not receive the citations they would have deserved.


Gene mutations

Mutations occur when the number or order of bases in a gene is disrupted. Nucleotides can be deleted, doubled, rearranged, or replaced, each alteration having a particular effect. Mutation generally has little or no effect, but, when it does alter an organism, the change may be lethal or cause disease. A beneficial mutation will rise in frequency within a population until it becomes the norm.

For more information on the influence of genetic mutations in humans and other organisms, vidjeti human genetic disease and evolution.

The Editors of Encyclopaedia Britannica This article was most recently revised and updated by Adam Augustyn, Managing Editor, Reference Content.


Gene structure, introns and exons, splice sites

Predict genes by comparing genomic sequences from evolutionary related organisms to each other.

Find information about the roles that alternative splicing variants play in protein structure and function.

Access and mine enormous alternative splicing information.

Search for alternative splice events and the resultant isoform splice patterns of genes from human, and other model species.

Search for alternatively spliced genes.

Generate graphs for gene alternative slicing.

Search for comprehensive information on splicing by exon skipping in human genome.

Detect exon-intron structure of a gene by comparing the genomic sequence to the related ESTs.

Find information about alternative splicing gene variants.

Carry out simulated RT-PCR to detect transcript variants.

Find gene models including alternative splicing events from genomic alignment of mRNA, EST and protein sequences.

Analyze alternative splicing events in custom gene datasets.

Predict gene in eukaryotic genomic sequences based on a generalized hidden Markov model.

Derive Transcript Patterns from AltSplice Splice Patterns and search for information on polyA sites.

Search for information about the spliceosomal introns of the yeast Saccharomyces cerevisiae.

Search for comprehensive information about alternatively spliced genes of mammals.

Find information related to alternative splicing (AS) events.

Find information about aberrant splice sites.

Use a collection of methods to analyze and graphically represent various DNA parameters.

Search for alternative splice forms (ASforms) from nine eukaryotic organisms calculate of the tissue-NAEs, tissue-NCEs and tissue-NSS in human genome.

Search for annotated information about gene structure, function and expression, and alternative splicing events.

Search for EST-derived alternative splicing in human genome.

Rapidly analyze exon sequences to identify putative human exonic splicing enhancers (ESEs).

Search for information on the exon/intron structure of eukaryotic genes.

An algorithm designed to retrieve, compare and search for the exon-intron structure of existing gene annotations.

Identify exonic splicing silencers and predict if a coding SNP abolishes exonic splicing silencer motifs.

Asoftware tool for identifying and removing the vector from raw DNA sequence data without prior knowledge of the vector sequence.

Predict gene structures of plant genomes.

Find genes whose promoter regions have G-quadruplex motifs.

Search for annotated information on alternatively spliced human transcripts.

Search for annotated information on alternative gene splicing.

Search for Homo Sapiens Exon, Intron and Splice regions.

Search for putative alternative splicing information from human and mouse UniGene clusters.

A unified resource for analyzing effects of alternative splicing events in the context of protein structures.

Predict splicing phenotypes by identifying sequence changes that disrupt or alter predicted ESEs.

Search for known mammalian splice site sequences and other related information.

Search for occurrences of the four major alternative-splicing modes in human genome.

A web-based tool for splice-site analysis.

Search for information on alternative splice events at GYNGYN donors and NAGNAG acceptors.

Search and compare alternative splicing events in 15 animal species.

Explore the molecular biology and genomics of C. elegans with a special emphasis on alternative splicing.

Search for information on genome architecture and design in unicellular genomes.

Search for information on orthologous U12-introns from completely sequenced eukaryotic genomes.

Search for information on experimentally validated human noncoding fragments with gene enhancer activity as assessed in transgenic mice.

Search for information about all introns encoded in the nuclear and mitochondrial genomes of the yeast Saccharomyces cerevisiae.

Search for data from the Yeast Deletion, Mitochondrial Proteomics, and Yeast Expression Projects.

Deformation energy and nucleosome-positioning score calculator.

Search for computationally predicted human gene structure and splice variants derived from human mRNAs and ETS.

The Health Sciences Library System supports the Health Sciences at the University of Pittsburgh.

© 1996 - 2014 Health Sciences Library System, University of Pittsburgh. Sva prava pridržana.
Contact the Webmaster


Findings

ljudski Papillomavirus (HPV) infection is a particularly difficult problem for human immunodeficiency virus (HIV)-infected women because they are more vulnerable to infection and less likely to clear the virus, which increases their risk of developing cervical lesions and cancer[1]. Specifically, there are differences in the prevalence, incidence, progression and regression of HPV-related cervical diseases in HIV-infected women compared to HIV-uninfected women. Moreover, in HIV-infected women, cervical cancer (CC) responds poorly to recommended therapies, behaves more aggressively, and in cases of recurrence, has a poorer prognosis[1, 2]. The severe impact of HIV in relation to CC was demonstrated in a study that showed that HIV-positive women had an almost five fold greater chance of developing precancerous lesions than did HIV-uninfected women[3].

In cervical carcinogenesis, the integration of high-risk HPV (HR-HPV) into host-cell chromosomes is followed by the binding of HPV E6 and E7 oncoproteins with tumor suppressor proteins p53 i pRb, respectively. This process results in impaired tumor suppressor gene function, involving DNA repair, decreased apoptosis, deregulation of key controls in cell proliferation, and eventual cell immortalization[4].

The p53 tumor suppressor gene specifically inhibits cell cycle progression and promotes DNA repair and/or apoptosis its inactivation is correlated with a critical step in the development of many human cancers. Inactivation may result from a number of events, including mutation of the p53 gene (with or without associated allelic deletions) and binding of the p53 gene to cellular or viral proteins, such as the HPV E6 oncoprotein[5]. p53 mutations are mostly missense in nature and are located predominantly within the DNA-binding domain, where a single mutation is sufficient to cause loss of normal p53 function[6]. Studies on the association between CC and the loss of p53 function have yielded conflicting results[5, 7, 8].

Mutations in the p53 gene occur most frequently within exons 5–8, which is the highly conserved DNA binding domain region[9]. Studies on p53 that included all exons have suggested that mutations outside exons 5–8 are rare in tumors[10]. However, most studies on the involvement of the p53 gene in cervical carcinogenesis are related to its protein expression by immunohisto/cytochemical or polymorphism in condon-72[5, 7]. To our knowledge, no previous studies have analyzed the mutations in exons 5–8 of the p53 gene in HIV- and HPV-infected women. In our study, we verified these mutations in women with and without cervical abnormalities.

The study included cervical samples of 160 women who were divided into three groups: (1) 83 HPV- and HIV-infected (HIV group) (2) 37 HPV-infected/HIV-uninfected (control group) and (3) 40 cervical samples from women with normal cytology/DNA-HPV negative/HIV-uninfected that were only used as a negative control for the mutation of the p53 gene exons (negative control str 53 reactions). The women included in the study were enrolled in the Specialized Assistance Service (SAE) for sexually transmitted diseases (STD)/AIDS in Maringá, Brazil, between April 1, 2011, and October 30, 2011. In these samples, HPV-DNA was previously detected (data not shown) in the Clinical Cytology Laboratory at the State University of Maringá (UEM), Brazil, and stored at -80°C. Stored samples from HIV-infected and HIV-uninfected women, both with and without cervical lesions, were included in the study. The samples for 1 and 2 groups were also HPV-DNA positive.

Cervical and endocervical samples were collected using a cytobrush and an Ayre’s spatula, transferred to 1.5 ml tubes with 1.0 ml of sterile 0.9% NaCl solution, and stored at -80°C. Genomic DNA was extracted using the AxyPrep™ Body Fluid Viral DNA/RNA Miniprep Kit (AP-MN-Bf-VNA-50, Axygen, CA, USA) according to the manufacturer’s instructions. The quality and quantity of purified DNA were measured by spectrophotometry. HPV polymerase chain reaction (PCR) amplification for HPV was conducted using primers MY09 (5′CGTCCMAARGGAWACTGATC-3′) and MY11 (5′-GCMCAGGGWCATAAYAATGG-3′) co-amplification of the human β-globin gene was performed as an internal control using primers GH20 (5′-GAAGAGCCAAGGACAGGTAC-3′) and PC04 (5′-CAACTTCATCCACGTTCACC-3′) under the same conditions as for the HPV-PCR[11]. The cytological smears were prepared with a portion of the collected material and were reported according to the Bethesda System[12]: normal, without altered cells atypical squamous cells of undetermined significance, cannot exclude high-grade squamous intraepithelial lesion (ASC-H) low-grade squamous intraepithelial lesion (LSIL) or high-grade squamous intraepithelial lesion (HSIL). Cases with a cytological diagnosis of HSIL were confirmed by histopathology.

For HPV genotyping of selected samples, a new HPV-PCR amplification was performed, which was followed by PCR-Restriction Fragment Length Polymorphism (PCR-RFLP) analysis using Hpy CH4V[13]. The mutations of the p53 g ene was verified by PCR-Single Strand Conformational Polymorphism (PCR-SSCP), which detects molecular changes in single-stranded DNA that cause changes in electrophoretic mobility[8]. The following primers were used: exon 5 (5′-TGTTCACTTGTGCCCTGACT-3′) / (5′-AGC AAT CAG TGA GGA ATC AG-3′), 310 bp exon 6 (5′-TGGTTGCCCAGGGTCCCCAG-3′) / (5′-TGGAGGGCCACTGACAACCA--3′), 223 bp exon 7 (5′-CTTGCCACAGGTCTCCCCAA-3′) / (5′-AGGGGTCAGCGGCAAGCAGA-3′), 248 bp and exon 8 (5′-TTGGGAGTAGATGGAGCCT-3′) / (5′-AGAGGCAAGGAAAGGTGATA-3′), 213 bp. This is a simple technique which allows the identification of samples with type missense mutation, as well as correlation with the expression of mutated p53[14]. The women signed a consent form, and this study was approved by the Committee for Ethics in Research Involving Humans at the State University of Maringá (UEM)/Paraná, Brazil (No. 085/2011).

The statistical analysis was performed using STATISTICA 8.0 software, and all of the variables were expressed as absolute and relative frequencies. The rates of str 53 exon mutations in the groups of women were compared using a non-parametric Z test. A p value < 0.05 was considered statistically significant.

On average, the HIV group was older than the control group (40.9 ± 11.23 vs 35.7 ± 10.57 years old p = 0.0254). The majority of the HIV group showed excellent control of the HIV infection, as determined by the correct use of highly active antiretroviral therapy (HAART) (79.2%), current CD4+ T lymphocyte count > 350 cells/mm 3 (73.6%) and current viral load < minimum limit (58.4%) or between the minimum limit and 100 copies/mL (38.8%).

The most common HR-HPV in the HIV group were HPV-51 and HPV-16 (n = 11/83, 13.5% each). Of these samples, a p53 mutation occurred in only 1 sample of HPV-16 (9.1%) and in 6 samples of HPV-51 (54.5%). For the control group, HPV-16 (n = 6/37, 16.2%) and HPV-66 (n = 5/37, 13.5%) were the most common, but the p53 mutation was observed in only 1 sample each (16.7% and 20.0%, respectively). HPV-58 was detected in 2 samples, and the mutation occurred in these 2 samples (100%). In regards to the cytological findings, the HIV group showed the following: 70 normal, 2 ASC-H, 10 LSIL and 1 HSIL. The findings in the control group were as follows: 21 normal, 6 ASC-H, 9 LSIL and 1 HSIL (Table 1).

Figure 1(a) shows a mutation in exon 6 as an example of abnormal bands of the p53 gen. In total, 19.3% of the HIV group and 18.9% of the control group (p = 0.4896) showed mutations in the p53 gene and all had HR-HPV. As previously described, no mutations occurred in any of the negative control str 53 reactions[15] which is baseline condition this population. A mutation in exon 7 alone or together with a mutation in exon 6 was the highest in the HIV group (43.8%), and a mutation in exon 6 was highest in the control group (57.2%) (p = 0.0793) (Figure 1b). However, because the p value was close to being statistically significant, these data may suggest a tendency toward mutations in exon 7 in the HIV group.

Mutation in exon 6 of the p53 gene in the HIV group compared with the control group. Panel a: Electrophoretic analysis of cervical p53 gene mutations using PCR-Single Strand Conformational Polymorphism (PCR-SSCP) in an 8% polyacrylamide gel stained with ethidium bromide. Samples A1-A3, negative for p53 gene mutations A4, positive for p53 gene mutation (arrow) C, negative control str 53 reactions M, 25 bp molecular weight marker. Panel b: The frequency of mutations in p53 exons 5 to 8 in both groups. Exon 7 and exon 6 were the most mutated exons examined in the HIV group and in the control group, respectively.

In the HIV group, a mutation in exon 7 occurred at the highest frequency in normal cytology (31.3%) followed by LSIL and HSIL (6.3% for both). For the control group, a mutation in exon 6 was most common in both normal cytology and LSIL (28.6% each) (Table 1). There was no difference in mutation rates in normal cytology or lesions in both groups (p = 0.4956 and 0.3303, respectively Table 1).

These findings suggested that the HPV infection appears to lead to a mutation in the p53 gene in different exons in HIV-infected and HIV-uninfected women, i.e., mainly in exons 7 and 6, respectively. A point mutation at the splice donor site at the 3′ end of exon 7 of the human p53 gene results in the retention of the intron 7 sequence in the mRNA, thereby inactivating the p53 protein[16].

We also showed that the total mutation in p53 gene exons 5–8 was not significantly associated with the HIV and control groups, and in women of both groups with normal cytology or different grades of cervical abnormalities, similar to those described for p53 gene condon 72 polymorphism[7] and p53 gene immunoexpression[5] in HIV-uninfected women. Interestingly, the samples from the HIV group with HPV-51 showed the highest rates of mutations in the p53 gene which deserves further studies. Overall, higher rates of cervical HPV infection and CC can be partly related to a more specific mutated exon in HIV-infected patients.

Through its effect on CD4 cells and regulation of immune responses to a variety of antigens, HIV infection may attenuate the systemic immune response to HPV. It is speculated that if there is a low number of circulating HPV-specific memory cells, then HPV-specific immunity may be particularly vulnerable to the effects of HIV. Possible due to this HIV-infected women are more vulnerable to infection and less likely to clear the virus, which increases their risk of developing cervical lesions and cancer[1]. According to this hypothesis, HPV-specific immunity may not recover fully after immune response is restored, which may explain the relatively limited beneficial effect of HAART on HPV cervical infection and CC[17].


2. Gene expression

Prokaryotic cells and eukaryotic cells also differ in the way genes are expressed. Prokaryotic cells have compact genomes that lack introns or large non-coding regions. The genes of these organisms are expressed in groups, called operons, that are transcribed on the same piece of RNA and then made into separate proteins. Since prokaryotes lack a nucleus, DNA transcription into RNA and RNA translation into proteins can occur simultaneously. The DNA of eukaryotic cells however, is enclosed in the nucleus so transcription must be completed and the mRNA sent out of the nucleus before translation can occur. In eukaryotic cells, mRNA transcripts are modified before they are translated because they contain introns that need to be removed. Thus the mature mRNA that leaves the nucleus will only contain exon sequences that will be translated to protein by ribosomes in the cytoplasm.


SINEs (Short interspersed elements)

There are over one million copies in the human genome (representing some 10% of our total DNA).

The most abundant SINEs are the Alu elements. Alu elements consist of a sequence averaging 260 base pairs that contains a site that is recognized by the restriction enzyme AluI. They appear to be reverse transcripts of 7S RNA, part of the signal recognition particle.

Most SINEs do not encode any functional molecules and depend on the machinery of active L1 elements to be transposed that is, copied and pasted in new locations.

The RNA genome of HIV-1 contains a gene for

  • reverse transcriptase and one for
  • integrase. The integrase serves the same function as the transposases of DNA transposons. The DNA copies can be inserted anywhere in the genome.

Gene regulation

Gene regulation is a label for the cellular processes that control the rate and manner of gene expression. A complex set of interactions between genes, RNA molecules, proteins (including transcription factors) and other components of the expression system determine when and where specific genes are activated and the amount of protein or RNA product produced.

Some genes are expressed continuously, as they produce proteins involved in basic metabolic functions some genes are expressed as part of the process of cell differentiation and some genes are expressed as a result of cell differentiation.

Mechanisms of gene regulation include:

  • Regulating the rate of transcription. This is the most economical method of regulation.
  • Regulating the processing of RNA molecules, including alternative splicing to produce more than one protein product from a single gene.
  • Regulating the stability of mRNA molecules.
  • Regulating the rate of translation.

Transcription factors are proteins that play a role in regulating the transcription of genes by binding to specific regulatory nucleotide sequences.


Gledaj video: Komplementaarinen DNA cDNA (Kolovoz 2022).