Informace

Jsou geny rovnoměrně rozptýleny v celém genomu?


Myslím, že telomery a centromery jsou oblasti s velmi nízkým obsahem genů (= oblasti, které obsahují málo genů). Jsou geny, s výjimkou telomer a centromerů, rovnoměrně rozloženy v celém genomu, nebo mají tendenci se shlukovat nebo se rozptylovat, jak jen mohou? Mají geny tendenci se shlukovat nebo se vyhýbat specifickým oblastem, jako jsou oblasti s nízkou mírou mutací nebo nízkou rychlostí rekombinace?


Ne nejsou. Vysoká hustota genů koreluje s obsahem GC. Většina genů se nachází v izochorách bohatých na GC, které nejsou distribuovány rovnoměrně (jak je vidět na každém karyotypu). Je také ukázán prostřednictvím přímé sekvenční analýzy (hustota genů je zobrazena červeně, obsah GC zeleně):

Venter a kol. pokračuj a řekni:

Tato nehomogenita, čistý výsledek miliónů let duplikace savčích genů, byla popsána jako „desertifikace“ genomu obratlovců. Proč existují seskupené oblasti s vysokou a nízkou hustotou genů a jsou to historické nehody nebo jsou hnány selekcí a evolucí?

Desertifikace odkazuje na tento článek Ohna z roku 1985:

Čistým důsledkem stovek milionů let nepřetržité duplikace genů je dezertifikace euchromatické oblasti moderních obratlovců; průměrná vzdálenost mezi stále fungujícími genovými lokusy se postupně prodlužuje.

Zdá se, že to naznačuje, že tyto pouště jsou výsledkem duplikace genů a následné degenerace do pseudogenů, i když to rozhodně není jediná příčina. Nejsem si jistý, zda vaše poslední otázka nebo otázky, které položili Venter a spol. zatím máte odpověď. Tento novější článek nabízí několik zajímavých nápadů (odkazy pro stručnost odstraněny):

Ohno (1985) před více než 20 lety postuloval dezertifikaci euchromatické oblasti genomů vyšších obratlovců v důsledku kontinuálních událostí duplikace genů následovaných degenerací nově vzniklých kopií genů v jejich evoluční historii. Teprve s prvním vydáním úplné sekvence lidského genomu v roce 2001 se potvrdila Ohnova předpověď existence takových pouští. Dalším mechanismem generování nerovnováhy genových pouští mezi chromozomy mohou být velké intrachromozomální duplikace, ze kterých se zdá, že se vyvinuly některé savčí specifické genové pouště. Funkční nebo evoluční význam genových pouští však ještě není zcela objasněn. Na první pohled se zdá, že genové pouště postrádají biologické funkce kvůli nedostatku DNA kódující protein. Navzdory tomu bylo ukázáno, že některé genové pouště obsahují důležité regulační a někdy ultra konzervované oblasti pro sousední geny, které fungují na velké vzdálenosti. Kromě toho pozorování stabilních genových pouští s homologními lemujícími geny (často transkripčními faktory), které jsou udržovány po dlouhou dobu evoluce, a také existence mnoha konzervovaných negenických sekvencí v genomu savců naznačují, že genové pouště nejsou jen genomické vrakoviště místo toho může mít funkční význam. Některé genové pouště lze však vymazat bez znatelných fenotypových účinků. Zůstává tedy nejasné, zda nerovnoměrná akumulace genových pouští v eutherianských chromozomech, která se jeví jako nejsilnější původce pozorovaného relativního nedostatku vztahu NG/LC v genomech placentárních savců, je pouze vedlejším produktem jejich vývoje genomu a možná i dlouhodobý pokles velikosti populace, jak by naznačovalo obohacení genových pouští podél evoluční linie vedoucí k savcům. Připravované podrobné rekonstrukce genomů obratlovců předků pomohou tyto body objasnit.

Alternativně by tento konkrétní architektonický rys eutherianských genomů mohl být spojen s některými jejich morfologickými, fyziologickými, neurologickými a kognitivními evolučními inovacemi, případně regulací genů s nezbytnými vývojovými funkcemi. Nedávno se předpokládalo, že regulační prvky v genových pouštích fungují při regulaci základních genů obratlovců. Kromě toho přibližně 20% konzervovaných nekódujících prvků je specifických pro eutherian. Nerovnoměrná distribuce genových pouští by tedy mohla být způsobena základním vzorem nerovnoměrné distribuce některých základních genů v placentárních genomech. Tato hypotéza by měla být testována v budoucnosti.


Housekeeping gen

V molekulární biologii úklidové geny jsou typicky konstitutivní geny, které jsou nutné pro udržení základní buněčné funkce, a jsou exprimovány ve všech buňkách organismu za normálních a patofyziologických podmínek. [1] [2] [3] [4] Ačkoli některé geny pro domácnost jsou ve většině nepatologických situací exprimovány relativně konstantními rychlostmi, exprese jiných genů pro domácnost se může lišit v závislosti na experimentálních podmínkách. [1] [5]

Původ termínu „housekeeping gen“ zůstává nejasný. Literatura z roku 1976 používala tento termín k popisu konkrétně tRNA a rRNA. [6] Pro experimentální účely je jako referenční bod pro analýzu úrovní exprese jiných genů použita exprese jednoho nebo více housekeeping genů. Klíčovým kritériem pro použití úklidového genu tímto způsobem je, že zvolený úklidový gen je rovnoměrně exprimován s nízkou odchylkou za kontrolních i experimentálních podmínek. Před jejich použitím v experimentech s genovou expresí, jako je RT-PCR, by měla být provedena validace úklidových genů. Nedávno byla vyvinuta webová databáze lidských a myších housekeeping genů a referenčních genů/transkriptů s názvem Housekeeping and Reference Transcript Atlas (HRT Atlas), která nabízí aktualizovaný seznam úklidových genů a spolehlivých kandidátních referenčních genů/transkriptů pro data RT-qPCR normalizace. [1] K této databázi lze přistupovat na adrese http://www.housekeeping.unicamp.br.


1. Co je to gen?

Sidney Brenner, zakladatel moderní biologie červů, kdysi řekl, “ Starí genetici věděli, o čem mluví, když používali termín ‘gen ’, ale zdá se, že se poškodili moderní genomikou, což znamená jakýkoli kus vyjádřené sekvence … ” (Brenner, 2000). Sidneyův nářek slouží k ilustraci dvou bodů. První je, že koncept genu může znamenat různé věci pro různé lidi v různých kontextech. Druhým je, že koncept genu se vyvíjel nejen v moderní genomické éře, ale od té doby, co se poprvé objevil na počátku 20. století jako termín pro konceptualizaci částicového základu dědičných fyzických vlastností (Snyder a Gerstein, 2003) . Proto v přehledu genové struktury v C. elegans zdá se rozumné definovat, co rozumíme pod genem.

Naše definice genu je nutně silně ovlivněna moderní genomikou, ale raději si myslíme, že nebyla poškozena. Definujeme gen jako “ kompletní sekvenční oblast nezbytnou pro generování funkčního produktu ”. To zahrnuje promotory a kontrolní oblasti nezbytné pro transkripci, zpracování a případně translaci genu. Zahrnujeme tedy nejen geny kódující proteiny (geny kódující polypeptidy), ale také nekódující geny RNA (ribozomální RNA, přenosová RNA, mikro RNA a malé nukleární RNA geny). Jeden další typ genu, o kterém se krátce zmíníme, je pseudogen, i když obvykle nejsou považovány za funkční.

Plný rozsah genu nebo “kompletní sekvenční oblast ” není pro většinu znám C. elegans geny, protože promotory zůstávají z větší části neúplně definovány. Dokonce ani plný rozsah primárního transkriptu není často znám, protože většina (70%) genů kódujících proteiny je rychle modifikována trans-sestřihem, který zahrnuje přidání krátkých 22 ex exogenních druhů RNA na konec 5 ’ transkriptu (Zorio et al., 1994). Nedávno bylo ukázáno, že některé nekódující geny RNA jsou také trans-sestřiženy jako prekurzor mikroRNA let-7 byl identifikován s vedoucí sekvencí trans-sestřihu (Bracht et al., 2004).


Ori sekvence

J.W. Zyskind, D.W. Smith, v Encyclopedia of Genetics, 2001

Společné funkce původu

Počátky replikace DNA jsou charakterizovány především třemi typy struktur: (1) místa pro vazbu proteinů, hlavně iniciačních a pomocných proteinů, (2) charakteristicky rozvinutá oblast bohatá na AT a (3) místa a strukturní vlastnosti zahrnuté v regulace iniciačních událostí. Zdá se, že tyto tři typy struktur propůjčují sekvenci DNA nezbytné rysy k tomu, aby byla nebo se stala funkčním původem replikace DNA pro celý život. Specifičnost zahájení pro daný organismus nebo třídu organismů nebo pro daný čas nebo typ buňky během životního cyklu daného organismu je poskytována podrobnostmi o těchto třech typech struktur. Příklady iniciačních proteinů zahrnují RepA pro plazmid R100, DnaA pro eubakterie, T antigen pro virus SV40 a ORC proteiny pro kvasinky a vyšší eukaryoty, zatímco příklady odvíjející se oblasti bohaté na AT zahrnují 13merové přímé oblasti v eubakteriálním původu (Obrázek 1), oblast DUE původu SV40, prvek B2 v kvasinkovém původu a oblasti DUE v původu z vyšších eukaryot (Obrázek 3). Regulační místa a vlastnosti zahrnují vazbu RNA inhibitoru RNA na RNA II iniciace plazmidu ColE1, místa GATC v počátcích replikace enterických bakterií, vazebné místo Sp-1 v počátku SV40 a podobná vazebná místa transkripčního faktoru v jiných eukaryotických počátky (viz obrázek 3), znaky a místa struktury chromatinu pro interakci jaderné matrice v eukaryotickém původu a stav methylace CpG v eukaryotickém původu.

Během iniciace dochází ke třem hlavním událostem: odvíjení původní DNA, aktivace vedoucího řetězce DNA a sestavení replisomu. Pouze první je určeno sekvencí DNA. Umístění odvíjení (sekvence bohaté na AT) a zavedení helikázy je pevné a sekvence DNA v tomto místě je považována za původ. Požadavky na velikost a sekvenci minimálního původu lze definovat mutační a deleční analýzou. Protože k působení primázy dochází po odvíjení helikázy při jejím pohybu přes DNA, umístění iniciačních míst nebo spojení RNA: DNA lze nalézt na heterogenních místech uvnitř i vně minimálního původu. Také odvíjení helikázy je s největší pravděpodobností vyžadováno pro doplňující sestavu, ke které může také dojít mimo minimální původ. Je nepravděpodobné, že umístění primingu a sestavy replisomu je určeno konkrétní sekvencí DNA, ale je určeno spíše událostmi vyskytujícími se na počátku.


Ten Vignettes: Stories of Genomic Discovery

Stejně jako raní průzkumníci, kteří poprvé zahlédli novou a neprobádanou zemi, se vědci poprvé podívají na nezmapovaná území lidského genomu. Ale na rozdíl od svých předchůdců mají tito průzkumníci 21. století výraznou výhodu - pohled na celou krajinu z ptačí perspektivy. Pohled podle těchto genomických průzkumníků není o nic menší než vzbuzuje úctu!

„Distribuce genů na chromozomech savců je nerovnoměrná, což vytváří pozoruhodný vzhled,“ řekl Bob Waterston, ředitel Centra genomu na Washingtonské univerzitě v St. Louis. "V některých regionech jsou geny stísněné podobně jako budovy v městských centrech. V jiných oblastech se geny šíří po rozlehlých plochách, jako jsou zemědělské usedlosti na prérii. A pak jsou tu velké plochy pouště, kde je pouze nekódující 'nevyžádaná DNA." "lze nalézt. Každý region vypráví jedinečný příběh o historii našeho druhu a o tom, co nás nutí zaškrtnout."

Tato krajina je v ostrém kontrastu s genomy mnoha dalších organismů, jako je hořčičný plevel, červ a moucha. Jejich genomy se více podobají uniformním rozlehlým předměstím s geny relativně rovnoměrně rozmístěnými podél chromozomů.

Geneticky hustá městská centra lidského genomu jsou převážně složena ze stavebních bloků DNA G a C a nazývají se „oblasti bohaté na GC“. Naproti tomu pouště nevyžádané DNA jsou bohaté na AT. Oblasti bohaté na GC a AT lze ve skutečnosti vidět mikroskopem jako světlé a tmavé pásy na chromozomech.

Na každém lidském chromozomu existují velké a znatelné výkyvy v obsahu GC, jeden úsek může mít 60 procent, zatímco sousední úsek může mít pouze 30 procent. Tyto výkyvy nemohly nikdy nastat náhodně a představovaly jednoznačnou organizaci „čtvrtí“ s místními akcenty.

Městská centra obsahují desetkrát vyšší hustotu genů než pouště. „Je to, jako by mezi geny a dlouhými, opakujícími se segmenty nevyžádané DNA bylo vytvořeno datum - smlouva, podle níž se určité opakující se prvky dohodly na obsazení pouští a opuštění měst pro geny,“ říká Eric Lander, ředitel Centrum institutu Whitehead pro výzkum genomu.

Další zajímavou vlastností je, že takzvané „klastry genů HOX“, které hrají důležitou roli ve vývoji, nejsou nikdy napadeny nevyžádanou DNA. To naznačuje, že evoluce má důvod pro zachování celistvosti těchto genových klastrů.

Blízko genových měst jsou sousední oblasti dinukleotidového CpG - úseky až 30 000 písmen pouze se dvěma bázemi, C a G, opakující se stále znovu. Obvykle je v celém genomu nedostatečně zastoupeno, mnoho oblastí CpG pomáhá regulovat funkci genu.

2. Miliardová otázka: Kolik genů existuje?

Předpovědi týkající se počtu genů v lidském genomu byly stejně variabilní jako biotechnologický index v NASDAQ, přičemž odhady se pohybovaly od 20 000 do 120 000 genů.

Po ukončení tohoto desetiletí trvajícího období divokých spekulací nyní mezinárodní konsorcium uvádí, že dospělo k přesnějšímu a stabilnějšímu odhadu. Došli k závěru, že genom obsahuje 30 000 až 35 000 genů. Ačkoliv malé mezery v sekvenci lidského genomu musí být vyplněny, než mohou vědci dosáhnout přesného počtu, nyní mají téměř všechna data, která potřebují k přesné projekci.

Tato zpráva představuje pokornou realistickou kontrolu pro ty, kteří dlouhodobě arogantně nesouhlasí s počtem genů u lidí. Nový odhad naznačuje, že lidé mají jen dvakrát tolik genů než červ nebo moucha! Jak lze lidskou složitost vysvětlit genomem s tak malým počtem genů? Ukázalo se, že lidé jsou svými geny velmi šetrní a dokážou s tím, co mají, udělat více než jiné druhy. Místo produkce pouze jednoho proteinu na gen mohou lidské geny produkovat několik různých proteinů.

Lidé používají proces nazývaný „alternativní sestřih“, ve kterém lze různé části bílkovin podle potřeby přeskupovat-podobně jako části drátenkových hraček-a ze stejných základních složek vyrábět různé bílkoviny. Alternativní sestřih je možný, protože lidské geny jsou rozloženy ve velkých oblastech genomové DNA a oblasti, které kódují proteiny, nejsou nutně spojité, což umožňuje jednomu genu kódovat různé části proteinu. V průměru každý lidský gen pravděpodobně vytvoří tři proteiny, více než červi a mouchy.

Protože geny obsahují malou část lidského genomu, je jejich identifikace v sekvenci genomu nejnáročnější. Předpovídané geny a sady proteinů popsané vědci tedy nejsou konečné, budou se i nadále dolaďovat s vývojem lepších nástrojů pro hledání genů.

Nízký počet genů je dobrou zprávou pro vědce z akademické sféry a farmaceutické společnosti. Lovcům genů, kteří chtějí sestavit kompendium všech genů, a farmaceutickým společnostem, které hledají konečný počet drogových cílů, právě výrazně ubyla práce, čas i náklady.

3. Znovuobjevení kola

Proč znovu objevovat kolo, když máte strategii, která funguje? Zdá se, že evoluce tímto způsobem funguje, zvláště pokud jde o lidské proteiny.

Celá sada proteinů (proteomů) kódovaných lidským genomem je složitější než u bezobratlých, protože obratlovci přeuspořádali staré proteinové domény do bohatší sbírky nových architektur. Jinými slovy, lidé dosáhli inovací přeskupením a rozšířením osvědčených strategií z jiných druhů-nikoli vývojem nových vlastních strategií. „Nejlevnější způsob, jak vymyslet něco nového, je vzít dobrý vynález a upravit jej tak, aby vyhovoval novému účelu,“ říká Sir John Sulston, bývalý ředitel Sanger Center.

Další způsob, jakým my lidé inovujeme, je rozšiřování proteinových rodin. Vědci uvádějí, že asi 60 procent proteinových rodin u lidí jsou superrodiny s více členy rodiny než v kterémkoli ze čtyř dalších sekvenovaných organismů. To naznačuje, že duplikace genů byla hlavní evoluční silou během evoluce obratlovců.

Mnoho rodin, které prošly expanzí u lidí, se podílejí na charakteristických aspektech fyziologie obratlovců. Jedním příkladem je rodina imunoglobulinových (Ig) domén, poprvé identifikovaná v protilátkách před třiceti lety. U kvasinek a hořčičného plevele chybí klasické Ig domény. U obratlovců zahrnuje repertoár Ig širokou škálu imunitních funkcí a je důkazem myšlenky, že jedna rodina proteinů může být extrémně všestranná a vyvolává mnohostrannou a organizovanou reakci na infekci.

Dalším příkladem rodiny, která proliferovala u lidí, jsou epiteliální proteiny, jako je keratin. Tato rodina proteinů se pravděpodobně rozrostla, aby podporovala a lemovala různé orgány u lidí, včetně výstelky tenkého střeva a řasinek ve vnitřním uchu.

Nakonec se alespoň některé rodiny genů v lidském genomu zmenšují. Zdá se, že více než polovina našich pachových receptorů je rozbitá. To je zvláštní, vzhledem k tomu, že pachové receptory patří do jedné z největších genových rodin (s více než 1 000 členy). Zdá se, že navzdory vysoké prioritě, kterou pachatelé našich obratlovců přikládali čichu, se zdá, že lidé na něm ztratili závislost. Vůně byla u našich předků obratlovců klíčem k přežití, ale pro nás je pro přežití pravděpodobně důležitější zrak.

4. Ano, je to Junk, ale není to Garbage

Pouze malá část, asi 1,5 procenta lidského genomu, se skládá z oblastí genomu kódujících protein. Drtivá většina genomu-více než 50 procent-se skládá z opakujících se sekvencí neboli „nevyžádané DNA“, které poskakují kolem genomu po 3 miliardy let.

Nevyžádaná DNA pomohla vědcům vyrovnat se s jedním z nejnápadnějších paradoxů lidského genomu-že náš genom je 200krát větší než pekařských kvasnic, ale 200krát menší než améby! Vědci tento rozpor ve velikostech genomu připisovali existenci shromažďování nevyžádané DNA v organismech a nedostatku rutinního úklidu. I přesto vědci plně ocenili hodnotu nevyžádané DNA-až dosud.

Nevyžádaná DNA představuje bohatý fosilní záznam klíčů k naší evoluční minulosti.Je možné datovat skupiny opakování, kdy se v evolučním procesu „narodily“, a sledovat jejich osudy v různých oblastech genomu nebo u různých druhů. Vědci HGP použili 3 miliony takových prvků jako datovací nástroje.

Na základě takového „DNA datování“ mohou vědci sestavit rodokmeny opakování a přesně ukázat, odkud a kdy přišli. Tato opakování přetvořila genom jeho přeskupením, vytvořením zcela nových genů a úpravou a přeskupením stávajících genů.

Výpočet evolučního věku opakujících se prvků v lidském genomu přinesl spoustu zajímavých, šokujících a kuriózních faktů o věcech, ze kterých jsme stvořeni (podrobnosti viz další dvě viněty).

5. Obviňujte to z naší mentality Packrat

Jedním z nejzajímavějších aspektů opakujících se prvků je to, že jako druh se zdá, že my lidé máme tendenci být ve srovnání s jinými organismy smečkovými krysami. Množství haraburdí, které jsme nashromáždili v našem genomu, výrazně převyšuje množství shromážděné našimi ranými evolučními bratranci (přičemž améba je výraznou výjimkou).

V našich genomech máme větší procento opakování-50 procent-než hořčičný plevel (11 procent), červ (7 procent) nebo moucha (3 procenta). Také naše opakující se prvky jsou mnohem starší-ve skutečnosti opravdu starodávné-ve srovnání s těmi, které se nacházejí v jiných organismech.

"To naznačuje, že jsme nebyli nároční na úklid domácnosti. Pomalu jsme uklidili naše zásuvky, skříně nebo podkroví," říká Arian Smit, vědec z oblasti bioinformatiky z Ústavu pro systémovou biologii. Když vypočítáme poločas rozpadu některých z těchto prvků, zjistíme, že zatímco moucha provedla poslední úklid domu před 12 miliony let, savci naposledy uklízeli dům před 800 miliony let. Tyto rysy lidského genomu pravděpodobně platí pro všechny savce.

6. Shocker: Dramatický pokles opakování

Ale jedna funkce-šokující-ne. Zdá se, že za posledních 50 milionů let došlo k dramatickému poklesu opakování v lidském genomu. Je to, jako bychom se před 50 miliony let rozhodli přestat sbírat harampádí. Naproti tomu se zdá, že u hlodavců takový pokles opakování neexistuje.

Ba co víc, zdá se, jako by některé z našich opravdu starodávných harampádí vyhynuly a některé další harampádí balancují na pokraji vyhynutí. Ale tato vyhynulá nebo téměř vyhynulá opakování - nazývaná DNA transpozony, respektive LTR retroposony - jsou živá a nakopávají myší genom. Kontrast mezi lidskými a myší genomy naznačuje, že vyhynutí nebo téměř vyhynutí těchto opakujících se prvků může být způsobeno některými zásadními rozdíly mezi hominidy a hlodavci.

„Struktura a dynamika populace se zdají být pravděpodobně podezřelými,“ říká Eric Lander, ředitel centra genomu Whitehead. "Hlodavci mívají velké populace, zatímco populace hominidů jsou typicky malé a mohou se často potýkat s problémy. Zodpovědné mohou být také faktory jako inbreeding a genetický drift, pokračoval Lander." Vědci doufají, že další studie vnesou do těchto rozdílů více světla.

7. Vyřešeno: Tajemství ALU

A nyní přichází kuriózní příběh o jednom opakujícím se prvku, který fenomén vědci nazývají „tajemství Alu“. Toto tajemství se točí kolem toho, jak se opakující prvek SINE Alu, známý jako „občan druhé kategorie“ lidského genomu, dostal do fantastických čtvrtí lidského genomu.

Opakované prvky neboli nevyžádaná DNA v lidském genomu se dodávají ve čtyřech variantách: typ „vyhynulý“ (transpozony DNA), téměř vyhynulý typ (retropozony LTR) a dva další typy, které jsou stále aktivní v lidském genomu ( LINE elements and SINE elements).

Když se vědci podívali na distribuci těchto prvků podle obsahu GC (nebo čtvrtí bohatých na geny), našli vzor, ​​který na první pohled vzdoroval logice a zmátl je.

Většina opakujících se prvků-občané druhé třídy v království, kde geny vládnou-se nacházejí v méně žádaných čtvrtích v genomových oblastech, které jsou bohaté na AT a chudé na GC. Zdá se však, že prvky SINE přistály ve skutečně fantastických čtvrtích genomu-v regionech, které jsou bohaté na geny.

Vědci předpokládali, že existují dvě možná vysvětlení. Jedním z nich je, že lstiví SINE se nějakým způsobem dostali do čtvrtí bohatých na GC. Druhou hypotézou je, že většina SINE přistává nejprve v sousedstvích chudých na GC a evoluce upřednostňuje SINE, které náhodou přistály v realitách bohatých na GC.

Vědci použili návrh genomové sekvence k prozkoumání této záhady porovnáním sklonu mladých, dospívajících, středního věku a starého Aluse. Je překvapivé, že mladí Alusové žijí v regionech bohatých na AT a starší Alus má tendenci se stěhovat do čtvrtí bohatých na GC.

Výsledkem je, že druhá hypotéza, že evoluce se stará o přiblížení SINE k genům, musí být správná. V průběhu let si prvky SINE získaly mezi vědci špatnou pověst kvůli tomu, co vypadalo jako parazitické chování. Ale tato pověst může být neoprávněná, zdá se, že prvky SINE zůstaly v genomu v průběhu času, protože jsou užitečnými symbioty, kteří si vydělávají na udržení v genomu.

8. Rychlý život na chromozomu Y

Sekvence lidského genomu se svou velkou databází opakujících se prvků poskytuje účinný zdroj pro řešení neobvyklé historie chromozomu Y.

Datováním 3 milionů opakujících se prvků a zkoumáním vzoru rozptýlených opakování na chromozomu Y vědci odhadli relativní míry mutací v chromozomech X a Y a v zárodečných liniích samců a samic. Zjistili, že u mužů je dvakrát více mutací než u žen.

Za tímto účelem vědci identifikovali opakující se prvky z nedávných podrodin (ve skutečnosti rodné kohorty pocházející z posledních 50 milionů let) a změřili míry substituce pro členy podrodiny na chromozomech X a Y. Zjistili, že poměr mutací u mužů a žen je 2: 1.

Vědci poukazují na několik možných důvodů vyšší rychlosti mutací v zárodečné linii samců, včetně skutečnosti, že na tvorbě spermií se podílí větší počet buněčných dělení než na vejcích a na existenci různých opravných mechanismů ve spermiích a vejcích.

9. Horizontální přenos: Dárky nesoucí bakterie

Pomocí molekulární fosilní kopie sekvence lidského genomu vědci odkryli zbytky dávné migrace, ke které došlo u našich raných předků obratlovců. Tito předkové měli jen málo obranných systémů proti invazi parazitů, takže se bakterie mohly usadit uvnitř hostitele obratlovců. Nějaký čas během soužití hostitele a parazita si mezi těmito dvěma vyměnili starodávné geny. Vědci spekulují, že geny mohly být zanechány bakteriálními útočníky nebo transportovány do genomu virovými zprostředkovateli, ačkoli nemohou zcela vyloučit možnost, že bakterie ukradly geny předkům obratlovců.

Vědci identifikovali více než 200 genů v lidském genomu, jejichž nejbližší příbuzní jsou v bakteriích. Analogické geny se nenacházejí u bezobratlých, jako jsou červi, mušky a kvasinky. To naznačuje, že tyto geny byly získány v novějším evolučním okamžiku, možná po narození obratlovců. S největší pravděpodobností infekce vedly k přenosu DNA z bakterií do chromozomů lidského předka. Vědci nenašli žádný jediný bakteriální zdroj přenesených genů, což naznačuje, že došlo k několika nezávislým přenosům genů z různých bakterií.

Tento proces, nazývaný horizontální přenos, se dnes pravděpodobně nestane, protože lidská vajíčka a sperma, které předávají DNA další generaci, jsou izolovány od vnějšího světa a lidé mají vysoce vyvinutý imunitní systém, který chrání před cizími útočníky.

Ale tady je nakopávač! Mnoho přenesených genů není zdaleka triviálních a zdá se, že jsou zapojeny do důležitých fyziologických funkcí, což mohlo poskytnout předkům obratlovců výhodu v přežití. V důsledku toho byly tyto geny v evoluci zachovány v lidském genomu. Na psychiatrických poruchách se podílí například monoaminooxidáza (MAO), enzym, který je důležitý při zpracování neurotransmiterů. Mezi další důležité akvizice patří RAG1 a RAG2, enzymy kritické pro protilátkovou odpověď imunitního systému.

10. Mapa SNP: Doprovodný svazek ke Knize života

Kniha života, sekvence lidského genomu, je analogická základnímu seznamu částí lidského druhu, protože lidské bytosti jsou si na 99,9 procent podobné. Ale ten rozdíl 0,1 procenta-jedno na každých 1 000 písmen-přispívá k naší individualitě a jako celek může vysvětlit genetický základ nemoci.

V doprovodném svazku ke Knize života vytvořili vědci katalog 1,4 milionu jednopísmenových rozdílů neboli jednonukleotidových polymorfismů (SNP)-s jejich přesným umístěním v lidském genomu. Tato mapa SNP, největší veřejně dostupný katalog SNP na světě, slibuje revoluci jak v mapování nemocí, tak ve sledování lidské historie.

Bez mapy SNP museli vědci studující gen nemoci projít pracným, časově náročným a nákladným procesem porovnávání genomů mnoha jedinců a nalezení sady SNP v rámci požadovaného genu. . Nyní se vědec studující gen nemoci může nejprve obrátit na mapu SNP, aby našel variace genů. Vzhledem k tomu, že průměrný gen je dlouhý asi 30 000 písmen, lze mnoho SNP identifikovat v typickém genu během jedné krátké počítačové relace.

„Mapu SNP již používáme v každodenní vědě. Minulý měsíc jsme se mohli zeptat:‚ Ovlivňuje gen, který ovlivňuje množství testosteronu produkovaného tělem, riziko rakoviny prostaty? ‘ Stáhli jsme 15 SNP z webu a zadali je našim pacientům. 15 SNP se objevilo pouze ve čtyřech kombinacích. Takže tento gen lze nyní redukovat na čtyři příchutě. Celý proces trval asi dva týdny, zatímco dříve by to byl masivní projekt, nákladný projekt, “vysvětluje David Altshuler, vědecký pracovník výzkumu v centru genomu Whitehead.

Mapa SNP přesahuje rámec odkazu na geny nemocí a odpovídá na otázky týkající se historie lidské populace. Podporuje existující populačně genetický model, který předpokládá, že velmi malý počet lidí se rychle rozšířil a zalidnil celou Zemi za posledních 10 000 až 100 000 let.

Na podporu předpovědi vědci uvádějí, že SNP nejsou rovnoměrně distribuovány a koncentrace se v celém lidském genomu značně liší. Některé oblasti genomu jsou pouště SNP bez jediného SNP, zatímco jiné mají velké množství. Oblasti s malým počtem SNP mohou vyplývat z evoluce výběrem jedné formy genu, která má být udržována po celou dobu. Například v chromozomu X je vidět malá variace. Ale oblast HLA, která kóduje proteiny na povrchu krevních buněk, které vyvolávají nejsilnější imunitní odpověď, má mnoho rozmanitosti.

Aktuální mapa SNP je výsledkem společného úsilí Mezinárodního konsorcia pro sekvenování lidského genomu a Konsorcia SNP. Konsorcium SNP je neobvyklé partnerství veřejného a soukromého sektoru mezi akademickými institucemi, farmaceutickými společnostmi a charitativními organizacemi, jehož cílem je vytvořit mapu, která by byla veřejnosti k dispozici zdarma. Konsorcium daleko překonalo svůj původní cíl objevit 300 000 SNP do dubna 2001. Katalog 1,4 milionu SNP není úplným souborem všech SNP v genomu, ale je více než dostačující k tomu, aby umožnil genetické studie, které nebyly možné. před.

Skupina pro analýzu genomu

V dubnu 1999 projekt Human Genome Project sestavil skupinu nazvanou hard-core analysis group. Předsedal Eric Lander, ředitel Centra pro výzkum genomu Whitehead Institute, byla tato skupina složena ze 40 analytiků, včetně odborníků na různorodou škálu genomických témat, jako jsou proteiny, geny, genová sestava, evoluce a opakující se prvky.

Skupina se orientovala v sekvenčních datech po dobu šesti solidních měsíců a během týdenních konferenčních hovorů a setkání ve Whiteheadu a ve Philadelphii začala provádět počáteční analýzu sekvence lidského genomu. Mezitím skupina na univerzitě v Santa Cruz sestavila sekvenci genomu do „zlaté dráhy“-odkaz jazyka na tvář, že to byla stále nedokonalá sekvence.

Skupina pro analýzu genomu představovala největší skupinu sekvenčních analytiků spojenou pro jakýkoli úkol. E -maily létaly tam a zpět - celkem 5 000 - přes tři kontinenty a sedm zemí. Na Den díkůvzdání roku 2000 měla skupina svou analýzu společně.

Skupina začala psát Příroda papír v říjnu a předložil jej v prosinci. Úkol přirovnávají k sepsání cestovního průvodce Spojenými státy, pro které redaktor potřeboval spojit různorodou skupinu odborníků. Potřebovali někoho, kdo by v podstatě mohl autoritativně psát o raftingu na divoké vodě na řece Colorado a dalších, kteří věděli, jaké jsou výhody klubů v Greenwich Village v New Yorku.

„Potřebovali jsme někoho, kdo by popsal historii Route 66, a další, kdo bude hovořit o plavbě po Šesté třídě. Potřebovali jsme někoho, kdo namaluje celkový obraz topografických prvků, jako jsou Skalnaté hory, a také někoho, kdo nám poskytne recenze potravin na díry v nástěnné restaurace v San Francisku, “říká Lander, ředitel Whitehead Genome Center. „Byla to výzva, ale také velká zábava.“


Diskuse

Ovocné stromy obvykle vykazují vysokou heterogenitu, což ztěžuje získání vysoce kvalitních kompletních genomů a tento efekt je zvláště patrný u uvolněných genomů stromů ovocných stromů. Při sestavování meruňkového genomu, abychom překonali problém způsobený heterozygotností, jsme nejprve shromáždili data Illumina do superčtení pomocí MaSuRCA a superčtení a opravené subready PacBio byly poté sestaveny do kontigů tvořících diploidní genom. Po vyčištění haplotigů byla velikost meruňkového genomu N50 1 018 044 bp a velikosti N50 broskví, třešní, mume a mandlí 294, 276, 31 772 a 77 040 bp, což naznačuje, že P. armeniaca referenční genom byl nejvíce souvislý mezi sekvenovanými ovocnými stromy 16,17,18,19. Analýza BUSCO ukázala, že v sestavě bylo detekováno 98,0% kompletních genů, což naznačuje, že genomová kvalita meruněk byla lepší než u ostatních publikovaných genomů peckového ovoce 16,17,18,19. Stručně řečeno, tyto výsledky naznačují, že genom meruněk je relativně přesný a úplný mezi dostupnými genomy stromů ovocných stromů.

Virus švestek, také známý jako Sharka, je lineární jednovláknový RNA virus, který ovlivňuje Prunus druh. Výběr genetických zdrojů rezistentních na PPV v Prunus zárodečné plazmy jsou důležitým přístupem pro šlechtění rezistence, který je v současné době účinný proti PPV s průlomy týkajícími se genů anti-PPV, byly použity nebo mohou být využity biotechnologické strategie k udělení rezistence na PPV 64,65. Nedávné studie ukázaly, že meruňková rezistence na PPV je spojena s pseudogenizací/downregulací dvou tandemově duplikovaných genů MATHd 66. Porovnáním změn v ortologech MATHd v Prunus, zjistili jsme, že přidružené oblasti byly vertikálně zděděny po předchůdci Prunus druhu a že v každém druhu byly zachovány alespoň dvě tandemově uspořádané kopie, ztráta genů MATHd může mít za následek citlivost na PPV. Při společném zvážení těchto výsledků bude zajímavé testovat role těchto genů v infekci PPV prostřednictvím molekulárních studií, studií genetické asociace a molekulárního šlechtění v rámci jiných Prunus druh.

Rovnováha biosyntézy a rozkladu β-karotenu může přispět k zbarvení meruňkového ovoce. Za prvé, β-karoten, jako jeden z metabolitů důležitých pro kvalitu ovoce, přispívá ke žluté barvě meruňkového ovoce 67,68. Mezi ovocnými pigmenty jsou antokyany hlavními typickými pigmenty, které přispívají k červenému, růžovému nebo fialovému zbarvení některých druhů ovoce, jako jsou jablka, rajčata, purpurové sladké brambory a jahody 69,70,71,72,73,74,75,76 . V meruňkovém ovoci je však β-karoten detekovatelný a vykazuje výrazně vyšší hladiny ve žluté dužině „Chuanzhihong“ než v bílé dužině „Dabaixing“. Tyto výsledky ukázaly, že β-karoten je hlavním pigmentem meruněk se žlutou dužinou (obr. 5), což podporují studie Curl 77 a Roussos et al. 10 Existuje také mnoho dalších ovocných druhů s vysokým obsahem β-karotenu, jako jsou citrusy, mrkev, mango, papája a rajčata 73,78.

Expresní vzorce genů pro syntézu beta-karotenu v rostlinách jsou navíc závislé na tkáni a stupni. Psy, pds, zds, lcy-e, crt-b, zep a necd3 jsou všechny vyjádřeny v kávových listech, květech a výhoncích, ale úrovně transkriptu se mezi těmito třemi tkáněmi liší 79. U rajčat, citrusů, melounu a dalších plodin ovocného typu se zdá, že geny související s biosyntézou β-karotenu vykazují nejvyšší úrovně transkriptu a rychlá akumulace β-karotenu je pozorována hlavně v téměř zralém stádiu 80,81,82. Lykopen a β-karoten se rychle hromadí v dužině citrusových plodů Cara během dvou fází zvětšování ovoce a zrání ovoce. Tato studie ukázala, že fáze G2 až CT mohou být odpovídajícím klíčovým obdobím meruněk. Jak je popsáno v literatuře, změna barvy ze zelené na červenou nebo žlutou je při vývoji ovoce velmi důležitá, protože antokyany nebo karotenoidy se kromě cukru, ABA a ETH hromadí, aby podpořily zrání ovoce 83,84,85. V této studii byl pozorován podobný výsledek (obr. 5). Během fáze dozrávání plodů G2 až CT se výrazněji změnily úrovně exprese genů, zejména genů souvisejících se syntézou β-karotenu. V této fázi je zapojeno více metabolických cest, které ovlivňují vývoj a zrání ovoce, včetně biosyntézy beta-karotenu. Obsah β-karotenu v „Chuanzhihong“ se rychle zvýšil na vysokou úroveň počínaje stádiem CT a dosáhl nejvyšší úrovně ve stadiu FR, což naznačuje zralost ovoce.

Dále byly analyzovány všechny DEG související s cestou biosyntézy p-karotenu. V meruňce, lcy-b může významně přispět k rozvoji žlutého masa při dozrávání ovoce „Chaunzhihong“. Jak je znázorněno na obr. S10, lcy-b byla významně zvýšena, což naznačuje, že p-karoten procházel rychlou syntézou během fáze CT, což je podobné trendu změny barvy masa. Naproti tomu mezi dalšími třemi důležitými geny (psy, pds, zds) pro biosyntézu p-karotenu nebyly hladiny genové exprese konstantní s akumulací p-karotenu. Všechny předchozí studie ukázaly, že změny genové exprese řídící biosyntézu beta-karotenu v rostlinách mezi různými druhy nebo různými odrůdami jsou velmi složité. Je však zajímavé, že v bílém kultivaru „Dabaixing“ byla úroveň přepisu NCED gen je během vývoje ovoce mnohem vyšší, zejména v posledních dvou fázích CT a FR, což je v rozporu s tím, co je pozorováno u žlutějšího kultivaru „Chuanzhihong“ (obr. S13). Nově syntetizované karotenoidy se rychle přeměňují na xantoxin, předchůdce abcisátu, enzymovou katalýzou, zejména NCED, zastavení akumulace karotenu. Rovnováha biosyntézy a rozkladu β-karotenu může přispět k zbarvení meruňkového ovoce, což poskytuje první zprávu o pravděpodobném mechanismu vývoje barvy ovoce u meruněk. Další výzkum s ohledem na charakterizaci a funkční identifikaci lcy-b a NCED stejně jako bude proveden možný mechanismus transkripční regulace β-karotenu u meruněk, což je cenné pro základní výzkum a budoucí šlechtění nových odrůd meruněk bohatých na β-karoten.


Výsledky a diskuse

CNEE a omezení v ptačím genomu

Identifikovali jsme soubor 193 genů, které byly spojeny s vývojem peří prostřednictvím mutantních fenotypů nebo časově omezených expresních vzorců (doplňkové materiály a metody a doplňková tabulka S1, doplňkový materiál online). Abychom prozkoumali evoluční historii těchto genů a jejich potenciálních regulačních prvků, zkonstruovali jsme 19cestné uspořádání celého genomu odkazující na kuřecí genom (Hillier et al. 2004) obsahující čtyři ptáky, dva krokodýly, dvě želvy, ještěrku, čtyři savci, žába a pět aktinopterygických ryb (paprskoploutví). Oblasti genomu vykazující evoluční omezení byly identifikovány pomocí fylogenetického skrytého Markovova modelu pro detekci oblastí zarovnání vyvíjejících se pomaleji než synonymní místa v kódujících oblastech. Celkově bylo identifikováno 957 409 konzervovaných prvků o celkové hmotnosti přibližně 71 Mb a zahrnujících přibližně 7,2% kuřecího genomu, což je vyšší procento než 5% často uváděných pro lidský genom. Tento výsledek je v souladu s malou (1,2 Gb) velikostí kuřecího genomu vzhledem k lidskému genomu, takže celkové množství sekvence je anotováno jako omezené asi na polovinu toho, co je v současné době uvedeno pro člověka (Siepel et al. 2005 Lindblad-Toh et (2011). Abychom identifikovali domnělé regulační prvky, odstranili jsme všechny oblasti překrývající exon anotovaný u kuřete nebo jiného druhu, což vedlo k 602 539 CNEE pokrývajícím 4,4% kuřecího genomu. Identifikovali jsme gen, který každý CNEE pravděpodobně reguluje přiřazením každého CNEE ke genu s nejbližším počátečním místem transkripce, a zjistili jsme, že 13 307 CNEE bylo spojeno s 193 geny souvisejícími s peřím v datové sadě. Přestože regulační prvky mohou působit na dlouhé genomické vzdálenosti, které zahrnují geny neregulované prvky (Kleinjan a van Heyningen 2005), experimentálně identifikované zesilovače bývají nejblíže genům s expresí ve stejných tkáních a ve stejnou dobu ve vývoji (Visel et al. 2009). Mnoho regulačních oblastí navíc prochází rychlým vývojem a obratem (Wray 2007, 2013), a ty naše analýza postrádá. Kvůli jejich různým funkcím jsme rozdělili seznam 193 genů souvisejících s peřím a jejich přidruženými CNEE do strukturální sady 67 keratinových genů a vzorovací sady 126 nekeratinových genů a tyto skupiny jsme analyzovali samostatně.

Ancient Genic Toolkit and Extended Regulatory Evolution are associated with Feather Origins

Genetické a regulační složky sad keratinu a nekeratinu vykazují velmi odlišné vzorce v páteři 500-My našeho stromu na linii vedoucí od společného předka obratlovců ke kuřeti (obr. 1 a 2, doplňkový obr. S1, Doplňkový materiál online). Nejstarší větev v naší analýze, která vedla ke společnému předkovi ryb paprskovitých a dalších obratlovců, ukazuje nejsilnější obohacení genů nekeratinového peří (1,7krát očekávané), přičemž menší počet genů nekeratinového peří vzniká na větvích vedoucích k tetrapodům a méně inkluzivní clady (obr. 1A a 2). Žádní členové této nekeratinové sady genů peří nejsou rekonstruováni, aby vznikli po předchůdci ptáků a želv. Přestože se během vývoje kuřat pravděpodobně studují starodávné geny, nekeratinové geny v naší studii byly ještě starodávnější, než bychom při zohlednění této předpojatosti očekávali (Mann – Whitney U test P & lt 0,022 doplňkový obr. S2, doplňkový materiál online). Odvozený první výskyt oblastí nekódatinových proteinů kódujících, které jsou zapojeny například do vzorování placode a ontogeneze peří u ptáků, je v souladu s tím, že tyto geny jsou součástí starověké vývojové sady nástrojů (obr. 1 a 2).

Geny pro vývoj peří jsou staré, zatímco související CNEE vrcholí u předka amniotů. Evoluční dynamika (A) geny pro vývoj nekeratinového peří a související CNEE (n = 126 genů) a (b) keratinové geny a související CNEE (n = 67 genů). Černá vodorovná čára označuje nulové očekávání počtu nových genů (srovnání se všemi geny v genomu) nebo CNEE (rovnoměrné rozdělení v celém genomu). Body nad touto čarou označují linie, na kterých vznikl vyšší než očekávaný počet genů nebo CNEE. Body na X osa odpovídá předkům znázorněným na obrázku 2, s rozestupy úměrnými divergenčním časům zaznamenaným v timetree.org (Hedges et al. 2006). V (b), větší pík obsahoval β-keratiny pocházející z expanzí genových klastrů na kuřecích chromozomech 27 a 2. Malý pík u předka želvy a ptáka je způsoben expanzí klastru genů β-keratinu na chromozomu 25. Oba tyto výsledky jsou v souladu s předchozími studiemi vývoje β-keratinu (Greenwold a Sawyer 2010 Li et al. 2013).

Geny pro vývoj peří jsou staré, zatímco související CNEE vrcholí u předka amniotů. Evoluční dynamika (A) geny pro vývoj nekeratinového peří a související CNEE (n = 126 genů) a (b) keratinové geny a související CNEE (n = 67 genů). Černá vodorovná čára označuje nulové očekávání počtu nových genů (srovnání se všemi geny v genomu) nebo CNEE (rovnoměrné rozdělení v celém genomu). Body nad touto čarou označují linie, na kterých vznikl vyšší než očekávaný počet genů nebo CNEE. Body na X osa odpovídá předkům znázorněným na obrázku 2, s rozestupy úměrnými divergenčním časům zaznamenaným v timetree.org (Hedges et al. 2006). V (b), větší pík obsahoval β-keratiny pocházející z expanzí genových klastrů na kuřecích chromozomech 27 a 2. Malý pík u předka želvy a ptáka je způsoben expanzí klastru genů β-keratinu na chromozomu 25. Oba tyto výsledky jsou v souladu s předchozími studiemi evoluce β-keratinu (Greenwold a Sawyer 2010 Li et al. 2013).

Hlavní genomové události, které jsou základem vzniku peří. Barevná páteř stromu ukazuje tři stopy: CNEE, geny nekeratinového peří (n = 126) a geny keratinu (n = 67). Sazby původu těchto tří genomových tříd jsou označeny barvami pro každý stonek internodia a stopu ve stromu, přičemž modré barvy označují nízké počátky a červené barvy označují vysoké počátky. Jsou uvedeny klíčové události na úrovni kódujících oblastí (genů) a regulačních prvků. Barvy siluet vpravo udávají procento regulační složky peří přítomné v kuřecím genomu, z čehož lze usoudit, že vznikly v předchůdci každého uvedeného taxonu. Například se předpokládá, že ryby mají asi 28% CNEE spojených s geny peří u kuřete, zatímco u 86% pozorovaných kuřecích CNEE je odvozeno, že byly vytvořeny rodovým archosaurem, včetně neavanských dinosaurů.

Hlavní genomové události, které jsou původem peří. Barevná páteř stromu ukazuje tři stopy: CNEE, geny nekeratinového peří (n = 126) a geny keratinu (n = 67). Sazby původu těchto tří genomových tříd jsou označeny barvami pro každý stonek internodia a stopu ve stromu, přičemž modré barvy označují nízké počátky a červené barvy označují vysoké počátky. Jsou uvedeny klíčové události na úrovni kódujících oblastí (genů) a regulačních prvků. Barvy siluet vpravo ukazují procento regulační složky peří přítomné v kuřecím genomu, z čehož lze usoudit, že vznikly v předchůdci každého uvedeného taxonu. Například se předpokládá, že ryby mají asi 28% CNEE spojených s geny peří u kuřete, zatímco u 86% pozorovaných kuřecích CNEE je odvozeno, že byly vytvořeny rodovým archosaurem, včetně neavanských dinosaurů.

CNEE spojené s geny nesouvisejícími s peřím překvapivě vykazují nejvyšší míru původu nikoli na internodě mezi rodovým archosaurem a ptáky, kde vykazují o 25% vyšší původ, než se očekávalo, ale místo toho na větvi vedoucí k amnioty, kde vykazují míru vzniku o 60% vyšší, než se očekávalo (obr. 1 a 2, doplňkový obr. S1, doplňkový materiál online). Rychlost vzniku těchto CNEE je větší, než by se očekávalo od CNEE rovnoměrně rozmístěných v genomu pro šest z osmi větví podél linie vedoucí ke kuřatům, což naznačuje velké množství regulačních inovací po delší časové období (obr.1A a 2). Nekeratinová genová složka vývoje peří vznikla hluboko u obratlovců a největší signál regulační inovace byl shodný s výbuchem fenotypové změny spojené s přechodem na pevninu. Ačkoli informace o obalu rodového amniotu zůstávají výjimečně omezené (Alibardi et al. 2009 Alibardi 2012), akumulace CNEE, o kterých se předpokládá, že v této době nastaly, naznačuje klíčovou roli regulačních změn během tohoto přechodu a v následném vývoji obratlovců intelektuální rozmanitost. V souladu s touto hypotézou je zde 32 genů v naší genové sadě peří identifikováno jako sdílené s těmi, které se podílejí na vývoji srsti savců (Lowe et al. 2011) (hypergeometrická distribuce, P & lt 1e-80 doplňková tabulka S3, doplňkový materiál online) a přítomná u předka amniotů. Dříve bylo ukázáno, že geny podporující vývoj vlasů vykazují nárůst regulačních inovací na větvi vedoucí k amniotům, následovaný vrcholem na větvi vedoucím k savcům a poklesem v poslední době (Lowe et al. 2011).

Naše analýza naznačuje, že neavaničtí dinosauři, jako součást Archosaurie, měli k dispozici celou známou sadu nástrojů pro kódování nekeratinových proteinů pro výrobu peří. Navíc za předpokladu konstantní rychlosti akumulace CNEE v celém genomu u obratlovců odhadujeme, že v archosaurském předchůdci bylo přítomno také 86% CNEE nekkeratinového peří. CNEE přítomné v tomto předchůdci mohou mít méně společného s původem peří, ale místo toho by mohly být spojeny s dřívějším přechodem amniotů na pevninu, přičemž pozdější CNEE specifické pro ptáky mají funkce specifické pro peří. Tyto výsledky jsou také v souladu s novými daty o integumentární inovaci a rozmanitosti v archosaurii: vláknité nebo štětinové struktury buď vznikly jednou na začátku kladu nebo třikrát nebo vícekrát (Clarke 2013) u pterosaurů (Kellner et al. 2010), ornithischian (Zheng et al. 2009 Godefroit et al. 2014) a teropodních dinosaurů (Norell a Xu 2005). Genetický a regulační doplněk identifikovaný u rodového archosaura tedy byl buď flexibilní sada nástrojů kooptovaná v různých počátcích nových struktur, včetně peří, nebo naznačuje starověký původ v tomto kladu vláknitých integumentárních struktur, často nazývaných prekurzory peří, na některé části těla nebo fáze vývoje více než 100 My před vznikem zpeřeného peří u dinosaurů.

Omezená role evoluce bílkovin v peří

Naše analýza detekuje známý výbuch duplikace v genech β-keratinu v Archosaurii (Greenwold a Sawyer 2010 Li et al. 2013) na větvi vedoucí k ptákům (obr.1b a 2). Větší vrchol pro inovaci keratinu obsahoval 57 β-keratinů vznikajících jako expanze genového klastru na kuřecím chromozomu 27 a 5 β-keratinů z duplikací na chromozomu 2. Malý vrchol v předku želvy a ptáků je způsoben expanzí Shluk genů β-keratinu na chromozomu 25. Oba tyto výsledky jsou v souladu s předchozími studiemi vývoje β-keratinu (Greenwold a Sawyer 2010 Li et al. 2013). Tento keratinový výbuch však představuje jediný, i když podstatný signál inovace na úrovni bílkovin v původu zpeřeného peří. Je pozoruhodné, že v blízkosti genů β-keratinu existuje jen málo důkazů o regulační inovaci. Zjistili jsme jen málo dalších mezidruhových omezení mimo exonické oblasti v klastrových keratinech, než bychom očekávali, kdyby byly v genomu náhodně distribuovány CNEE. Na větvi vedoucí k ptákům jsme detekovali pouze 15 keratinů sousedících s peřím, které jsou CNEE, což naznačuje, že regulační vývoj v blízkosti beta-keratinů není výjimečný. Ačkoli podpis CNEE je pravděpodobně komplikován historií duplikace a genové konverze v této multigenové rodině, buď regulační krajina kolem beta-keratinů nevypadá pozoruhodně, nebo jsou jejich regulační prvky méně přísně omezeny. Tato data jsou v souladu s myšlenkou, že keratinová složka peří vznikla především v důsledku genových inovací.

Kromě evoluce beta-keratinu se zdá, že evoluce proteinů hraje omezenou roli v původu zpeřeného peří. Hledali jsme signály pozitivní selekce s ohledem na substituce aminokyselin. Po Bonferroniho korekci vykazovaly pouze 3 ze 126 genů nekeratinového peří podpisy pozitivní selekce na archosaurské větvi vedoucí k ptákům (doplňková tabulka S2, doplňkový materiál online). Tyto výsledky naznačují, že většina nekeratinových genů souvisejících s vývojem peří vykazuje regulační inovace v linii ptačích kmenů, nikoli kódující proteiny, včetně živých ptáků a neavanských dinosaurů, což je v souladu s hypotézou, že regulační inovace jsou základem adaptací v modelování kůže a morfologii peří.

Geny velikosti těla vykazují výjimečnou regulační inovaci v dinosaurii

Geny s anomálně velkým počtem regulačních prvků vznikajících u ptáků po jejich odchylce od existujících krokodýlů mohou přispět ke vzniku ptačích fenotypů. Průzkum genomu v celém genomu 1-Mb genomických oken odhalil 23 segmentů kuřecího genomu s neobvykle vysokým počtem CNEE vznikajících na větvi vedoucí k ptákům (obr.A opraveno P & lt 0,01 doplňková tabulka S4, doplňkový materiál online). Ačkoli genová ontologická analýza neodhaluje významné obohacení žádných funkcí pro sadu genů poblíž těchto segmentů bohatých na inovace, řada těchto segmentů obklopuje geny zapojené do velikosti těla, vývoje končetin a integumentu (obr.A). Region vykazující největší obohacení pro ptáky specifické CNEE v celém kuřecím genomu, o více než 500% více, než se očekávalo (P & lt 10-53), je soustředěn v 400 kb genové poušti, přičemž dva nejbližší geny jsou protein vázající růstový faktor podobný inzulínu (IGFBP) 2 a 5 (obr.b a C). IGFBP2 je exprimován v apikálním ektodermálním hřbetu kuřat a na špičkách růstových destiček v pupenu křídla, obsahuje jednonukleotidové polymorfismy spojené s fenotypovými variacemi v končetinách kuřat (McQueeney a Dealy 2001 Li et al. 2006) a leží v signální dráha jak velikosti těla, tak délky končetin u savců a ptáků (Fisher et al. 2005 Sutter et al. 2007). IGFBP5 také hraje důležitou roli ve vývoji končetin (McQueeney a Dealy 2001) a zmenšování velikosti těla (Salih et al. 2004). Jeho rozšířená exprese během vývoje kuřat (Antin et al. 2014) je v souladu s úlohou regulačních prvků spojených s IGFBP5 při zmenšování velikosti těla. Je známo, že velikost těla a délka končetin se v celé Dinosaurii značně liší a bylo navrženo, že budou hrát klíčovou roli v evoluční dynamice dinosaurů (Benson et al. 2014), přičemž miniaturizace podle fosilních záznamů předcházela vzniku letu v Paraves ( Turner a kol.2007 Lee a kol. Analýza vzorů regulačních inovací tedy nabízí potenciál spojit evoluci genomu s klíčovými posuny tvaru a formy, ke kterým dochází v hlubokém čase.

Identifikace oblastí ptačího genomu s podpisy výjimečných regulačních inovací v linii archosaurů, která zahrnuje ptáky a další dinosaury. (A) Graf celého genomu o hustotě CNEE vznikajících na archosaurské větvi vedoucí k ptačí předkovi. Červené oblasti označují oblasti obohacené ve srovnání s distribucí CNEE na jiných pobočkách (šedá čára v [b]) a zelené čtverečky označují 23 významných vrcholů obohacení pro CNEE specifické pro ptáky vzhledem k rovnoměrné distribuci v celém genomu. Zkoumali jsme nejbližší upstream a nejbližší downstream geny a pro vybrané píky je naznačen doprovodný gen spolu s navrhovanou rolí v morfologické evoluci ptáků (klíč nahoře), regulační inovace mohla také hrát roli v dřívější evoluční dynamice dinosauří linie. (b) Nejhustší oblast pro ptačí specifické CNEE v kuřecím genomu je v genové poušti na chromozomu 7, přičemž IGFBP2 je nejbližší dobře komentovaný gen refseq a IGFBP5 je nejbližší genová predikce. Hustota CNEE na všech větvích jiných než těch, které vedou k ptákům, je vyznačena šedě. (C) UCSC Genome Browser snímek oblasti bohaté na CNEE v blízkosti IGFBP2 a IGFBP5, která funguje při vývoji končetin a regulaci velikosti těla (viz hlavní text, doplňková tabulka S4, doplňkový materiál online), zobrazující CNEE nalezené pouze u ptáků (červená boxy) nebo vznikající na hlubších větvích stromu obratlovců (šedé boxy). Oblasti zarovnávací sekvence pro zástupce 19 zahrnutých taxonů jsou zelené.

Identifikace oblastí ptačího genomu s podpisy výjimečných regulačních inovací v linii archosaurů, která zahrnuje ptáky a další dinosaury. (A) Graf celého genomu o hustotě CNEE vznikajících na archosaurské větvi vedoucí k ptačí předkovi. Červené oblasti označují oblasti obohacené ve srovnání s distribucí CNEE na jiných pobočkách (šedá čára v [b]) a zelené čtverečky označují 23 významných vrcholů obohacení pro ptačí specifické CNEE vzhledem k rovnoměrné distribuci v celém genomu.Zkoumali jsme nejbližší upstream a nejbližší downstream geny a pro vybrané píky je naznačen doprovodný gen spolu s navrhovanou rolí v morfologické evoluci ptáků (klíč nahoře), regulační inovace mohla také hrát roli v dřívější evoluční dynamice dinosauří linie. (b) Nejhustší oblast pro ptačí specifické CNEE v kuřecím genomu je v genové poušti na chromozomu 7, přičemž IGFBP2 je nejbližší dobře komentovaný gen refseq a IGFBP5 je nejbližší genová predikce. Hustota CNEE na všech větvích jiných než těch, které vedou k ptákům, je vyznačena šedě. (C) UCSC Genome Browser snímek oblasti bohaté na CNEE v blízkosti IGFBP2 a IGFBP5, která funguje při vývoji končetin a regulaci velikosti těla (viz hlavní text, doplňková tabulka S4, doplňkový materiál online), zobrazující CNEE nalezené pouze u ptáků (červená boxy) nebo vznikající na hlubších větvích stromu obratlovců (šedé boxy). Oblasti zarovnávací sekvence pro zástupce 19 zahrnutých taxonů jsou zelené.


Obsah

Ektopická rekombinace Upravit

Duplikace vznikají z události nazývané nerovnoměrné křížení, ke které dochází během meiózy mezi špatně zarovnanými homologními chromozomy. Šance, že k tomu dojde, je funkcí stupně sdílení opakujících se prvků mezi dvěma chromozomy. Produkty této rekombinace jsou duplikací v místě výměny a vzájemným odstraněním. Ektopická rekombinace je typicky zprostředkována sekvenční podobností v duplicitních hraničních bodech, které tvoří přímá opakování. Opakující se genetické prvky, jako jsou transponovatelné prvky, nabízejí jeden zdroj repetitivní DNA, která může usnadnit rekombinaci, a často se nacházejí v hraničních bodech duplikace v rostlinách a savcích. [2]

Úpravy replikace replikace

Replication slippage je chyba v replikaci DNA, která může způsobit duplikace krátkých genetických sekvencí. Během replikace začíná DNA polymeráza kopírovat DNA. V určitém okamžiku během procesu replikace se polymeráza disociuje z DNA a replikace se zastaví. Když se polymerasa znovu připojí k řetězci DNA, zarovná replikující se vlákno do nesprávné polohy a mimochodem zkopíruje stejný úsek více než jednou. Opakování replikace je také často usnadněno opakujícími se sekvencemi, ale vyžaduje pouze několik základů podobnosti.

Upravit transpozici

Retrotranspozony, hlavně L1, mohou příležitostně působit na buněčnou mRNA. Transkripty jsou reverzně transkribovány do DNA a vloženy do náhodného místa v genomu, čímž vznikají retrogeny. Výsledná sekvence obvykle postrádá introny a často obsahuje poly sekvence, které jsou také integrovány do genomu. Mnoho retrogenů vykazuje změny v genové regulaci ve srovnání s jejich rodičovskými genovými sekvencemi, což někdy vede k novým funkcím.

Aneuploidy Upravit

K anuploidii dochází, když nedisjunkce na jednom chromozomu vede k abnormálnímu počtu chromozomů. Aneuploidie je často škodlivá a u savců pravidelně vede ke spontánním potratům (potratům). Někteří aneuploidní jedinci jsou životaschopní, například trizomie 21 u lidí, což vede k Downovu syndromu. Aneuploidie často mění dávkování genů způsoby, které jsou škodlivé pro organismus, proto je nepravděpodobné, že by se šířily populacemi.

Polyploidie Upravit

Polyploidie, příp duplikace celého genomu je produktem nedisjunkce během meiózy, která vede k dalším kopiím celého genomu. Polyploidie je běžná v rostlinách, ale objevila se také u zvířat, přičemž dvě linie duplikace celého genomu (událost 2R) v linii obratlovců vedou k lidem. [3] Vyskytlo se také u kvasinek hemiascomycete ∼100 mya. [4] [5]

Po duplikaci celého genomu nastává relativně krátká doba nestability genomu, rozsáhlá ztráta genu, zvýšené hladiny substituce nukleotidů a přepojení regulační sítě. [6] [7] Navíc významnou roli hrají účinky dávkování genů. [8] Většina duplikátů je tedy ztracena během krátké doby, nicméně značná část duplikátů přežije. [9] Je zajímavé, že geny zapojené do regulace jsou přednostně zachovány. [10] [11] Kromě toho zachování regulačních genů, zejména genů Hox, vedlo k adaptivní inovaci.

Rychlá evoluce a funkční divergence byly pozorovány na úrovni transkripce duplikovaných genů, obvykle bodovými mutacemi v motivech vázajících krátký transkripční faktor. [12] [13] Kromě toho je rychlá evoluce proteinových fosforylačních motivů, obvykle uložených v rychle se vyvíjejících vnitřně neuspořádaných oblastech, dalším faktorem přispívajícím k přežití a rychlé adaptaci/neofunkcionalizaci duplicitních genů. [14] Zdá se tedy, že existuje souvislost mezi genovou regulací (alespoň na posttranslační úrovni) a evolucí genomu. [14]

Polyploidie je také dobře známým zdrojem speciace, protože potomci, kteří mají ve srovnání s rodičovskými druhy různý počet chromozomů, často nejsou schopni se křížit s nepolyploidními organismy. Duplikace celého genomu je považována za méně škodlivou než aneuploidie, protože relativní dávka jednotlivých genů by měla být stejná.

Rychlost duplikace genu Upravit

Porovnání genomů ukazuje, že duplikace genů jsou běžné u většiny zkoumaných druhů. Toto je indikováno proměnlivým počtem kopií (variací počtu kopií) v genomu lidí [15] [16] nebo ovocných mušek. [17] Bylo však obtížné změřit rychlost, s jakou k takovým duplikacím dochází. Nedávné studie přinesly první přímý odhad míry genové duplikace genů v celém genomu C. elegans, první mnohobuněčná eukaryota, pro kterou byl k dispozici takový odhad. Rychlost duplikace genu v C. elegans je řádově 10–7 duplikací/gen/generace, to znamená, že v populaci 10 milionů červů bude mít jedna genovou duplikaci za generaci. Tato rychlost je o dva řády větší než spontánní rychlost bodové mutace na nukleotidové místo u tohoto druhu. [18] Starší (nepřímé) studie uváděly lokální specifické míry duplikace v bakteriích, Drosophilaa lidé v rozmezí od 10-3 do 10-7 /gen /generace. [19] [20] [21]

Neofunkcionalizace Upravit

Duplikace genů jsou základním zdrojem genetických novinek, které mohou vést k evoluční inovaci. Duplikace vytváří genetickou nadbytečnost, kde druhá kopie genu je často bez selektivního tlaku - to znamená, že její mutace nemají žádné škodlivé účinky na jeho hostitelský organismus. Pokud u jedné kopie genu dojde k mutaci, která ovlivňuje jeho původní funkci, může druhá kopie sloužit jako „náhradní část“ a nadále správně fungovat. Duplicitní geny tedy akumulují mutace rychleji než funkční gen s jednou kopií v generacích organismů a je možné, že jedna ze dvou kopií vyvine novou a odlišnou funkci. Některé příklady takové neofunkcionalizace jsou zjevná mutace duplikovaného trávicího genu v rodině ledových ryb na nemrznoucí gen a duplikace vedoucí k novému genu hadího jedu [22] a syntéza 1 beta-hydroxytestosteronu u prasat. [23]

Předpokládá se, že v evoluci hraje hlavní roli duplikace genů. Tento postoj zastávají členové vědecké komunity více než 100 let. [24] Susumu Ohno byl jedním z nejslavnějších vývojářů této teorie ve své klasické knize Evoluce genovou duplikací (1970). [25] Ohno tvrdil, že duplikace genů je nejdůležitější evoluční silou od vzniku univerzálního společného předka. [26] Velké duplikace genomu mohou být zcela běžné. Předpokládá se, že celý genom kvasinek prošel duplikací asi před 100 miliony let. [27] Rostliny jsou nejplodnějšími duplikátory genomu. Pšenice je například hexaploidní (druh polyploidní), což znamená, že má šest kopií svého genomu.

Subfunkcionalizace Upravit

Dalším možným osudem duplicitních genů je, že obě kopie mohou stejně volně akumulovat degenerativní mutace, pokud jsou jakékoli defekty doplněny druhou kopií. To vede k neutrálnímu modelu „subfunkcionalizace“ nebo DDC (duplikace-degenerace-komplementace) [28] [29], ve kterém je funkčnost původního genu distribuována mezi dvě kopie. Žádný gen nelze ztratit, protože oba nyní vykonávají důležité neredundantní funkce, ale nakonec ani jeden není schopen dosáhnout nové funkce.

K subfunkcionalizaci může dojít prostřednictvím neutrálních procesů, ve kterých se hromadí mutace bez škodlivých nebo prospěšných účinků. V některých případech však může dojít k subfunkcionalizaci s jasnými adaptačními výhodami. Pokud je rodový gen pleiotropní a plní dvě funkce, často nelze ani jednu z těchto dvou funkcí změnit, aniž by byla ovlivněna druhá funkce. Tímto způsobem rozdělení rodových funkcí na dva samostatné geny může umožnit adaptivní specializaci dílčích funkcí, a tím poskytnout adaptivní výhodu. [30]

Ztráta Upravit

Výsledná genomová variace často vede k neurologickým poruchám závislým na dávce genu, jako je Rettův syndrom a Pelizaeus – Merzbacherova choroba. [31] Takové škodlivé mutace se pravděpodobně z populace ztratí a nebudou zachovány ani nevyvinou nové funkce. Mnoho duplikací však ve skutečnosti není na škodu ani prospěšné a tyto neutrální sekvence mohou být ztraceny nebo se mohou šířit populací náhodnými výkyvy prostřednictvím genetického driftu.

Kritéria a skenování jednoho genomu Upravit

Dva geny, které existují po události duplikace genu, se nazývají paralogy a obvykle kódují proteiny s podobnou funkcí a/nebo strukturou. Oproti tomu ortologní geny přítomné v různých druzích, z nichž každý je původně odvozen ze stejné rodové sekvence. (Viz Homologie sekvencí v genetice).

V biologickém výzkumu je důležité (ale často obtížné) rozlišovat mezi paralogy a ortology. Pokusy o funkci lidského genu lze často provádět na jiných druzích, pokud lze v genomu tohoto druhu nalézt homolog s lidským genem, ale pouze pokud je homolog ortologický. Pokud se jedná o paralogy a jsou výsledkem události duplikace genu, jejich funkce budou pravděpodobně příliš odlišné. Jedna nebo více kopií duplikovaných genů, které tvoří genovou rodinu, může být ovlivněna inzercí transponovatelných prvků, které mezi nimi způsobují významné variace v jejich sekvenci, a nakonec se mohou stát zodpovědnými za odlišnou evoluci. To může také zajistit šance a rychlost genové konverze mezi homology genových duplikátů v důsledku menší nebo žádné podobnosti v jejich sekvencích.

Paralogy lze identifikovat v jednotlivých genomech vzájemným porovnáváním sekvencí všech komentovaných genových modelů. Takové srovnání lze provést na translatovaných aminokyselinových sekvencích (např. BLASTp, tBLASTx) k identifikaci starodávných duplikací nebo na nukleotidových sekvencích DNA (např. BLASTn, megablast) k identifikaci novějších duplikací. Většina studií k identifikaci genových duplikací vyžaduje vzájemné nejlepší zásahy nebo fuzzy reciproční nejlepší zásahy, kde každý paralog musí být druhým nejlepším shodou druhého v porovnání sekvencí. [32]

Většina genových duplikací existuje jako replikace s nízkým počtem kopií (LCR), spíše vysoce repetitivní sekvence jako transponovatelné prvky. Většinou se nacházejí v pericentronomických, subtelomerických a intersticiálních oblastech chromozomu. Mnoho LCRs, vzhledem k jejich velikosti (& gt1Kb), podobnosti a orientaci, je vysoce náchylné k duplikacím a delecím.

Genomická mikročipy detekují duplikace Upravit

K detekci chromozomálních abnormalit, jako jsou mikroduplikace, ze vzorků genomové DNA se používají technologie, jako jsou genomová mikročipy, nazývané také matice srovnávací genomové hybridizace (pole CGH). Zejména technologie mikročipů DNA může současně monitorovat úrovně exprese tisíců genů v rámci mnoha ošetření nebo experimentálních podmínek, což výrazně usnadňuje evoluční studie genové regulace po genové duplikaci nebo speciaci. [33] [34]

Sekvenování příští generace Upravit

Duplikace genů lze také identifikovat pomocí sekvenčních platforem nové generace. Nejjednodušší způsob, jak identifikovat duplikace v genomických datech pro opětovné vyrovnání, je použití sekvenčních čtení se spárovaným koncem. Tandemové duplikace jsou indikovány sekvenováním přečtených párů, které mapují v abnormálních orientacích. Prostřednictvím kombinace zvýšeného pokrytí sekvence a abnormální orientace mapování je možné identifikovat duplikace v genomových sekvenčních datech.

Duplikace genů nemusí nutně představovat trvalou změnu v genomu druhu. Ve skutečnosti takové změny často netrvají za původním hostitelským organismem. Z hlediska molekulární genetiky je genová amplifikace jedním z mnoha způsobů, kterými lze gen nadměrně exprimovat. Genetická amplifikace může nastat uměle, jako při použití techniky polymerázové řetězové reakce k amplifikaci krátkých řetězců DNA in vitro pomocí enzymů, nebo se může vyskytovat přirozeně, jak je popsáno výše. Pokud se jedná o přirozenou duplikaci, může stále probíhat v somatické buňce, nikoli v zárodečné buňce (což by bylo nutné pro trvalou evoluční změnu).

Role v rakovině Upravit

Duplikace onkogenů jsou častou příčinou mnoha typů rakoviny. V takových případech dochází ke genetické duplikaci v somatické buňce a ovlivňuje pouze genom samotných rakovinných buněk, nikoli celý organismus, tím méně jakékoli následné potomstvo.


Obsah

Gen Vasa je členem DEAD box rodiny RNA helikáz v Drosophila melanogaster. [1] Jeho lidský ortolog, Ddx4, se nachází na lidském chromozomu 5q. Je syntenický pro myší chromozom 13, kde se nachází gen myší vasy. [2] Gen je konzervován u mnoha bezobratlých a druhů obratlovců, jako je např C. elegans, Xenopus„Zebrafish, ploštěnci, ostnokožci, měkkýši, hlístice, myši a krysy jako důležitá součást udržování a funkce zárodečné linie. [2] [3]

Všechny druhy obratlovců a Drosophila mít pouze jeden ortolog vasa. C. elegans však má čtyři geny Vasa, z nichž pouze jeden (GLH-1) je nezbytný. [4] [5]

Všechny DEAD boxové geny, včetně Vasa, mají 9 konzervovaných sekvenčních motivů. [6] Genová rodina Vasa se vyvinula z duplikace, po které následovalo získání určitých domén. [7] Na počátku evoluce mnohobuněčných zvířat došlo k duplikaci genu DEAD-box souvisejícího s PL10. [8] Výsledkem byla zvířata s geny Vasa i PL10, ale rostliny a houby mají pouze geny PL10 a žádnou Vasa. [7] Po duplikaci získala N-koncová oblast domény Zn-koleno, které jsou nyní konzervovány u bezobratlých. Obratlovci i hmyz ztratili domény Zn-koleno. Počet těchto domén se liší mezi různými druhy genů Vasa. Důležitou vlastností Zn-kloubů, které lze kategorizovat jako klasické zinkové prsty, [9] je to, že jsou schopné vázat se na jednovláknovou a dvouvláknovou DNA nebo RNA. [10] Přítomnost Zn-kloubů u bezobratlých a absence u obratlovců může být indikací rozdílů v cílových vazebných místech. Jejich přítomnost může být důležitá pro funkce mimo vývoj zárodečné linie. Výjimkou z této teorie je přítomnost kloubů Zn ve všech čtyřech genech Vasa C. elegans, které jsou omezeny na funkce v zárodečné linii. [11]

Proteinový produkt u lidí má 724 aminokyselin, molekulovou hmotnost 79 kDa a 8 konzervovaných domén ve všech proteinech DEAD-box, které se podílejí na aktivitě RNA helikázy. Doména V obsahuje motiv DEAD. [12] Stejně jako u jiných proteinů souvisejících s Vasa má lidská Vasa N -konec bohatý na glycin a opakuje se motiv RGG, který funguje při vazbě RNA. [13]

Vasa je regulována na úrovni transkriptu a bílkovin. Vyvíjející se embrya a dospělí regulují expresi Vasa na místa specifická pro buňky a tkáně. U Drosophily dochází k zygotické transkripci Vasa na pólových buňkách a zůstává zárodečná linie specifická po celý život organismu. [14]

Vasa promotor je regulován methylací. V buňkách, kde byla Vasa úspěšně přepsána, je promotor hypomethylován a ve všech ostatních buňkách je methylován. [14] Když je Vasa ve varlatech hypermethylovaná, mohou nastat defekty spermatogeneze. [15]

Post-transkripčně má Vasa několik spojovacích forem u různých zvířat. [16] [17] U P. hawaiensis je transkript Vasa rovnoměrně distribuován v embryu a je lokalizován v závislosti na stabilizaci 3'UTR (netranslatovaná oblast na buňky zárodečné linie. [18] Translaci lze inhibovat cis regulační prvky v 5 'a 3' UTR transkriptu. Mohou inhibovat translaci vytvářením sekundárních struktur RNA nebo vazebných trans-působících faktorů. Lokalizace exprese Vasa je řízena represí těchto translačních inhibičních cest. [19]

Post-translationally, in DrosophilaProtein Vasa je během embryonálního vývoje lokalizován do pólového plazmatu. Mnoho dalších proteinů v Drosophila jsou také lokalizovány na pólech. Například bylo zjištěno, že protein Oskar se lokalizuje do pólového plazmatu a může se podílet na ukotvení Vasa k polárním granulím v zadním pólu oocytu. [20] Další enzym, tukové fasety, může dále stabilizovat Vasu v pólovém plazmatu. [21] Další posttranslační modifikace zahrnuje fosforylaci ortologu Vasa v C. elegans, [22] a metylace argininu v konzervované oblasti myší, Xenopus a Drosophila Vasa geny. [23]

Jednou z hlavních funkcí proteinu Vasa je stanovení a funkce zárodečných buněk. [2] K regulaci translace více mRNA využívá katalytickou aktivitu RNA helikázy závislou na ATP. [24] Vasa odvíjí duplexní RNA vazbou a ohýbáním krátkých úseků duplexu neprocesním způsobem. [25] [26] Konzervovaná doména může fungovat jako chaperony odvíjením sekundárních struktur RNA a správným přebalováním. [27] sestřih pre-mRNA, ribozomální biogeneze, jaderný export, translační regulace a degradace. [6]

Bylo zjištěno, že vaza váže RNA sekvenčně specifickým způsobem. V embryích Drosophila váže Vasa motiv Uracil bohatý na UTR mei-P26. Mutace ve Vasa snížila interakci mezi Mei-P26 a iniciačním faktorem elF58, což zase významně snížilo translaci genu. [28]

Nedávné důkazy u bezobratlých zjistily, že Vasa hraje roli v multipotentních kmenových buňkách, ale přesná funkce není známa. [3]

Mutace Upravit

Drosophila Upravit

Nulová mutace způsobuje sterilitu žen v důsledku závažných defektů oogeneze [29], ale muži jsou plodní.

Homozygotní mutace pro částečnou ztrátu funkce umožňuje oplodnění vajíček, ale embryím chybí zárodečné buňky. [8]

Mus musculus Upravit

Mutace v homologu Vasa, Mvh, způsobují defekty spermatogeneze, ale ženy jsou plodné. Samčí sterilita může být způsobena nedostatky v proliferaci a diferenciaci zárodečných buněk (myší homolog Droso.).Plodnost žen může být způsobena funkční nadbytečností jiných členů rodiny DEAD-box. Nulová mutace stále umožňuje vznik primordiálních zárodečných buněk, ale mají závažné defekty. [30]

Homo sapiens Upravit

Ačkoli nebyly provedeny žádné studie mutací Vasa u lidí, je pravděpodobné, že by to způsobilo sterilitu. [2]

Tyto pohlavně specifické fenotypy u myší a Drosophila mutanti naznačují, že Vasa buď reguloval odlišně, nebo má různé cílové funkce ve dvou typech zárodečných linií. [3]

Exprese Vasa je omezena na tkáňově specifické buňky. Až donedávna se mělo za to, že protein Vasa lze nalézt pouze v gametách a je nedetekovatelný v somatických buňkách. [2] V zárodečných buňkách je Vasa exprimována v cytoplazmě. Během embryogeneze je Vasa exprimována v migračních primordiálních zárodečných buňkách (PGC) na gonadálním hřbetu u mužů i žen. Tato specifičnost umožňuje použití Vasy jako vysoce specifického markeru pro zárodečné buňky. [2] U pacienta se syndromem Sertoliho buněk nebyl z testikulární biopsie detekován žádný signál Vasa. [2] Nedávné studie však ukazují, že Vasa funguje i v jiných buňkách. [3]

Studie na Macrostomum lignano našel kromě zárodečných buněk expresi Vasa v multipotentních neoblastních kmenových buňkách. [16] RNAi knockdown odhalil, že buď Vasa není v tomto organismu nezbytná, nebo je funkčně nadbytečná jinými geny podobnými Vasa. Podobné výsledky byly nalezeny ve studiích koloniálního ascidika Botryllus primigenus, [31] ústřice, [32] teleosty, [33] dráp žába, [34] parazitická vosa, [35] a korýš Parhyale hawaiensis. [18]

Exprese Vasa byla pozorována v epiteliálních buňkách rakoviny vaječníků. Bylo zjištěno, že odradí kontrolní bod G2 indukovaný poškozením DNA snížením regulace exprese jiného genu. [36] Vasa je také přítomen v kuřecích embryonálních kmenových buňkách, kde indukuje expresi genů zárodečné linie. Tato funkce stále podporuje nejdůležitější roli Vasy ve vývoji zárodečných linií. [37] U Cnidariánů má Vasa roli v nervových buňkách a buňkách žláz. [38] Mezi další příklady patří Vasa v klastru multipotentních kmenových buněk Polyascus polygenea pupeny a stolon, [39] Vasa v pomocných buňkách vaječníků ústřic, [40] Vasa v liniích nezárodečných linií v hlemýždi Ilyanassa, [41] Vasa v předkové mezodermální zadní růstové zóně polychaete annelid Platynereis dumerilii, [17] a Vasa přítomní v negenetických segmentech během vývoje Oligochaete. [42] Ale žádné zprávy o vase exprimované mimo buňky zárodečných linií u obratlovců nebo hmyzu. [3]

v Drosophila, vasa exprese je pozorována v zárodečných buňkách, konkrétně v zárodečných kmenových buňkách (GSC) ženských vaječníků a v raných stádiích spermatogeneze v mužských varlatech.

Barvení Upravit

Vzhledem k lokalizaci vasa, imunohistochemické barvení lze provést pomocí protilátek vasa. Například, vasa barvení protilátek je specifické pro zárodečné kmenové buňky v D. melanogaster germarium.

Tento protein je lokalizován v cytoplazmě zárodečných buněk plodu a v cytoplazmě vyvíjejících se oocytů u savců.


Metody

Sekvenování genomu a anotace.

Kompletní sekvence genomu P. fluorescens Pf-5 byl stanoven pomocí metody 41 genomové brokovnice. Fyzické a sekvenční mezery se uzavřely kombinací procházení primerem, generování a sekvenování knihoven transpozonem značených klonů velkých inzertů a multiplexní PCR 42. Identifikace domnělých genů kódujících protein a anotace genomu byla provedena, jak bylo popsáno výše 43. Počáteční sada ORF, u nichž se předpokládalo, že kódují proteiny, byla identifikována pomocí GLIMMER 44. ORF sestávající z méně než 30 kodonů a těch, které obsahují přesahy, byly odstraněny. Posuny rámců a bodové mutace byly opraveny nebo označeny jako „autentické“. Funkční přiřazení, identifikace membránových domén, stanovení paralogových genových rodin a identifikace oblastí neobvyklého nukleotidového složení byly provedeny, jak bylo popsáno výše 43. Sekvenční zarovnání a fylogenetické stromy byly generovány pomocí metod popsaných dříve 43.

Trinukleotidová kompozice.

Byla stanovena distribuce všech 64 trinukleotidů (3 mery) a byla vypočtena 3-merová distribuce v oknech o velikosti 2 000 bp, které se překrývaly o polovinu své délky (1 000 bp) napříč genomem. Pro každé okno jsme vypočetli statistiku χ 2 na rozdílu mezi jeho obsahem 3-meru a obsahem celého chromozomu. Velká hodnota pro χ 2 naznačuje, že 3-merní složení v tomto okně se liší od zbytku chromozomu. Hodnoty pravděpodobnosti pro tuto analýzu jsou založeny na předpokladech, že složení DNA je v celém genomu relativně jednotné a že 3-merní složení je nezávislé. Protože tyto předpoklady mohou být nesprávné, dáváme přednost interpretaci vysokých hodnot χ 2 jako indikátorů oblastí na chromozomu, které vypadají neobvykle a vyžadují další zkoumání.

Srovnávací genomika.

The P. fluorescens Pf-5 a další sekvenovány Pseudomonas genomy byly porovnány na úrovni nukleotidů analýzou stromu přípon pomocí MUMmer 45. P. fluorescens ORF Pf-5 byly porovnány pomocí BLAST s kompletní sadou ORF z Pseudomonas genomy využívající mezní hodnotu E 10–5.

Přistoupení k GenBank.

Kompletní komentovaná sekvence genomu je k dispozici pod přístupovým číslem GenBank CP000076.


Podívejte se na video: МОЧЕПОЛОВАЯ СИСТЕМА, почки - массаж точек на ногах. Му Юйчунь. (Listopad 2021).