Informace

Co generuje rozdíly v druhu?


Jaký je biologický mechanismus změn v sexuálně se množících druzích? Je zřejmé, že děti jsou v různé míře kombinací svých rodičů. Jak ale variace začíná u rodičů?

Nemám na mysli evoluci nebo mutace, spíše mám na mysli věci jako struktura obličeje a osobnost lidí nebo barvení srsti u psů. Jen jsem si myslel, že jsem si matně pamatoval, že existuje nějaký druh variace ... Produkuje rodič například různé zárodečné buňky, které se záměrně liší od genomu rodiče?

Jen si myslím, že mi tu něco chybí.

(Jsem obeznámen s DNA a genetikou, které jsem absolvoval na univerzitě na hodině biologie a hodně si toho pamatuji, ale zdá se, že na to nemohu dát prst ...)


Po mutacích, které jsou pravděpodobně zdrojem většiny variací. Klasický biologický model variace pochází z historických a environmentálních nehod.

Mnoho mutací časem zmizí, protože nejsou užitečné (výhodné). Rozdíly přetrvávají více než několik generací v tom, že nám naše rozdíly pomohly žít úspěšný život a (v biologickém smyslu úspěchu) mít potomky. V Evropě je gen laktátdehydrogenázy a další jemu podobné, které pomáhají lidem trávit mléko, aktivní po celý dospělý život v důsledku domestikace zvířat produkujících mléko, v Asii je tento znak vzácnější nebo neexistuje, protože zemědělství tam mléko nevytváří (ve většině případy).

To je velký rozdíl, ale platí to v menší míře pro všechny naše individuální rysy, nebo alespoň teorie jde. Jednotlivé rodinné vlastnosti pomáhají vytvářet silnější rodinná pouta, takže i něco jako výrazné důlky nebo čelo mají nárok být výhodnou vlastností. Je možné, že blond vlasy jsou produktem takové výhody - je to silný signál otcovství, pokud je otec například blonďatý.

Další odpověď na vaši otázku je, že pravděpodobně existují mechanismy v buňce nebo při výběru partnera, které zvyšují nebo snižují variace v komunitě v daných dobách stresu. Například hadi patří mezi zvířata, která mají zvláštní schopnost výběru pohlaví v závislosti na podmínkách, které žena zažívá. více mužů může zvýšit variabilitu v komunitě - méně mužů a více žen ji sníží. (ne moc, ale trochu).

Další odpověď přidaná podle požadavku:

Chápu, o co vám jde - proč děti někdy vypadají jako takové individuální a jedinečné věci?

Při sexuální reprodukci jsou potomci produktem míchání genomů rodičů prostřednictvím meiózy, kde se páry chromozomů, které máme, spojí a vytvoří jeden chromozom, který bude polovinou dětského genomu.

Tento proces může vyústit ve zcela nové kombinace genů při přenosu mnoha podob od rodiče. Domnívám se, že toto je hlavní příčina jedinečnosti potomků/dětí.

Také u savců existují některé buněčné linie, které spojují rodiny genů, což způsobí, že potomci budou potenciálně zcela odlišní od obou rodičů. Imunitní geny jsou například vytvářeny od nuly ze spousty genů, které dávají rodiče. Dělat každého potomka jedinečným, ale také produktem genetického repertoáru rodičů. To může být významné, protože to ovlivňuje zdraví a také do určité míry přitažlivost - studie ukázaly, že lidé, kteří pro nás mají atraktivní vůni, jsou od nás imunologicky odlišní.

@David zmiňuje epigenetické variace, což je novější významný vývoj. Během našeho života může být DNA zárodečné linie (spermie/vajíčko) chemicky označena v závislosti na podmínkách prostředí, se kterými se setkáváme. Slavným příkladem je prožívání hladomorových podmínek, které způsobily, že se děti mimo jiné narodily na malé straně. Novější studie ukázaly, že se jedná o rozšířený mechanismus pro ovládání buněk v našem těle během našeho života a také pro komunikaci s našimi potomky o tom, jaký je život. Očekává se, že nás toto označení navždy neovlivní - epigenetické štítky se v průběhu generace poměrně často mění (věříme).


Jaké 3 události v meióze přispívají ke genetické variabilitě?

Otázkou také je, jaké události v meióze přispívají ke genetické variabilitě?

Přejezd během profáze redukční dělení buněk Já, dvojité chromatidové homologní páry chromozomů se navzájem kříží a často si vyměňují chromozomální segmenty. Tato rekombinace vytvoří genetická rozmanitost povolením geny od každého rodiče po smísení, což má za následek chromozomy s jiným genetický doplněk.

Kromě toho, jaké jsou 3 typy genetických variací? Existují tři zdroje genetické variace: mutace, tok genůa sexuální reprodukci. A mutace je prostě změna v DNA. Mutace samy o sobě nejsou příliš časté a jsou obvykle škodlivé pro populaci. Z tohoto důvodu jsou mutace obvykle vybírány proti evolučním procesům.

Podobně se lidé ptají, jakými třemi způsoby vede meióza ke genetické variabilitě?

Zbývají nám čtyři haploidní buňky, z nichž každá je geneticky odlišná od sebe navzájem i od rodičovské buňky. 8. Popište tři způsoby meiózy produkuje genetická variabilita. Viděli jsme to meióza vytváří variace třemi způsoby: přechod, mutace způsobené během přechodu a nezávislý sortiment.


Brent Cornell

Existují tři hlavní mechanismy, kterými mohou nastat genetické rozdíly mezi jednotlivci v druhu:

  • Mutace - Změna genetického složení gamet (zárodečná mutace) vede ke změně charakteristik u potomků
  • Redukční dělení buněk - buď křížením (profáze I) nebo nezávislým sortimentem (metafáze I)
  • Sexuální reprodukce - Kombinace genetického materiálu ze dvou odlišných zdrojů vytváří nové genové kombinace u potomků

A genová mutace je změna v nukleotidové sekvenci části DNA kódující specifický znak

Genové mutace mohou být prospěšné, škodlivé nebo neutrální

  • Prospěšné mutace mění genovou sekvenci (missense mutace) k vytvoření nových variací vlastnosti
  • Detrimentální mutace zkracují genovou sekvenci (nesmyslné mutace) zrušit normální funkci rysu
  • Neutrální mutace nemají žádný vliv na fungování specifické funkce (tiché mutace)

Variace prostřednictvím mutace

Meióza podporuje variace vytvářením nových genových kombinací buď křížením, nebo nezávislým sortimentem

1. Překračující

Přechod zahrnuje výměnu segmentů DNA mezi homologními chromozomy během profázy I

  • K výměně genetického materiálu dochází mezi nesesterské chromatidy ve zvaných bodech chiasmata

V důsledku této rekombinace budou všechny čtyři chromatidy, které obsahují bivalent, geneticky odlišné

  • Nazývají se chromatidy, které se skládají z kombinace DNA odvozené z obou homologních chromozomů rekombinantů
  • Potomstvo s rekombinantními chromozomy bude mít jedinečné genové kombinace, které nejsou přítomny v žádném z rodičů

2. Nezávislý sortiment

Když se homologní chromozomy seřadí v metafázi I, jejich orientace vůči opačným pólům je náhodný

Nastává orientace každého bivalentu nezávisle, což znamená, že různé kombinace mateřských / otcovských chromozomů lze zdědit, když se bivalenty oddělí v anafázi I

  • Celkový počet kombinací, které se mohou vyskytnout v gametech, je 2 n - kde n = haploidní počet chromozomů
  • Lidé mají 46 chromozomů (n = 23), a tak mohou náhodnou orientací produkovat 8 388 608 různých gamet (2 23)
  • Pokud také dojde k přechodu, počet různých kombinací gamet se stane nezměrným


Sexuální reprodukce

Fúze dvou haploidních gamet má za následek vznik diploidní zygoty

Protože meióza vede ke geneticky odlišným gametám, náhodné oplodnění vajíčkem a spermatem vždy vytvoří různé zygoty


Fáze meiózy u lidí

Replikace DNA v přípravě na meiózu. Po replikaci se každý chromozom stane strukturou obsahující 2 identické chromatidy.

Chromozomy kondenzují do viditelných struktur ve tvaru X, které lze snadno vidět pod mikroskopem, a homologní chromozomy se spárují. K rekombinaci dochází, když si homologní chromozomy vyměňují DNA. Na konci této fáze se jaderná membrána rozpustí.

Spárované chromozomy se seřadí podél středu buňky.

Dvojice chromozomů se oddělí a přesunou se k protilehlým pólům. Každý z dvojice může jít na kterýkoli pól.

Reforma jaderných membrán. Buněčné dělení a 2 dceřiné buňky jsou vytvořeny, každý s 23 chromozomy.

Nyní jsou zde 2 buňky. DNA se znovu nereplikuje.

Jednotlivé chromozomy se řadí do středu buňky.

Kopie chromozomů (chromatidy) se oddělí a přesunou se k opačným pólům.

Reforma jaderných membrán. K dispozici jsou 4 nové haploidní dceřiné buňky. U mužů se produkují 4 spermie. U žen se produkuje 1 vaječná buňka a 3 polární těla. Polární těla nefungují jako pohlavní buňky.


Analýzy

Jednosměrné analýzy a fylogenetický signál

Protože blízce příbuzné druhy budou mít pravděpodobně podobné hodnoty vlastností X, hodnoty ε budou korelovány mezi druhy. Předpokládáme tedy, že kovarianční matice pro ε je dána E <εε'>= σ 2 C, kde σ 2 škáluje celkový fylogeneticky zděděný rozptyl (někdy označovaný jako rychlost evoluce Garland et al., 1999 Garland a Ives, 2000), a C udává korelační strukturu vytvořenou fylogenetickou příbuzností. Nejběžnějším předpokladem ve fylogenetických analýzách je, že evoluce probíhá jako proces „Brownova pohybu“ v čase, hodnota znaku se mění v malých přírůstcích v náhodných směrech, jako náhodná procházka v nepřetržitém čase (Felsenstein, 1985). Za tohoto předpokladu ε má vícerozměrné normální rozdělení, ve kterém prvek Cij z C je úměrná délce sdílených větví, od kořene po posledního společného předka, mezi druhy a j (Felsenstein, 1985 Hansen a Martins, 1996 Martins a Hansen, 1997 Garland a Ives, 2000). Možné jsou i jiné modely evoluční změny, například zahrnutí nefylogenetické složky evoluční změny (Lynch, 1991 Freckleton et al., 2002 Housworth et al., 2004) nebo za předpokladu, že se evoluce řídí Ornstein-Uhlenbeckovým procesem (Hansen a Martins, 1996 Blomberg et al., 2003) každý z nich povede k jinému překladu délek větví do kovarianční matice C, ale model daný rovnicí 1 lze použít bez ohledu na to, jak C je vybráno.

Termín chyby měření η podobně má kovarianční matici σm 2 M. Pokud chyby měření mezi druhy nekorelovaly, M je diagonální matice a rozptyl způsobený chybou měření znaku x pro druhy je σm 2 mii, kde mii je diagonální prvek M. Je možné, že chyby měření korelují mezi druhy, což by mohlo být případ, kdyby hodnoty vlastností pro danou kladu byly všechny měřeny jediným výzkumníkem pomocí stejné techniky, která se lišila od technik používaných pro jiné clades. V tomto případě může být korelace mezi chybami měření začleněna do off-diagonálních prvků M. Ačkoli nepovažujeme podrobně korelované chyby měření, nenulové prvky mimo diagonály M lze použít ve všech metodách, které odvozujeme. Nakonec, i když to obvykle předpokládáme ε a η mají pro více níže popsaných statistických postupů vícerozměrné normální rozdělení, ε a η nemusí být omezeny na běžnou distribuci.

Problém odhadu představený rovnicí 5 je ve statistické literatuře označován jako problém „chyby měření známý“ (Fuller, 1987), protože předpokládáme, že σm 2 byl odhadnut nezávisle (jak uvádí standardní chyby průměrných hodnot pro druhy). U nefylogenetických analýz jsou opravné kroky pro známou chybu měření poměrně jednoduché (Fuller, 1987). Bohužel tyto nápravné kroky nelze použít, pokud existuje fylogenetická korelace (jak nesprávně provedli Irschick et al., 1996), a jsou zapotřebí metody, které uvádíme níže. Jiné problémy s chybami měření lze však vyřešit poměrně jednoduše, pokud existuje fylogenetická korelace (C). Konkrétně pokud místo znalosti odchylky chyby měření σm 2 známe poměr rozptylu chyby měření ke skutečné odchylce σm 2 /σ 2, je možné vypočítat fylogenetický průměr nahrazením C v rovnici 3 s Ψ = C + (σm 2 /σ 2) M a ošetřit problém obvyklým způsobem GLS nebo nezávislými kontrasty. Protože tento jednoduchý případ byl řešen jinde (Pagel a Harvey, 1988a, 1988b Harvey a Pagel, 1991), nepovažujeme jej dále.

Odhad

V rovnici 5 nejsou známy dva parametry: střední hodnota A znaku x pro všechny druhy (nebo, ekvivalentně, hypotetickou rodovou hodnotu na bázi stromu) a fylogenetický rozptyl σ 2 (nebo, ekvivalentně, rychlost evoluce). Tyto parametry lze odhadnout pomocí iterované verze odhadovaných generalizovaných nejmenších čtverců (EGLS), maximální pravděpodobnosti (ML) a omezené maximální pravděpodobnosti (REML). K získání odhadů ML a REML je nutné určit formu rozdělení chybových termínů ε a η přirozený předpoklad, a ten, který zde používáme, je ten ε a η jsou běžně distribuovány. Protože kovarianční matice Ψ obsahuje parametr σ 2, který je nutno odhadnout, jsou pro všechny tři metody vypočtené intervaly spolehlivosti aproximace. Všimněte si, že potíže s odhadem, když je chyba měření, zmizí, když neexistuje chyba měření, v takovém případě jsou odhady GLS a ML stejné a za předpokladu, že ε je normálně rozloženo, jsou odhady t-distribuováno.

Dodatek 1 poskytuje úplný popis těchto metod, jak jsou použity v tomto článku. Rovněž univariační odhad EGLS lze implementovat pomocí nezávislých kontrastů, jak se to dělá v programu MS DOS PD_SE.EXE (k dispozici od TG) a používají Bonine et al. (2005).

Příklad

Jako příklad jsme analyzovali data od Martins a Lamont (1998) o délce zobrazení pro devět druhů ještěrek. Vybrali jsme si tento příklad, protože se jedná o skutečný soubor srovnávacích dat, je dostatečně malý na to, aby graficky znázorňoval naše výsledky, a má u některých druhů dostatečně velké standardní chyby, takže účinky začlenění chyby měření jsou jasně patrné. Pro každý druh poskytují Martins a Lamont (1998) standardní chybu míry znaku, kterou používáme k výpočtu matice σm 2 M za předpokladu, že měření jsou mezi druhy nezávislá. Pro srovnání jsme vypočítali odhady parametrů za předpokladu (i) žádné fylogenetické korelace mezi druhy (C = ekvivalentní předpokladu „hvězdné fylogeneze“) a bez chyby měření (M = 0), pro které je odhad A je jednoduše průměr vzorku (ii) žádná fylogenetická korelace, ale chyba měření, přičemž rozptyl chyby měření se mezi body (druhy) liší (iii) fylogenetická korelace (použití jako „skutečný“ strom, obr. 1a) a žádná chyba měření, která poskytuje standardní fylogenetický případ analyzovaný nezávislými kontrasty nebo GLS a (iv) fylogenetickou korelací a chybou měření. Pro každý soubor předpokladů jsme pomocí tří přístupů vypočítali 95% intervaly spolehlivosti odhadů. Nejprve jsme pro EGLS použili standardní vzorce GLS, přičemž jsme ignorovali, že jsme odhadli parametr v kovarianční matici Ψ a nejistotu spojenou s tímto odhadem (Neter et al., 1989). Za druhé, pro ML jsme odvozili přibližné intervaly spolehlivosti z funkce log-pravděpodobnosti (Judge et al., 1985), toto je standardní postup používaný při odhadu ML. Za třetí, pro všechny tři metody odhadu jsme použili parametrický bootstrapping za předpokladu, že jsou normálně distribuovány jak měření, tak skutečné chyby. Parametrický bootstrapping (Efron a Tibshirani, 1993) je simulační postup, při kterém se nejprve odhadnou parametry (jakoukoli metodou se používá), ke simulaci datových sad se použije statistický model s jeho odhadovanými parametry a parametry se odhadnou ze simulovaného data. Po mnohonásobném opakování (např. 2 000) se výsledná sada odhadů přiblíží distribuci odhadce (podrobnosti viz Příloha 1). Pojem „parametrický bootstrapping“ je potenciálně matoucí, protože na rozdíl od standardního (neparametrického) bootstrapingu nejsou zbytky získané ze skutečných dat převzorkovány k vytvoření nových datových sad, ale jsou místo toho simulovány. Parametrický bootstrapping je v našem případě nezbytný, protože neznáme skutečná měření pro každý vzorek použitý k udávání hodnot druhů, proto je třeba chybu měření simulovat z generátoru náhodných čísel. Ačkoli může být méně matoucí odkazovat na parametrický bootstrapping jednodušeji jako „simulaci“ pro získání intervalů spolehlivosti, pak to zavádí zmatek, když provádíme simulace za účelem prozkoumání statistických vlastností metod odhadu. Zvláštní výhodou parametrického bootstrapingu je, že nejenže poskytuje intervaly spolehlivosti, ale také identifikuje zkreslení, pokud je například průměr odhadů bootstrapu nižší než skutečný odhad, pak to identifikuje, že odhad je směrem dolů zaujatý.

Pro univariační případ využívající data od Martins a Lamont (1998) lze efekty chyby měření vizualizovat vytvořením stromu, který odpovídá kovarianční struktuře dat kombinujících jak fylogenetickou kovarianci, tak rozptyl chyb měření (viz text). Rozptyl chyby měření prodlužuje segmenty koncových větví stromu, přičemž délka prodloužení hrotu dává rozptyl chyby měření ve vztahu k rozptylu evolučního procesu.(a) Fylogenetický strom, ze kterého je kovarianční matice σ 2 C se počítá. (b) Fylogenetický strom s rozptylem spojeným s chybou měření pro celkovou dobu zobrazení graficky znázorněný na špičkách stromu, čímž poskytuje grafické znázornění kovarianční matice σ 2 C + σm 2 M. Pro srovnání (c) je jako (b), ale s chybou měření pro jiný znak, trvání headbobu. Zvýšením očekávaných vnitrodruhových odchylek beze změny mezidruhových kovariancí chyba měření snižuje mezidruhové korelace v pozorovaných datech. Tabulka uvádí hodnoty vlastností a standardní chyby měření pro vlastnosti a odhady fylogenetického průměru A jsou uvedeny pro každý strom.

Pro univariační případ využívající data od Martins a Lamont (1998) lze efekty chyby měření vizualizovat vytvořením stromu, který odpovídá kovarianční struktuře dat kombinujících jak fylogenetickou kovarianci, tak rozptyl chyb měření (viz text). Rozptyl chyby měření prodlužuje segmenty koncových větví stromu, přičemž délka prodloužení hrotu dává rozptyl chyby měření ve vztahu k rozptylu evolučního procesu. (a) Fylogenetický strom, ze kterého je kovarianční matice σ 2 C se počítá. (b) Fylogenetický strom s rozptylem spojeným s chybou měření pro celkovou dobu zobrazení graficky znázorněný na špičkách stromu, čímž poskytuje grafické znázornění kovarianční matice σ 2 C + σm 2 M. Pro srovnání (c) je jako (b), ale s chybou měření pro jiný znak, trvání headbobu. Zvýšením očekávaných vnitrodruhových odchylek beze změny mezidruhových kovariancí chyba měření snižuje mezidruhové korelace v pozorovaných datech. Tabulka uvádí hodnoty vlastností a standardní chyby měření pro vlastnosti a odhady fylogenetického průměru A jsou uvedeny pro každý strom.

Všechny tři metody odhadu zahrnující chybu měření poskytly podobné odhady A a σ 2, pokud nebyla zahrnuta fylogenetická korelace (tj. C = , případ ii). Když však předpokládáme vývoj Brownova pohybu podél skutečné fylogeneze (tj. C, případ iv), ML odhady obou parametrů A a σ 2 se výrazně lišily od odhadů získaných z EGLS a REML (tabulka 1). Odhad ML σ 2 se zdá být silně zkreslený směrem dolů ML odhad σ 2 je 0,049 a průměr odhadovaného bootstrapu je 0,032. Předpojatost odhadů rozptylů ML je běžným pozorováním, které se vyskytuje u mnoha typů statistických problémů, a relativní nedostatek předpojatosti odhadů REML je častým důvodem pro upřednostňování REML před ML (Patterson a Thompson, 1971 Cooper a Thompson, 1977 Smyth a Verbyla , 1996). V tomto konkrétním případě bohužel neexistuje dobrý způsob, jak a priori předpovědět velikost předpojatosti, silné zkreslení v ML odhadce se objevilo pouze v případech, kdy byla začleněna fylogenetická korelace.

Parametrické odhady fylogenetického průměru A a rozptyl σ 2 a míra fylogenetického signálu K* pro údaje o celkové délce zobrazení devíti druhů leguánů (od Martins a Lamont, 1998: obr. 1).

Fylogeneze. Metoda. Fylogenetický průměr A . Odhad bootstrapu. σ 2. Odhad bootstrapu. K* .
(hvězda) AGLS C (ne já.) 2.82 1 (2.08, 3.56) 2.83 (2.22, 3.46) 4 0.93 (0.22, 1.81) 0.94 (0.25, 2.05) 4
VEJCE d2.95 (2.32, 3.57) 2 2.95 (2.41, 3.47) 0.29 (0.070, 0.57) 2 0.30 (0, 1.12)
ML E2.95 (2.40, 3.50) 3 2.96 (2.48, 3.43) 0.22 (0, 0.75) 3 0.19 (0, 0.80)
REML F2.94 2.95 (2.42, 3.46) 0.28 0.29 (0, 1.04) 3
C (skutečný) bGLS (bez názvu) 2.52 1 (0.10, 4.94) 2.53 (0.49, 4.63) 1.92 (0.46, 3.74) 1.91 (0.52, 4.17) 0.32 (P <0,05) 5
VEJCE 2.76 (1.61, 3.91) 2 2.77 (1.73, 3.74) 0.35 (0.084, 0.68) 0.40 (0, 1.77) 0.53 (P > 0,4)
ML 2.94 (2.16, 3.72) 2.93 (2.44, 3.41) 0.049 (0, 0.44) 0.032 (0, 0.20) 4.5 (P > 0,5)
REML 2.76 2.75 (1.80, 3.72) 0.32 0.32 (0, 1.10) 0.57 (P > 0,4)
Fylogeneze. Metoda. Fylogenetický průměr A . Odhad bootstrapu. σ 2. Odhad bootstrapu. K* .
(hvězda) AGLS C (ne já.) 2.82 1 (2.08, 3.56) 2.83 (2.22, 3.46) 4 0.93 (0.22, 1.81) 0.94 (0.25, 2.05) 4
VEJCE d2.95 (2.32, 3.57) 2 2.95 (2.41, 3.47) 0.29 (0.070, 0.57) 2 0.30 (0, 1.12)
ML E2.95 (2.40, 3.50) 3 2.96 (2.48, 3.43) 0.22 (0, 0.75) 3 0.19 (0, 0.80)
REML F2.94 2.95 (2.42, 3.46) 0.28 0.29 (0, 1.04) 3
C (skutečný) bGLS (bez názvu) 2.52 1 (0.10, 4.94) 2.53 (0.49, 4.63) 1.92 (0.46, 3.74) 1.91 (0.52, 4.17) 0.32 (P <0,05) 5
VEJCE 2.76 (1.61, 3.91) 2 2.77 (1.73, 3.74) 0.35 (0.084, 0.68) 0.40 (0, 1.77) 0.53 (P > 0,4)
ML 2.94 (2.16, 3.72) 2.93 (2.44, 3.41) 0.049 (0, 0.44) 0.032 (0, 0.20) 4.5 (P > 0,5)
REML 2.76 2.75 (1.80, 3.72) 0.32 0.32 (0, 1.10) 0.57 (P > 0,4)

Hvězdná fylogeneze za předpokladu, že kovarianční matice kovarianční matice bez fylogenetické příbuznosti je maticí identity .

Pravá fylogeneze s kovarianční maticí C.

Zobecněné nejmenší čtverce za předpokladu žádné chyby měření.

Odhad zobecněných nejmenších čtverců zahrnujících chybu měření.

Maximální pravděpodobnost zahrnující chybu měření.

Omezená maximální pravděpodobnost zahrnující chybu měření.

Implementováno také v programu MS DOS PD_SE.EXE, jak je používán v Bonine et al. (2005).

Přibližný 95% interval spolehlivosti získaný z GLS.

Přibližný 95% interval spolehlivosti získaný z ML.

Přibližný 95% interval spolehlivosti získaný parametrickým bootstrappingem.

Pravděpodobnost odmítnutí nulové hypotézy, že K* rovná se 1 (vývoj Brownova pohybu podél specifikované fylogeneze).

Parametrické odhady fylogenetického průměru A a rozptyl σ 2 a míra fylogenetického signálu K* pro údaje o celkové délce zobrazení devíti druhů leguánů (od Martins a Lamont, 1998: obr. 1).

Fylogeneze. Metoda. Fylogenetický průměr A . Odhad bootstrapu. σ 2. Odhad bootstrapu. K* .
(hvězda) AGLS C (ne já.) 2.82 1 (2.08, 3.56) 2.83 (2.22, 3.46) 4 0.93 (0.22, 1.81) 0.94 (0.25, 2.05) 4
VEJCE d2.95 (2.32, 3.57) 2 2.95 (2.41, 3.47) 0.29 (0.070, 0.57) 2 0.30 (0, 1.12)
ML E2.95 (2.40, 3.50) 3 2.96 (2.48, 3.43) 0.22 (0, 0.75) 3 0.19 (0, 0.80)
REML F2.94 2.95 (2.42, 3.46) 0.28 0.29 (0, 1.04) 3
C (skutečný) bGLS (bez názvu) 2.52 1 (0.10, 4.94) 2.53 (0.49, 4.63) 1.92 (0.46, 3.74) 1.91 (0.52, 4.17) 0.32 (P <0,05) 5
VEJCE 2.76 (1.61, 3.91) 2 2.77 (1.73, 3.74) 0.35 (0.084, 0.68) 0.40 (0, 1.77) 0.53 (P > 0,4)
ML 2.94 (2.16, 3.72) 2.93 (2.44, 3.41) 0.049 (0, 0.44) 0.032 (0, 0.20) 4.5 (P > 0,5)
REML 2.76 2.75 (1.80, 3.72) 0.32 0.32 (0, 1.10) 0.57 (P > 0,4)
Fylogeneze. Metoda. Fylogenetický průměr A . Odhad bootstrapu. σ 2. Odhad bootstrapu. K* .
(hvězda) AGLS C (ne já.) 2.82 1 (2.08, 3.56) 2.83 (2.22, 3.46) 4 0.93 (0.22, 1.81) 0.94 (0.25, 2.05) 4
VEJCE d2.95 (2.32, 3.57) 2 2.95 (2.41, 3.47) 0.29 (0.070, 0.57) 2 0.30 (0, 1.12)
ML E2.95 (2.40, 3.50) 3 2.96 (2.48, 3.43) 0.22 (0, 0.75) 3 0.19 (0, 0.80)
REML F2.94 2.95 (2.42, 3.46) 0.28 0.29 (0, 1.04) 3
C (skutečný) bGLS (bez názvu) 2.52 1 (0.10, 4.94) 2.53 (0.49, 4.63) 1.92 (0.46, 3.74) 1.91 (0.52, 4.17) 0.32 (P <0,05) 5
VEJCE 2.76 (1.61, 3.91) 2 2.77 (1.73, 3.74) 0.35 (0.084, 0.68) 0.40 (0, 1.77) 0.53 (P > 0,4)
ML 2.94 (2.16, 3.72) 2.93 (2.44, 3.41) 0.049 (0, 0.44) 0.032 (0, 0.20) 4.5 (P > 0,5)
REML 2.76 2.75 (1.80, 3.72) 0.32 0.32 (0, 1.10) 0.57 (P > 0,4)

Hvězdná fylogeneze za předpokladu, že kovarianční matice kovarianční matice bez fylogenetické příbuznosti je maticí identity .

Pravá fylogeneze s kovarianční maticí C.

Zobecněné nejmenší čtverce za předpokladu žádné chyby měření.

Odhad zobecněných nejmenších čtverců zahrnujících chybu měření.

Maximální pravděpodobnost zahrnující chybu měření.

Omezená maximální pravděpodobnost zahrnující chybu měření.

Implementováno také v programu MS DOS PD_SE.EXE, jak je používán v Bonine et al. (2005).

Přibližný 95% interval spolehlivosti získaný z GLS.

Přibližný 95% interval spolehlivosti získaný z ML.

Přibližný 95% interval spolehlivosti získaný parametrickým bootstrappingem.

Pravděpodobnost odmítnutí nulové hypotézy, že K* rovná se 1 (vývoj Brownova pohybu podél specifikované fylogeneze).

Porovnání případů ii a iv, účtování chyb měření má za následek výrazně nižší odhady σ 2. K tomu dochází, protože část variability dat je přičítána chybě měření, takže mezi druhy zůstává méně skutečná variabilita. Účinky chyby měření lze vizualizovat sestrojením stromu, který poskytuje kovarianční strukturu dat kombinující jak fylogenetickou kovarianci, tak rozptyl chyb měření. To se provádí pomocí odhadů EGLS σ 2 na obrázku 1 pro celkovou dobu zobrazení a pro srovnání doba trvání headbobu (další příklad viz Bonine et al., 2005). Výsledkem chyby měření je prodloužení koncových větvových segmentů stromu nad rámec přísného fylogenetického stromu, přičemž délka prodloužení hrotu dává odchylku chyby měření. Zvýšením mezidruhových odchylek beze změny mezidruhových kovariancí chyba měření snižuje mezidruhové korelace v pozorovaných datech.

Účtování chyby měření zvýší odhady síly fylogenetického signálu v souborech dat. Blomberg a kol. (2003) odvodil opatření, K*o síle fylogenetického signálu. Měření K* závisí na poměru rychlosti evoluce (měřeno σ 2) potřebném k vysvětlení variability znaku mezi druhy za předpokladu žádné fylogenetické korelace (C = ) na rychlost vývoje požadovanou za předpokladu, že C je dána fungující fylogenezí. Tento poměr vypočítaný pro data je pak porovnán s teoretickým očekáváním poměru, který má dát K*. Hodnota K* = 1 znamená, že pozorovaný vzor kovariancí v datech je konzistentní s tím, který se očekává od pracovní fylogeneze (specifikované kovarianční maticí C), zatímco hodnoty K* méně než jedna naznačuje, že síla fylogenetické korelace je nižší, než se od fylogeneze očekávalo. Hodnoty K* méně než 1 znamená slabší fylogenetický signál. Pokud existuje chyba měření, K* by mělo být vypočítáno po odstranění rozptylu způsobeného chybou měření. Tím pádem, K* závisí na odhadovaném rozptylu σ 2 „skutečných“ hodnot X* spíše než rozptyl spojený s pozorovanými hodnotami X, což také závisí na σm 2 M. (Všimněte si, že Blomberg et al. [2003] také odvozují opatření K s čímž úzce souvisí K*. Z technických důvodů zde nebudeme diskutovat o problémech s chybami měření K* je vhodnějším měřítkem fylogenetického signálu. Viz také Rohlf, 2006.)

Odhad K* u doby zobrazení ještěrky je statisticky významně menší než 1, pokud se nepředpokládá žádná chyba měření (tabulka 1). Naproti tomu hodnota K* odhaduje se, zatímco účtování chyby měření se statisticky neliší od 1 (tabulka 1). Účtování chyby měření tedy odhaluje základní fylogenetický signál. Všimněte si, že ML odhad K* je větší než 1, i když je to způsobeno stejnou předpojatostí, která způsobila nízký ML odhad σ 2.

Simulace

Ve výše uvedeném příkladu neznáme ani skutečnou hodnotu A ani skutečná fylogenetická korelace, což znemožnilo studium statistických vlastností odhadů parametrů. Abychom prozkoumali tyto vlastnosti, simulovali jsme data pomocí fylogeneze od Martins a Lamont (1998 viz obr. 1). Předpokládali jsme, že se znak vyvíjí Brownovým pohybovým způsobem s σ 2 = 0,35 (odhad EGLS z dat pro celkovou dobu zobrazení). Abychom simulovali chybu měření, předpokládali jsme, že standardní odchylka měření u jednoho zvířete je dvojnásobkem hlášené standardní chyby celkové doby trvání, jak uvádí Martins a Lamont (1998). To dává vysokou chybu měření, a tudíž silný test metod odhadu zahrnující chybu měření. Abychom změnili chybu měření, předpokládali jsme, že data z n = 2 k (k = 0, 1,…, 6) jednotlivci byli získáni pro každý druh zvětšující velikost vzorku n snižuje chybu měření, protože standardní chyba chyby měření je úměrná 1/✓ n. Pro každý simulovaný soubor dat jsme vypočítali odhady A, σ 2, a míra fylogenetického signálu K*. Použili jsme pouze odhad EGLS Odhad REML poskytl podobné výsledky a odhad ML ukázal značnou předpojatost, zejména v odhadech K*.

Simulace ukazují, že účtování chyby měření má malý vliv na odhad A, i když se intervaly spolehlivosti snižují (obr. 2). Naproti tomu odhad σ 2 se výrazně zlepší, když je do analýzy začleněna chyba měření. Nicméně, když je chyba měření velká, ani účtování chyby měření nepřekoná zkreslení směrem nahoru v odhadu σ 2. Podobně, když je započítána chyba měření, odhad K* je méně zkreslený kolem své skutečné hodnoty 1 a má intervaly spolehlivosti, které jsou relativně necitlivé na sílu chyby měření. Naopak, když je chyba měření ignorována, odhady K* jsou výrazně nízké, pokud dojde k velké chybě měření. Měli bychom však zdůraznit, že chyba měření použitá v simulacích byla velmi vysoká s velikostí vzorku jedna, průměrná standardní chyba chyby měření byla 1,4, což je více než dvojnásobek standardní odchylky skutečné mezi druhy chyba, 0,59. Chyba měření uvedená Martinsem a Lamontem (1998) odpovídá velikosti našeho simulovaného vzorku 2 2 = 4 a zkreslení v σ 2 i K* výše je minimální pro metody odhadu zahrnující chybu měření.

Simulace univariačního případu za účelem poskytnutí odhadů (a) A, (b) σa (c) míra fylogenetického signálu K*. Plné čáry udávají odhady EGLS zahrnující chybu měření a odpovídající 95% mezí odhadu jsou dané stínovanou oblastí. Přerušované čáry udávají odhad a 95% mezí odhadu získaného bez účtování chyby měření (GLS). Předpokládáme fylogenezi s 9 hroty, kterou předložili Martins a Lamont (1998). Trait x se vyvíjí podle Brownova vývoje pohybu, s A = 0 a σ 2 = 0,35. Předpokládá se, že chyba měření pro měření na jednotlivých osobách má standardní chybu rovnající se 2násobku standardní chyby poskytnuté Martinsem a Lamontem (1998) pro celkovou dobu zobrazení. Pro každou velikost simulovaného vzorku n = 2 k (k = 0, 1,…, 6), bylo simulováno 2000 datových sad a byly vypočítány odhady pro každý parametr.

Simulace univariačního případu za účelem poskytnutí odhadů (a) A, (b) σa (c) míra fylogenetického signálu K*. Plné čáry udávají odhady EGLS zahrnující chybu měření a odpovídající 95% mezí odhadu jsou dané stínovanou oblastí. Přerušované čáry udávají odhad a 95% mezí odhadu získaného bez účtování chyby měření (GLS). Předpokládáme fylogenezi s 9 hroty, kterou předložili Martins a Lamont (1998). Trait x se vyvíjí v souladu s Brownovým pohybovým vývojem, s A = 0 a σ 2 = 0,35. Předpokládá se, že chyba měření pro měření na jednotlivých osobách má standardní chybu rovnající se 2násobku standardní chyby poskytnuté Martinsem a Lamontem (1998) pro celkovou dobu zobrazení. Pro každou velikost simulovaného vzorku n = 2 k (k = 0, 1,…, 6), bylo simulováno 2000 datových sad a byly vypočítány odhady pro každý parametr.

Korelace mezi rysy

Odhad

Pokud jsou k dispozici odhady pro standardní chyby hodnot zvláštností pro každý druh, tyto udávají hodnoty σmx 2 MX, σmůj 2 My, a rm & lt ekv26 & gt σmůjMxy. Kromě toho dává fylogeneze a související předpoklad o evoluční změně CX a Cy. Jediné parametry, které musí být odhadnuty, jsou proto AX, Ay, σX 2, σy 2 a r pro případ bivariační korelace. Stejně jako u univariačního případu lze k odhadu parametrů pro model daný rovnicemi 9 a 10 použít více metod. Zde ilustrujeme EGLS a REML (dodatek 1), ačkoli poskytujeme také programy Matlab pro ML. EGLS má tu výhodu, že může být formálně aplikován, když skutečné variace a/nebo variační chyby měření nejsou normálně distribuovány. Jak ukážeme níže, REML má tu výhodu, že nemá téměř žádné zkreslení, ve srovnání s mírným zkreslením, které ukazuje EGLS. Kromě toho při výpočtu korelace mezi více páry znaků REML (a ML) používá data ze všech znaků při odhadu každé párové korelace, což vede k nejlepším odhadům při provádění vícerozměrných analýz, jako je PCA. Ačkoli existuje několik metod pro získání intervalů spolehlivosti odhadů (viz výše „Univariate Analyses“), omezili jsme pozornost na parametrické bootstrapping pro malé velikosti vzorků typické pro mnoho fylogenetických studií, odhadci korelačních koeficientů jsou často zkreslení, a proto parametrický bootstrapping je často nejrobustnějším přístupem k získání intervalů spolehlivosti.

Příklad

Analyzovali jsme data od Bauwens et al. (1995) o tělesné hmotnosti, délce zadních končetin a rychlosti sprintu 13 druhů ještěrek pomocí fylogeneze A z jejich obrázku 2. Jejich tabulka 1 uvádí průměrné hodnoty a standardní chyby těchto znaků v aritmetickém měřítku. Tento příklad jsme vybrali, protože obsahuje znaky, které by mohly být podrobeny řadě různých statistických analýz (korelační, regresní a funkční relační modely), a protože má velikost (13 druhů, n = 4 až 20 jedinců měřeno podle druhu), což není netypické pro „malé“ srovnávací studie (např. Viz kompilace v Ricklefs a Starck, 1996 Freckleton et al., 2002 Blomberg et al., 2003). Logicky jsme transformovali všechny vlastnosti, což snížilo zkreslení v distribuci hodnot vlastností (analýzy nejsou uvedeny). Při log-transformačních hodnotách, které jsou měřeny s variacemi, jak průměr, tak rozptyl log-transformovaných dat závisí na rozptylu chyby měření, předpokládali jsme tedy, že daná hodnota znaku pro daný druh byla log-normálně distribuována a provedena odpovídajícím způsobem log-transformace (dodatek 2). Nakonec jsme předpokládali, že chyby měření mezi znaky nesouvisí, takže rm = 0 v rovnici 10.

V tomto případě, jak je pravděpodobné, že bude běžné (např. Martins a Lamont, 1998 Bonine et al., 2005), byly velikosti vzorků pro některé druhy hodnot malé (n = 4). Když jsou velikosti vzorků malé, samotné standardní chyby jsou nepřesné odhady chyby měření. V praxi je tento problém často bezvýznamný, protože odhady chyby měření, přestože jsou nepřesné, jsou přesto nestranné. Možným přístupem, pokud existují malé velikosti vzorků nebo pokud jsou některé druhy zastoupeny jediným jedincem (např. Langerhans et al., 2006), je vypočítat průměr chyby měření na vzorku a z toho vypočítat chybu měření pro každý druh na základě odpovídající velikosti vzorku (dodatek 3). Pro níže uvedené analýzy jsme použili jak standardní chyby uvedené v Bauwens et al. (1995) a chyba měření získaná zprůměrováním mezi druhy, oba postupy poskytly kvantitativně velmi blízké výsledky, a proto uvádíme pouze výsledky s použitím standardních chyb pro každý druh.

Pro dvoumístný příklad jsme vypočítali odhady r mezi tělesnou hmotností a rychlostí sprintu pomocí GLS (tj. bez chyby měření), EGLS a REML za předpokladu, že mezi druhy neexistuje žádná fylogenetická příbuznost (fylogeneze hvězd, CX = Cy = ) nebo fylogenetická příbuznost daná skutečnou fylogenezí za vývoje Brownova pohybu (tabulka 2). Pro hvězdnou fylogenezi odhaduje EGLS a REML r byly podobné a výrazně se nelišily od odhadu GLS. Pro skutečnou fylogenezi byl však odhad EGLS (0,025) podobný odhadu GLS (0,022) a oba byly mnohem nižší než odhad REML (0,341). Průměr odhadů REML bootstrapped z r (0,327) byl nižší než odhad REML, což naznačuje, že pokud něco, odhad REML je zkreslený směrem dolů. To naznačuje, že odhad EGLS (0,025) je ještě závažněji zkreslený než odhad REML. Navzdory velkému rozdílu mezi odhady EGLS a REML jsou intervaly spolehlivosti pro oba velké a v žádném případě není odhad r statisticky odlišné od nuly.

GLS, EGLS a REML odhady korelačního koeficientu (r) mezi velikostí těla polena a rychlostí sprintu od Bauwens et al. (1995).

Fylogeneze. GLS. Bootstrap GLS. VEJCE. EGLS bootstrap. REML. REML bootstrap.
(hvězda) 0.466 0.454 1 (−0.11, 0.81) 2 0.478 0.465 1 (−0.15, 0.85) 2 0.497 0.486 1 (−0.098, 0.85) 2
C (skutečný) 0.022 0.017 1 (−0.57, 0.56) 2 0.025 0.033 1 (−0.60, 0.65) 2 0.341 0.331 1 (−0.28, 0.81) 2
Fylogeneze. GLS. Bootstrap GLS. VEJCE. EGLS bootstrap. REML. REML bootstrap.
(hvězda) 0.466 0.454 1 (−0.11, 0.81) 2 0.478 0.465 1 (−0.15, 0.85) 2 0.497 0.486 1 (−0.098, 0.85) 2
C (skutečný) 0.022 0.017 1 (−0.57, 0.56) 2 0.025 0.033 1 (−0.60, 0.65) 2 0.341 0.331 1 (−0.28, 0.81) 2

Průměr parametrické distribuce bootstrapu r.

95% parametrické intervaly spolehlivosti bootstrapu z 2000 sad dat replikace.

GLS, EGLS a REML odhady korelačního koeficientu (r) mezi velikostí těla polena a rychlostí sprintu od Bauwens et al. (1995).

Fylogeneze. GLS. Bootstrap GLS. VEJCE. EGLS bootstrap. REML. REML bootstrap.
(hvězda) 0.466 0.454 1 (−0.11, 0.81) 2 0.478 0.465 1 (−0.15, 0.85) 2 0.497 0.486 1 (−0.098, 0.85) 2
C (skutečný) 0.022 0.017 1 (−0.57, 0.56) 2 0.025 0.033 1 (−0.60, 0.65) 2 0.341 0.331 1 (−0.28, 0.81) 2
Fylogeneze. GLS. Bootstrap GLS. VEJCE. EGLS bootstrap. REML. REML bootstrap.
(hvězda) 0.466 0.454 1 (−0.11, 0.81) 2 0.478 0.465 1 (−0.15, 0.85) 2 0.497 0.486 1 (−0.098, 0.85) 2
C (skutečný) 0.022 0.017 1 (−0.57, 0.56) 2 0.025 0.033 1 (−0.60, 0.65) 2 0.341 0.331 1 (−0.28, 0.81) 2

Průměr parametrické distribuce bootstrapu r.

95% parametrické intervaly spolehlivosti bootstrapu z 2000 sad dat replikace.

Abychom prozkoumali korelace mezi více páry znaků, odhadli jsme to r pro tři páry vlastností: tělesná hmotnost, rychlost sprintu a délka zadních končetin pomocí GLS, EGLS a REML. Abychom implementovali REML, odhadli jsme korelace jak párově (párová REML), tak současně pro všechny tři znaky (společný REML). Společný REML je správný postup REML, protože odhad REML je založen na pravděpodobnosti celého souboru dat. (Náš program Matlab automaticky implementuje společný REML.) Informace o korelaci mezi znaky x a y a mezi znaky y a z se tedy používají při odhadu korelace mezi znaky x a z. Jinak řečeno, odhady párových korelací mezi znaky nejsou nezávislé. To se liší od případu bez chyby měření, kde jsou odhady párových korelací nezávislé. Vědci mohou být v pokušení vypočítat korelační koeficienty odděleně párově, zvláště když je požadováno velké množství párových korelací. Vypočítali jsme párové odhady REML, i když to není správný postup, abychom ilustrovali problémy, které to může způsobit.

Odhadované korelace pro všechny tři páry znaků (tělesná hmotnost, rychlost sprintu, délka zadních končetin) pomocí párového REML měly tendenci být větší než odhady GLS a EGLS (tabulka 3). Společné odhady REML jsou o něco méně vysoké. Třídruhové korelační matice získané z EGLS i párových REML nejsou platné, protože nejsou jednoznačné. Požadavek, aby korelační matice byla jednoznačně kladná, je ekvivalentní požadavku, aby korelační koeficienty byly mezi −1 a +1, stejně jako nemá smysl, aby korelační koeficienty byly větší než +1, nedává smysl, aby korelační matice nebyla pozitivní definitivní. Selhání korelační matice získané z EGLS a párových REML jako pozitivní definitivní je způsobeno nízkou odhadovanou korelací mezi velikostí těla a rychlostí sprintu, rxy. Protože vlastnosti x (velikost těla logu) a z (délka zadní končetiny logu) jsou vysoce korelované a znaky y (rychlost logového sprintu) a z jsou vysoce korelované, musí být znaky xay také vysoce korelované, aby korelační matice byla pozitivní definitivní, ale tato podmínka není splněna pro EGLS a párové REML. Naproti tomu korelační matice získané z GLS (pro které jsou párové odhady korelačních koeficientů nezávislé) a společné REML (které odhaduje všechny korelační koeficienty současně) jsou jednoznačně pozitivní. Tento konkrétní soubor dat je náchylný k tomu, že odhadované korelační matice nejsou jednoznačně pozitivní, protože velikost vzorku je malá a korelace mezi znaky jsou vysoké. Tento problém se však pravděpodobně vyskytuje často v podobných sadách dat.

Odhady korelačních koeficientů a zatížení na první hlavní komponentu (PC 1) pro vlastnosti log body mass (x), log sprint speed (y) a log zadní končetiny (z) poskytnuté Bauwens et al. (1995) pro 13 druhů ještěrek.

. . . . . Načítání .
. . . . . .
Metoda. rxy . rxz . ryz . %Variace PC 1. X . y. z.
GLS (bez názvu) 0.022 0.845 0.491 0.66 0.36 0.22 0.42
VEJCE 0.025 0.867 0.550 — 1
Dvojice REML 0.341 0.899 0.799 — 1
Kloub REML 0.257 0.887 0.635 0.74 0.34 0.27 0.39
. . . . . Načítání .
. . . . . .
Metoda. rxy . rxz . ryz . %Variace PC 1. X . y. z.
GLS (bez názvu) 0.022 0.845 0.491 0.66 0.36 0.22 0.42
VEJCE 0.025 0.867 0.550 — 1
Dvojice REML 0.341 0.899 0.799 — 1
Kloub REML 0.257 0.887 0.635 0.74 0.34 0.27 0.39

Kovarianční matice získaná z párových analýz nebyla jednoznačně pozitivní.

Odhady korelačních koeficientů a zatížení na první hlavní komponentu (PC 1) pro vlastnosti log body mass (x), log sprint speed (y) a log zadní končetiny (z) poskytnuté Bauwens et al. (1995) pro 13 druhů ještěrek.

. . . . . Načítání .
. . . . . .
Metoda. rxy . rxz . ryz . %Variace PC 1. X . y. z.
GLS (bez názvu) 0.022 0.845 0.491 0.66 0.36 0.22 0.42
VEJCE 0.025 0.867 0.550 — 1
Párování REML 0.341 0.899 0.799 — 1
Kloub REML 0.257 0.887 0.635 0.74 0.34 0.27 0.39
. . . . . Načítání .
. . . . . .
Metoda. rxy . rxz . ryz . %Variace PC 1. X . y. z.
GLS (bez názvu) 0.022 0.845 0.491 0.66 0.36 0.22 0.42
VEJCE 0.025 0.867 0.550 — 1
Párování REML 0.341 0.899 0.799 — 1
Kloub REML 0.257 0.887 0.635 0.74 0.34 0.27 0.39

Kovarianční matice získaná z párových analýz nebyla jednoznačně pozitivní.

Pomocí odhadovaných korelačních matic jsme provedli PCA (Sokal a Rohlf, 1981), výpočet první osy PC a odpovídající zatížení (tabulka 3). Vysoké korelace získané ze společného REML způsobily, že 74% korelace bylo zachyceno první osou hlavních komponent (PC1). Naproti tomu PC1 využívající odhady GLS bylo 66%. Začlenění chyby měření tedy odhalí silnější korelační strukturu v datech. Protože korelační matice získané z EGLS a párových REML nejsou pozitivní, určité, výsledné PCA jsou neplatné.

Simulace

Zkoumat vlastnosti odhadů r, provedli jsme na základě příkladu simulační studii. Konkrétně jsme simulovali data pro 13 druhů s fylogenezí 13 druhů studovaných Bauwensem et al. (1995). Předpokládali jsme, že dva znaky xay sledují vývoj Brownova pohybu po fylogenetickém stromu s hodnotami σX = 0,86, σy = 0,28, a r = 0,83. Předpokládali jsme, že standardní odchylka měření u jednoho zvířete je 4krát vyšší než standardní chyba hlášená Bauwensem et al. (1995) pro tělesnou hmotnost a rychlost sprintu a data z n = 2 k (k = 0, 1,…, 6) jednotlivci byli získáni pro každý druh. Když tedy k = 4 (n = 16), rozptyl chyby měření je stejný jako v Bauwens et al. (1995) a vyšší rozptyl nastává u menších velikostí vzorků. Pro každý z 2000 simulovaných datových sad pro každou velikost vzorku n, odhadli jsme parametry pomocí EGLS i REML.

Po započítání chyby měření REML odhaduje r měl pouze mírné předpětí směrem dolů, přičemž přibližné očekávání se pohybovalo mezi 0,813 a 0,821 pro skutečnou hodnotu r = 0,83 (obr. 3). Odhady EGLS měly větší zkreslení směrem dolů pro malé velikosti vzorků. Naproti tomu odhady GLS, které ignorovaly chybu měření, měly mnohem větší zkreslení směrem dolů. Kromě toho, že odhady REML byly méně zkreslené než odhady EGLS, byly také konzistentně přesnější, s užšími 95% mezemi inkluze. Všimněte si také, že distribuce odhadů REML je značně zkreslená, horní hranice zahrnutí 95% nikdy nepřekročí 0,88, zatímco dolní hranice inkluze klesá téměř na nulu. To se očekává, jako r je omezena na hodnotu menší nebo rovnou jedné (viz také Martins a Garland, 1991).

(a) EGLS a (b) REML odhady korelačního koeficientu r ze simulovaných datových sad založených na Bauwens et al. (1995). Plné čáry udávají odhady zahrnující chybu měření a odpovídající 95% mezí odhadu jsou dané stínovanou oblastí. Přerušované čáry udávají odhad a 95% mezí odhadu získaného bez účtování chyby měření (GLS). Předpokládáme, že existuje 13 druhů s fylogenezí danou fylogenezí pro 13 ještěrek analyzovaných Bauwensem et al. (1995). Oba rysy se vyvíjejí v souladu s vývojem Brownova pohybu, s σX = 0.86, σy = 0,28, a r = 0,83. Předpokládá se, že chyba měření pro měření na jednotlivých jedincích má standardní chybu rovnající se 4násobku standardních chyb druhu poskytnutých Bauwensem et al. (1995). Pro každou velikost simulovaného vzorku n = 2 k (k = 0, 1,…, 6), bylo simulováno 2000 datových sad a byly vypočítány odhady pro každý parametr.

(a) EGLS a (b) REML odhady korelačního koeficientu r ze simulovaných datových sad založených na Bauwens et al. (1995). Plné čáry udávají odhady zahrnující chybu měření a odpovídající 95% mezí odhadu jsou dané stínovanou oblastí. Přerušované čáry udávají odhad a 95% mezí odhadu získaného bez účtování chyby měření (GLS). Předpokládáme, že existuje 13 druhů s fylogenezí danou fylogenezí pro 13 ještěrek analyzovaných Bauwensem et al. (1995). Oba rysy se vyvíjejí v souladu s vývojem Brownova pohybu, s σX = 0.86, σy = 0,28, a r = 0,83. Předpokládá se, že chyba měření pro měření na jednotlivých jedincích má standardní chybu rovnající se 4násobku standardních chyb druhu poskytnutých Bauwensem et al. (1995). Pro každou velikost simulovaného vzorku n = 2 k (k = 0, 1,…, 6), bylo simulováno 2000 datových sad a byly vypočítány odhady pro každý parametr.

Regrese

Odhad

Stejně jako univariační analýzy a korelace lze pro odhad použít EGLS, ML a REML (dodatek 1). Zde zvažujeme všechny tři při analýze příkladu a studujeme REML podrobněji se simulací.

Příklad

Stejně jako v příkladu korelace jsme analyzovali data od Bauwens et al. (1995). Tabulka 4 uvádí odhady sklonu GLS, EGLS, ML a REML b1 pro regresi délky zadních končetin protokolu na velikost těla polena. Odhady za předpokladu žádné souvislosti s fylogenezí (CX = Cy = ) jsou podobné pro všechny tři metody zahrnující chybu měření. Parametrické intervaly spolehlivosti bootstrapu jsou navíc podobné přibližným intervalům spolehlivosti získaným pro EGLS a ML. Jediným rozdílem mezi statistickými analýzami je relativně nízký odhad b1 získané pro EGLS, když je použita skutečná fylogeneze druhu.

Odhady regresního sklonu b1 pro log délku zadní končetiny regresní na log tělesné hmotnosti pro 13 druhů ještěrek z Bauwens et al. (1995).

Fylogeneze. GLS (bez názvu). VEJCE. EGLS bootstrap. ML. ML bootstrap. REML. REML bootstrap.
(hvězda) 0.305 (0.19, 0.42) 1 0.307 (0.20, 0.41) 2 0.307 (0.21, 0.41) 3 0.310 (0.21, 0.41) 4 0.312 (0.21, 0.42) 3 0.309 0.310 (0.21, 0.41) 3
C (skutečný) 0.224 (0.13, 0.32) 1 0.232 (0.14, 0.33) 2 0.231 (0.14, 0.32) 3 0.263 (0.17, 0.36) 4 0.265 (0.19, 0.35) 3 0.260 0.261 (0.18, 0.35) 3
Fylogeneze. GLS (bez názvu). VEJCE. EGLS bootstrap. ML. ML bootstrap. REML. REML bootstrap.
(hvězda) 0.305 (0.19, 0.42) 1 0.307 (0.20, 0.41) 2 0.307 (0.21, 0.41) 3 0.310 (0.21, 0.41) 4 0.312 (0.21, 0.42) 3 0.309 0.310 (0.21, 0.41) 3
C (skutečný) 0.224 (0.13, 0.32) 1 0.232 (0.14, 0.33) 2 0.231 (0.14, 0.32) 3 0.263 (0.17, 0.36) 4 0.265 (0.19, 0.35) 3 0.260 0.261 (0.18, 0.35) 3

95% interval spolehlivosti od GLS.

95% interval spolehlivosti s použitím přibližné standardní chyby získané ze vzorců GLS.

95% interval spolehlivosti z parametrického bootstrapování.

95% interval spolehlivosti od a t-distribuce ML.

Odhady regresního sklonu b1 pro log délku zadní končetiny regresní na log tělesné hmotnosti pro 13 druhů ještěrek z Bauwens et al. (1995).

Fylogeneze. GLS (bez názvu). VEJCE. EGLS bootstrap. ML. ML bootstrap. REML. REML bootstrap.
(hvězda) 0.305 (0.19, 0.42) 1 0.307 (0.20, 0.41) 2 0.307 (0.21, 0.41) 3 0.310 (0.21, 0.41) 4 0.312 (0.21, 0.42) 3 0.309 0.310 (0.21, 0.41) 3
C (skutečný) 0.224 (0.13, 0.32) 1 0.232 (0.14, 0.33) 2 0.231 (0.14, 0.32) 3 0.263 (0.17, 0.36) 4 0.265 (0.19, 0.35) 3 0.260 0.261 (0.18, 0.35) 3
Fylogeneze. GLS (bez názvu). VEJCE. EGLS bootstrap. ML. ML bootstrap. REML. REML bootstrap.
(hvězda) 0.305 (0.19, 0.42) 1 0.307 (0.20, 0.41) 2 0.307 (0.21, 0.41) 3 0.310 (0.21, 0.41) 4 0.312 (0.21, 0.42) 3 0.309 0.310 (0.21, 0.41) 3
C (skutečný) 0.224 (0.13, 0.32) 1 0.232 (0.14, 0.33) 2 0.231 (0.14, 0.32) 3 0.263 (0.17, 0.36) 4 0.265 (0.19, 0.35) 3 0.260 0.261 (0.18, 0.35) 3

95% interval spolehlivosti od GLS.

95% interval spolehlivosti s použitím přibližné standardní chyby získané ze vzorců GLS.

95% interval spolehlivosti z parametrického bootstrapování.

95% interval spolehlivosti od a t-distribuce ML.

V tomto případě způsobující začlenění fylogenetické příbuznosti způsobilo velký pokles odhadů b1vzhledem k tomu, že chyba měření měla relativně malý účinek. Je zajímavé, že 95% intervaly spolehlivosti získané s fylogenetickými informacemi vyloučily sklon 1/3, který by byl očekáván pro geometrickou podobnost při použití EGLS, ale ne s ML a REML. V tomto případě má výběr přístupu odhadu rozdíl v interpretaci výsledků, alespoň pokud je striktně dodržována úroveň spolehlivosti 95%. V tomto případě bohužel není důvod statisticky upřednostňovat jednu metodu odhadu před jinou, protože všechny metody vykazovaly malou předpojatost. Ve výjimečných situacích, jako je tato, můžeme doporučit pouze opatrné hlášení výsledků.

Simulace

Navrhli jsme simulace podobné předchozím simulacím (obr. 2 a 3), abychom prozkoumali vliv chyby měření změnou velikosti vzorků jednotlivců měřených podle druhu. Chtěli jsme také porovnat soubory dat s různým počtem druhů, což zvyšuje počet druhů, což nesníží chybu měření, ale mělo by to snížit rozptyl odhadů parametrů poskytnutím více informací o vztahu mezi těmito dvěma znaky. Chtěli jsme tedy porovnat rozptyl v odhadu b1 když se zvýší počet jedinců odebraných ze stejného druhu ve srovnání se zvýšením počtu druhů, ze kterých se odebírají vzorky. Zvažujeme pouze odhad REML, protože EGLS a ML poskytují podobné výsledky.

Pro simulaci jsme předpokládali, že existuje 13 nebo 49 druhů. Pro případ 13 druhů jsme použili fylogenezi pro 13 ještěrek od Bauwens et al. (1995). Pro 49-druhový případ jsme použili fylogenezi pro 49 Carnivora a kopytníků z Garland et al. (1993). Nastavili jsme skutečnou hodnotu b1 = 1/3, jak by se dalo očekávat, kdyby závislou proměnnou byl log lineární dimenze (např. Délka nohy), nezávislou proměnnou byl log tělesné hmotnosti a druhy různé velikosti těla byly geometricky podobné. Ostatní parametry jsme nastavili stejně jako odhady REML od Bauwens et al. (1995) data využívající model plné chyby měření se skutečnou fylogenezí (tabulka 4). U 13druhové fylogeneze jsme předpokládali, že standardní odchylka chyby měření u jednoho jedince byla 9krát větší než standardní chyba hlášená Bauwens et al. (1995) jsme použili tak velkou chybu měření, protože skutečná chyba měření neměla silný vliv na analýzy skutečných dat. Pro 49-druhovou fylogenezi jsme druhům přiřadili standardní chyby náhodným výběrem ze 13 hodnot standardní chyby použitých v 13-druhové simulaci. Předpokládali jsme, že chyby měření mezi znaky byly nezávislé.

V obou 13- a 49-druhových případech odhad REML b1 zahrnující chybu měření bylo maximálně mírně zkreslené, zatímco odhad GLS b1 bez chyby měření byla špatně zkreslená, když počet jedinců vzorkovaných podle druhu byl malý (obr. 4). Předpojatost odhadů GLS byla téměř stejná pro soubory 13 i 49 druhů dat, což ukazuje, že zkreslení způsobené chybou měření nezávisí na počtu vzorků druhů, pouze na přesnosti měření pro každý druh ( a tedy počet jednotlivců odebraných ze vzorku podle druhu). Nicméně intervaly spolehlivosti odhadů b1 s rostoucím počtem druhů se zužují. To akcentuje statistické problémy, které mohou vyplynout z předpojatosti. V případě 49 druhů je skutečná hodnota b1, 1/3, je vyloučena z 95% intervalu zahrnutí odhadů při velikosti vzorků n jsou malé, takže hypotéza, že b1 = 1/3 by byla zamítnuta, i když víme, že skutečná hodnota b1 je 1/3! Harmon a Losos (2005) diskutují obecněji vliv chyby měření na chyby typu I a typu II ve fylogenetických analýzách.

REML odhady sklonu regrese simulovaných datových sad. V (a) simulovaná data sestávala z 13 druhů s fylogenezí poskytnutých Bauwensem et al. (1995), a v (b) existuje 49 druhů s fylogenezí danou Garland et al. (1993). Plné čáry udávají odhady zahrnující chybu měření a odpovídající 95% mezí odhadu jsou dané stínovanou oblastí. Přerušované čáry udávají odhad a 95% mezí odhadu získaného bez účtování chyby měření (GLS). Oba rysy se vyvíjejí v souladu s vývojem Brownova pohybu, s b1 = 1/3, σX = 0,8 a σy = 0,1. V (a) se předpokládá, že chyba měření pro měření na jedinci má standardní chybu rovnající se 9násobku standardních chyb druhu poskytnutých Bauwensem a kol. (1995), zatímco v (b) jsou chyby měření vybrány náhodně z těchto 13 hodnot. Pro každou velikost vzorku n = 2 k (k = 0, 1,…, 6), bylo simulováno 2000 datových sad. Srovnatelné údaje využívající odhad EGLS a ML se kvalitativně nelišily.

REML odhady sklonu regrese simulovaných datových sad. V (a) simulovaná data sestávala z 13 druhů s fylogenezí poskytnutých Bauwensem et al. (1995), a v (b) existuje 49 druhů s fylogenezí danou Garland et al. (1993). Plné čáry udávají odhady zahrnující chybu měření a odpovídající 95% mezí odhadu jsou dané stínovanou oblastí. Přerušované čáry udávají odhad a 95% mezí odhadu získaného bez účtování chyby měření (GLS). Oba rysy se vyvíjejí v souladu s Brownovým pohybovým vývojem, s b1 = 1/3, σX = 0,8 a σy = 0,1. V (a) se předpokládá, že chyba měření pro měření na jednom jedinci má standardní chybu rovnající se 9násobku standardních chyb druhu poskytnutých Bauwensem a kol. (1995), zatímco v (b) jsou chyby měření vybrány náhodně z těchto 13 hodnot. Pro každou velikost vzorku n = 2 k (k = 0, 1,…, 6), bylo simulováno 2000 datových sad. Srovnatelné údaje využívající odhad EGLS a ML se kvalitativně nelišily.

Přestože se zvětšují velikosti vzorků n podle druhu sníží chybu měření, a proto poskytnou přesnější odhady b1, přesnost odhadů b1 je také omezen počtem druhů v datové sadě. U těchto příkladů poskytuje zvýšení velikosti vzorku podle druhu pouze mírné zlepšení přesnosti odhadů b1 jakmile velikost vzorku překročí 4. Standardní odchylka odhadů však b1 se sníží zhruba o 50%, pokud existuje 49 druhů ve srovnání s 13 druhy. Důvodem je, že rostoucí počet druhů zvyšuje informace o vztahu mezi znaky x a y, tyto informace jsou obsaženy v rozptylu mezi druhy.

Modely funkčních vztahů

Regrese je vhodný statistický model, který se má použít, když je jedna proměnná kauzálně určena jinou, nebo pokud má být jedna proměnná předpovězena hodnotou jiné proměnné. V mnoha biologických otázkách je však cílem porozumět tomu, jak dva rysy spolu funkčně souvisejí, aniž by byl přiřazen směr kauzality. Někoho by například mohl zajímat vztah mezi délkou ocasu a délkou nohy u skupiny druhů. Problém funkčních vztahů byl řešen modely „obecných strukturovaných vztahů“ (Rayner, 1985), z nichž je nejčastěji používaným zvláštním případem regrese redukované hlavní osy (RMA). Zde vyvíjíme funkční relační modely, které flexibilním způsobem začleňují fylogenetickou korelaci a chybu měření. Poté představíme některé speciální případy, které pro nefylogenetický případ odvozuje Rayner (1985). Naším cílem při prezentaci těchto případů je ukázat, že modely odvozené Raynerem (1985) lze snadno rozšířit o fylogenety a chyby měření.

Model podle rovnice 13 obsahuje sedm parametrů: AX, b0, b1, σγ x 2, σX 2, σy 2 a r. Informace dostupné ze souboru dat však umožňují odhadnout pouze pět parametrů. To lze heuristicky vysvětlit poznámkou, že datový soubor poskytuje pět informací o rozdělení x a y: průměr x a y, jejich odchylky a kovarianci mezi nimi. To představuje problém statistické identifikovatelnosti, který se často objevuje v modelech chyb měření (Fuller, 1987). Pokud nejsou k dispozici žádné další informace, pak jediným řešením problému s identifikovatelností je vytvořit předpoklady o hodnotách parametrů nebo matematických vztazích mezi nimi. Pokud se například předpokládá, že neexistuje žádná neznámá variace v x (σX 2 = r = 0), pak se rovnice 13 redukuje na regresní model y na x daný rovnicí 11. Naopak, pokud neexistuje žádná neznámá variace v y (σy 2 = r = 0), pak se rovnice 13 redukuje na regresi x na y. Nakonec, pokud se předpokládá, že neexistuje žádná variace v X* (σγ X 2 = 0, a proto b1 = 0), pak se model redukuje na korelační model daný rovnicí 6.

Další speciální případy lze odvodit uznáním, že rovnice 13 je zobecněním obecného modelu strukturálních vztahů podle Raynera (1985), model obecné strukturální rovnice se získá, když neexistuje žádná fylogenetická korelace, Cγ X = CX = Cy = a chyba měření je nulová, MX = My = Mxy = 0 důkaz je uveden v dodatku 4. Regrese RMA je pak odvozena jako speciální případ za předpokladu, že neexistuje žádná korelace mezi εX a εy (r = 0), a poměr standardních odchylek εX a ε y splňuje σyX = b1 (Rayner, 1985). Specifickou vlastností regrese RMA je, že mezi znaky xay neexistuje žádná kauzální směrovost, protože regrese RMA znaku y na x je ekvivalentní regresi RMA x na y. Konkrétně první dva řádky rovnice 13 lze psát ekvivalentně jako Y* = Ay+ γy a X* = β0+ β1Y*, kde Ay = b0+ b1AX, β0 = −b0/b1, a β1 = 1/b1. Dále proto, že σyX = b1 pro regresi RMA, σXy = 1/b1 = β1. V regresi RMA lze tedy za „závislou proměnnou“ považovat buď x nebo y.

Další speciální případ lze odvodit za předpokladu, že relativní velikosti odchylek v ε X a εy jsou známy jako konstanta k (k = σyX), a εX a εy nesouvisejí (r = 0). To může být rozumný model, pokud má výzkumník omezené informace o variacích v εX a εy—Dostatečné k přiřazení relativních, ale ne absolutních velikostí rozptylu mezi rysy, jako tomu bylo v případě Pagel a Harvey (1989). Tento případ označujeme jako VRF (variační poměr pevný) regrese. S předpoklady, že k = σyX a r = 0, parametry AX, b0, b1, σγX 2 a σX 2 lze odhadnout z rovnice 13.

Ze statistického hlediska lze četné různé obecné strukturální relační modely, které lze odvodit jako speciální případy z rovnice 13, považovat za stejně platné. Korelace, regrese a regrese RMA jsou tedy statisticky podobně dobře definovány. Nicméně různé statistické modely jsou náchylné k různým chybám při interpretaci. Pokud je například regrese RMA aplikována na dva znaky, které jsou nezávislé, očekávání pro odhadovaný sklon bude 1, přestože mezi znaky neexistuje žádný vztah. V tomto případě je způsob, jak se chránit před nesprávnou interpretací sklonu RMA, věnovat pozornost intervalům spolehlivosti, pokud jsou vlastnosti nezávislé, intervaly spolehlivosti budou široké. Korelační analýza také odhalí nedostatek korelace mezi rysy. Zde nechceme tolerovat ani odsuzovat použití regresní RMA a dalších strukturálních relačních modelů, ale věříme v opatrnost při interpretaci jejich výsledků.

Odhad

Pro obecný případ s chybou měření (rovnice 16) lze použít odhad EGLS, ML a REML. Zde omezujeme pozornost na odhad ML. Výhodou ML oproti odhadu EGLS je, že lze použít pravděpodobnosti k porovnání různých formulací modelu. Míchání a porovnávání různých předpokladů, například zda chybové termíny εX a ε y obsahují fylogenetické korelace, vedou k více možným modelům a ML lze použít k třídění modelů a nalezení těch nejlepších. Je také možné použít odhad REML, ačkoli interpretace pravděpodobností vypočítaných z REML není tak přímočará jako ML, takže dáváme přednost odhadu ML. U strukturálních relačních modelů jsme v odhadech ML našli malou předpojatost, takže k tomuto hlavnímu omezení odhadu ML zjištěného u jiných problémů (zejména těch, které zahrnují odhady odchylek a korelací) nedošlo.

Poskytujeme programy Matlab pro regresi RMA a VRF.

Příklad

V tomto příkladu jsme analyzovali stejné údaje o tělesné hmotnosti a délce zadní končetiny ze 13 druhů ještěrek v Bauwens et al. (1995) použitý v regresním příkladu. Uvažujeme tři páry modelů. Nejprve použijeme regresi RMA a její fylogenetický protějšek, ve kterém jsou odhady b1 a intervaly spolehlivosti jsou dány rovnicemi 14 a 15, pokud neexistuje chyba měření (MX = My = Mxy = 0). Tyto modely označujeme jako rma (I) a rma (C). Za druhé, uvažujeme o nefylogenetickém a fylogenetickém páru regresí VRF, ve kterých k = σyX a r = 0, a neexistuje žádná chyba měření. Za hodnotu k, používáme jednoduché průměrné standardní chyby log-transformovaných znaků x (0,0495) a y (0,0177), které uvádí Bauwens et al. (1995). To napodobuje případ, kdy má výzkumník pouze hrubé informace o variacích znaků a předpokládá, že celková nevysvětlená variace znaků xay je úměrná jejich vnitrodruhovým změnám odhadovaným ze standardní chyby. Tyto modely označujeme jako modely vrf (I) a vrf (C). Za třetí, uvažujeme dvojici nefylogenetických a fylogenetických modelů, které vytvářejí předpoklady b1 = σyX a r = 0 jako u regrese RMA, ale MX a My jsou odvozeny ze standardních chyb hlášených Bauwens et al. (1995). Označujeme je jako rmaM (I) a rmaM (C). V regresním modelu VRF neuvažujeme chybu měření, protože jsme již použili informace o chybě měření k výběru hodnoty k.

Nefylogenetické verze všech tří modelů poskytují velmi podobné odhady sklonu funkčních vztahů b1 (Tabulka 5). Podobnost mezi modely RMA a VRF je dána skutečností, že u standardních chyb uvedených v Bauwens et al. (1995), k = 0,36, což je shodou okolností velmi blízké hodnotě b1 = 0,347, což se předpokládá jako rovno k = σyX v regresi RMA. Odhady b1 u všech fylogenetických verzí modelů je nižší než u nefylogenetických verzí. Nižší pravděpodobnost log pro fylogenetické verze však naznačuje, že odpovídají datům hůře než nefylogenetické modely. Ze statistických důvodů jsou tedy preferovány odhady z nefylogenetických verzí. K formální arbitraci mezi fylogenetickými a nefylogenetickými modely je nejlepším přístupem zavedení parametru, který výslovně řídí sílu fylogenetické korelace. Například Blomberg a kol. (2003) odvozují transformaci z procesu Ornstein-Uhlenbeck, který zavádí parametr d do kovarianční matice C to diktuje sílu fylogenetické korelace začleněním této do modelů (jako v případě žádné chyby měření v REGRESSIONv2.m) by umožnilo testy fylogenetické síly a výběr nejlepšího odhadu b1 (viz také Grafen, 1989 Freckleton et al., 2002). Podle našich zkušeností se skutečnými soubory dat se často stává, že i mírné zkreslení fylogenetického stromu, aby byl poněkud hvězdicovější, poskytne podstatně lepší shody.

Odhady sklonu funkčního vztahu b1 pro log tělesnou hmotnost a délku kulatých zadních končetin pro 13 druhů ještěrek od Bauwens et al. (1995).

Modelka . Předpoklady. Fylogeneze. ML odhad b1 . Bootstrap ML odhad b1 . Pravděpodobnost logu.
RMA Ar = 0 (hvězda) 0.347 (0.25, 0.45) 1 (0.24, 0.51) 3 0.349 (0.25, 0.46) 2 8.64
σyX = b1C (skutečný) 0.265 (0.18, 0.35) 1 (0.17, 0.42) 3 0.267 (0.19, 0.36) 1 3.72
VRF br = 0 (hvězda) 0.346 (0.23, 0.46) 1 0.349 (0.24, 0.49) 2 8.64
σyX = k = 0.36 C (skutečný) 0.251 (0.15, 0.35) 1 0.253 (0.16, 0.36) 2 3.72
RMA s chybou měření r = 0 (hvězda) 0.349 (0.25, 0.45) 1 0.352 (0.26, 0.47) 2 8.69
σyX = b1C (skutečný) 0.292 (0.20, 0.38) 1 0.295 (0.22, 0.39) 2 5.13
Modelka . Předpoklady. Fylogeneze. ML odhad b1 . Bootstrap ML odhad b1 . Pravděpodobnost logu.
RMA Ar = 0 (hvězda) 0.347 (0.25, 0.45) 1 (0.24, 0.51) 3 0.349 (0.25, 0.46) 2 8.64
σyX = b1C (skutečný) 0.265 (0.18, 0.35) 1 (0.17, 0.42) 3 0.267 (0.19, 0.36) 1 3.72
VRF br = 0 (hvězda) 0.346 (0.23, 0.46) 1 0.349 (0.24, 0.49) 2 8.64
σyX = k = 0.36 C (skutečný) 0.251 (0.15, 0.35) 1 0.253 (0.16, 0.36) 2 3.72
RMA s chybou měření r = 0 (hvězda) 0.349 (0.25, 0.45) 1 0.352 (0.26, 0.47) 2 8.69
σyX = b1C (skutečný) 0.292 (0.20, 0.38) 1 0.295 (0.22, 0.39) 2 5.13

Snížená regrese hlavní osy.

Variační poměr pevná regrese.

95% interval spolehlivosti od a t-distribuce pomocí přibližné standardní chyby získané z informační matice při odhadu ML.

95% interval spolehlivosti z parametrického bootstrapování.

95% interval spolehlivosti z rovnice 15.

Odhady sklonu funkčního vztahu b1 pro log tělesnou hmotnost a délku zadní končetiny pro 13 druhů ještěrek od Bauwens et al. (1995).

Modelka . Předpoklady. Fylogeneze. ML odhad b1 . Bootstrap ML odhad b1 . Pravděpodobnost logu.
RMA Ar = 0 (hvězda) 0.347 (0.25, 0.45) 1 (0.24, 0.51) 3 0.349 (0.25, 0.46) 2 8.64
σyX = b1C (skutečný) 0.265 (0.18, 0.35) 1 (0.17, 0.42) 3 0.267 (0.19, 0.36) 1 3.72
VRF br = 0 (hvězda) 0.346 (0.23, 0.46) 1 0.349 (0.24, 0.49) 2 8.64
σyX = k = 0.36 C (skutečný) 0.251 (0.15, 0.35) 1 0.253 (0.16, 0.36) 2 3.72
RMA s chybou měření r = 0 (hvězda) 0.349 (0.25, 0.45) 1 0.352 (0.26, 0.47) 2 8.69
σyX = b1C (skutečný) 0.292 (0.20, 0.38) 1 0.295 (0.22, 0.39) 2 5.13
Modelka . Předpoklady. Fylogeneze. ML odhad b1 . Bootstrap ML odhad b1 . Pravděpodobnost logu.
RMA Ar = 0 (hvězda) 0.347 (0.25, 0.45) 1 (0.24, 0.51) 3 0.349 (0.25, 0.46) 2 8.64
σyX = b1C (skutečný) 0.265 (0.18, 0.35) 1 (0.17, 0.42) 3 0.267 (0.19, 0.36) 1 3.72
VRF br = 0 (hvězda) 0.346 (0.23, 0.46) 1 0.349 (0.24, 0.49) 2 8.64
σyX = k = 0.36 C (skutečný) 0.251 (0.15, 0.35) 1 0.253 (0.16, 0.36) 2 3.72
RMA s chybou měření r = 0 (hvězda) 0.349 (0.25, 0.45) 1 0.352 (0.26, 0.47) 2 8.69
σyX = b1C (skutečný) 0.292 (0.20, 0.38) 1 0.295 (0.22, 0.39) 2 5.13

Snížená regrese hlavní osy.

Variační poměr pevná regrese.

95% interval spolehlivosti od a t-distribuce pomocí přibližné standardní chyby získané z informační matice při odhadu ML.

95% interval spolehlivosti z parametrického bootstrapování.

95% interval spolehlivosti z rovnice 15.

Všimněte si toho, že maximální pravděpodobnost logů pro modely RMA a VRF se stejnými fylogenetickými předpoklady jsou stejné. To je důsledkem problému s identifikovatelností, kdy má sedm parametrů různé způsoby, jak omezit model tak, aby poskytoval pět parametrů (maximum, které lze odhadnout), přičemž všechny poskytnou stejnou maximální pravděpodobnost. ML přibližné intervaly spolehlivosti pro b1 jsou blízké parametrickým intervalům spolehlivosti bootstrapu, což ukazuje, že aproximace je přesná. Konečně, ML přibližné intervaly spolehlivosti jsou lepší (pomocí intervalů spolehlivosti bootstrapu jako zlatého standardu) než intervaly spolehlivosti pro regresi RMA dané rovnicí 15.

Simulace

Abychom prozkoumali statistické vlastnosti odhadů pro různé modely, simulovali jsme data pomocí modelu rmaM (C) - model s r = 0, b1 = σyXa fylogeneze a chyby měření dané Bauwens et al. (1995) příklad 13 ještěrek - pomocí hodnot parametrů získaných přizpůsobením modelu datům (tabulka 5). Pro srovnání jsme stejný model simulovali také po zvýšení standardních odchylek chyb měření o faktor 4 (4 × simulace). Pro 2000 simulovaných datových sad jsme použili stejných šest modelů, jak je znázorněno v příkladu (tabulka 5).

Všichni odhadci b1 byly nestranné v simulacích chyb měření 1 × a 4 × (obr. 5a a 5c). Heuristicky to lze vysvětlit tím, že odhad funkční relace y na x, b1, je inverzní funkční vztah x na y, 1/b1 pro modely RMA a VRF. Pokud by například existovaly konzistentní zkreslení směrem dolů v odhadu funkčního vztahu, pak odhady obou b1 a 1/b1 muselo by být předpojaté směrem dolů, což zjevně není současně možné.

ML odhady b1 v modelu funkčních vztahů daném rovnicí 13 pro simulovaná data, když standardní odchylky v chybě měření jsou (a) ty, které uvádí Bauwens et al. (1995) a (c) čtyřnásobek těchto hodnot. Pro každý z 2000 simulovaných datových sad ML odhaduje b1 byly získány pro 6 modelových variant: rma (I) a rma (C), snížená regrese hlavní osy (b1 = σ X/σy, r = 0) bez fylogenetické korelace a fylogenetické korelace dané ještěrovou fylogenezí Bauwens (1995) za Brownova evoluce pohybu vrf (I) a vrf (C), model funkčních vztahů s fixním poměrem rozptylu chyb měření (k = σ X/σy, r = 0) s a bez fylogenetické korelace a rmaM (I) a rmaM (C), snížená regrese hlavní osy zahrnující chybu měření s a bez fylogenetické korelace. Chybové pruhy udávají 95% intervaly zahrnutí odhadů. Numerická konvergence k odhadu ML neproběhla u 1,2% kombinací metod odhadu souboru údajů nekonvergentní případy byly zahrnuty do 95% intervalů zahrnutí, ale nikoli do průměrných odhadů b1. (b a d) Podíl simulovaných datových souborů 2000 odpovídajících (a) a (c), v nichž měl daný model nejvyšší pravděpodobnost. Protože pravděpodobnost modelů rma a vrf je stejná, jsou tyto kombinovány.

ML odhady b1 v modelu funkčních vztahů daném rovnicí 13 pro simulovaná data, když standardní odchylky v chybě měření jsou (a) ty, které uvádí Bauwens et al. (1995) a (c) čtyřnásobek těchto hodnot. Pro každý z 2000 simulovaných datových sad ML odhaduje b1 byly získány pro 6 modelových variant: rma (I) a rma (C), snížená regrese hlavní osy (b1 = σ X/σy, r = 0) bez fylogenetické korelace a fylogenetické korelace dané ještěrovou fylogenezí Bauwens (1995) za Brownova evoluce pohybu vrf (I) a vrf (C), model funkčních vztahů s fixním poměrem rozptylu chyb měření (k = σ X/σy, r = 0) s a bez fylogenetické korelace a rmaM (I) a rmaM (C), snížená regrese hlavní osy zahrnující chybu měření s a bez fylogenetické korelace. Chybové pruhy udávají 95% intervaly zahrnutí odhadů. Numerická konvergence k odhadu ML neproběhla u 1,2% kombinací metod odhadu souboru údajů nekonvergentní případy byly zahrnuty do 95% intervalů zahrnutí, ale nikoli do průměrných odhadů b1. (b a d) Podíl simulovaných datových souborů 2000 odpovídajících (a) a (c), v nichž měl daný model nejvyšší pravděpodobnost. Protože pravděpodobnost modelů rma a vrf je stejná, jsou tyto kombinovány.

Navzdory absenci předpojatosti existuje mezi modely značná variabilita v přesnosti odhadů b1, jak ukazují jejich 95% intervaly zařazení. Není překvapením, že největší přesnosti (nejmenšího intervalu zahrnutí) bylo dosaženo modelem použitým k simulaci dat, rmaM (C).Přesnost modelu rma (C) však byla téměř identická. Oba modely VRF měly špatnou přesnost, zvláště když došlo k velké chybě měření (obr. 5c).

Překvapivě model rmaM (C) použitý ke generování dat ne vždy nejlépe odpovídal simulovaným datům (obr. 5b, 5d), a to ani v případě vysoké chyby měření (obr. 5d), byl to nejlépe vyhovující model pouze pro něco málo přes 50% simulovaných datových souborů a v případě chyby s nízkou měřením (obr. 5b) byl model rma (C) vybrán jako nejlépe padnoucí model častěji než model rmaM (C). Kromě toho byly poměrně často vybrány nefylogenetické modely. Částečně je to kvůli malé velikosti vzorku 13 druhů pomocí simulačních studií, Blomberg et al. (2003) ukázali, že spolehlivá detekce fylogenetického signálu (nehvězdné fylogenetiky) pomocí jednorozměrných datových souborů vyžaduje alespoň 20 druhů. Tento příklad poskytuje upozornění na statistickou schopnost identifikovat správný statistický model z malých datových sad.


Molekulární a evoluční procesy generující variace v genové expresi

Dědičná variace v genové expresi je běžná uvnitř druhů i mezi nimi. Tato variace vyplývá z mutací, které mění formu nebo funkci regulačních sítí molekulárních genů, které jsou poté filtrovány přirozeným výběrem. Vysoce výkonné metody pro zavádění mutací a charakterizaci jejich cis- a trans-regulačních účinků na genovou expresi (zejména transkripce) odhalují, jak různé molekulární mechanismy generují regulační variace, a studie porovnávající tyto mutační efekty s variacemi pozorovanými ve volné přírodě se od sebe odtrhávají role neutrálních a neutrálních evolučních procesů. Tato integrace molekulární a evoluční biologie nám umožňuje pochopit, jak vznikla variace v genové expresi, kterou dnes vidíme, a předpovědět, jak se nejpravděpodobněji bude vyvíjet v budoucnosti.

Obrázky

Obrázek 1:. cis - a trans -regulační…

Obrázek 1:. cis - a trans -regulační příspěvky k výrazovým rozdílům mezi druhy a uvnitř druhů.

Obrázek 2 .. Zdroje cis -regulační variace…

Obrázek 2 .. Zdroje cis -regulační variace v eukaryotech.

Mutace (označené blesky) ovlivňující…

Obrázek 3 .. Zdroje transregulačních variací.

Obrázek 3 .. Zdroje transregulačních variací.

Mutace (indikované blesky), které mohou ovlivnit výraz ...

Obrázek 4 :. Použití mutačních efektů k odvození…

Obrázek 4 :. Využití mutačních efektů k odvození působení přirozeného výběru.


Závěry

Moderní biologie rychle objevuje dynamickou povahu fenotypových variací a genetických omezení. Identifikace specifických genů reprezentovaných QTL a funkcí těchto genů je klíčovým dalším krokem k pochopení variací a omezení v adaptivním evolučním procesu. Tento průzkum má potenciál odhalit sítě genů ve vývojových programech zodpovědných za fenotypy, fenotypovou integraci a omezení. Obzvláště fascinující je, že mnoho procesů, které generují jak genetické variace, tak omezení, bude pravděpodobně působit současně v jednom genomu v daném bodě. Jak se naše chápání fylogenetických vztahů na všech úrovních zlepšuje, lze použít explicitní evoluční rámce ke zkoumání fenotypových změn z mnoha hledisek, včetně vývojové, genové exprese (např. Strukturální vs. regulační) a ekologické (např. Whittal et al., 2006 ). Kromě toho, protože jsou sekvenovány genomy dalších modelových a nemodelních rostlin, srovnávací genomika umožní další pohled na fenotypovou evoluci a genetická omezení ekologicky důležitých znaků. Mezi nejslibnější techniky, které jsou v současné době k objasnění takových jevů k dispozici, patří reciproční transgenika, která umožňuje rozbor cis- a trans-regulační změny (např. Hay a Tsiantis, 2006) a aplikace genového knockdownu na bázi RNAi, které umožňují hodnocení endogenních genových funkcí u nemodelních druhů (Burch-Smith et al., 2004 Hileman et al., 2005) . K získání úplného obrazu o tom, jak tyto někdy protichůdné evoluční dynamiky ovlivňují genom, bude tedy vyžadovat aplikaci více globálních přístupů a technik.


3.4.6 Biodiverzita v rámci komunity

Příležitosti pro rozvoj dovedností

Biodiverzita se může týkat řady stanovišť, od malého místního stanoviště až po Zemi.

Druhová bohatost je měřítkem počtu různých druhů v komunitě.

Index rozmanitosti popisuje vztah mezi počtem druhů v komunitě a počtem jedinců v každém druhu.

Výpočet indexu rozmanitosti () ze vzorce

kde = celkový počet organismů všech druhů

a = celkový počet organismů každého druhu.

Zemědělské techniky snižují biologickou rozmanitost. Rovnováha mezi ochranou a zemědělstvím.

Studentům mohla být poskytnuta data, ze kterých vypočítají index rozmanitosti a interpretují význam vypočtené hodnoty indexu.


Nenáhodné páření

Pokud se jednotlivci nerandomicky spárují s jinými jedinci v populaci, tj. Zvolí si svého partnera, mohou volby řídit vývoj v populaci. Existuje mnoho důvodů, proč dochází k náhodnému páření. Jedním z důvodů je například jednoduchá volba partnera nebo sexuální výběr. Znaky, které vedou k více páření pro jednotlivce, vedou k většímu počtu potomků a díky přirozenému výběru nakonec vedou k vyšší frekvenci tohoto znaku v populaci. Jednou z běžných forem volby partnera, nazývané pozitivní asortativní páření, je individuální a rsquos preference páření s partnery, kteří jsou si fenotypicky podobní.

Obrázek ( PageIndex <1> ): Asortativní páření v americkém Robinu: Americký Robin může praktikovat asortativní páření na barvě peří, což je znak založený na melaninu, a spářit se s jinými červenatci, kteří mají nejvíce podobný odstín barvy. Může však také existovat určitý sexuální výběr pro zářivější peří, které indikuje zdraví a reprodukční výkonnost.

Další příčinou náhodného páření je fyzické umístění. To platí zejména ve velkých populacích rozložených na velké geografické vzdálenosti, kde ne všichni jednotlivci budou mít k sobě stejný přístup. Některé mohou být na míle vzdáleny lesem nebo drsným terénem, ​​zatímco jiné mohou bydlet bezprostředně poblíž.


Obsah

Rekapitulace Upravit

Étienne Serres v letech 1824–26 navrhl teorii rekapitulace evolučního vývoje, která odráží myšlenky Johanna Friedricha Meckela z roku 1808. Tvrdili, že embrya „vyšších“ zvířat prošla nebo rekapitulovala řadu fází, z nichž každá připomínala zvíře níže ve velkém řetězci bytí. Například mozek lidského embrya vypadal nejprve jako rybí, pak jako mozek plazů, ptáků a savců, než se stal jasně lidským. Proti tomu se postavil embryolog Karl Ernst von Baer, ​​který v roce 1828 tvrdil, že neexistuje lineární posloupnost jako ve velkém řetězci bytí, založená na jediném plánu těla, ale proces epigeneze, ve kterém se struktury odlišují. Von Baer místo toho poznal čtyři odlišné plány zvířecích těl: vyzařují, jako hvězdice měkkýši, jako škeble artikulují, jako humři a obratlovci, jako ryby. Zoologové pak do značné míry upustili od rekapitulace, ačkoli Ernst Haeckel ji oživil v roce 1866. [2] [3] [4] [5] [6]

Evoluční morfologie Upravit

Od počátku 19. století do většiny 20. století stála embryologie před tajemstvím. Bylo vidět, že se zvířata vyvíjejí z vajíček na dospělé s velmi odlišným tělesným plánem, často v podobných fázích, ale zoologové nevěděli téměř nic o tom, jak byl embryonální vývoj řízen na molekulární úrovni, a tedy stejně málo o tom, jak se vývojové procesy vyvíjely. [7] Charles Darwin tvrdil, že sdílená embryonální struktura předpokládá společného předka. Jako příklad toho uvedl Darwin ve své knize z roku 1859 O původu druhů larva krevetky barnacle, jejíž přisedlí dospělí nevypadali jako ostatní členovci, které Linnaeus a Cuvier klasifikovali jako měkkýši. [8] [9] Darwin také poznamenal zjištění Alexandra Kowalevského, že i plášťovec nebyl měkkýš, ale v jeho larválním stádiu měl notochord a faryngální štěrbiny, které se vyvinuly ze stejných zárodečných vrstev jako ekvivalentní struktury u obratlovců, a měl by proto s nimi být seskupeni jako strunatci. [8] [10] Zoologie 19. století tak převedla embryologii na evoluční vědu, spojující fylogenezi s homologiemi mezi zárodečnými vrstvami embryí. Zoologové včetně Fritze Müllera navrhli využití embryologie k objevení fylogenetických vztahů mezi taxony. Müller prokázal, že korýši sdílejí larvu Nauplius a identifikovali několik parazitických druhů, které nebyly uznány jako korýši. Müller také uznal, že přirozený výběr musí působit na larvy, stejně jako na dospělé, lhát rekapitulaci, která by vyžadovala, aby byly larvální formy chráněny před přirozeným výběrem. [8] Dvě další Haeckelovy myšlenky o vývoji vývoje dopadly lépe než rekapitulace: v 70. letech 19. století tvrdil, že změny v načasování (heterochronie) a změny v umístění těla (heterotopy) aspektů embryonálního vývoje by vedly evoluce změnou tvaru těla potomka ve srovnání s předkem. Trvalo celé století, než se tyto myšlenky ukázaly jako správné. [11] [12] [13] V roce 1917 napsal D'Arcy Thompson knihu o tvarech zvířat, která jednoduchou matematikou ukazuje, jak malé změny parametrů, jako jsou úhly spirálové skořápky plži, mohou radikálně změnit zvířecí formu, ačkoli dával přednost mechanickému před evolučním vysvětlením. [14] [15] Ale pro další století, bez molekulárních důkazů, pokrok se zastavil. [8]

Moderní syntéza z počátku 20. století Edit

V takzvané moderní syntéze počátku 20. století Ronald Fisher spojil Darwinovu evoluční teorii s důrazem na přirozený výběr, dědičnost a variace a genetické zákony Gregora Mendela do ucelené struktury pro evoluční biologii. Biologové předpokládali, že organismus je přímým odrazem jeho jednotlivých genů: genů kódovaných pro bílkoviny, které budovaly tělo organismu. Biochemické dráhy (a předpokládalo se, že nové druhy) se vyvinuly mutacemi v těchto genech. Byl to jednoduchý, jasný a téměř ucelený obraz: ale nevysvětloval embryologii. [8] [16]

Evoluční embryolog Gavin de Beer ve své knize z roku 1930 předpokládal evoluční vývojovou biologii Embrya a předci, [17] tím, že ukazuje, že evoluce může nastat heterochronicky, [18] například při zachování juvenilních rysů u dospělých. [11] To, de Beer tvrdil, by mohlo způsobit zjevně náhlé změny ve fosilním záznamu, protože embrya fosilují špatně. Protože mezery ve fosilních záznamech byly použity jako argument proti Darwinově postupné evoluci, de Beerovo vysvětlení podpořilo darwinovskou pozici. [19] Navzdory de Beerovi moderní syntéza do značné míry ignorovala embryonální vývoj, aby vysvětlila formu organismů, protože populační genetika se zdála být adekvátním vysvětlením toho, jak se formy vyvíjely. [20] [21] [a]

The lac operon Edit

V roce 1961 Jacques Monod, Jean-Pierre Changeux a François Jacob objevili lac operon v bakterii Escherichia coli. Byl to shluk genů, uspořádaný do smyčky pro kontrolu zpětné vazby, takže jeho produkty byly vyráběny pouze tehdy, když byly „zapnuty“ podnětem prostředí. Jedním z těchto produktů byl enzym, který štěpí cukr, laktózu a laktóza samotná byla podnětem, který zapnul geny. Bylo to zjevení, protože poprvé ukázalo, že geny, dokonce i v organismu tak malém jako bakterie, podléhají jemnozrnné kontrole. Důsledkem bylo, že mnoho dalších genů bylo také komplikovaně regulováno. [23]

Zrození evo-devo a druhá syntéza Edit

V roce 1977 začala revoluce v myšlení o evoluci a vývojové biologii s příchodem technologie rekombinantní DNA do genetiky a prací Ontogeneze a fylogeneze od Stephena J. Goulda a Evoluce Tinkeringem od Françoise Jacoba. Gould položil k odpočinku Haeckelovu interpretaci evoluční embryologie, zatímco Jacob stanovil alternativní teorii. [8] To vedlo k druhé syntéze, [24] [25] konečně zahrnující embryologii a také molekulární genetiku, fylogenezi a evoluční biologii k vytvoření evo-devo. [26] [27] V roce 1978 objevil Edward B. Lewis homeotické geny, které regulují embryonální vývoj v Drosophila ovocné mušky, které jsou jako veškerý hmyz členovci, jedna z hlavních kmenů bezobratlých živočichů. [28] Bill McGinnis rychle objevil homeotické genové sekvence, homeoboxy, u zvířat v jiné fýle, u obratlovců, jako jsou žáby, ptáci a savci, byli později nalezeni také v houbách, jako jsou kvasinky, a v rostlinách. [29] [30] V genech, které řídily vývoj napříč všemi eukaryoty, byla evidentně silná podobnost. [31] V roce 1980 popsali Christiane Nüsslein-Volhard a Eric Wieschaus mezerové geny, které pomáhají vytvořit model segmentace v embryích ovocných mušek [32] [33], a spolu s Lewisem získali za svou práci v roce 1995 Nobelovu cenu. [29] [ 34]

Později byly objeveny konkrétnější podobnosti: například gen Distal-less byl v roce 1989 zapojen do vývoje přívěsků nebo končetin u ovocných mušek, [35] ploutví ryb, křídel kuřat, parapodií mořští červi annelidů, ampule a sifony pláštěnců a nohy trubek mořských ježků. Bylo evidentní, že gen musí být starověký, sahající až k poslednímu společnému předkovi dvoustranných zvířat (před obdobím Ediacaran, které začalo asi před 635 miliony let). Evo-devo začal objevovat způsoby, jak byla během vývoje stavěna všechna těla zvířat. [36] [37]

Hluboká homologie Upravit

Zhruba kulovitá vejce různých zvířat dávají vzniknout extrémně odlišným tělům, od medúz přes humry, motýly až po slony. Mnoho z těchto organismů sdílí stejné strukturní geny pro bílkoviny pro stavbu těla, jako je kolagen a enzymy, ale biologové očekávali, že každá skupina zvířat bude mít svá vlastní pravidla vývoje. Překvapením evo-devo je, že tvarování těl je řízeno poměrně malým procentem genů a že tyto regulační geny jsou staré a sdílejí je všechna zvířata. Žirafa nemá gen pro dlouhý krk, stejně jako slon má gen pro velké tělo. Jejich těla jsou vzorována systémem přepínání, který způsobuje, že vývoj různých rysů začíná dříve nebo později, probíhá v té či oné části embrya a pokračuje více či méně času. [7]

Hádanka, jak byl řízen embryonální vývoj, se začala řešit pomocí ovocné mušky Drosophila melanogaster jako modelový organismus. Podrobná kontrola její embryogeneze byla vizualizována připojením fluorescenčních barviv různých barev ke specifickým typům bílkovin vytvořených geny exprimovanými v embryu. [7] Barvivo, jako je zelený fluorescenční protein, původem z medúzy, bylo typicky připojeno k protilátce specifické pro protein ovocné mušky, což tvoří přesný ukazatel, kde a kdy se tento protein objevil v živém embryu. [38]

Použitím takové techniky Walter Gehring v roce 1994 zjistil, že pax-6 gen, zásadní pro formování očí ovocných mušek, přesně odpovídá oku tvořícímu genu u myší a lidí. Stejný gen byl rychle nalezen v mnoha dalších skupinách zvířat, jako je chobotnice, měkkýš hlavonožce. Biologové včetně Ernsta Mayra věřili, že oči vznikly v říši zvířat nejméně 40krát, protože anatomie různých typů očí se velmi liší. [7] Například složené oko ovocné mušky je tvořeno stovkami struktur s malými čočkami (ommatidia), lidské oko má slepé místo, kde zrakový nerv vstupuje do oka, a nervová vlákna probíhají po povrchu sítnice, takže světlo musí projít vrstvou nervových vláken, než dosáhne detekčních buněk v sítnici, takže struktura je naopak efektivně „vzhůru nohama“, oko hlavonožce má sítnici, pak vrstvu nervových vláken, pak stěnu oko „správným směrem“. [39] Důkazy o pax-6"Nicméně bylo to, že stejné geny řídily vývoj očí všech těchto zvířat, což naznačuje, že se všichni vyvinuli ze společného předka." [7] Starověké geny byly uchovávány po miliony let evoluce, aby vytvářely rozdílné struktury pro podobné funkce, což dokazuje hlubokou homologii mezi strukturami, které se dříve považovaly za čistě analogické. [40] [41] Tento pojem byl později rozšířen na evoluci embryogeneze [42] a způsobil radikální revizi významu homologie v evoluční biologii. [40] [41] [43]

Gene toolkit Edit

Malá část genů v genomu organismu řídí vývoj organismu. Tyto geny se nazývají vývojově-genetická sada nástrojů. Jsou mezi phylou vysoce konzervovaní, což znamená, že jsou starověcí a velmi podobní v široce oddělených skupinách zvířat. Rozdíly v nasazení genů sady nástrojů ovlivňují tělesný plán a počet, identitu a strukturu částí těla. Většina genů sady nástrojů je součástí signálních drah: kódují transkripční faktory, proteiny adheze buněk, proteiny receptorů buněčného povrchu a signální ligandy, které se na ně vážou, a vylučované morfogeny, které difundují embryem. To vše pomáhá definovat osud nediferencovaných buněk v embryu. Společně vytvářejí vzory v čase a prostoru, které formují embryo a nakonec tvoří tělesný plán organismu. Mezi nejdůležitější geny sady nástrojů patří Hox geny. Tyto transkripční faktory obsahují motiv DNA vázající protein homeobox, nacházející se také v jiných genech sady nástrojů, a vytvářejí základní vzor těla podél jeho osy zepředu dozadu. [43] Geny Hox určují, kde opakující se části, jako například mnoho obratlů hadů, porostou ve vyvíjejícím se embryu nebo larvě. [7] Pax-6, již zmíněný, je klasický gen sady nástrojů. [44] Ačkoli se na sestavení plánu těla rostliny podílejí další geny sady nástrojů, [45] geny homeoboxu se nacházejí také v rostlinách, což znamená, že jsou společné všem eukaryotům. [46] [47] [48]

Regulační sítě embrya Upravit

Proteinové produkty regulační sady nástrojů nejsou opakovaně použity duplikováním a modifikací, ale komplexní mozaikou pleiotropie, která se beze změny aplikuje v mnoha nezávislých vývojových procesech a dává vzor mnoha různým tělesným strukturám.[43] Místa těchto pleiotropních genů sady nástrojů mají velké, komplikované a modulární cis-regulační prvky. Například zatímco nepleiotropní gen rodopsinu v ovocné mušce má cis-regulační prvek dlouhý jen několik stovek párů bází, pleiotropní bezočivá cis-regulační oblast obsahuje 6 cis-regulačních prvků ve více než 7000 párech bází. [43] Příslušné regulační sítě jsou často velmi rozsáhlé. Každý regulační protein kontroluje „skóre na stovky“ cis-regulačních prvků. Například 67 transkripčních faktorů ovocných mušek ovládalo každý průměrně 124 cílových genů. [43] Celá tato složitost umožňuje zapínat a vypínat geny podílející se na vývoji embrya přesně ve správný čas a na správných místech. Některé z těchto genů jsou strukturální, přímo vytvářejí enzymy, tkáně a orgány embrya. Ale mnoho dalších jsou samy regulačními geny, takže to, co je zapnuto, je často přesně načasovaná kaskáda přepínání, zahrnující zapínání jednoho vývojového procesu za druhým ve vyvíjejícím se embryu. [43]

Taková kaskádová regulační síť byla podrobně studována ve vývoji embrya ovocných mušek. Mladé embryo má oválný tvar, jako ragbyový míč. Malý počet genů produkuje poslové RNA, které vytvářejí koncentrační gradienty podél dlouhé osy embrya. V raných embryích, bicoid a hrbáč geny jsou ve vysoké koncentraci blízko předního konce a dávají vzor budoucí hlavě a hrudníku ocasní a nanos geny jsou ve vysoké koncentraci blízko zadního konce a dávají vzor nejzadnějším břišním segmentům. Účinky těchto genů interagují například, protein Bicoid blokuje translaci ocasní's messenger RNA, takže koncentrace Caudal proteinu se na předním konci sníží. Caudal později zapne geny, které vytvářejí nejzadnější segmenty mouchy, ale pouze na zadním konci, kde je nejvíce koncentrovaný. [49] [50]

Proteiny Bicoid, Hunchback a Caudal zase regulují transkripci genů mezery, jako jsou obří, knirps, Krüppel, a bez ocasu v pruhovaném vzoru, vytvářející první úroveň struktur, ze kterých se stanou segmenty. [32] Proteiny z nich zase ovládají geny s párovými pravidly, které v další fázi vytvořily 7 pásů podél dlouhé osy embrya. Nakonec geny polarity segmentu, jako je rozzuřený rozdělte každé ze 7 pásem na dvě, čímž vytvoříte 14 budoucích segmentů. [49] [50]

Tento proces vysvětluje přesnou konzervaci genových sekvencí sady nástrojů, což vedlo k hluboké homologii a funkční ekvivalenci proteinů sady nástrojů u nepodobných zvířat (pozorováno například tehdy, když myší protein řídí vývoj ovocných mušek). Interakce transkripčních faktorů a cis-regulačních prvků nebo signálních proteinů a receptorů se uzamknou prostřednictvím více použití, což způsobí, že téměř jakákoli mutace je škodlivá, a proto je eliminuje přirozený výběr. [43]

Mezi překvapivější a možná i neintuitivní (nedávno-darwinovské hledisko) výsledky nedávného výzkumu v evoluční vývojové biologii patří to, že rozmanitost tělesných plánů a morfologie v organismech napříč mnoha fýlami nemusí nutně odrážet rozmanitost na úrovni sekvence genů, včetně sekvencí vývojové genetické sady nástrojů a dalších genů zapojených do vývoje. Opravdu, jak poznamenali John Gerhart a Marc Kirschner, existuje zjevný paradox: „tam, kde nejvíce očekáváme, že najdeme variace, najdeme zachování, nedostatek změn“. [51] Pokud tedy pozorovaná morfologická novinka mezi různými klady nepochází ze změn v genových sekvencích (například mutací), odkud pochází? Novinka může nastat mutacemi řízenými změnami v genové regulaci. [43] [52] [53] [54]

Variace v sadě nástrojů Upravit

Variace v sadě nástrojů mohly způsobit velkou část morfologické evoluce zvířat. Sada nástrojů může řídit vývoj dvěma způsoby. Gen sady nástrojů může být vyjádřen v jiném vzoru, jako když byl zobák Darwinova velkého pozemního pěnkavy zvětšen BMP gen, [55] nebo když hadi přišli o nohy jako distálně-méně na místech, kde si ostatní plazi nadále formovali končetiny, se projevovali nedostatečně nebo vůbec. [56] Nebo může gen sady nástrojů získat novou funkci, jak je vidět na mnoha funkcích stejného genu, distálně-méně, který ovládá tak rozmanité struktury, jako je čelist u obratlovců, [57] [58] nohy a tykadla v ovocné mušce, [59] a vzor potu v motýlích křídlech. [60] Vzhledem k tomu, že malé změny v genech sady nástrojů mohou způsobit významné změny v tělesných strukturách, často umožnily konvergenciálně nebo paralelně stejnou funkci. distálně-méně generuje křídelní vzory u motýlů Heliconius erato a Heliconius melpomene, což jsou Müllerian mimics. V takzvané usnadněné variaci [61] jejich vzory křídel vznikaly v různých evolučních událostech, ale jsou ovládány stejnými geny. [62] Vývojové změny mohou přímo přispět ke speciaci. [63]

Konsolidace epigenetických změn Upravit

Evoluční inovace může někdy začít v lamarckovském stylu epigenetickými změnami genové regulace nebo generováním fenotypu, následně konsolidovanými změnami na genové úrovni. Epigenetické změny zahrnují modifikaci DNA reverzibilní methylací [64], jakož i neprogramované přetváření organismu fyzickými a jinými vlivy prostředí v důsledku inherentní plasticity vývojových mechanismů. [65] Biologové Stuart A. Newman a Gerd B. Müller navrhli, že organismy na počátku historie mnohobuněčného života byly náchylnější k této druhé kategorii epigenetického určení než moderní organismy, které poskytují základ pro rané makroevoluční změny. [66]

Vývojová předpojatost Upravit

Vývoj ve specifických liniích může být zkreslený buď pozitivně, k dané trajektorii nebo fenotypu, [b] nebo negativně, mimo produkci určitých typů změn, buď může být absolutní (změna je vždy nebo nikdy není produkována) nebo relativní. Důkazy pro jakýkoli takový směr v evoluci je však těžké získat a mohou také vyplývat z vývojových omezení, která omezují diverzifikaci. [68] Například u plžů je skořápka šnečího typu vždy stavěna jako trubice, která roste jak do délky, tak i do průměru, což v nich vytváří širokou škálu tvarů skořepin, jako jsou ploché spirály, kravaty a vysoké věžové spirály. omezení. Mezi stonožkami má Lithobiomorpha jako dospělý vždy 15 kmenových segmentů, pravděpodobně výsledek vývojové předpojatosti směrem k lichému počtu kmenových segmentů. Další řád stonožky, Geophilomorpha, počet segmentů se liší u různých druhů mezi 27 a 191, ale počet je vždy lichý, což z něj činí absolutní omezení, téměř všechna lichá čísla v tomto rozsahu jsou obsazena jedním nebo jiným druhem. [67] [69] [70]

Ekologická evoluční vývojová biologie (eco-evo-devo) integruje výzkum vývojové biologie a ekologie, aby prozkoumala jejich vztah k evoluční teorii. [71] Vědci studují koncepty a mechanismy, jako je vývojová plasticita, epigenetická dědičnost, genetická asimilace, konstrukce niky a symbióza. [72] [73]


Podívejte se na video: Varijacije (Listopad 2021).