Informace

3.3.8: Data Dive - populace lišek ostrovních - biologie


Přehled

Pracovní skupina pro ochranu ostrova Fox a přátelé neziskové organizace Island Fox usilovně pracují na neustálém financování výzkumných a ochranářských projektů, aby zajistily trvalé přežití lišky ostrovní. Výsledky tohoto setkání můžete vidět v grafu a tabulce níže:

Obrázek ( PageIndex {a} ): Populační trendy pro poddruhy lišky ostrovní (plné čáry = velké ostrovní poddruhy, přerušované čáry = malé ostrovní poddruhy). Graf Rachel Schleiger (CC-BY-NC) upraven z dat v aktualizaci Island Island Status 2019.

Obrázek ( PageIndex {b} ): Stavy určené pro rok 2019 pro poddruhy lišky ostrovní na základě liščí populace a velikosti ostrova. Graf Rachel Schleiger (CC-BY-NC) upraven z dat v aktualizaci Island Island Status 2019.

Otázky

  1. Co je to nezávislá (vysvětlující) proměnná a závislá (odpověď) proměnná?
  2. Na jaké otázky se snaží autoři pomocí tohoto grafu a tabulky odpovědět?
  3. Který poddruh lišky ostrovní je podle vás nejstabilnější? Proč?
  4. Které roky byly pro většinu poddruhů lišky ostrovní špatné (což znamená, že odhady populace byly velmi nízké)?
  5. Jak je uvedeno v grafu, populace se odhadují pro každý poddruh ročně. Proč si myslíte, že v plánu ochrany byl místo delšího časového intervalu zvolen roční odhad?

3.3.8: Data Dive - populace lišek ostrovních - biologie

Tato studie si dala za cíl identifikovat koreláty zneužívání fentanylu v minulém roce v USA.

Užívání heroinu (44,3%) a SUD (38,2%) se často objevovalo při zneužívání fentanylu v loňském roce.

Tato skupina měla také velmi vysokou míru poruchy užívání nealkoholových látek (78,7%).

Zneužívání fentanylu bylo spojeno s častou poruchou užívání opioidů na předpis (53,7%).

Osoby se zneužíváním fentanylu v loňském roce jsou silně opioidy a zahrnují mnoho látek.


Abstraktní

Proměna pěstování je rozšířené využívání půdy v tropech, které je považováno za hlavní hrozbu pro rozmanitost a strukturu deštných pralesů. Na Filipínách, v zemi s bohatou biologickou rozmanitostí a vysokou mírou endemismu druhů, převládá pěstování, místně nazývané jako kaingin, hlavní využití půdy a je po staletí. Navzdory potenciálnímu dopadu přesunu pěstování na lesy a jeho důležitosti pro mnoho lidí není jasné, jak se biologická rozmanitost a struktura lesů obnoví po opuštění kainginů v zemi a jak dobře mohou tyto post-kainginské sekundární lesy doplňovat lesy pralesa. Zkoumali jsme parametry lesní diverzity a struktury podle gradientu úhoru v sekundárních lesích regenerujících se po opuštění kainginů na ostrově Leyte na Filipínách (nadmořská výška: 445–650 m n. M.). Nejprve jsme změřili indexy stromové diverzity a struktury lesů v regenerujících sekundárních lesích a pralesích. Poté jsme změřili obnovu stromové diverzity a parametrů struktury lesa ve vztahu ke pralesu. Nakonec jsme pomocí lineárních modelů se smíšeným efektem (LMM) vyhodnotili vliv různých environmentálních proměnných na obnovu lesní diverzity a struktury. Zjistili jsme podstatně vyšší druhovou hustotu na nejstarších úhorových lokalitách, zatímco Shannonův index, rovnoměrnost druhů, počet stonků, bazální plocha a index listové plochy byly vyšší ve pralesích. V lokalitách staršího úhoru bylo nalezeno homogenní druhové složení. Multivariační analýza odhalila velikost záplaty jako silný prediktor diverzity stromů a obnovy struktury lesa po přesunu kultivace. Naše studie naznačuje, že sekundární lesy regenerující se po přesunu opuštění kultivace se mohou rychle zotavit. Přestože obnova lesní struktury nebyla tak rychlá jako rozmanitost stromů, naše starší úhorové lokality obsahovaly podobný počet druhů jako prales. Mnoho z těchto druhů je také endemických na Filipínách. Nové a vznikající ekosystémy, jako jsou tropické sekundární lesy, mají velký význam z hlediska ochrany a mohou fungovat jako útočiště pro ubývající biologickou rozmanitost tropických lesů.


1. ÚVOD

Pokračující krize biologické rozmanitosti představuje vážnou hrozbu jak pro globální ekosystémy, tak pro globální socioekonomiku (Naidoo et al., 2006). Zřízení a správa sítí chráněných území (PAN) je jednou z nejrozšířenějších a nejefektivnějších akcí k zachování biologické rozmanitosti (Moilanen, 2007 Possingham, Wilson, Andelman, & Vynne, 2006). V této souvislosti se priorita prostorové ochrany (SCP), aktivita identifikace oblastí důležitých pro dosažení cílů zachování biologické rozmanitosti nákladově efektivně, stala jednou z ústředních metod plánování ochrany (Kukkala & Moilanen, 2012 Moilanen & Arponen, 2011). Ochranná biogeografie poskytuje koncepční základ pro návrh PAN, které široce zachycují klíčové atributy biologické rozmanitosti (Ladle & Whittaker, 2011 Whittaker et al., 2005), včetně těch ekologických a historických procesů, které jsou základem současného vzorce biologické rozmanitosti (Hawkins et al., 2003 Mittelbach et al., 2007 Ricklefs, 2004). Metody SCP, které jsou informovány biogeografií, mohou přispět k efektivní reprezentaci evoluce, historických událostí a procesů sestavování druhů (Ferrier, Faith, Arponen, & Drielsma, 2009 Kusumoto et al., 2017).

Biodiverzita na ostrovech existuje přirozeně roztříštěně a je často charakterizována endemičností, zejména na oceánských ostrovech. Ostrovy významně přispívají ke globální biologické rozmanitosti, mnohé z nich jsou prioritami ochrany (Whittaker & Fernández-Palacios, 2007) a jsou vysoce hodnoceny mezi globálními body biologické rozmanitosti (Mittermeier, Turner, Larsen, Brooks a Gascon, 2011). Vzhledem ke své odlišné biogeografické historii slouží východoasijské ostrovy (které tvoří Japonsko) jako ideální region, ve kterém mohou biogeografové ochrany vyvíjet analýzy prostorové prioritizace s cílem dlouhodobého zachování ekologického a evolučního potenciálu. Geografické procesy na východoasijských ostrovech, jako je spojení mezi pevninou a kontinentem v reakci na paleoklimatické změny, formovaly jedinečné vzorce biologické rozmanitosti prostřednictvím rozptylu specifického pro taxony a evoluční diverzifikace související s izolací a/nebo paleoklimatickou změnou (Kubota, Hirao, Fujii , Shiono, & Kusumoto, 2014 Shiono, Kusumoto, Yasuhara, & Kubota, 2018 Tojo et al., 2017). Navzdory ekologicky a/nebo evolučně odlišným biotám v regionu vedly nedávné antropogenní tlaky ke ztrátě přirozeného prostředí, degradaci a fragmentaci, což ohrožuje globálně významnou biodiverzitu (Kusumoto et al., 2015). Kromě toho má japonská PAN silnou prostorovou zaujatost vůči méně produktivním a vzdáleným oblastem (Kusumoto et al., 2017). Japonská vláda se v poslední době zavázala rozšířit pokrytí japonského pozemního PAN na 17% plochy, jak bylo dohodnuto v cíli Aichi 11 Úmluvy o biologické rozmanitosti (Ministerstvo životního prostředí, 2012). Přesto nebyla dosud provedena žádná komplexní, ekologicky odůvodněná prostorová analýza, která by identifikovala rozšíření PAN, která by zachycovala japonskou biologickou rozmanitost a biogeografické procesy efektivně a vyváženě z hlediska oblasti.

Vzory biologické rozmanitosti závislé na taxonech a jejich podpůrné ekologické/evoluční procesy lze nejlépe vystihnout plánováním ochrany specifickým pro taxony, které zohledňuje minulé ztráty způsobené taxonem, hlavní současné hrozby a nákladovou efektivitu alternativních ochranářských akcí. Proto je taxonově specifická SCP analýza užitečná pro stanovení základních priorit ochrany pro jednotlivé taxony, zejména z hlediska konzervační biogeografie. Prostorová nesourodost prioritních oblastí u různých taxonů však může naznačovat, že předpoklady náhradního mateřství nefungují dobře (Franco et al., 2009) a oddělené cíle ochrany pro jednotlivé taxony sníží plošnou účinnost celkových prioritních oblastí (Jenkins, Guénard, Diamond (Weiser, & Dunn, 2013). Proto je kriticky zapotřebí multitaxonový přístup SCP k zajištění klíčových biogeografických procesů napříč taxony, které mají různé rozptylové schopnosti a evoluční historii, přičemž je zohledněna celková efektivita oblasti (nákladů). Odborníci na ochranu přírody mohou také zdůraznit taxonomické nebo druhové skupiny na základě jejich příspěvku k funkcím ekosystému nebo ekonomickým hodnotám (Brown et al., 2013 Ellison et al., 2005 Sergio, Newton, & Marchesi, 2005), které mohou být implementovány taxonem vážení.

V této studii vyvíjíme dvoustupňový přístup SCP k identifikaci nejvhodnějších oblastí rozšíření PAN v Japonsku jako modelu ostrovní biogeografie pro zachování, aby byl splněn 17% cíl Aichi. Jako vedlejší produkt hodnotíme výkonnost současného PAN z hlediska pokrytí biologickou rozmanitostí. Naše upřednostňování jsme založili na modelech distribuce druhů postavených v rozlišení 1 km 2 s využitím velkého množství údajů o všech původních japonských obojživelnících, ptácích, sladkovodních rybách, savcích, plazech a cévnatých rostlinách (v této studii celkem 6 325 druhů, nazýváme tyto taxony nebo taxonomické skupiny). Nejprve jsme provedli analýzu environmentálních faktorů, abychom vyjasnili vzorce biologické rozmanitosti specifické pro taxony ve vztahu ke geohistorii a paleoklimatické změně. Za druhé, provedli jsme SCP analýzu specifickou pro taxon, abychom stanovili prioritní vzorce pro každý taxon, což také umožnilo prozkoumat prostorovou shodu priorit. Ve třetím kroku jsme spojili data pro všechny taxony do stejné analýzy SCP, a to jak s aktuálním PAN, tak bez něj jako výchozím bodem. Tato multitaxonová analýza SCP nám umožnila identifikovat nákladově efektivní expanze japonské PAN. Nakonec diskutujeme o příslušném významu přístupů k prioritizaci priorit mezi jednotlivci a multitaxony pro podporu plánování územní ochrany v Japonsku.


Webináře na vyžádání

KLAS Reports: Secure Communication 2017 – The Realities of Secure Communication Platform Adoption (2/20) Paul Hess, ředitel výzkumu, KLAS (Tato řada je přístupná pouze těm, kteří pracují v organizacích poskytovatelů zdravotní péče. Registrace prováděné pomocí obecných e -mailových adres &# 8211 gmail, yahoo, hotmail – nebudou akceptovány.) Webinar Sponzorováno: qliqSOFT & amp Vocera (E -mail Nancy Wilcox pro odkaz na archiv.)

Zprávy KLAS: Implementační služby 2017: Které firmy konzistentně překračují očekávání? (10/19) Garrett Hall, ředitel výzkumu, služby implementace kybernetické bezpečnosti a zesilovačů, KLAS (Tato řada je přístupná pouze těm, kteří pracují v organizacích poskytujících zdravotní péči. Registrace prováděné pomocí obecných e -mailových adres – gmail, yahoo, hotmail – nebudou být přijat.) Webinar Sponsored by: Optimum Healthcare IT & amp Galen Healthcare Solutions E -mail Nancy Wilcox for a link to the archive.

Zprávy KLAS: Podíl na trhu EMR v USA v roce 2017 (6/27) Erik Bermudez, vedoucí výzkumu, KLAS (Tato řada je otevřena pouze těm, kteří pracují v organizacích poskytujících zdravotní péči.) E -mail Nancy Wilcoxové o odkaz na archiv.

Zprávy KLAS: Služby řízené péčí založené na hodnotách (3/28) Warren Whitford & amp Lois Krotz, ředitelé výzkumu, KLAS (Tato řada je přístupná pouze těm, kteří pracují v organizacích poskytovatelů zdravotní péče. Registrace prováděny pomocí obecných e-mailových adres – gmail, yahoo , hotmail – nebude přijat.) E -mail na Nancy Wilcox pro odkaz na archiv.

Zprávy KLAS: Bezpečnostní poradenské služby 2016 – Které firmy pomáhají poskytovatelům v noci spát? (29. 11. – Tato událost je přístupná pouze těm, kteří pracují v organizacích poskytujících zdravotní péči) Garrett Hall, ředitel výzkumu, implementace kybernetické bezpečnosti a zesilovačů, KLAS (webinář sponzorovaný společností Clearwater Compliance) E -mail Nancy Wilcoxové o odkaz na archiv.

Zprávy KLAS: Zpracování přirozeného jazyka - pohledy do budoucnosti těžby nestrukturovaných dat (23. 8. – tato událost je přístupná pouze těm, kteří pracují v organizacích poskytujících zdravotní péči) Boyd Stewart, ředitel výzkumu, KLAS (sponzorováno linguamatikou) E -mail Nancy Wilcox odkaz na archiv.

Zprávy KLAS: “Imaging IT Landscape 2016 Enterprise Platform: The Next Nirvana? ” Amy Fetter Johnson, ředitel výzkumu, KLAS Monique Rasband, vrchní ředitel výzkumu, zobrazování a onkologie zesilovačů, KLAS (sponzor webináře: Merge, společnost IBM) Tato událost je přístupná pouze těm, kteří pracují v organizacích poskytujících zdravotní péči, a#8211 pošlete e -mail Nancy Wilcoxové na odkaz na archiv

Zprávy KLAS: “Enterprise Health BI & amp Population Health Management ” Joe Van De Graaff, Director Research, and Mark Allphin, Senior Research Director, KLAS (This event is available for those working at medical providers organizations only – email Nancy Wilcox odkaz na archiv)

Zprávy KLAS: “ Péče založená na hodnotách – Making the Shift: Who Can Help? ” Warren Whitford, ředitel výzkumu, KLAS (Tato akce je přístupná pouze těm, kteří pracují v organizacích poskytujících zdravotní péči) Webinar Sponsored by Valence Health, Lumeris & amp Premier (Kontaktujte Nancy Wilcox pro přístup do archivu webináře)

KLAS Report Spotlight: “ Zabezpečení zdravotních dat: 155 identifikovaných prodejců - kdo chrání vaše data? ” (Tento archiv je k dispozici pouze těm, kteří pracují v organizacích poskytujících zdravotní péči. Svůj požadavek prosím zašlete e -mailem Nancy Wilcox)


7.4 Predikce prediktivní přesnosti

Všechny předchozí navrhují jeden způsob, jak procházet nadměrné a nedostatečné vybavení: Vyhodnoťte naše modely mimo vzorek. Podle definice ale nemáme vzorek, tak jak na něm můžeme vyhodnotit naše modely? Existují dvě rodiny strategií: křížová validace a informační kritéria. Tyto strategie se snaží odhadnout, jak dobře si modely v průměru povedou při předpovídání nových dat. (str. 217, důraz v originále)

7.4.1 Křížová validace.

Oblíbenou strategií pro odhad prediktivní přesnosti je skutečně otestovat prediktivní přesnost modelu na jiném vzorku. Toto je známé jako křížová validace, vynecháme malý kus pozorování z našeho vzorku a vyhodnotíme model na pozorováních, která byla vynechána. Samozřejmě nechceme vynechat data. Obvykle se tedy dělí vzorek na několik kusů, nazývaných „záhyby“. Po tréninku na všech ostatních je model požádán, aby předpověděl každý záhyb. Poté průměrujeme skóre pro každý záhyb, abychom získali odhad přesnosti mimo vzorek. Minimální počet záhybů je 2. V opačném případě můžete z každého bodového pozorování udělat záhyb a přizpůsobit tolik modelů, kolik máte individuálních pozorování. (str. 217, důraz v originále)

Záhyby mají obvykle ekvivalentní velikost a často označujeme celkový počet záhybů (k ), což znamená, že počet případů bude s rostoucím (k ) menší. V krajním případě (k = N ). Cross-validation-one-out (LOO-CV) je název pro tento oblíbený typ křížové validace, který využívá největší možný počet záhybů tím, že do každého záhybu zahrnuje jeden případ (de Rooij & amp Weeda, 2020 viz Zhang & amp Yang, 2015). To bude náš přístup.

Praktický problém s LOO-CV je, že je nákladný z hlediska času a paměti potřebné k opětovné montáži modelu (k = N ) krát. Naštěstí máme aproximaci čistého LOO-CV. Vehtari, Gelman a Gabry (2017) navrhli, aby Pareto vyhladil křížovou validaci odběru vzorků důležitosti (PSIS-LOO-CV) jako účinný způsob aproximace skutečného LOO-CV.


Výsledky a diskuse

Rozsah požárů ve vegetačních společenstvech

Vyvinuli jsme celokontinentální palebnou vrstvu založenou na dálkově snímaných datech historických hotspotů Digital Earth Australia mřížkovaných v rozlišení 2,5  km v období od 1. července 2019 do 11. února 2020 (obr.   1a viz ‘Metody ’) . Na základě této vrstvy odhadujeme, že asi 200 velkých požárů shořelo 10,4 milionu hektarů (asi 25,7 milionů akrů) půdy v jihovýchodní Austrálii (obr. . Požáry postupovaly ze severu na jih a rostly nejrychleji v období od září 2019 do ledna 2020 (doplňkový obrázek   2). V jihovýchodní Austrálii pravidelně dochází k velmi velkým požárům, ale celkový prostorový rozsah požárů Černého léta ve státech Victoria a Nový Jižní Wales (NSW) zdvojnásobuje velké požární události posledních desetiletí (všechny asi 0,5 𠄵  Mha Doplňková data   1), a dokonce i 1851 viktoriánské požáry ‘ Černý čtvrtek ’ (asi 5  Mha). Významným rysem akce byla obrovská velikost jednotlivých požárů: jedenáct přesáhlo 0,1  Mha (tj. 100 000  ha) a sedm překročilo 0,40  Mha (asi 1 milion akrů obr.   1b). Většina velkých požárů (zde definovaných jako Ϡ.1  Mha) vznikla po sloučení několika nezávislých velkých požárů. V celém regionu také došlo k dalším šesti velkým požárům (0,050 𠄰.099  Mha) a mnoha menším požárům (obr.   1b). Největší dva  megafire v severním NSW tvořily komplex přibližně 380  km dlouhý, který pokrýval 2,66  Mha (6,57 milionu akrů) (obr.

A Austrálie se studijní oblastí jako červenou vložkou a b studijní oblast jihovýchodní australské pevniny zrekonstruovaná z dat satelitního hotspotu (viz ‘ Metody ’). Teplota ohně byla škálována mezi minimální a maximální teplotou za vzniku relativní teploty požáru (TR. Nízká   = 𠂐 𠄰.25, střední   =   Ϡ.25 𠄰.50, vysoká   =   Ϡ.50 𠄰.75, velmi vysoká   = & #x02009 Ϡ.75 𠄱.0, ND   =  žádné údaje viz ‘ Metody ’).Široké typy vegetace jsou: RF   =  Rostlinné a vinné houští EF   = 𠂞ucalyptské lesy a lesy OF   =  Ostatní lesy a lesy, SH   =  Shrublands & x vřesoviště #x02009Trávy, Herblands, Ostřice a Rushlands. Celková plocha typů vegetace a jejich podílů spálených v každém ze čtyř pobřežních nebo příbřežních bioregionů (NET   =   New England Tablelands, NNC   =  NSW North Coast, SYB   =  Sydney Basin, SEC & #x02009 =   South East Corner) a v každé kategorii relativní teploty. Hodnota v závorkách po každém megapálení je požární plocha v milionech hektarů.

Přibližně tři čtvrtiny spálených oblastí se vyskytovaly v rámci zbytkové zalesněné vegetace (obr.   2a, b). Mezi širokými typy vegetace založenými na australských hlavních vegetačních skupinách (MVG viz tabulka   1) 7 byly nejvíce zasaženy eukalyptové lesy a lesy (7,34  Mha), ale velké plochy deštných pralesů a viničních houštin (0,33  Mha obr. & #x000a0 2C), keře a vřesoviště (0,22  Mha) a další lesní a lesní ekosystémy (0,25  Mha) byly také spáleny (tabulka   1). Biogeografický rozsah požárů Černého léta je odhalen skutečností, že tyto široké typy vegetace byly zasaženy napříč jedenácti jihovýchodními australskými bioregiony (IBRA bioregiony 8), které se vyskytují ve studované oblasti (obr.   1b a doplňková tabulka &# x000a0 1). Mezi nimi mělo pobřežní a pobřežní bioregiony (NSW North Coast, Sydney Basin, South East Corner a New England Tablelands) nejvyšší procento těchto typů vegetace hořet (PFT), včetně 4,40  Mha (PFT  = �%) eukalyptových lesů a lesů, 0,25  Mha (PFT  = �%) deštného pralesa a révy a 0,18  Mha (PFT  = �%) křovin a vřesovišť (tabulka   1). V některých bioregionech PFT přesáhnout 75%, zejména u deštných pralesů v New England Tablelands a jihovýchodním rohu NSW (obr.   1b a doplňková tabulka   1). Zbývající spálené oblasti sestávaly převážně z odklizené nebo nepůvodní vegetace (2,06  Mha).

A Rozsah 1. července 2019 a#x0201311 únor 2020 požáry. b Široké typy vegetace v jihovýchodní Austrálii červené   =   deštné pralesy a vinné houštiny, zelené   =   eukalyptový les a lesy, hnědé   =   křoviny a vřesoviště, žluté   =   trávy, Ostřice, Rushlands a olivy   =   Ostatní lesy a lesy. C Chladný mírný deštný prales v Barrington Tops, NSW. d Aktivní požáry v megafire Wollemi dne 4. ledna 2020 s jasně viditelnými spálenými oblastmi a refugiemi. E Taxony ovlivněné typem stanoviště rodiny a deštného pralesa (RF  + +  =  rainforest, RF  +  =   polodéšť, RF   =   okraje pralesa, všechny ostatní & #x02009 =  non deštný prales   =  RF −). Vnitřní koláčový graf obsahuje data pouze pro druhy RF  + + , RF  +  a RF. Ap   = a#x02009Apocynaceae, Ar   = 𠂚raliaceae, As x02009 = 𠂞laeocarpaceae, Er   = 𠂞ricaceae, Eu   = 𠂞uphorbiaceae, Fa   = �, Go   = Ȁ  Lauraceae, My   =  Myrtaceae, Or   = Pl x02009Restionaceae, Rh   =  Rhamnaceae, Ru   =  Rutaceae, So   =  Solanaceae, Za   =  Zamiaceae, Oth &#x F Počet druhů podle formy života MS   =   střední keře, LS   =   nízké keře, TS   =   vysoké keře, GF   =  geofytické trvalé forby, PF   = & x02009další trvalé forby, PG   =  trvalé graminoidy, LT   =   nízké stromy, MT   =   střední stromy, EP/CL   = 𠂞piphytes a horolezci, AF/AG &#x #x02009 roční forby a trávy, S/TFC   =   krátké a vysoké kapradiny a cykasy, TT   =   vysoké stromy, AQ   = 𠂚quatic (úplné popisy v ‘Metody ȁ Modré   =   keře, oranžové   =  stromy, žluté   =  trvalé forby a graminoidy a šedé   =   další skupiny. G Podíl spálený (PFM) endemických druhů deštných pralesů (RF ++), polo-deštných pralesů (RF+), okrajových oblastí deštných pralesů (RF) a nedažďových lesů (RF-). Počty druhů jsou uvedeny níže v údajích pro každý typ stanoviště. Střední a dolní a horní závěs každého boxplotu odpovídají mediánu, respektive prvnímu a třetímu kvartilu, zatímco vousy se prodlužují na největší hodnotu ne dále než 1,5násobek mezikvartilového rozsahu. Datové body jsou zobrazeny jako malé kruhy s odlehlými hodnotami vyplněnými černými skupinami stanovišť. Prostředky jsou zobrazeny jako velké černé kruhy. Celkové skupinové rozdíly byly významné (Kruskal –Wallis χ 2   = �.5, df   = 𠂓, P  < 𠂐.001) významné párové skupinové rozdíly (P  < 𠂐.05) na základě dvoustranných testů Wilcoxonova součtu jsou zobrazeny v horní části panelu. h Stojan vzácných, endemických tvorů mallee Eucalyptus imlayensis na hoře Imlay, jižní pobřeží NSW. Obrázky od (C) M.Fagg, (d) NASA ’s Worldview Snapshots application (https://wvs.earthdata.nasa.gov), part of the Earth Observing System Data and Information System, and (h) M.Crisp. © Australská národní botanická zahrada, 1978.

Stůl 1

Dopad lesních požárů 2019 � na typy vegetace ve studované oblasti. Zobrazeny jsou oblasti spálené (FG tisíce hektarů) a jako procento z celkového počtu (PFT) ve všech 11 bioregionech a ve čtyřech pobřežních a pobřežních bioregionech. Pouze velké vegetační skupiny a spáleno#x0003e50% (PFT  > �%) a se skóre dopadu (H)   > 𠂐.25 (viz ‘ Metody ’) alespoň v jednom jednotlivém bioregionu.

Široký typ vegetace a Seskupené bioregionyJednotlivé bioregiony d
KódHlavní vegetační skupina (MVG)Všechny bioregiony b Pobřežní bioregiony c AUANANSÍŤNNCSEKSEHSEKVSYB
FGPFTFGPFTFGFGFGFGFGFGFGFG
Deštné pralesy a révy
1Deštné pralesy a révy328.9033.0244.6558.6 13,06 ° C 175,97 D 32,70 D
Eukalyptový les a lesy
2Eukalypt Vysoké otevřené lesy1357.3353.01116.9756.0 11,40 B 144,24 C 753,62 ° C 152,76 D 80,42 ° C
3Eukalyptové otevřené lesy3849.5433.62246.0664.4 479,76 C 816,58 D 700,48 C
4Nízké otevřené lesy eukalyptu102.3356.784.7858.4 18,89 C. 65,04 D 0,57 E 1,05 D 9,55 D
5Eukalyptové lesy1899.5417.9904.3152.3 389,82 D
11Eukalyptové otevřené lesy129.1410.944.8936.4 0,03 A. 11,52 D 33,00 C.
Celkový7337.8828.24397.0058.8 1 323,74 C 1 360,56 D 1 245,70 C
Ostatní lesy a lesy
6Akátové lesy a lesy41.244.112.3968.90,013 C. 12,32 D 2,15 E 0,01 B
9Lesy a lesy Melaleuca33.8425.27.2029.2 0,17 E
10Ostatní lesy a lesy38.1953.833.4070.7 33,07 D
13Acacia Open Woodlands0.040.60.04100 0,04 A.
15Nízce uzavřené lesy a vysoké uzavřené keře14.1013.50.1427.7 0,55 D
Celkový248.968.5100.8538.4 46,56 D
Křoviny a vřesoviště
14Mallee Woodlands a Shrublands19.537.512.8179.4 4,27 A. 6,99 B
16Akátové keře2.8713.81.3424.8 0,20 B
17Ostatní keře20.2012.711.5431.1 1,93 B
18Vřesoviště175.155.6148.9068.1 3,64 A. 12,30 D 10,59 B 128,08 B
Celkový217.7428.9174.5963.0 11,95 D 137,04 B
Travnaté porosty, Herblands, Ostřice, Rushlands
19Tussock trávy26.383.40.9314.0 0,06 ° C
21Ostatní travní porosty, byliny, ostřice a říše32.520.311.2242.0 5,25 A.
Celkový59.126.2412.436.2 5,31 A.

a NVIS Major Vegetation Groups (názvy a kódy NVIS jsou uvedeny pro každou z nich) byly seskupeny do čtyř širokých typů vegetace. Úplný seznam MVG v každém širokém vegetačním typu je uveden v doplňkové tabulce   1.

b Bioregiony zahrnuté do studie byly: Australské Alpy (AUA), Brigalow Belt South (BBS), Nandewar (NAN), New England Tablelands (NET), NSW North Coast (NNC), NSW South Western Slopes (NSS), South East Coastal Plain (SCP), South East Corner (SEC), South Eastern Highlands (SEH), Southeast Queensland (SEQ) a Sydney Basin (SYB).

Naše data také naznačují, že teplota hotspotu se u všech velkých požárů výrazně lišila (obr.   1b). Téměř polovina všech buněk mřížky (46%) obsahovala velmi vysokou nebo vysokou relativní teplotu hotspotu ohně (TR. viz ‘ Metody ’). Ty se často vyskytovaly podél západních okrajů megapalov, zejména v severních a středních NSW (obr.   1b). Naopak ve všech megafirech (obr.   1b) byly detekovány nespálené oblasti o velikosti �  ha (obr.   1b), obvykle obklopené velkými oblastmi s nižší teplotou ohně. Analýza metriky prostorového dopadu, H, založené na odhadovaném procentu plochy ve velmi vysokých a vysokých relativních kategoriích požárních teplot (TR.  > 𠂐.50), předpovídá, že 17 australských hlavních vegetačních skupin 7 bylo vážně zasaženo a trpí oběma rozsáhlými požáry (PF)T  > �%) a relativně vysoké teploty požáru (H  > �%, tabulka   1) v jednom nebo více bioregionech. Mezi geograficky nejrozsáhlejší z nich patří Eucalypt Tall Open Forests (1,14  Mha across five bioregions), Eucalypt Open Forests (2.0  Mha across three bioregions), Eucalypt Woodland (0.39  Mha in one bioregion), Rainforests and Vine Thickets (0,22  Mha ve třech bioregionech) a vřesoviště (0,16  Mha ve čtyřech bioregionech, tabulka 1). Opět byly nejvíce zasaženy pobřežní a pobřežní bioregiony: zde mělo 10 MVG každý 㹐% své celkové plošné popáleniny a 15 zaznamenalo rozsáhlé horké požáry (H  > �%) alespoň v jednom bioregionu (tabulka   1). Satelitní snímky jasně ukazují dramatickou krajinu ‘hnědnutí ’, která následovala po požářích Černého léta v těchto oblastech, přičemž ztráta většiny zalesněného baldachýnu zanechala pouze mozaiku menších nespálených oblastí (obr.   2d).

Rozsah požárů a šíře typů vegetace zasažených během požární sezóny 2019 � má důsledky pro ochranu biologické rozmanitosti v Austrálii i na celém světě. Mnoho z těchto ekosystémů obsahuje globálně významný hotspot 9 biologické rozmanitosti, 10 s vysokou bohatostí, vzácností, endemismem a fylodiverzitou patrný mezi druhy Proteaceae 6, Asteraceae 11, jehličnany 12, eukalypty 13, mechorosty 14 a další skupiny rostlin 15, 16. Region také obsahuje chladně mírné gondwanské reliktní a subtropické druhy deštných pralesů, které v minulých desetiletích 9 prošly rozsáhlou likvidací a dnes mají velmi omezené, fragmentované rozsahy 17. Podporují rozmanité skupiny vzácných nebo ohrožených živočichů, které rovněž trpí pokračujícím demografickým poklesem 18.

Dopady na taxony cévnatých rostlin

Kvantifikovali jsme dopad požárů Černého léta na taxony původních cévnatých rostlin na jihovýchodní australské pevnině pomocí údajů o prostorovém výskytu od � druhů stažených z Australasian Virtual Herbarium 19. Odhady podílu spálených populací nebo geografických distribucí (PF) byly vyvinuty na základě unikátních záznamů o umístění vzorků (PF)SR), záznamy o umístění vzorku byly binovány do rastrové mřížky 2,5  x 𠂒,5  km, aby se snížilo zkreslení převzorkování (PF)BR) a u druhů s unikátními záznamy o poloze � rozsahy vytvořené z modelů distribuce druhů založených na maximální entropii (MaxEnt) (PFSDM). Přijali jsme konzervativní přístup s využitím maximální hodnoty všech dostupných odhadů PF (PFM) jako náš odhad dopadu ohně na jednotlivé taxony, což představuje horní hranici počtu ovlivněných taxonů (viz ‘Methods ’). Použili jsme kritérium PFM  > 𠂐.50 k identifikaci taxonů silně ovlivněných ohněm (tj. 㹐% spálených populací nebo rozsahů).

Naše údaje naznačují, že 816 druhů cévnatých rostlin v jihovýchodní Austrálii na pevnině bylo silně zasaženo požáry Černého léta (doplňující údaje   2), z nichž 325 a 173 bylo 㹵% (PFM  > 𠂐.75) a 㺐% spáleno (PFM  > 𠂐,90). Všechny známé populace odhadem 116 druhů (14% z celkového počtu) shořely, což je více než dvojnásobek počtu druhů rostlin endemických na Britských ostrovech. Mezi 816 druhy podpora PFM odhady byly silné pro 80% taxonů (n  = � species) s alespoň dvěma PFSR, PFBR nebo PFSDM překročení kritéria PF   > 𠂐,50 pro zařazení. Zbývající taxony byly zahrnuty pouze na základě obou PFSR (n  = �), PFBR (n  = �) nebo PFSDM (n  = �) ve většině případů byly alternativní odhady PF těsně pod prahovou hodnotou 0,50 (doplňující údaje   2).

Velikost požárů se odráží v rozmanitosti čeledí rostlin (n  = �) a ovlivněny formy života. Taxony nenalezené v deštných pralesích (RF-) tvořily 88% flóry (n  = � druh obr.   2e), mezi nimiž jsou Myrtaceae (n  = � druhů včetně 65 Eukalyptus spp.), Fabaceae (n  = � včetně 50 Akácie spp.), Proteaceae, Orchidaceae, Asteraceae a Rutaceae byly nejvíce speciální (43 � taxonů každý obr.   2e). Tyto taxony se vyskytují v řadě stanovišť, ale odhadujeme, že nejméně 89% se vyskytuje převážně ve sklerofylovém lese a lesích (n  = �) nebo vřesoviště nebo křoviny (n  = �) nebo v obou (n  = �). Většina zbytku se vyskytuje v bažinách a nedřevnaté vegetaci (doplňující údaje   2). Mezi převážně druhy deštných pralesů, polodažďových lesů a okrajových druhů deštných pralesů (RF ++, RF+a RF) byly orchideje a členové Apocynaceae, Solanaceae a Lamiaceae také různorodé (obr.   2e). Přítomnost starověkých rodů Gondwanských deštných pralesů (např. Argophyllaceae, Cunoniaceae, Elaeocarpaceae, Lauraceae, Proteaceae, Trimeniaceae a Winteraceae Fig. požáry. Je však pozoruhodné, že taxony deštného pralesa (RF ++) obsahují pouze n  = � druhů (3% z celkového počtu), z nichž 24 je endemických pro studovanou oblast (obr.   2e). Polodéšťové a okrajové taxony deštného pralesa, z nichž většina se nachází také ve vlhkých sklerofylových lesích, přispívají dalšími 72 taxony.

Nejvíce ovlivněným formám života dominovaly keře přízemní a podrostlé vrstvy, s nízkými nebo prostými keři (ρ  m vysoký), středními (1 𠄳  m) a vysokými formami (ϣ 𠄷  m vysoký, včetně eukalyptů mallee), obsahující 62% (n  = � species) všech taxonů s PFM  > 𠂐,50 (obr.   2f). Ze zbývajících kratších stromů (7 �  m) tvořily vytrvalé negeofytické forby, geofyty a graminoidy přibližně 7% z celkového počtu (obr.   2f). Většina forem života byla zastoupena ve všech hlavních typech stanovišť, kromě jednoletých druhů, geofytických forbů a vyšších stromů (㸵  m), které v deštných pralesech téměř chyběly, a epifytů a horolezců, kteří byli převládající v nebo zcela omezeni na (Doplňková tabulka   2). Bez ohledu na tyto drobné rozdíly požáry jasně zasáhly širokou škálu druhů, které přispívají jak k floristické rozmanitosti, tak k heterogenitě stanovišť lesů a lesů v lokálním až bioregionálním měřítku. Tyto charakteristiky jsou základem zásadních ekosystémových služeb, mezi něž patří produkce biomasy a sekvestrace uhlíku 21, 22, interakce povrchová atmosféra 23 a zajišťování potravin a stanovišť pro živočišná sdružení 24 – 26, a transformační změny v těchto procesech pravděpodobně budou velký význam v důsledku požárů.

Důsledky pro ochrannou biogeografii

Abychom porozuměli důsledkům požárů Černého léta na ochranu v širších biogeografických měřítcích 27, zkoumali jsme vztahy mezi velikostí rozsahu rostlin, druhovými rysy a polohou a rozsahem požárů Černého léta. Nejprve jsme určili maximální rozsah geografického rozsahu (RET) všech taxonů cévnatých rostlin endemických pro studovanou oblast a s PFM  > �% na základě záznamů vzorků (n  = � druhů).Tato data (obr. W  = 𠂐.803, P  < 𠂐.001) vůči druhům s omezeným rozsahem: 14% (n  = �) měl extrémně (RET  < �  km) nebo velmi malé rozsahy (RET  = � �  km) a dalších 143 (20%) mělo rozsahy 25 �  km. Přítomnost trojúhelníkového vztahu mezi RET a PFM a zejména silný inverzní lineární vztah (P  < 𠂐.001) na kvantilu 0,90 (viz doplňkové poznámky) ukazuje, že mezi zasaženou flórou byly vzácnější, endemické druhy častěji vystaveny spálení ve většině nebo ve všech jejich rozsazích. Druhy extrémně a velmi omezeně omezené na rozsah skutečně zažily požár v průměru 90 �% svých rozsahů ve srovnání s 57 �% u nejrozšířenějších druhů (RET  > �  km Obr.   3b Doplňující poznámky). Přítomnost významné variace v PFM mezi 8 rostoucí RET škálovací třídy (Kruskal –Wallis rank-sum test χ 2   = �.4, df   = 𠂗, P  < 𠂐.001 obr.   3b) dále podporuje tento závěr.

A Taxony endemické pro studovanou oblast seřazené podle maximálního rozsahu dosahu (maximální vzdálenost mezi umístěními vzorků RET y-osa). Horní RET limity a počty druhů pro velmi omezený dojezd (㰥  km, VRR), omezený rozsah (25 �  km, RR), středně rozšířený (100 �  km, MW), velmi rozšířený (500 � & Zobrazeny jsou#x02009km, VW) a extrémně rozšířené (1000 �  km, EW). Je ukázán přibližný maximální rozsah tří megafirů od malého (Namadgi megafire, 0.17  Mha) medium (Wollemi megafire, 1.1  Mha) a very large (Northern Rivers-Mid North complex 2.66  Mha (viz obr.   1). b Vztah mezi velikostí rozsahu (RET) a poměr spálený (PFM) pro endemické taxony, které ukazují nárůst PFM s klesající velikostí dosahu. Rozdíly mezi kategoriemi velikostí rozsahu byly významné (Kruskal –Wallis rank-sum test χ 2   = �.4, df   = 𠂗, P  < 𠂐.001) na základě n  = � druhů v osmi velikostních třídách rozsahu. Pro každý boxplot odpovídá střední a dolní a horní závěs mediánu, respektive prvnímu a třetímu kvartilu, zatímco vousky se prodlužují na největší hodnotu, což je#x022641,5násobek mezikvartilového rozsahu. Datové body jsou zobrazeny jako malé kruhy s odlehlými hodnotami vyplněnými černými skupinami. Prostředky jsou zobrazeny jako velké vyplněné kruhy. C Variace v rozsahu rozsahu s životní formou endemických druhů (kromě vodních druhů) n  = 𠂑). Zkratky formy života jsou jako na obr.   2f. Boxploty byly konstruovány jako na obr. ꀻ počty druhů jsou uvedeny pod každou skupinou. Rozdíly mezi formami života byly významné (Kruskal –Wallis rank-sum test χ 2   = �.2, df   = �, P  < 𠂐.001) na základě n  = � druhů ve 12 třídách forem života. Významné skupinové rozdíly určené pomocí dvou sledovaných párových testů Wilcox rank-sum byly: PG vs. GF, LS a MS (všechny 0,01   >  P  > 𠂐.001) a EP/CL vs. GF, LS (0,01   >  P  > 𠂐.001), MS (P  = 𠂐.016), LT (P  = 𠂐.018) a TS (P  = 𠂐.049). Žádné jiné rozdíly nebyly u kritéria 0,05 významné. d Koncepční rámec pro reakce druhů na požáry Černého léta na základě velikosti dosahu (rozšířený vs. omezený rozsah), perzistence ohně (nepersistující   =  red, persister   = 𠂛lue) a stanoviště (H ’ & #x02009 = 𠂟requent history of fire, H ”   =  infrequent or null history of fire). Druhy typu A a D mají malý a velký rozsah, v daném pořadí, a vyskytují se v krajině náchylné k požáru. Typy B, C a E se vyskytují v krajinách méně náchylných k požáru, které byly během roku 2019 � silně spáleny. Požáry Černého léta byly u typů B 𠄾 pravděpodobně bezprecedentní.

Analýza variací v RET také naznačují významné rozdíly v rozsahu rozsahu napříč kategoriemi forem života (obr. χ 2   = �.2, df   = �, P  < 𠂐.001), s epifyty a horolezci a vytrvalými graminoidy, které mívají větší rozsahy než keře, nízké stromy a geofytické forby. Vztah mezi seskupenými RET velikostní třídy a kategorie životních forem (doplňková tabulka   3 a doplňkové poznámky) také vykazují velkou nepředvídatelnost (χ 2   = �.1, df   = �, P  < 𠂐.001) mezi těmito proměnnými, přičemž střední a nízké keře mají větší pravděpodobnost úzkých endemických rozsahů (㰥  km) a/nebo méně pravděpodobné, že budou mít střední (100 �  km) až velké rozsahy (𾔀  km obr.   3c a doplňkové poznámky). Tyto údaje jsou víceméně v souladu s předchozími studiemi 28, které ukazují prevalenci druhů s malým a ohroženým rozsahem mezi keřově bohatými rodinami východních australských rostlin (např. Myrtaceae, Fabaceae, Lamiaceae, Proteaceae, Rutaceae a Ericaceae).

Mapování spálených populací endemických taxonů s velmi  small do extrémně malých rozsahů (RET  < �  km) ukazuje, že většina z nich byla soustředěna v malém počtu nárazových hotspotů od dalekého jižního Queenslandu po jihovýchodní NSW, zejména v Border Ranges, Washpool-Gibraltar oblasti severního NSW, Wollemi-Blue Oblast hor západně od Sydney a izolované rozsahy v jižním NSW (obr.   4a). Zbývající nespálené refugie pro tyto taxony jsou nyní malé a disjunktní, přičemž druhově nejbohatší z nich leží uvnitř národního parku Blue Mountains   (obr.   4a). Taxony s omezeným dojezdem (RET  = � �  km) byly ovlivněny podobně, ale měly více početných a větších hotspotů s dopadem a refugií (doplňkový obrázek   3a). Tyto vzorce jasně demonstrují vznikající důsledky megafirů na biologickou rozmanitost, které společně přesahují velikost rozmezí místních druhů a zahrnují více bioregionů a spadají do oblastí s vysokou rozmanitostí rostlin a endemismem. Naproti tomu velký počet a rozsah nespálených refugií u velmi rozšířených (obr.   4b) a středně rozšířených taxonů (doplňkový obr.M hodnoty (50 �%, obr.   3b) a indikuje vyšší úroveň odolnosti vůči požárním událostem této stupnice.

Zobrazeny jsou: spálené a nespálené mapy pro velmi omezené druhy (A maximální rozsah dosahu (RET)   < �  km zahrnuje extrémně omezené druhy s RET  < �  km), velmi rozšířený druh (b RET  > �  km zahrnuje extrémně rozšířené druhy s RET  > �  km), taxony deštného pralesa (C Druhy RF ++), taxony polo-deštného pralesa (RF+) a deštného pralesa (RF) (d), druhy, které přetrvávají po požáru (E) a druhy, které po požáru nepřetrvávají (F). Hotspoty bohatství druhů jsou: A   =   Hranice, B   =   Rozsah Washington-Gibraltar, C   =  Wollemi – Modré hory, D   =  Tor =  Guy Fawkes, F   = 𠂛udawang, G   =  Noční čepice, H   =  Kumbatine-Willi Willi, I   =  Jižní východní roh. Nespálené refugie jsou: 1   = 𠂛lue Mountains National Park, 2   =  Springbrook –Lamington-Mt Jerusalem –Nightcap, 3   =  Sundown-Donnybrook, 4 &#x východně od Bellingenu, 5   = �rrington Tops, 6   =  Sydney-Budderoo-Macquarie Pass, 7   =  South East Corner.

Taxony deštného pralesa byly spáleny v pěti hlavních hotspotech bohatství severovýchodní oblasti NSW (obr. Koncentrace spálených taxonů se objevily v oblastech Main Range, Nightcap Range a Gibraltar-Washpool, které dohromady tvoří důležitou součást gondwanských deštných pralesů zařazených na seznam světového dědictví Austrálie 29. Nespálené refugie obsahující tyto druhy se nyní primárně vyskytují v oblasti Springbrook-Lamington-Mt Jerusalem-Nightcap, v některém národním parku New England a v Barrington Tops (obr.   4c). Zejména bohaté oblasti spálených polodéšťových a okrajových druhů deštných pralesů se vyskytovaly jižněji v NSW (obr.   4d). Zatímco druhy deštného pralesa a polodeštného pralesa se zdají mít obecně větší rozsah než jiné taxony (analýza rozptylu F  = 𠂔.7 df   = 𠂓, 696 P  = 𠂐.003 znamená RET druhů RF+ a RF- se liší v P  < 𠂐.01 úroveň, viz doplňkové poznámky) a měl výrazně menší podíl těchto popálenin (Kruskal –Wallisův test součtu součtu χ 2   = �.5, df   = 𠂓, P  < 𠂐.001 obr. Druhově bohaté nespálené refugie pro rozmanitější flóru bez deštného pralesa byly poměrně početné a rozsáhlé (doplňkový obrázek   3c).

Navzdory okamžitým potenciálním dopadům na jihovýchodní australskou vegetaci odhaleným v této studii zůstává schopnost mnoha rostlinných společenstev a druhů zotavit se a regenerovat se po megapalech tohoto rozsahu špatně pochopena 30 – 32. Jak jsme ukázali, velikost druhů (obr.   3a, b) a geografická poloha požárů (obr. složení ohněm ovlivněné flóry. Demografický dopad požárů na konkrétní taxony bude také záviset na jejich schopnosti přežít a vzpamatovat se z ohně (tj. Ohnivzdorní vs. sensu Pausas a kol. 33). Obrázek   3d obsahuje jednoduchý časoprostorový rámec, který integruje tyto koncepty, v nichž se na stanovištích s různou historií požárů vyskytují druhy omezené na rozsah a rozšířené druhy perzistentní a neperzistentní. Zde tento rámec používáme ke zkoumání důsledků požárů pro pět různých typů taxonů.

Naše data ukazují, že většina druhů zasažených požáry se primárně vyskytuje ve sklerofylových lesích a lesích nebo křovinách a vřesovištích (doplňující údaje   2 a doplňkový obrázek   3d). Oheň je přirozenou součástí těchto ekosystémů a mnoho druhů je vysoce přizpůsobeno ohni s vlastnostmi, jako je semenná banka uložená v půdě 34, serotinózní šišky nebo ovoce 35, klíčivost semen 36, 37 vyvolaná kouřem a/nebo teplem 36, 37 cued kvetoucí 38, silná ochranná bazální kůra 39, epikormické pupeny nebo podzemní lignotubery, které buď poskytují ochranu před ohněm a/nebo zajišťují následnou obnovu 40. Důkazy z 270 druhů v naší studii potvrzují tento vzorec: 251 (93%) v 93 rodech jsou údajně ohnivé perzistéry, které se mohou po požáru znovu vzpamatovat nebo regenerovat prostřednictvím propagulí, nebo obojí (obr.   4e a doplňující údaje   3). Mezi nimi je mnoho vzácných, endemických taxonů, například některé eukalypty  mallee (obr.   2h), keřovité Acacia, Callistemon, Grevillea a Zieriaa hlízotvorné orchideje Corunastylis a Paraprasophyllum. Přestože mají malé rozsahy náchylné k požáru, zdá se, že takovéto taxony odolávající ohni (typ A na obr. nepravděpodobné, že by představovaly bezprecedentní událost, pokud neprošly nedávnou kontrakcí dosahu. Mnoho z nich se vyskytuje také ve skalnatých stanovištích (útesy, žulové tory atd., Doplňkový obr.

Naproti tomu u rozšířených endemických druhů s dosahem 500 a#x02009 km nebo více (n  = � Obr.   3a) demografické důsledky požárů v letech 2019–2020 jsou pravděpodobně bezprecedentní alespoň za poslední dvě století. I když většina pravděpodobně budou také hasiče požáru (typ D na obr. -zotavení po požáru způsobené rzí myrty (Austropuccinia psidii) 42, býložravost opětovného růstu invazními zvířaty a sucho. Taxony deštného pralesa schopné přežít požár, ale neschopné konkurovat následnému vpádu plevelů nebo sklerofilních druhů (typ B na obr.   3d), mohou být pod podobným tlakem 43, 44. Povinně naočkujte dřeviny, jako jsou eukalypty popela (např. Eucalyptus fraxinoides) budou pravděpodobně ohroženi, pokud se požáry vrátí před dokončením jejich typicky dlouhých období sexuálního zrání 45, 46.

A konečně, rostliny s úzkými nebo širokými rozsahy, které se spoléhají na reklonizaci prostřednictvím rozptýlení propagulí z nespálených oblastí (nehořlavé materiály typu C a E obr. Mezi identifikovanými (doplňující údaje   3) ​​většinou byly geofytické orchideje se specializovanými strukturami, které jsou poškozeny ohněm (např. Mělké hlízy v Caladenia 49 a Chiloglottis), větrem rozptýlené keře nebo obligátní epifyty, kterým chybí semenná banka (např. orchideje) Dockrillia a Plectorrhiza). Pozoruhodná místa výskytu bohatosti nárazů pro tyto taxony se vyskytovala v severovýchodních deštných pralesích, jižních oblastech a dalekém jihovýchodním rohu NSW (obr. RET  < �  km), populace některých epifytů se nyní zjevně vyskytují ve vysoce disjunktních záplatách deštných pralesů (doplňkový obrázek   3f). Malý, ale evolučně významný počet požárně citlivých památek Gondwanského deštného pralesa 50, 51 a dalších druhů deštných pralesů může také čelit úpadku, zejména na stanovištích, která zřídka, pokud vůbec, hoří. O některých těchto taxonech je známo, že vyrůstají 52 nebo se regenerují ze semen 53, ale pro většinu dalšího zkoumání těchto znaků je naléhavě nutné.

Kolektivně existují důvody pro opatrný optimismus, že většina zde identifikovaných druhů rostlin se vzpamatuje ze všeho kromě nejintenzivnějšího požáru 54 – 58. Navzdory této odolnosti však nedávné důkazy zalesněných ekosystémů na celém světě naznačují, že katastrofické požární události stále více katalyzují dramatické změny ve složení druhů napříč velkými oblastmi 59, 60. V nejextrémnějších případech se dosahuje bodů zvratu, což má za následek přechody z lesní do nezalesněné vegetace 61. Zhoršení regenerace po požáru bylo konkrétně spojeno s prahovými hodnotami deficitu tlaku par, půdní vlhkosti a maximální povrchové teploty 1, 31, jakož i intenzity požáru a dostupnosti osiva 1, 62. To je obzvláště znepokojivé, protože velká část vegetace zasažená požáry Černého léta již trpěla extrémním suchem, rekordně vysokými teplotami (doplňkový obrázek   1) a nerovnoměrným odumíráním vrchlíku před začátkem požární sezóny 2019–2020. I při absenci požáru mohou tyto faktory vést k rychlým posunům v dynamice a distribuci lesních ekosystémů 2, 63, 64. V oblastech, kde Černé léto vypaluje oblasti, které se teprve nedávno vzpamatovaly z předchozích požárů, bude rostoucí frekvence požárů dalším stresorem 58. Pravděpodobně nejcitlivější jsou komunity Gondwanských deštných pralesů v Austrálii (obr.   2c), které byly silně spáleny v několika bioregionech (obr. Naše data dále naznačují, že rozsáhlý rozsah požárů v období 2019--2020 způsobil, že taxonomicky různorodá řada druhů se subkontinentálními rozsahy utrpěla rozsáhlé ztráty dospělých jedinců, což je činí potenciálně náchylnými k dalším faktorům, jako je nemoc 65, býložravost a rušení. Dohromady tyto faktory pravděpodobně vyčerpaly odolnost některých zalesněných ekosystémů vůči požárům závažnosti a rozsahu, jaké byly zaznamenány během Černého léta ‘. Nyní je zapotřebí další práce k určení, zda u nich nyní může dojít k regeneračnímu selhání a trvalé biogeografické změně.


Přidružení

Centrum pro australský národní výzkum biologické rozmanitosti, CSIRO National Research Collections Australia, Canberra, ACT, Austrálie

Robert C. Godfree, Nunzio Knerr, Francisco Encinas-Viso, Cécile Gueidan, Alexander Schmidt-Lebuhn & amp Linda M. Broadhurst

Centrum pro výzkum australské národní biologické rozmanitosti, Australské národní botanické zahrady, Canberra, ACT, Austrálie

David Albrecht, D. Christine Cargill, Mark Clements, Lydia K.Guja & amp; Brendan Lepschi

Australian Tree Seed Center, CSIRO National Research Collections Australia, Canberra, ACT, Australia

CSIRO Land and Water, Canberra, ACT, Austrálie

Australská národní sbírka divoké zvěře, Národní výzkumné sbírky CSIRO Austrálie, Canberra, ACT, Austrálie

Australian Tropical Herbarium, James Cook University, Cairns, QLD, Austrálie

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Tohoto autora můžete také vyhledat v PubMed Google Scholar

Příspěvky

L.M.B. a R.G. z počátečních výzkumných otázek. Všichni autoři se zúčastnili workshopu k identifikaci rozsahu práce. R.G., L.M.B. a F.E-V. dále rozvinul rozsah a strukturu výzkumu D.B., D.C.C., M.C., L.J., A.S-L., B.L., C.G., L.G., T.H., and K.N přispěl k rozvoji biogeografických, ekologických a taxonomických témat. N.K. vedl a R.G. přispěl ke kódování v celé studii. N.K. a R.G. analyzovali databázi hotspotů a N.K., R.G. a L.M.B. vytvořil požární mapu. N.K., R.G. a D.A vyvinuli databázi exemplářů herbáře. D.A., D.C.C., C.G., M.C., B.L. a K.N. poskytuje taxonomické znalosti. R.G., D.A., M.C., L.G. a B.L. vyvinul databázi vlastností rostlin a historii života. N.K. a R.G. analyzoval prostorový dopad požárů na vegetační vrstvy a jednotlivé taxony. T.H. přispěla odbornými znalostmi pro modelování Maxent. R.G. vyvinuté metriky a koncepční model uvedený v příspěvku. R.G. a F.E.-V. provedl statistické analýzy. Všichni autoři pak přispěli taxonomickou, biogeografickou nebo ekologickou odborností k interpretaci dat. R.G. vedl a všichni autoři se podíleli na vývoji první, přepracované a konečné verze příspěvku.

Odpovídající autor


3.3.8: Data Dive - populace lišek ostrovních - biologie

Tento registr existuje proto, aby pomáhal lidem objevovat a sdílet datové sady, které jsou k dispozici prostřednictvím zdrojů AWS. Další informace o sdílení dat na AWS.

Hledat datové sady (aktuálně 13 odpovídajících datových sad)

Přidat do tohoto registru

Pokud chcete do tohoto registru přidat datovou sadu nebo příklad použití datové sady, postupujte podle pokynů v registru otevřených dat v úložišti AWS GitHub.

Pokud není konkrétně uvedeno v příslušné dokumentaci datové sady, datové sady dostupné prostřednictvím registru otevřených dat na AWS nejsou poskytovány a udržovány AWS. Datové sady jsou poskytovány a udržovány řadou třetích stran na základě různých licencí. Zkontrolujte licence datové sady a související dokumentaci, abyste zjistili, zda lze datovou sadu použít pro vaši aplikaci.

Atom genomu rakoviny

vědy o rakovině, genomové vědy o životě STRIDES sekvenování celého genomu

Atom Cancer Genome Atlas (TCGA), spolupráce mezi National Cancer Institute (NCI) a National Human Genome Research Institute (NHGRI), si klade za cíl vytvořit komplexní, vícerozměrné mapy klíčových genomových změn u hlavních typů a podtypů rakoviny. TCGA analyzovala odpovídající nádor a normální tkáně od 11 000 pacientů, což umožňuje komplexní charakterizaci 33 typů a podtypů rakoviny, včetně 10 vzácných druhů rakoviny. Datový soubor obsahuje otevřený klinický dodatek, doplněk biologického druhu, kvantifikaci genové exprese RNA-Seq, kvantifikaci izoformové exprese miRNA-Seq.

Příklady použití

  • TCGA Cancer Selected for Study by National Cancer Institute
  • Archiv GDC Legacy od National Cancer Institute
  • Cloud rakoviny genomiky od sedmi mostů
  • Krajina přístupnosti chromatinu primárních lidských rakovin od M. Ryana Corcesa, Jeffreyho M. Granji a kol.
  • Strojové učení identifikuje vlastnosti kmenů spojené s onkogenní odlišností od Tathiane M. Malta, Artem Sokolov a kol.

Terapeuticky aplikovatelný výzkum generující efektivní léčbu (TARGET)

vědy o rakovině, genomové vědy o životě STRIDES sekvenování celého genomu

Terapeuticky aplikovatelný výzkum generující efektivní léčbu (TARGET) je společným úsilím velkého rozmanitého konsorcia vyšetřovatelů extramurálních a NCI. Cílem této snahy je urychlit molekulární objevy, které řídí zahájení a progresi těžko léčitelných dětských nádorových onemocnění, a usnadnit rychlý přenos těchto nálezů na kliniku. Projekty TARGET poskytují komplexní molekulární charakterizaci ke stanovení genetických změn, které vedou k zahájení a progresi dětských nádorových onemocnění. Datový soubor obsahuje otevřený klinický dodatek, Biospecimen.

Příklady použití

  • Opakující se mutace homeodomény DGCR8, DROSHA a SIX v příznivé histologii Wilmsových nádorů od Walz AL, Ooms A, Gadd S, et al.
  • Profily genomu extrakraniálních maligních rhabdoidních nádorů odhalují heterogenitu a dysregulované vývojové cesty od Chun HJ, Lim EL, Heravi-Moussavi A a kol.
  • Molekulární krajina dětské akutní myeloidní leukémie odhaluje opakující se strukturální změny a věkově specifické mutační interakce Bolouri H, Farrar JE, Triche T Jr, et al.
  • Genomická krajina dětské a mladé dospělé akutní lymfoblastické leukémie řady T od Yu Liu, John Easton, Ying Shao a kol.
  • Cloud rakoviny genomiky od sedmi mostů

Společné procházení

encyklopedické internetové strojové učení zpracování přirozeného jazyka

Korpus dat procházení webu složený z více než 50 miliard webových stránek.

Příklady použití

  • Index zábava od Philippe Sutera
  • Společný index procházení Athena od Edwarda Rosse
  • Analýza petabajtů webových stránek Mark Litwintschik
  • Obrana proti neurálním falešným zprávám Rowan Zellers, Ari Holtzman, Hannah Rashkin, Yonatan Bisk, Ali Farhadi, Franziska Roesner a kol
  • Hledejte společné procházení pomocí funkcí Lambda od Andrese Riancha

Sentinel-2

zemědělství reakce na katastrofy pozorování Země geoprostorové přírodní zdroje satelitní snímky udržitelnost

Mise Sentinel-2 je souhvězdí dvou pozemních monitorovacích družic, které poskytují optické snímky s vysokým rozlišením a zajišťují kontinuitu současných misí SPOT a Landsat. Mise poskytuje každých 5 dní globální pokrytí zemského povrchu Země a data se tak skvěle uplatňují v probíhajících studiích. Data L1C jsou celosvětově k dispozici od června 2015. Data L2A jsou k dispozici od září 2016 v širším evropském regionu a globálně od ledna 2017.

Příklady použití

Gabriella Miller Kids First Pediatric Research Program (Kids First)

rakovina genetická genomová Homo sapiens vědy o životě dětské pediatrické STRIDY strukturální vrozená vada sekvenování celého genomu

Vize NIH Common Fund 's Gabriella Miller Kids First Pediatric Research Program („Kids First“) vize je „zmírnit utrpení rakoviny dětského věku a strukturální vrozené vady podporou společného výzkumu s cílem odhalit etiologii těchto nemocí a podporou sdílení dat v rámci komunita pediatrického výzkumu. “ Program nadále generuje a sdílí data o sekvenci celého genomu od tisíců dětí postižených těmito stavy, od vzácných dětských rakovin, jako je osteosarkom, až po běžnější diagnózy, jako jsou vrozené srdeční vady. V roce 2018 Kids Fi.

Příklady použití

  • Genotypy mikrosatelitů zárodečné linie odlišují děti s meduloblastomem. Samuel Rivero-Hinojosa, Nicholas Kinney, et al.
  • Genomické analýzy implikují nekódující De Novo varianty u vrozené srdeční choroby. Felix Richter, Sarah U Morton a kol.
  • Kids First DRC Portal od Kids First DRC
  • Škodlivé de novo varianty X-vázaného ZC4H2 u žen způsobují variabilní fenotyp s neurogenní multiplexní kongenitou arthrogryposis. od Suzanna G M Frints, Friederike Hennig a kol.
  • Germline 16p11.2 Mikrodeletace predisponuje k neuroblastomu. Laura Egolf, Zalman Vaksman, et al.

USGS Landsat

zemědělství reakce na katastrofy pozorování Země geoprostorové přírodní zdroje satelitní snímky udržitelnost

Tento společný program NASA/USGS poskytuje nejdelší nepřetržitý vesmírný záznam existence pozemské země. Satelity Landsat poskytují každý den důležité informace, které pomáhají správcům pozemků a tvůrcům politik rozumně se rozhodovat o našich zdrojích a životním prostředí. Data jsou poskytována pro Landsats 1, 2, 3, 4, 5, 7 a 8.

Příklady použití

Jazykové zdroje Sudachi

zpracování přirozeného jazyka

Japonské slovníky a vkládání slov pro zpracování přirozeného jazyka. SudachiDict je slovník pro japonský tokenizer (morfologický analyzátor) Sudachi. chiVe je japonské předtrénované vkládání slov (slovní vektory), vyškolené pomocí ultra velkého webového korpusu NWJC Národním institutem pro japonskou Langauge a lingvistiku, analyzováno Sudachi.

Příklady použití

  • Ach 素 解析器 『Sudachi』 の た め の 大規模 辞書 開 発 od 坂 本 美 保, 川 原 典 子, 久 本 空 海, 髙 岡 一 馬, 内 田佳孝
  • Kurz SudachiPy od Works Works
  • Sudachi Tutorial od Works Applications
  • Kintoki: Analyzátor závislostí podle Works aplikací
  • sudachidict_small na pypi.python.org - modul Pythonu ke stažení a instalaci SudachiDict pro tokenizer pythonu od Works Applications

Datové sady Foldingathome COVID-19

alchymistické výpočty volné energie biomolekulární modelování koronavirus COVID-19 skládací atomu zdraví vědy o živé přírodě molekulární dynamika protein simulace SARS-CoV-2 strukturální biologie

[email protected] je rozsáhle distribuovaný počítačový projekt, který pomocí biomolekulárních simulací zkoumá molekulární původ nemocí a urychluje objev nových terapií. [email protected], který provozuje konsorcium [email protected] Consortium, celosvětová síť výzkumných laboratoří zaměřujících se na řadu různých chorob, se snaží řešit problémy v oblasti lidského zdraví v měřítku, které je nerealizovatelné jiným způsobem, a sdílí výsledky těchto rozsáhlých škálovat studie s výzkumnou komunitou prostřednictvím recenzovaných publikací a veřejně sdílených datových sad. Během epidemie COVID-19 zaměřila společnost [email protected] své zdroje na pochopení náchylnosti k viru SARS-CoV-2, viru, který způsobuje onemocnění COVID-19, a na úzkou spolupráci s řadou experimentálních spolupracovníků s cílem urychlit pokrok směrem k účinné terapii léčby. COVID-19 a ukončení pandemie. Přitom vytvořil první exaskalovaný distribuovaný výpočetní zdroj na světě, který mu umožňuje generovat cenné vědecké datové sady nebývalé velikosti. Více informací o výzkumných aktivitách COVID-19 [email protected] 's na stránce [email protected] COVID-19. Kromě přímé spolupráce s experimentálními spolupracovníky a rychlého sdílení nových výsledků výzkumu prostřednictvím serverů předtiskové přípravy se společnost [email protected] spojila s dalšími výzkumnými pracovníky, kteří se zavázali rychle sdílet všechna data z výzkumu COVID-19, a spojila své síly s AWS a softwarovým institutem pro molekulární vědy ( MolSSI) ke sdílení datových sad bezprecedentní strany prostřednictvím AWS Open Data Registry, indexování těchto masivních datových sad prostřednictvím MolSSI COVID-19 Molecular Structure and Therapeutics Hub. Kompletní rejstřík všech datových sad [email protected] najdete zde. Th.

Příklady použití

Databáze agregace genomu (gnomAD)

bioinformatika genetická genomová věda o životě populace populace genetika krátké čtení sekvenování sekvenování celého genomu

Agenomační databáze genomu (gnomAD) je zdroj vyvinutý mezinárodní koalicí vyšetřovatelů, který agreguje a harmonizuje data exomu i genomu ze široké škály rozsáhlých projektů lidského sekvenování. Zde poskytnuté souhrnné údaje jsou vydávány ve prospěch širší vědecké komunity bez omezení používání. Soubor dat v2 (GRCh37) zahrnuje 125 748 sekvencí exomu a 15 708 sekvencí celého genomu od nepříbuzných jedinců. Datová sada v3 (GRCh38) zahrnuje 71 702 genomů vybraných jako v v2. Zaregistrujte se zde do seznamu adres gnomAD.

Příklady použití

  • gnomAD v2.1 od Laurent Francioli, Grace Tiao, Konrad Karczewski, Matthew Solomonson, Nick Watts
  • Spektrum mutačních omezení kvantifikované z variací u 141 456 lidí. Nature 581, 434–443 (2020) od Karczewski, KJ, Francioli, LC, Tiao, G., Cummings, BB, Alföldi, J., Wang, Q., Collins, RL, Laricchia, KM, Ganna, A., Birnbaum, DP, Gauthier, LD, Brand, H., Solomonson, M., Watts, NA, Rhodes, D., Singer-Berk, M., England, EM, Seaby, EG, Kosmicki, JA,. MacArthur, D. G.
  • Hodnocení potenciálních cílů léčiv pomocí genetické variability lidské ztráty funkce. Nature 581, 459–464 (2020) od společností Minikel, EV, Karczewski, KJ, Martin, HC, Cummings, BB, Whiffin, N., Rhodes, D., Alföldi, J., Trembath, RC, van Heel, DA, Daly, MJ, tým genomové agregační databáze, Consortium genomové agregační databáze, Schreiber, SL, & amp MacArthur, DG
  • Krajina více-nukleotidových variant ve 125 748 lidských exomech a 15 708 genomech. Nature Communications 11, 2539 (2020) od Wang, Q., Pierce-Hoffman, E., Cummings, BB, Karczewski, KJ, Alföldi, J., Francioli, LC, Gauthier, LD, Hill, AJ, O'Donnell- Produkční tým Luria, AH, Genome Aggregation Database (gnomAD), Consortium Genome Aggregation Database (gnomAD), & amp MacArthur, DG
  • Kontrola kvality gnomAD Úložiště GitHub od gnomAD Production Team

NEXRAD na AWS

zemědělství pozorování Země meteorologické přírodní zdroje udržitelnost počasí

Data v reálném čase a archivy ze sítě NEXRAD (Next Generation Weather Radar).

Příklady použití

  • Otevřete přístup k datům NEXRAD pro úroveň 3 pomocí [email protected] od Zac Flamig
  • Kontrolní dokument rozhraní úrovně 2 pro přenos: Build 18 od NOAA ROC
  • Kontrolní dokument rozhraní úrovně 3 pro formáty dat zpráv: Build 18 od NOAA ROC
  • Sezónní hojnost a přežití migrační avifauny Severní Ameriky určené meteorologickým radarem Adriaana M. Doktera, Andrewa Farnswortha, Daniela Finka, Viviany Ruiz-Gutierrezové, Wesleyho M. Hochachky, Franka A. La Sorte, Orina J. Robinsona, Kennetha V. Rosenberga & amp; Steve Kelling
  • nexradaws na pypi.python.org - modul pythonu k dotazování a stahování dat Nexrad z Amazonu S3 od Aarona Andersona

Anatomie létajícího mozku: FlyLight Gen1 a Split-GAL4 Imagery

biologie fluorescenční zobrazování zpracování obrazu biologické vědy mikroskopie neurobiologie neuroimaging neurověda

Tato datová sada, kterou zpřístupnil projekt Janelia 's FlyLight, se skládá z fluorescenčních obrazů ovladačů Drosophila melanogaster, zarovnaných se standardními šablonami a uložených ve formátech vhodných pro rychlé vyhledávání v cloudu. Po zveřejnění budou přidána další data.

Příklady použití

  • Neuronální architektura těla hub poskytuje logiku asociativního učení Yoshinori Aso, Daisuke Hattori, Yang Yu, Rebecca M Johnston, Nirmala A Iyer, Teri-TB Ngo, Heather Dionne, LF Abbott, Richard Axel, Hiromu Tanimoto, Gerald M Vtírat
  • Color Depth Search Fidži Plugin od Hideo Otsuna
  • Hledání masky MIP pro barevnou hloubku: nový nástroj pro urychlení tvorby Split-GAL4 od Hideo Otsuna, Masayoshi Ito, Takashi Kawase
  • Používání snímků na AWS S3 od Roba Svirskase
  • Sbírka ovladačů Fly Light Split-GAL4 od Roba Svirskase

Geostacionární operativní environmentální satelity NOAA (GOES) 16 a 17

reakce na katastrofy zemědělství pozorování Země geoprostorové meteorologické satelitní snímky udržitelnost počasí

Satelity GOES (GOES-16 a zesilovače GOES-17) poskytují nepřetržité zobrazení počasí a monitorování údajů o meteorologickém a vesmírném prostředí v celé Severní Americe. Satelity GOES poskytují druh nepřetržitého monitorování nezbytného pro intenzivní analýzu dat. Vznášejí se nepřetržitě nad jednou polohou na povrchu. Satelity obíhají dostatečně vysoko, aby umožňovaly celoplošný pohled na Zemi. Vzhledem k tomu, že zůstávají nad pevným bodem na povrchu, poskytují neustálou bdělost atmosférickým „spouštěčům“ v nepříznivých povětrnostních podmínkách, jako jsou tornáda, bleskové povodně, krupobití a hurikán.

Příklady použití

  • Srovnání čtení dat GOES-R z AWS S3 v netCDF versus zarr od Chelle Gentemann
  • NOAA GOES16 Notebook Julia Jupyter Příklad Peter Schmiedeskamp
  • GOES-2-go je balíček pythonu pro stahování a vykreslování vykreslování dat GOES. od Briana K. Blaylocka
  • Porovnání předpovědí blesků z modelu rychlého obnovení s vysokým rozlišením s pozorováním geostacionárního mapovače blesků od Briana K. Blaylocka a Johna D. Horela
  • Vizualizujte GOES-16 v Pythonu pomocí Xarray od Hamed Alemohammad

Terénní dlaždice

reakce na katastrofy zemědělství pozorování Země nadmořská výška geoprostorová udržitelnost

Globální datová sada poskytující výšky terénu na holé zemi, pro snadné použití a poskytovaná na S3.

Příklady použití

Sbírky Imaging Cell Imaging

biologie buněčná biologie buněčné zobrazování Homo sapiens zpracování obrazu biologické vědy strojové učení mikroskopie

Tento segment obsahuje více datových sad (jako balíčky Quilt) vytvořených Allen Institute for Cell Science (AICS). Zobrazovací data v tomto segmentu obsahují některou z následujících položek: 1) obrazy zorného pole ze skleněných desek 2) segmentace buněčné membrány, DNA a struktury 3) buněčná membrána, obrysy DNA a struktury 4) predikce zobrazování strojového učení z dříve uvedených Kromě toho mnoho datových sad obsahuje soubory CSV, které obsahují sady funkcí související s těmito daty.

Příklady použití

Mezinárodní iniciativa pro sdílení dat Neuroimaging (INDI)

Homo sapiens biologické vědy zobrazování magnetickou rezonancí neuroimaging neurověda

Tento segment obsahuje několik datových sad pro neuroimaging, které jsou součástí mezinárodní iniciativy pro sdílení dat Neuroimaging. Mezi surová data neuroimagingu lidských a nehumánních primátů patří 1) Strukturální MRI 2) Funkční MRI 3) Zobrazování pomocí difuzního tenzoru 4) Elektroencefalogram (EEG) Kromě surových dat jsou u některých datových sad zahrnuta také předzpracovaná data. Úplný seznam dostupných datových sad lze vidět v níže uvedené dokumentaci.

Příklady použití

  • Výměna obrazových dat autistického mozku: směrem k rozsáhlému hodnocení vnitřní mozkové architektury v autismu. od A. Di Martina, C-G Yan,. M.P. Milham
  • Otevřený zdroj pro zobrazování primátů jiného než člověka od M.P. Milham, L. Ai,. CE Schroeder
  • Urýchlení evoluce nelidského primátového neuroimagingu M.P. Milham, C. Petkov
  • Posouzení dopadu sdílených dat zobrazování mozku na vědeckou literaturu M.P. Milham, R.C. Craddock,. A. Klein
  • Stahování dat FCP-INDI Neuroimaging z Amazon S3 od INDI

SpaceNet

počítačové vidění reakce na katastrofy pozorování Země geoprostorové strojové učení satelitní snímky

SpaceNet, spuštěný v srpnu 2016 jako otevřený inovační projekt nabízející úložiště volně dostupných snímků se společně registrovanými mapovými funkcemi. Před SpaceNet měli vědci počítačového vidění minimální možnosti získat bezplatné, přesně označené a satelitní snímky s vysokým rozlišením. SpaceNet dnes hostí datové sady vyvinuté vlastním týmem spolu se soubory dat z projektů, jako je funkční mapa světa IARPA (fMoW).

Příklady použití

CBERS na AWS

zemědělství reakce na katastrofy pozorování Země geoprostorové zobrazování satelitní snímky udržitelnost

Snímky získané satelitem China-Brazil Earth Resources Satellite (CBERS), 4 a 4A. Soubory snímků jsou zaznamenány a zpracovány společností Instituto Nacional de Pesquisas Espaciais (INPE) a jsou převedeny do formátu Geotiff optimalizovaného pro cloud, aby se optimalizovalo jeho použití pro cloudové aplikace. Obsahuje všechny scény CBERS-4 MUX, AWFI, PAN5M a PAN10M získané od začátku satelitní mise a je denně aktualizován o nové scény. Scény CBERS-4A MUX úrovně 4 (ortorektifikované) jsou experimentálně přijímány od 4. do 13. dubna 2021.

Příklady použití

Podání IRS 990

Strojově čitelná data z určitých elektronických 990 formulářů podaných u IRS od roku 2013 do současnosti.

Příklady použití

Multi-Scale Ultra High Resolution (MUR) Sea Surface Temperature (SST)

klima pozorování Země environmentální přírodní zdroj oceány satelitní snímky udržitelnost vodní počasí

Globální, bez mezer, mřížkovaná, denně 1 km datová sada Sea Surface Temperature (SST) datová sada vytvořená sloučením několika satelitních datových sad SST úrovně 2. Mezi tyto vstupní datové soubory patří NASA Advanced Microwave Scanning Radiometer-EOS (AMSR-E), JAXA Advanced Microwave Scanning Radiometer 2 (AMSR-2) on GCOM-W1, the Moderate Resolution Imaging Spectroradioimeter (MODIS) on the NASA Aqua and Terra platformy , mikrovlnný radiometr WindSat z amerického námořnictva, pokročilý radiometr s velmi vysokým rozlišením (AVHRR) na několika satelitech NOAA a pozorování SST in situ z projektu NOAA iQuam. Data jsou k dispozici od.

Příklady použití

RADARSAT-1

Zemědělství reakce na katastrofy pozorování Země geoprostorová globální ledová satelitní snímků udržitelnost

Vyvinutá a provozovaná Kanadskou vesmírnou agenturou je prvním kanadským komerčním satelitem pro pozorování Země.

Příklady použití

Department of Energy 's Open Energy Data Initiative (OEDI)

energie environmentální geoprostorový lidarový model sluneční udržitelnost

Data zveřejněna v rámci iniciativy Department of Energy 's Open Energy Data Initiative (DOE). Open Energy Data Initiative (OEDI) si klade za cíl zlepšit a zautomatizovat přístup k souborům vysoce hodnotných energetických dat napříč programy, kancelářemi a národními laboratořemi amerického ministerstva energetiky (DOE). OEDI si klade za cíl učinit data použitelná a zjistitelná výzkumnými pracovníky a průmyslem, aby urychlila analýzu a urychlila inovace.

Příklady použití

  • Tracking the Sun Tool od Lawrence Berkeley National Laboratory (LBNL)
  • Model poptávky na trhu distribuované generace (dGen): Dokumentace B. Sigrin, M. Gleason, R. Preus, I. Baring-Gould, R. Margolis
  • Benjamin Sigrin a Meghan Mooney ve Spojených státech technický potenciál solárních střech pro domácnosti s nízkými až středními příjmy
  • Odhad solárního technického potenciálu na střeše v USA pomocí kombinace metod založených na GIS, lidarových datech a statistickém modelování od Pietera Gagnona a kol. 2018 Environ. Res. Lett. 13 024027
  • Sledování cen Slunce a trendů designu u distribuovaných fotovoltaických systémů ve Spojených státech: Vydání 2019 od G. Barbose, N.

Otevřete NeuroData

pole tomografie biologie elektronová mikroskopie zpracování obrazu biologické vědy světelná mikroskopie magnetická rezonance neuroimaging neurověda

Tento kbelík obsahuje několik datových sad pro neuroimaging (jako Neuroglancer Precomputed Volumes) napříč různými modalitami a měřítky, od nanometru (elektronová mikroskopie) po mikroúrovni (mikroskopie s vymazanou světelnou tabulkou a tomografie pole) a mezoscale (strukturální a funkční magnetická rezonance). Mnoho datových sad navíc obsahuje segmentace a sítě.

Příklady použití

  • Od kosmu po konektomy: Evoluce vědy náročné na data od R. Burnse, J. T. Vogelsteina a A. S. Szalaye
  • Stáhněte si Benjamin Falk
  • CloudVolume od Williama Silversmitha
  • Neuroglancer od Jeremyho Maitina-Sheparda
  • Datový klastr Open Connectome Project: Scalable Analysis and Vision for High-Throughput Neuroscience od R. Burnse, WG Roncal, D. Kleissas, K. Lillaney, P. Manavalan, E. Perlman, DR Berger, DD Bock, K. Chung, L. Grosenick, N. Kasthuri, NC Weiler, K. Deisseroth, M. Kazhdan, J. Lichtman, RC Reid, SJ Smith, AS Szalay, JT Vogelstein a RJ Vogelstein.

PubSeq - zdroj veřejných sekvencí

bam bioinformatika biologie koronavirus COVID-19 fast5 fasta fastq genetické genomové zdraví json vědy o životě dlouhé čtení sekvenční medicína metadata open source software RDF SARS SARS-CoV-2 SPARQL

COVID-19 PubSeq je bezplatný a otevřený online zdroj bioinformatických veřejných sekvencí s on-the-fly analýzou sekvenovaných vzorků SARS-CoV-2, který umožňuje rychlý obrat v identifikaci nových kmenů virů. PubSeq umožňuje komukoli nahrávat sekvenční materiál ve formě souborů FASTA nebo FASTQ s doprovodnými metadaty prostřednictvím webového rozhraní nebo REST API.

Příklady použití

GeoTIFF optimalizovaný pro cloud Sentinel-2

zemědělství reakce na katastrofy pozorování Země geoprostorové přírodní zdroje satelitní snímky udržitelnost

Mise Sentinel-2 je souhvězdí dvou pozemních monitorovacích družic, které poskytují optické snímky s vysokým rozlišením a zajišťují kontinuitu současných misí SPOT a Landsat. Mise poskytuje globální pokrytí zemského povrchu Země každých 5 dní, což data skvěle využívá v probíhajících studiích. Tato datová sada je stejná jako datová sada Sentinel-2, kromě toho, že soubory JP2K byly převedeny do cloudově optimalizovaných GeoTIFF (COG). Kromě toho metadata katalogu aktiv SpatioTemporal byla v souboru JSON vedle dat a API STAC s názvem Earth-search je volně dostupné t.

Příklady použití

  • Příjem-STAC se sat-search Scottem Hendersonem
  • Vytvořte dynamický obkladač s TiTilerem od Vincenta Saraga
  • Sat-search Matthew Hanson
  • STAC, COG, Python a QGIS od Andrew Cutts
  • STAC a Sentinel-2 COGs (ESIP Summer Meeting 2020) od Matthew Hansona

Výsledky modelu eBird a trendů

biologická rozmanitost biologie pozorování Země ekosystémy environmentální vědy o živé přírodě udržitelnost

Projekt eBird Status and Trends generuje odhady výskytu a početnosti ptáků při vysokém časoprostorovém rozlišení. Tato datová sada představuje primární modelované výsledky z pracovního postupu analýzy a jsou navrženy pro další analýzu, syntézu, vizualizaci a průzkum.

Příklady použití

  • eBird Status and Trends FAQ od Cornell Lab of Ornithology
  • ebirdst - Intro Mapping od Toma Auera a Daniela Finka
  • Balíček ebirdst R od Cornell Lab of Ornithology
  • Delta řeky Colorado a centrální údolí Kalifornie jsou kritickými oblastmi pro mnoho migrujících severoamerických suchozemských ptáků podle DeLuca et al (2021)
  • ebirdst - Generování sezónní hojnosti a rozsahových map a statistik Matt Strimas -Mackey, Tom Auer a Daniel Fink

Encyklopedie rakovinné buněčné linie (CCLE)

rakovina genetická genomová Homo sapiens vědy o životě STRIDES transkriptomika sekvenování celého genomu

Projekt Cancy Cell Line Encyclopedia (CCLE) je snahou provést detailní genetickou charakterizaci velkého panelu lidských rakovinných buněčných linií. CCLE poskytuje veřejný přístup ke genomickým datům, vizualizacím a analýzám více než 1100 rakovinotvorných buněčných linií. Tato datová sada obsahuje data zarovnaná pro čtení RNA-Seq, zarovnaná čtení WXS a zarovnaná čtení WGS.

Příklady použití

DOE 's Water Power Technology Office 's (WPTO) US Wave dataset

energie pozorování Země geoprostorová meteorologická udržitelnost voda

Vydáno pro veřejnost jako součást iniciativy Department of Energy 's Open Energy Data Initiative, jedná se o veřejně dostupnou datovou sadu dlouhodobých vlnových vysílání s nejvyšším rozlišením, která-až bude kompletní-pokryje celou americkou exkluzivní ekonomickou zónu (EEZ).

Příklady použití

  • SWAN Cycle III verze 41.31A od týmu SWAN
  • Příklady HSDS Caleb Phillips, Caroline Draxl, John Readey, Jordan Perr-Sauer, Michael Rossol
  • Předpovídání oceánských vln podél východního pobřeží USA během energetických zimních bouří: citlivost na parametrizaci whitecapping od Allahdadi, M.N., He, R. a Neary, VS
  • Hindcast regionální vlny s vysokým rozlišením pro západní pobřeží USA od Yang, Zhaoqing Wu, Wei-Cheng Wang, Taiping Castrucci, Luca
  • Vývoj a validace modelu zadních vlnových regionálních vln s vysokým rozlišením pro charakterizaci zdrojů vln západního pobřeží USA Wu, Wei-Cheng Wang, Taiping Yang, Zhaoqing Garcia Medina, Gabriel

Archiv dat sonaru NOAA s vodním sloupcem

biodiverzita pozorování Země ekosystémy environmentální geoprostorové mapování udržitelnost oceánů

Data sonaru z vodních sloupců archivována v národních centrech NOAA pro informace o životním prostředí.

Příklady použití

  • Zvýšení přístupnosti akustických dat prostřednictvím globálního přístupu a snímků od Carrie Wall, Michael Jech a Susan McLean
  • Vykreslení surových dat EK60 od Carrie Wall
  • Rozdíl frekvence se surovými daty od Carrie Wall
  • Čtení a vykreslování spodních dat od Carrie Wall
  • Čtení a vykreslování zpracovaných dat CSV od Carrie Wall

Národní datový soubor NREL Wind Integration

environmentální geoprostorová meteorologická udržitelnost

Veřejná integrace National Dataset (WIND), která byla zveřejněna v rámci iniciativy Department of Energy 's Open Energy Data Initiative, je aktualizací a rozšířením sady dat Eastern Wind Integration Data a Western Wind Integration Data Set. Podporuje další generaci studií integrace větru.

Příklady použití

  • Wind Prospector od Paula Edwardse
  • Ověření výkonu pro sadu nástrojů WIND od J. Kinga, Andrewa Cliftona, Bri-Mathiase Hodge
  • Vizualizace větru od Jordan Perr-Sauer
  • The Wind Integration National Dataset (WIND) Toolkit by Caroline Draxl, Andrew Clifton, Bri-Mathias Hodge, Jim McCaa
  • Příklady HSDS Caleb Phillips, Caroline Draxl, John Readey, Jordan Perr-Sauer, Michael Rossol

Světová banka - světlo každou noc

satelitní snímky pro pozorování Země

Light Every Night-Night Bank Light Data Světové banky-poskytuje otevřený přístup ke všem nočním snímkům a datům ze sady Visible Infrared Imaging Radiometer Suite Day-Night Band (VIIRS DNB) z let 2012–2020 a operačního liniového systému obranného meteorologického satelitního programu (DMSP- OLS) z let 1992-2013. Podkladová data pocházejí z archivu NOAA National Centers for Environmental Information (NCEI). Další zpracování University of Michigan umožňuje přístup ve formátu GeoTIFF optimalizovaném pro cloud (COG) a vyhledávání pomocí standardu STAC (Spatial Temporal Asset Catalog). Data jsou.

Příklady použití

Consortium 2 (CPTAC-2) Clinical Proteomic Tumor Analysis

vědy o rakovině, genomické vědy o životě STRIDES transkriptomika

The Consortium of Clinical Proteomic Tumor Analysis Consortium (CPTAC) je národní snahou urychlit porozumění molekulárnímu základu rakoviny pomocí rozsáhlé analýzy proteomu a genomu nebo proteogenomiky. CPTAC-2 je Fáze II Iniciativy CPTAC (2011-2016). Datové sady obsahují otevřenou kvantifikaci genové exprese RNA-Seq, kvantifikaci izoformní exprese miRNA-Seq a kvantifikační expresi miRNA.

Příklady použití

  • Integrovaná proteogenomická charakteristika lidského vysoce sérového rakoviny vaječníků Hui Zhang, Tao Liu, Zhen Zhang, Samuel H. Payne, Bai Zhang, Jason E. McDermott, Jian-Ying Zhou, Vladislav A. Petyuk, Li Chen, Debjit Ray, Shisheng Sun, Feng Yang, Lijun Chen, Jing Wang, Punit Shah, Seong Won Cha, Paul Aiyetan, Sunghee Woo, Yuan Tian, ​​Marina A. Gritsenko, Therese R. Clauss, Caitlin Choi, Matthew E. Monroe, Stefani Thomas, Song Nie, Chaochao Wu, Ronald J. Moore, Kun-Hsing Yu, David L. Tabb, David Fenyö, Vineet Bafna, Yue Wang, Henry Rodriguez, Emily S. Boja, Tara Hiltke, Robert C. Rivers, Lori Sokoll, Heng Zhu , Ie-Ming Shih, Leslie Cope, Akhilesh Pandey, Bing Zhang, Michael P. Snyder, Douglas A. Levine, Richard D. Smith, Daniel W. Chan, Karin D. Rodland, vyšetřovatelé CPTAC
  • Datový portál CPTAC od National Cancer Institute
  • Genomic Data Commons od National Cancer Institute
  • Cloud rakoviny genomiky od sedmi mostů
  • Proteomická analýza karcinomu tlustého střeva a konečníku pomocí standardních a přizpůsobených databází společností Slebos RJ, Wang X, Wang X, Zhang B, Tabb DL, Liebler DC

ICGC na AWS

biologické vědy o rakovině

Mezinárodní konsorcium genomu rakoviny (ICGC) koordinuje projekty se společným cílem urychlit výzkum příčin a kontroly rakoviny. Studie PanCancer Analysis of Whole Genomes (PCAWG) je mezinárodní spolupráce na identifikaci společných vzorců mutací v celých genomech z ICGC. Více než 2400 důsledně analyzovaných genomů, které odpovídají více než 1100 unikátním dárcům ICGC, je nyní volně dostupných na Amazonu S3 pro důvěryhodné výzkumníky, kteří podléhají zásadám sdílení údajů ICGC.

Příklady použití

OpenAQ

města kvality ovzduší environmentální geoprostorová udržitelnost

Globální, agregované údaje o fyzické kvalitě ovzduší z veřejných zdrojů dat poskytnuté vládními, výzkumnými a jinými zdroji. Tyto úžasné skupiny odvádějí tvrdou práci při měření těchto dat a jejich veřejném sdílení a naše komunita je činí univerzálnějšími pro lidi i stroje.

Příklady použití

1000 Genomes Phase 3 Reanalysis with DRAGEN 3.5 and 3.7

bam biologie genetická genomová zdraví vědy o životě vcf

Tato datová sada obsahuje soubory zarovnání a krátké nukleotidy, počet kopií, soubory s opakovanou expanzí (STR) a strukturální volání z datové sady 1000 Genomes Project Phase 3 (n = 3202) pomocí softwaru Illumina DRAGEN v3.5.7b a v3.7.6. Datový soubor v3.7.6 také obsahuje výsledky ze společné malé varianty, de novo strukturální varianty, varianty počtu kopií de novo a opakovaných výzev k rozšíření na 602 trio rodinách složených z členů datové sady Phase 3 projektu 1000 Genomes, stejně jako DRAGEN gVCF Genotyper ( v3.8.3) analýza celého datového souboru (n = 3202). Vylepšení a nové funkce v3.7.

Příklady použití

Otevřené datové sady BossDB Neuroimagery

zobrazování vápníku elektronová mikroskopie biologické vědy světelná mikroskopie magnetická rezonance neuroimaging neurověda volumetrické zobrazování rentgenové záření rentgenové mikrotomografie rentgenové tomografie

Tento datový ekosystém, Brain Observatory Storage Service & amp Database (BossDB), obsahuje několik datových sad pro neuro-zobrazování napříč různými modalitami a měřítky, od nanorozsahu (elektronová mikroskopie) až po mikroúroveň (mikroskopie s vymazanou světelnou tabulkou a tomografie pole) a meziměřítko (strukturální a funkční magnetická rezonance). Mnoho datových sad navíc obsahuje hustou segmentaci a sítě.

Příklady použití

  • Služba Block Object Storage Service (bossDB): Cloud-Native approach for Petascale Neuroscience Discovery od Robert Hider Jr., Dean M. Kleissas, Derek Pryor, Timothy Gion, Luis Rodriguez, Jordan Matelsky, William Gray-Roncal, Brock Wester
  • Přístup a stahování dat Jordan Matelsky
  • stážista: Integrovaná sada nástrojů pro rozšiřitelnou a reprodukovatelnou neurovědu od Jordan K Matelsky, Luis Rodriguez, Daniel Xenes, Timothy Gion, Robert Hider Jr., Brock Wester, William Gray-Roncal
  • bossDB od týmu bossDB
  • Komunitní vývojový open-source výpočetní ekosystém pro velká data Neuro od JT Vogelsteina, E. Perlmana, B. Falk, A. Badena, W. Gray Roncala, V. Chandrashekhara, F. Collmana, S. Seshamaniho, JL Patsolic, K . Lillaney, M. Kazhdan, R. Hider, D. Pryor, J. Matelsky, T. Gion, P. Manavalan, B. Wester, M. Chevillet, ET Trautman, K. Khairy, E. Bridgeford, DM Kleissas, DJ Tward, AK Crow, B. Hsueh, MA Wright, MI Miller, SJ Smith, RJ Vogelstein, K. Deisseroth a R. Burns

Consortium 3 (CPTAC-3) Clinical Proteomic Tumor Analysis

vědy o rakovině, genomické vědy o životě STRIDES transkriptomika

The Consortium of Clinical Proteomic Tumor Analysis Consortium (CPTAC) je národní snahou urychlit porozumění molekulárnímu základu rakoviny pomocí rozsáhlé analýzy proteomu a genomu nebo proteogenomiky. CPTAC-3 je Fáze III Iniciativy CPTAC. Datový soubor obsahuje otevřená data kvantifikace genové exprese RNA-Seq.

Příklady použití

  • Proteomic Data Commons od National Cancer Institute
  • Datový portál CPTAC od National Cancer Institute
  • Genomic Data Commons od National Cancer Institute
  • Integrovaná proteogenomická charakteristika čirého buněčného karcinomu ledvin od Clark DJ, Dhanasekaran SM, Petralia F, Pan J, Song X, Hu Y, da Veiga Leprevost F, Reva B, Lih TM, Chang HY, Ma W, Huang C, Ricketts CJ , Chen L1, Krek A, Li Y, Rykunov D, Li QK, Chen LS, Ozbek U, Vasaikar S, Wu Y, Yoo S, Chowdhury S, Wyczalkowski MA, Ji J, Schnaubelt M, Kong A, Sethuraman S, Avtonomov DM, Ao M, Colaprico A, Cao S, Cho KC, Kalayci S, Ma S, Liu W, Ruggles K, Calinawan A, Gümüş ZH, Geizler D, Kawaler E, Teo GC, Wen B, Zhang Y, Keegan S, Li K, Chen F, Edwards N, Pierorazio PM, Chen XS, Pavlovich CP, Hakimi AA, Brominski G, Hsieh JJ, Antczak A, Omelchenko T, Lubinski J, Wiznerowicz M, Linehan WM, Kinsinger CR, Thiagarajan M, Boja ES , Mesri M, Hiltke T, Robles AI, Rodriguez H, Qian J, Fenyö D, Zhang B, Ding L, Schadt E, Chinnaiyan AM, Zhang Z, Omenn GS, Cieslik M, Chan DW, Nesvizhskii AI, Wang P, Zhang H Konsorcium pro klinickou analýzu proteinových nádorů
  • Cloud rakoviny genomiky od sedmi mostů

Globální databáze událostí, jazyk a tón (GDELT)

Tento projekt monitoruje celosvětové vysílání, tisk a webové zprávy z téměř všech koutů každé země ve více než 100 jazycích a identifikuje lidi, místa, organizace, počty, témata, zdroje, emoce, citáty, obrázky a události, které řídí náš globální společnost každou sekundu každého dne.

Příklady použití

Datová sada LADI (Low Altitude Disaster Imagery)

letecké snímky pobřežní počítačové vidění reakce na katastrofy pozorování Země zemětřesení geoprostorové zpracování obrazu zobrazovací infrastruktura země strojové učení mapování přírodní zdroje seismologie doprava městská voda

Datová sada LADI (Low Altitude Disaster Imagery) se skládá z leteckých a strojem komentovaných leteckých snímků shromážděných civilní leteckou hlídkou na podporu různých reakcí na katastrofy v letech 2015-2019. Počáteční vydání LADI se zaměřuje na období hurikánů v Atlantiku a pobřežní státy podél Atlantického oceánu a Mexického zálivu. Anotace jsou zahrnuty pro hlavní hurikány Harvey, Maria a Florence. Dvě klíčové odlišnosti jsou malá nadmořská výška, šikmá perspektiva snímků a rysy související s katastrofou, které se v benchmarcích počítačového vidění a sadách dat objevují jen zřídka.

Příklady použití

  • Trénujte a nasaďte klasifikátor obrázků pro reakci na katastrofy od Jianyu Mao, Kiana Harris, Nae-Rong Chang, Caleb Pennell, Yiming Ren
  • Videotestování v inovační a testovací laboratoři FirstNet pomocí datové sady veřejné bezpečnosti od Chris Budny, Jeffrey Liu, Andrew Weinert
  • Velká organizace a odvození datové sady snímků pro veřejnou bezpečnost Jeffrey Liu, David Strohschein, Siddharth Samsi, Andrew Weinert
  • Kurz dálkového průzkumu pro reakci na katastrofu od Summer Institute Beaver Works
  • Návody LADI od Andrew Weinert, Jianyu Mao, Kiana Harris, Nae-Rong Chang, Caleb Pennell, Yiming Ren, Ryan Earley, Nadia Dimitrova

Datová sada NYU Langone & amp FAIR FastMRI

biologie zdraví zpracování obrazu biologické vědy zobrazování magnetickou rezonancí neurobiologie neuroimaging

Tato datová sada obsahuje deidentifikovaná surová data k-prostoru a obrazové soubory DICOM s více než 1 500 koleny a 6 970 mozky.

Příklady použití

Záznamy o zájezdech New York City Taxi and Limousine Commission (TLC)

městská doprava městská

Údaje o cestách taxislužby a pronajatých vozidel v New Yorku.

Příklady použití

  • Deep Dive on Flink & amp Spark na Amazon EMR od Keith Steward
  • Strojové učení na distribuovaném Dasku pomocí Amazon SageMaker a AWS Fargate od Ram Vittal
  • Vytvářejte a provozujte streamovací aplikace s Apache Flink a Amazon Kinesis Data Analytics for Java Applications od Steffena Hausmanna
  • Vybudujte kanál pro zpracování streamů v reálném čase s Apache Flink na AWS od Steffena Hausmanna
  • Optimalizace dat pro analýzu pomocí Amazon Athena a AWS Glue od Manava Sehgala

Zářivý MLHub

pozorování Země environmentální geoprostorové značené strojové učení udržitelnost satelitních snímků

Radiant MLHub je otevřená knihovna pro geoprostorová tréninková data, která hostí datové sady generované týmem Radiant Earth Foundation 's a další katalogy tréninkových dat, které poskytli partneři Radiant Earth. Radiant MLHub je přístupný komukoli, aby měl přístup ke svým datovým sadám školení, jejich ukládání, registraci a/nebo sdílení pro vysoce kvalitní pozorování Země. Všechny tréninkové datové sady jsou uloženy pomocí katalogu kompatibilního s katalogem STAT (SpatioTemporal Asset Catalog) a zpřístupněny prostřednictvím společného API. Tréninkové datové sady obsahují dvojice snímků a štítků pro různé typy problémů strojového učení, včetně obrázků.

Příklady použití

Údaje o zemětřesení v jižní Kalifornii

pozorování Země zemětřesení seismologie udržitelnost

Tento datový soubor obsahuje seismické křivky rychlosti pohybu a zrychlení zaznamenané Seismickou sítí jižní Kalifornie (SCSN) a archivované v datovém centru pro zemětřesení v jižní Kalifornii (SCEDC).

Příklady použití

  • Cactus to Clouds: Processing the SCEDC Open Data Set on AWS by Tim Clements
  • Údaje o zemětřesení v jižní Kalifornii jsou nyní k dispozici v cloudu AWS od Ellen Yu Aparna Bhaskaran Shang -Lin Chen Zachary E. Ross Egill Hauksson Robert W. Clayton
  • Začínáme s veřejnou datovou sadou SCEDC AWS od Ellen Yu
  • Použití Lambdy ke zpracování seismogramů od Shang-Lin Chen
  • Skript ke stažení seismických průběhů z veřejné datové sady SCEDC AWS od Aparna Bhaskaran

USGS 3DEP LiDAR mračna bodů

zemědělství reakce na katastrofy zvýšení geoprostorové lidarové udržitelnosti

Cílem programu USGS 3D Elevation Program (3DEP) je shromažďovat údaje o nadmořské výšce ve formě údajů o detekci světla a rozsahu (LiDAR) na souběžných Spojených státech, na Havaji a na územích USA s daty získanými za období 8 let . Tato datová sada poskytuje dvě realizace dat mračna bodů 3DEP. Prvním zdrojem je organizace pro veřejný přístup poskytovaná ve formátu Entwine Point Tiles, což je bezztrátový, streamovatelný oktree s plnou hustotou založený na kódování LASzip (LAZ). Druhým zdrojem je žadatel platí stejná data ve formátu LAZ (Compressed LAS). Názvy zdrojů v botu.

Příklady použití

Data COVID-19 Data Lake

bioinformatika biologie koronavirus COVID-19 zdraví vědy o živé přírodě medicína MERS SARS

Centralizované úložiště aktuálních a upravených datových souborů o šíření a charakteristikách nového koronaviru (SARS-CoV-2) a s ním spojeného onemocnění COVID-19 nebo s ním související. Globálně probíhá několik snah o shromažďování těchto údajů a pracujeme s partnery na tom, aby byla tato klíčová data volně dostupná a udržovala je aktuální. Hostováno v cloudu AWS, naočkovali jsme naše kurátorské datové jezero s daty sledování případů COVID-19 od Johns Hopkins a The New York Times, dostupností nemocničního lůžka od společnosti Definitive Healthcare a více než 45 000 výzkumnými články o COVID-19 a relacích.

Příklady použití

CoMMpass od Nadace pro výzkum mnohočetného myelomu

rakovina genetická genomová PÁSUJE sekvenování celého genomu

Studie Související klinické výsledky u mnohočetného myelomu s osobním hodnocením genetického profilu je významnou iniciativou personalizované medicíny Nadace pro mnohočetný myelom (MMRF). CoMMpass je longitudinální pozorovací studie zahrnující přibližně 1 000 nově diagnostikovaných pacientů s myelomem, kteří dostávají různé standardní schválené léčby. Vize MMRF je sledovat léčbu a výsledky u každého pacienta CoMMpass, aby mohly být tyto informace jednou použity k vedení rozhodování pro nově diagnostikované pacienty. CoMMpass kontroloval pacienty každých 6 měsíců po dobu 8 let, sbíral vzorky tkání, gen.

Příklady použití

  • & quot; Průběžná analýza studie MMRF CoMMpass: longitudinální studie u mnohočetného myelomu týkající se klinických výsledků na genomické a imunofenotypové profily & quot; Keats JJ, Craig DW, Liang W, Venkata Y, Kurdoglu A, Aldrich J, Auclair D, Allen K, Harrison Jewell S, Kidd PG, Correll M, Jagannath S, Siegel DS, Vij R, Orloff G, Zimmerman TM, MMRF CoMMpass Network, Capone W, Carpten J, Lonial S.
  • „Identifikace iniciace kmenových mutací a odlišných molekulárních podtypů: Průběžná analýza studie Mmrf Commpass“ od Jonathana J Keatsa, PhD, Gil Speyera, Legendre Christophe, Christoffersona Austina, Kristi Stephenson, BS, Ahmet Kurdoglu, Megan Russell, Aldrich Jessica, Cuyugan , Jonathan Adkins, Jackie McDonald, Adrienne Helland, Alex Blanski, Meghan Hodges, Dan Rohrer, Sundar Jagannath, MD, David Siegel, MD PhD, Ravi Vij, MD MBA, Gregory Orloff, MD, Todd Zimmerman, MD, Ruben Niesvizky, MD , Darla Liles, MD, Joseph W. Fay, Jeffrey L. Wolf, MD PhD, Robert M. Rifkin, Norma C Gutierrez, The MMRF CoMMpass Network, Jen Toups, Mary Derome, MS, Winnie Liang, PhD, Seunchan Kim, Daniel Auclair, PhD, Pamela G. Kidd, MD, Scott Jewell, PhD, John David Carpten, PhD, Sagar Lonial, MD
  • Genomic Data Commons od National Cancer Institute
  • & quot; Molekulární prediktory výsledků a odezvy na léky u mnohočetného myelomu: Průběžná analýza studie Mmrf CoMMpass & quot; Jonathan J Keats, PhD, Gil Speyer, Austin Christofferson, Christophe Legendre, PhD, Jessica Aldrich, Megan Russell, Lori Cuyugan, Jonathan Adkins, Alex Blanski, Meghan Hodges, Dan Rohrer, Sundar Jagannath, MD, Ravi Vij, MD, Gregory Orloff, MD, Todd Zimmerman, MD, Ruben Niesvizky, MD, Darla Liles, MD, Joseph W. Fay, Jeffrey L. Wolf, MD, Robert M Rifkin, Norma C Gutierrez, MD PhD, Mmrf CoMMpass Network, Jennifer Yesil, MS, Mary Derome, MS, Seungchan Kim, PhD, Winnie Liang, PhD, Pamela G. Kidd, MD, Scott Jewell, PhD, John David Carpten , PhD, Daniel Auclair, PhD, Sagar Lonial, MD FACP
  • & quot; Průběžná analýza Mmrf Commpass Trial: Identifikace nových přeskupení potenciálně spojených s iniciací a progresí nemocí & Sagar Lonial, MD, Venkata D Yellapantula, Winnie Liang, PhD, Ahmet Kurdoglu, BS, Jessica Aldrich, MSc, Christophe M. Legendre, MD , Kristi Stephenson, Jonathan Adkins, Jackie McDonald, Adrienne Helland, Megan Russell, Austin Christofferson, Lori Cuyugan, Dan Rohrer, Alex Blanski, Meghan Hodges, Mmrf CoMMpass Network, Mary Derome, Daniel Auclair, PhD, Pamela G. Kidd, MD, Scott Jewell, PhD, David Craig, PhD, John Carpten, PhD, Jonathan J. Keats, PhD

Sdružený model srovnávacího projektu 6

zemědělství atmosféra klima pozorování Země environmentální model oceány simulace počasí

Šestá fáze globálního modelu modelu globální cirkulace v oceánské atmosféře. O další údaje lze požádat prostřednictvím formuláře Google

Tato aplikace je jednou z několika možností, jak najít citace dat CMIP6. V tomto blogovém příspěvku jsou popsány alternativní nástroje k nalezení referencí dat CMIP6. Obecné informace o citační službě jsou k dispozici na: cmip6cite.wdc-climate.de.

Příklady použití

  • Hledání dat CMIP6 pomocí příjem-esm a vykreslování časových řad pro body od Zac Flamig
  • Začínáme s daty CMIP6 od Aparna Radhakrishnan
  • Srovnání CMIP6 Zarr vs NetCDF Holdings od Aparna Radhakrishnan
  • Zpracování dat CMIP6 ve formátu Zarr pomocí Dask & amp AWS Fargate od Zac Flamig
  • Zvláštní vydání | Vázaný model Intercomparison Project Phase 6 (CMIP6) Experimental Design and Organisation V. Eyring

Digital Earth Africa Landsat Collection 2, úroveň 2

zemědělství deafrica reakce na katastrofy pozorování Země geoprostorové přírodní zdroje satelitní snímky udržitelnost

Digital Earth Africa (DE Africa) poskytuje bezplatný a otevřený přístup ke kopii produktů Landsat Collection 2 úrovně 2 v Africe. Tyto produkty vyrábí a dodává United States Geological Survey (USGS). Satelity Pozemských pozorovacích družic Landsat, vedené společně USGS a NASA, nepřetržitě pořizují snímky zemského povrchu od roku 1972. DE Africa poskytuje data ze satelitů Landsat 5, 7 a 8, včetně historických pozorování z konce 80. let a pravidelně aktualizované nové akvizice. Nová data Landsat 7 a Landsat 8 úrovně 2 jsou k dispozici po 15.

Příklady použití

  • Digital Earth Africa Explorer (LS5) od Digital Earth Africa Contributors
  • Digital Earth Africa Explorer (LS7) od přispěvatelů Digital Earth Africa
  • Školení Digital Earth Africa od přispěvatelů Digital Earth Africa
  • Digital Earth Africa Explorer (LS8) od přispěvatelů Digital Earth Africa
  • Webové služby Digital Earth Africa od přispěvatelů Digital Earth Africa

Opakovaná analýza ECMWF ERA5

zemědělství klima pozorování Země meteorologická udržitelnost počasí

ERA5 je pátou generací atmosférických reanalýz ECMWF globálního klimatu a první reanalyzou vytvořenou jako provozní služba. Využívá nejlepší dostupná pozorovací data ze satelitů a stanic in-situ, které jsou asimilovány a zpracovávány pomocí cyklu 41r2 integrovaného předpovědního systému (IFS) ECMWF. Datový soubor poskytuje všechny základní atmosférické meteorologické parametry, jako jsou mimo jiné teplota vzduchu, tlak a vítr v různých nadmořských výškách, spolu s parametry povrchu, jako jsou srážky, obsah půdní vlhkosti a parametry moře, jako je teplota povrchu moře.

Příklady použití

Souhrnná statistika povodňových rizik First Street Foundation (FSF)

zemědělství klimatický model statistika udržitelnost vodní počasí

Soubory CSV záplavové statistiky pro 48 sousedících států na úrovni okresu, okresu a PSČ. CSV pro každý z těchto geografických rozsahů obsahuje statistiky o množství ohrožených nemovitostí podle FEMA, počtu ohrožených nemovitostí podle First Street Foundation a rozdílu mezi nimi.

Příklady použití

  • Ověření modelu nebezpečí povodně s rozlišením 30 m v souběžných Spojených státech Oliverem E. J. Wingem, Paulem D. Batesem, Christopherem C. Sampsonem, Andrewem M. Smithem, Krisem A. Johnsonem, Tylerem A. Ericksonem
  • Odhad nedávných místních dopadů nárůstu hladiny moře na současné ztráty nemovitostí: Případová studie trhu s bydlením v Miami-Dade na Floridě od Stevena A. McAlpina, Jeremy R. Portera
  • Znáte povodňová rizika svého domova? Autor: Edward Kearns, Jeremy Porter, Michael Amodeo
  • First Street Foundation Flood Lab od First Street Foundation
  • Sdělení národního hodnocení povodňových rizik pomocí AWS od Ed Kearns, Mike Amodeo

Archiv čtení sekvence NIH NCBI (SRA) na AWS

bam cram fastq genetické genomové vědy o životě STRIDES transkriptomika sekvenování celého exomu sekvenování celého genomu

Sekvenční čtecí archiv (SRA), vytvořený Národním centrem pro biotechnologické informace (NCBI) v Národní lékařské knihovně (NLM) v Národních zdravotních ústavech (NIH), ukládá data o sekvenování surové DNA a informace o zarovnání z vysoce výkonných sekvenční platformy. SRA poskytuje otevřený přístup k těmto údajům o biologických sekvencích, aby podpořil úsilí výzkumné komunity o zlepšení reprodukovatelnosti a nové objevy porovnáním datových sad. Kbelíky v tomto registru obsahují veřejná data SRA v původním formátu (odeslaném uživatelem) z vybrané vysoké hodnoty a nově vydané verze.

Příklady použití

Model rychlého obnovení NOAA s vysokým rozlišením (HRRR)

zemědělství klima reakce na katastrofy udržitelnost životního prostředí počasí

HRRR je tříkilometrové rozlišení NOAA v reálném čase, hodinově aktualizované, atmosférický model umožňující konvekci umožňující cloud, inicializovaný 3 km mřížkami s 3 km radarovou asimilací. Radarová data jsou asimilována v HRRR každých 15 minut po dobu 1 hodiny, což přidává další podrobnosti k tomu, které poskytuje hodinová asimilace dat pomocí 13 km radarem vylepšeného Rapid Refresh.

Příklady použití

  • Balíček HRRR-B Python: stáhněte a čtěte soubory HRRR grib2 od Briana Blaylocka
  • Průvodce instalací Conda Enironment od Zacha Riecka
  • Co je Zarr? od Taylor Gowan
  • Příklad vizualizace Zarra od Taylor Gowan, James Powell, Zach Rieck
  • Definice proměnných souboru Zarr od Taylor Gowan

Ensemble NOAA Rapid Refresh Forecast System (RRFS) [Prototyp]

zemědělství klima meteorologická udržitelnost počasí

Rapid Refresh Forecast System (RRFS) je systém generování předpovědí proudění umožňující rychlou aktualizaci Národního úřadu pro oceán a atmosféru (NOAA), který je v současné době naplánován na provozní implementaci na konci roku 2023. Provozní konfigurace bude zahrnovat 3 km pokrývající síť Severní Amerika a zahrnují předpovědi každou hodinu až na 18 hodin, s rozšířením na 60 hodin čtyřikrát denně v 00, 06, 12 a 18 UTC. Každá prognóza má být složena z 9–10 členů. RRFS poskytne pokyny na podporu zájmů předpovědí, mimo jiné včetně letectví, silného konvekčního počasí, obnovitelné energie, silných srážek a zimního počasí v časových intervalech, kde jsou zvláště užitečné rychle aktualizované pokyny.

RRFS se opírá o Unified Forecast System (UFS), komunitní iniciativu modelování Země, a těží ze snahy o rozvojový rozvoj napříč NOAA, akademickou obcí a výzkumnými institucemi.

Vědro S3 poskytne datové sady ze tří z 2021 testů NOAA Testbed. Během každého z těchto experimentů bude spuštěna prototypová verze vyvíjeného RRFS. Následuje podrobný přehled časových období každého z experimentů Testbed spolu se širokým přehledem plánovaných konfigurací. Odkazy jsou k dispozici v sekci dokumentace pro podrobné finalizované konfigurace.

Experiment s předpovědí počasí na jaře 2021, předpověď na jaro, 3. května až 4. června 9členný vícefyzikální soubor se stochastickými poruchami běží jednou denně při vzdálenosti 3 km mřížky pokrývající Severní Ameriku po dobu 60 hodin. Počáteční podmínky a boční okrajové podmínky jsou převzaty z GFS a GEFS. 2021 Hydrometeorologický testbed Každoroční experiment s bleskovými povodněmi a intenzivními srážkami (FFaIR), 21. června až 23. července, s výjimkou týdne 4. července 9členný vícefyzikální soubor se stochastickými poruchami běží jednou denně na 3 km rozteči mřížky pokrývající Severní Ameriku 60 hodin. Počáteční podmínky a boční okrajové podmínky jsou převzaty z GFS a GEFS. 2021-2022 Hydrometeorologický testbed Zimní experiment s počasím, od poloviny listopadu do poloviny března Plánováno-systém asimilace dat RRFS aktualizovaný každou hodinu při vzdálenosti 3 km mřížky pokrývající Severní Ameriku. Podrobnosti jsou stále TBD.

Pro každý cyklus je datová sada uspořádána podle dne cyklu, denní doby a člena. Například rrfs.20210504/00/mem01/obsahuje předpověď od člena souboru 1 inicializovaného v 00 UTC dne 4. května 2021. Uživatelé najdou dva typy výstupu ve formátu GRIB2. První je:

To znamená, že toto je člen 1 souboru RRFS inicializovaný v 00 UTC, pokrývá severoamerickou doménu a je dodatečně zpracovaná mřížkovaná data v hodině 24. Tento výstup je na otočené doméně zeměpisné šířky a délky v rozteči mřížky 3 km. Jedná se o velké soubory a uživatelé si možná budou chtít po stažení mřížku podmnožit nebo promítnout. Pro takové účely doporučujeme používat aplikaci WGRIB2.

Druhý výstupní soubor ve formátu grib2 je následující:

Tyto mřížky byly podmnožinou z mnohem větší severoamerické domény na doménu CONUS na Lambertově konické konformní projekci a také obsahují podstatně méně polí, což má za následek menší soubory. Projektový tým produkuje tyto soubory, aby usnadnil účast na různých experimentech NOAA Testbed, jako je Testbed Hazardous Weather.

Obrázky pro vybrané běhy jsou také zahrnuty v grafech/ adresáři pod každým experimentálním dnem pro rychlou, ale jednoduchou vizualizaci.

Tato práce je podporována projektem Unified Forecast System Research to Operation (UFS R2O), který je společně financován úřadem NOAA pro vědu a technologickou integraci (OSTI) Národní meteorologické služby (NWS) a meteorologickou programovou kanceláří (WPO), [Joint Technology Transfer Initiative (JTTI)] Úřadu pro oceánský a atmosférický výzkum (OAR).

Příklady použití

  • Rámec komunitního modelování, který je základem RRFS - aplikace UFS pro krátký dosah počasí od komunity UFS
  • Prototyp UFS-Based Rapid Refresh Forecast System (RRFS) on the Cloud od Holt, C., D. Abdi, J. A. Abeles, J. R. Carley, C. W. Harrop, R. Panda, S. Trahan a C. R. Alexander
  • Podrobnosti o konfiguraci použité během jarního experimentu s předpovědí počasí na jaře 2021 s nebezpečným počasím lze nalézt v tabulce 11 přehledu programu a operačního plánu NOAA
  • Stav NOAA 's Convection-Allowing Ensemble příští generace: Rapid Refresh Forecast System od Carley J. R., C. R. Alexandra, J. K. Wolff, J. Beck, L. Wicker, E. Rogers, J.A Abeles, E. Aligo, J.A. Aravequia, B. Blake, L. Dawson, C.-H. Jeon, D. Jovic, T. Lei, J. Purser, M.E. Pyle, P. Shafran, R. Vasic, W.-S. Wu, Y. Wu, X. Zhang, D.T. Kleist a J.-W. Bao
  • Schopnost modelovat omezenou oblast pro dynamické jádro s konečnou objemovou kostkou (FV3) a srovnání s globálním obousměrným hnízdem od společnosti Black, TL, JA Abeles, BT Blake, D. Jovic, E. Rogers, X. Zhang, EA Aligo, LC Dawson, Y. Lin, E. Strobach, PC Shafran a JR Carley

Městský index normalizovaného rozdílu (NDUI)

pozorování Země geoprostorové satelitní snímky udržitelnost městská

NDUI je kombinována s bezoblačným stínem Landsat Normalized Difference Vegetation Index (NDVI) kompozitem a DMSP/OLS Night Time Light (NTL) k charakterizaci globálních městských oblastí s rozlišením 30 m a může výrazně vylepšit městské oblasti, které pak mohou být snadno rozeznatelné od holých zemí včetně úhorů a pouští. Díky schopnosti vymezit městské hranice a současně poskytnout dostatečné prostorové detaily v městských oblastech má NDUI potenciál pro studie urbanizace v regionálním a globálním měřítku.

Příklady použití

  • Robustní metoda pro generování konzistentních časových řad z dat nočního světla DMSP/OLS od Qingling Zhang a Bhartendu Pandey a Keren C.Seto
  • Vytváření lepšího městského obrazu: Kombinace denního a nočního dálkového snímání od Qingling Zhang a Bin Li a Davida Thau a zesilovače Rebeccy Moore
  • Korekce globálních obrázků DMSP od Yifang Wang
  • Automatická extrakce městských zastavěných oblastí pomocí NDUI pomocí Pythonu a Google Earth Engine od Yifang Wang
  • Příklad použití dat ndui s nástroji AWS sagemaker od Yifang Wang

OpenStreetMap na AWS

geoprostorové mapování odezvy na katastrofy osm udržitelnost

OSM je bezplatná, upravitelná mapa světa, vytvořená a udržovaná dobrovolníky. V Amazon S3 jsou k dispozici pravidelné archivy dat OSM.

Příklady použití

Nástroj pro monitorování ozonu (OMI) / Aura NO2 hustota troposférické kolony

kvalita ovzduší atmosféra pozorování Země environmentální geoprostorové satelitní snímky udržitelnost

Hustota troposférického sloupce NO2, testováno na CloudFraction & lt 30% globální denní kompozit s rozlišením 0,25 stupně pro časové období 2004 až květen 2020. Původní archivní data v HDF5 byla zpracována do formátu Cloud-Optimized GeoTiff (COG). Zajištění kvality - Tato data byla ověřena vědeckým týmem NASA v Goddard Space Flight Center. Upozornění: https://airquality.gsfc.nasa.gov/caution-interpretation.

Příklady použití

Cloudový bod LiDAR Prefeitura Municipal de São Paulo (PMSP)

města elevace geoprostorová půda lidar mapování urban

Cílem Map 3D Digital da Cidade (M3DC) radnice v São Paulu je zveřejnit data mraků bodů LiDAR. Počáteční data byla získána v roce 2017 leteckým průzkumem a budoucí data budou přidána. Tato veřejně přístupná datová sada je poskytována ve formátu Entwine Point Tiles jako bezztrátový oktree, plná hustota, na základě kódování LASzip (LAZ).

Příklady použití

Telemetrie SondeHub Radiosonde

klima prostředí GPS počasí

Telemetrie SondeHub Radiosonde obsahuje globální data o radiosondě (meteorologický balón) zachycená společností SondeHub z našich zúčastněných přijímacích stanic radiosonde_auto_rx. radiosonde_auto_rx je open source projekt zaměřený na příjem a dekódování telemetrie ze vzdušných radiosond pomocí softwarově definovaných rádiových technik, což umožňuje studium telemetrie a někdy i obnovu samotné radiosondy. V současné době 313 přijímacích stanic poskytuje data v průměru o 384 radiosondech denně. Data v tomto úložišti obsahují přijaté telemetrické rámce, včetně typu radiosondy, polohy GPS, a.

Příklady použití

  • Používání Atheny ke čtení dat radsondy od Michaely Wheelerové
  • Načítání příkladů notebooků do SageMaker od Michaely Wheeler
  • Vývojové desky STM32 (doslova) Falling From The Sky (Jak odesílat data) od Mark Jessop & amp; Michaela Wheeler
  • pysondehub od společnosti Sondehub
  • Použití pysondehub ke čtení dat radiosondy Michaely Wheelerové

Projekt 3000 rýžových genomů

zemědělství zabezpečení potravin genetické genomové vědy o životě

Projekt 3000 Rice Genome Project je mezinárodní snahou o sekvenování genomů 3 024 odrůd rýže z 89 zemí.

Příklady použití

  • RiceGalaxy od Mezinárodního institutu pro výzkum rýže
  • Rice Galaxy: otevřený zdroj pro vědu o rostlinách od Juanillas V et al (2019)
  • Strukturální varianty v 3000 genomech rýže od Fuentes RR et al (2019)
  • Chen J et al (2019) Tracking the origin of two genetical components associated with transposable element burses in domesticated rice by Chen J et al (2019)

Komunitní model systému Země Velký soubor (CESM LENS)

atmosféra klima geoprostorový ledový pozemek strojový model učení oceány udržitelnost

Datový soubor LEM (Community Earth System Model (CESM) Large Ensemble Numerical Simulation) obsahuje 40členný soubor klimatických simulací pro období 1920-2100 s využitím historických dat (1920-2005) nebo za předpokladu scénáře koncentrace skleníkových plynů RCP8.5 ( 2006-2100), stejně jako delší kontrolní cykly na základě předindustriálních podmínek. Data obsahují povrchové (2D) i volumetrické (3D) proměnné v atmosféře, oceánu, zemi a ledových doménách. Celkový objem dat původní datové sady je

500 TB, který byl tradičně uložen jako

150 000 jednotlivých souborů CF/NetCDF na disku o.

Příklady použití

  • Renderovaná (statická) verze notebooku Jupyter od Andersona Banihirwe, NCAR
  • Notebook Jupyter a další dokumentace a nástroje pro CESM LENS na AWS od NCAR Science at Scale team
  • Analýza velkých klimatických modelových souborů v cloudu od Joe Hammana, NCAR
  • Projekt rozsáhlého souboru Community Earth System Model (CESM): Komunitní zdroj pro studium změny klimatu v přítomnosti vnitřní proměnlivosti klimatu od Kay et al. (2015), Bull. AMS, 96, 1333-1349

Digital Earth Africa Sentinel-2 Level-2A

zemědělství deafrica reakce na katastrofy pozorování Země geoprostorové přírodní zdroje satelitní snímky udržitelnost

Mise Sentinel-2 je součástí programu Evropské unie Copernicus pro pozorování Země. Sentinel-2 se skládá ze dvou satelitů, Sentinel-2A (vypuštěno 23. června 2015) a Sentinel-2B (vypuštěno 7. března 2017). Tyto dva satelity mají stejnou oběžnou dráhu, ale pro optimální pokrytí a přenos dat jsou od sebe vzdáleny 180 °. Jejich kombinovaná data jsou použita v produktu Digital Earth Africa Sentinel-2. Společně pokrývají všechny zemské povrchy Země, velké ostrovy, vnitrozemské a pobřežní vody každých 3–5 dní. Data Sentinel-2 jsou odstupňována podle úrovně předběžného zpracování. Data úrovně 0, úrovně 1A a úrovně 1B obsahují nezpracovaná data fr.

Příklady použití

  • Použijte data Sentinel-2 v Open Data Cube od Alexa Leitha
  • Digital Earth Africa Explorer od přispěvatelů Digital Earth Africa
  • Webové služby Digital Earth Africa od přispěvatelů Digital Earth Africa
  • Školení Digital Earth Africa od přispěvatelů Digital Earth Africa

Encyklopedie prvků DNA (ENCODE)

bioinformatika biologie hloubkové učení genetické genomové vědy o životě strojové učení

Konsorcium The Encyclopedia of DNA Elements (ENCODE) je mezinárodní spolupráce výzkumných skupin financovaná Národním výzkumným ústavem pro lidský genom (NHGRI). Cílem ENCODE je vytvořit komplexní seznam funkčních prvků v lidském genomu, včetně prvků, které působí na úrovni proteinů a RNA, a regulačních prvků, které kontrolují buňky a okolnosti, za nichž je gen aktivní. Vyšetřovatelé ENCODE používají řadu testů a metod k identifikaci funkčních prvků. Objev a anotace genových prvků se provádí především sekvenováním a.

Příklady použití

Vstupní data GEOS-Chem

kvalita ovzduší klima environmentální meteorologická udržitelnost počasí

Vstupní data pro GEOS-Chem Chemical Transport Model. Včetně meteorologických produktů NASA/GMAO MERRA-2 a GEOS-FP, emisních inventářů HEMCO a dalších malých dat, jako jsou počáteční podmínky modelu.

Příklady použití

Genom v lahvi na AWS

genetický genomový vědy o životě referenční index vcf

Několik referenčních genomů, které umožňují translaci celého lidského genomového sekvenování do klinické praxe. Dne 11/12/2020 byla tato data aktualizována tak, aby odrážela nejaktuálnější vydání GIAB.

Příklady použití

  • Projekt Github pro genom v lahvi od konsorcia Genome In A Bottle
  • Wang Y et al (2019) s vysokým pokrytím a dlouhým čtením sekvencí referenčních vzorků čínského tria Han
  • Nástroje pro srovnávání GA4GH od týmu GA4GH Benchmarking
  • Rozsáhlé sekvenování sedmi lidských genomů pro charakterizaci referenčních referenčních materiálů od Zook J et al (2016)

JMA Himawari-8

reakce na katastrofy zemědělství pozorování Země geoprostorové meteorologické satelitní snímky udržitelnost počasí

Himawari-8, umístěný na 140E, vlastněný a provozovaný Japonskou meteorologickou agenturou (JMA), je geostacionární meteorologická družice s podporou Himawari-9 na oběžné dráze, která poskytuje konstantní a jednotné pokrytí východní Asie a oblasti západního a středního Pacifiku z přibližně 35 800 km nad rovníkem s oběžnou dráhou odpovídající době rotace Země. To umožňuje meteorologickým kancelářím JMA provádět nepřerušované pozorování environmentálních jevů, jako jsou tajfuny, sopky a obecné meteorologické systémy. Otázky týkající se specifikací snímků Himawari-8 navštivte.

Příklady použití

NA -CORDEX - severoamerická součást koordinovaného regionálního downscalingového experimentu

atmosféra klima geoprostorový model pozemního strojového učení udržitelnost

Datový soubor NA-CORDEX obsahuje údaje o regionálních scénářích změny klimatu a pokyny pro Severní Ameriku pro použití při dopadech, rozhodování a klimatické vědě. Archiv dat NA-CORDEX obsahuje výstup z regionálních klimatických modelů (RCM) provozovaných přes doménu pokrývající většinu Severní Ameriky pomocí okrajových podmínek ze simulací globálního klimatického modelu (GCM) v archivu CMIP5. Tyto simulace probíhají v letech 1950–2100 s prostorovým rozlišením 0,22 °/25 km nebo 0,44 °/50 km. Tato verze dat AWS S3 obsahuje vybrané proměnné převedené do formátu Zarr z původního NetCDF. Pouze denní údaje a.

Příklady použití

  • Katalog sání ESM od Briana Bonnlandera (NCAR)
  • Notebook Jupyter a další dokumentace a nástroje od Briana Bonnlandera, Setha McGinnise (NCAR)
  • Datová sada NA-CORDEX, verze 1.0. Datová brána NCAR pro klima, Boulder CO (2017) od Mearns, Linda O., et al.
  • Vykreslená (statická) verze notebooku Jupyter od Briana Bonnlandera (NCAR)

Referenční genomová aktiva Refgenie

bioinformatika biologie genetická genomová infrastruktura vědy o životě jednobuněčná transkriptomika transkriptomika sekvenování celého genomu

Předem vytvořené datové zdroje referenčního genomu refgenie používané pro zarovnání a analýzu sekvenčních dat DNA.

Příklady použití

Údaje o klimatu SILO na AWS

zemědělství klima pozorování Země environmentální meteorologický model udržitelnost vodní počasí

SILO je databáze australských klimatických údajů od roku 1889 do současnosti. Poskytuje nepřetržité, denní časové datové produkty ve formátech připravených k použití pro výzkumné a provozní aplikace. SIL.

Příklady použití

Sentinel-1

zemědělství reakce na katastrofy pozorování Země geoprostorové satelitní snímky udržitelnost

Sentinel-1 je dvojice evropských satelitů radarového zobrazování (SAR) vypuštěných v letech 2014 a 2016. Jeho 6denní cyklus opakování a schopnost pozorovat mraky je ideální pro monitorování moře a pevniny, reakci na mimořádné události v důsledku ekologických katastrof a ekonomické aplikace . Údaje GRD jsou celosvětově k dispozici od ledna 2017.

Příklady použití

Sentinel-3

pozorování Země environmentální geoprostorová pevnina oceány satelitní snímky udržitelnost

Tento soubor dat sestává z pozorování ze satelitu Sentinel-3 programu Evropské komise pro pozorování Země Copernicus. Sentinel-3 je polární obíhající satelit, který denně dokončí 14 oběžných drah Země. Nese přístroj Ocean and Land Color Instrument (OLCI) pro námořní a pozemská optická měření se středním rozlišením, radiometr pro měření teploty moře a pevniny (SLSTR), radarový výškoměr SAR (SRAL), radiometr MicroWave (MWR) a přesné stanovení oběžné dráhy (POD) nástroje. Družice byla vypuštěna v roce 2016 a do rutinní operační fáze vstoupila ve 20.

Příklady použití

Sentinel-5P úroveň 2

kvalita ovzduší atmosféra pozorování Země environmentální geoprostorové satelitní snímky udržitelnost

Tento soubor dat sestává z pozorování ze satelitu Sentinel-5 Precursor (Sentinel-5P) z programu Evropské komise pro pozorování Země Copernicus. Sentinel-5P je polární obíhající satelit, který denně dokončí 14 oběžných drah Země. Je vybaven spektrometrem TROPOspheric Monitoring Instrument (TROPOMI), který snímá ultrafialové (UV), viditelné (VIS), blízké (NIR) a krátkovlnné infračervené (SWIR) monitorování ozónu, metanu, formaldehydu, aerosolu, oxidu uhelnatého, dusíku kysličník a oxid siřičitý v atmosféře. Družice byla vypuštěna v říjnu 2017 a vstoupila do ro.

Příklady použití

Souhrnná statistika panství předků britské biobanky

genetický genom široká asociační studie genomové vědy o životě populační genetika

Analýza více rodů 7 221 fenotypů pomocí zobecněného rámcového testovacího rámce smíšených modelových asociací zahrnující 16 119 asociačních studií celého genomu. Poskytujeme standardní metaanalýzu napříč všemi populacemi a pro každý znak přístup typu „vynechat jednu populaci“. Data jsou poskytována ve formátu tsv (podle fenotypu) a Hail MatrixTable (všechny fenotypy a varianty). Metadata jsou poskytována ve fenotypových a variantních manifestech.

Příklady použití

Sada objektů a modelů Yale-CMU-Berkeley (YCB)

Tento projekt si klade za cíl především usnadnit benchmarking výkonu ve výzkumu robotiky. Datová sada poskytuje síťové modely, RGB, RGB-D a obrazy mračen bodů více než 80 objektů. Fyzické objekty jsou také k dispozici prostřednictvím projektu benchmarkingu YCB. Data jsou shromažďována dvěma nejmodernějšími systémy: skenovací zařízení UC Berkley 's a skener Google. Data skenovacího zařízení UC Berkley 's poskytují sítě generované Poissonovou rekonstrukcí, sítě generované integrací volumetrického rozsahu obrazu, texturované verze obou sítí, soubory Kinbody pro použití sítí s OpenRAVE, 600.

Příklady použití

ISDAsoil

zemědělství analytika zachování biologické rozmanitosti hluboké učení zabezpečení potravin geoprostorové strojové učení satelitní snímky

iSDAsoil je zdroj obsahující předpovědi vlastností půdy pro celý africký kontinent, generované pomocí strojového učení. Byly vytvořeny mapy pro více než 20 různých vlastností půdy ve 2 různých hloubkách (0-20 a 20-50 cm). Předpovědi vlastností půdy byly provedeny pomocí strojového učení spojeného s daty dálkového průzkumu a tréninkové sady více než 100 000 analyzovaných vzorků půdy. V této datové sadě jsou zahrnuty obrazy předpokládaných vlastností půdy, chyby modelu a satelitních kovariátů použitých v procesu mapování.

Příklady použití

Atlas mozku Allena Mouse

biologie genový projev genetické zpracování obrazu zobrazování biologické vědy strojové učení Mus musculus neurobiologie transkriptomika

Allen Mouse Brain Atlas je sbírka genomových profilů genových expresních profilů buněčného rozlišení pomocí in situ hybridizace (ISH). Vysoce metodické metody produkce dat a komplexní anatomické pokrytí hustým, rovnoměrně rozmístěným vzorkováním usnadňují konzistenci a srovnatelnost dat mezi více než 20 000 geny. Použití inbredního myšího kmene s minimální odchylkou mezi zvířaty umožňuje člověku léčit mozek v podstatě jako komplexní, ale vysoce reprodukovatelné trojrozměrné tkáňové pole. Celá datová sada Allen Mouse Brain Atlas a související nástroje jsou k dispozici prostřednictvím.

Příklady použití

Databáze nástroje Basic Local Alignment Sequences (BLAST)

bioinformatika biologie genetická genomová zdraví vědy o živé přírodě proteinový referenční index transkriptomika

Centralizované úložiště předformátovaných databází BLAST vytvořené Národním centrem pro biotechnologické informace (NCBI).

Příklady použití

  • BLAST+ Docker od NCBI BLAST
  • BLAST+: Architektura a aplikace od Christiam Camacho 1, George Coulouris, Vahram Avagyan, Ning Ma, Jason Papadopoulos, Kevin Bealer, Thomas L Madden
  • Gapped BLAST a PSI-BLAST: Nová generace programů pro vyhledávání proteinové databáze od S F Altschul, T L Madden, A A Schäffer, J Zhang, Z Zhang, W Miller, D J Lipman

Porazte akutní myeloidní leukémii (AML) 1.0

rakovina genetická genomová Homo sapiens vědy o životě STRIDES

Beat AML 1.0 je společný výzkumný program zahrnující 11 akademických lékařských center, kteří společně pracovali na lepším porozumění léčivům a jejich kombinacím, které by měly být upřednostněny pro další vývoj v rámci klinických a/nebo molekulárních podskupin pacientů s akutní myeloidní leukémií (AML). Beat AML 1.0 poskytuje dosud největší datový soubor o primárních vzorcích akutní myeloidní leukémie, který nabízí genomickou, klinickou a lékovou odezvu. Tento datový soubor obsahuje otevřená data o klinickém doplňku a kvantifikaci genové exprese RNA-Seq. Tento datový soubor také obsahuje kontrolované sekvenování celého exomu ( WXS) a R.

Příklady použití

Harmonizovaná data COVID-19

vědy o životě koronaviru COVID-19

Harmonizovaný sběr základních údajů týkajících se hlášených případů COVID-19 podle geografie, ve formátu připraveném pro analýzu

Příklady použití

Projekt sekvenování klinického hodnocení - difúzní velký B -buněčný lymfom

rakovina genomické vědy o životě STRIDES transkriptomika sekvenování celého genomu

Cílem projektu je identifikovat opakující se genetické alterace (mutace, delece, amplifikace, přesmyky) a/nebo podpisy genové exprese. National Cancer Institute (NCI) využil sekvenování celého genomu a/nebo sekvenování celého exomu ve spojení s transkriptomovým sekvenováním. Vzorky byly zpracovány a odeslány ke genomické charakterizaci pomocí potrubí a postupů zavedených v rámci projektu The Cancer Genome Analysis (TCGA).

Příklady použití

  • Multiproteinový superkomplex kontrolující onkogenní signalizaci u lymfomů Phelan JD, Young RM, Webster DE, Roulland S, Wright GW, Kasbekar M, Shaffer AL 3rd, Ceribelli M, Wang JQ, Schmitz R, Nakagawa M, Bachy E, Huang DW, Ji Y, Chen L, Yang Y, Zhao H, Yu X, Xu W, Palisoc MM, Valadez RR, Davies-Hill T, Wilson WH, Chan WC, Jaffe ES, Gascoyne RD, Campo E, Rosenwald A, Ott G, Delabie J, Rimsza LM, Rodriguez FJ, Estephan F, Holdhoff M, Kruhlak MJ, Hewitt SM, Thomas CJ, Pittaluga S, Oellerich T, Staudt LM
  • Genetika a patogeneze difuzního velkobuněčného lymfomu od Rolanda Schmitze, Ph.D., George W. Wrighta, Ph.D., Da Wei Huang, MD, Calvin A. Johnson, Ph.D., James D. Phelan, Ph .D., James Q. Wang, Ph.D., Sandrine Roulland, Ph.D., Monica Kasbekar, Ph.D., Ryan M. Young, Ph.D., Arthur L. Shaffer, Ph.D., Daniel J. Hodson, MD, Ph.D., Wenming Xiao, Ph.D., et al.
  • Genomic Data Commons od National Cancer Institute

Veřejný datový soubor Deutsche Börse

obchodování s daty na finančních trzích

Veřejná datová sada Deutsche Börse se skládá z údajů o obchodu agregovaných do jednominutových intervalů z obchodních systémů Eurex a Xetra. Poskytuje počáteční cenu, nejnižší cenu, nejvyšší cenu, konečnou cenu a objem za každou minutu obchodního dne a za každé obchodovatelné zabezpečení. Pokud potřebujete data s vyšším rozlišením, včetně neobchodovaných pohybů cen, podívejte se zde na náš historický produkt s údaji o trhu. Nezapomeňte se také podívat na náš portál pro vývojáře.

Příklady použití

Digitální Země Afrika Sentinel-1 Radiometricky opravený terén

zemědělství deafrica reakce na katastrofy pozorování Země geoprostorové přírodní zdroje satelitní snímky udržitelnost

Produkt zpětného rozptylu Sentinel-1 společnosti DE Africa byl vyvinut tak, aby vyhovoval specifikacím CEOS Analysis Ready Data for Land (CARD4L). Mise Sentinel-1, složená ze souhvězdí dvou satelitů radaru syntetické clony (CAR), provozuje Evropská vesmírná agentura (ESA) jako součást programu Copernicus. Mise v současné době sbírá data každých 12 dní nad Afrikou v prostorovém rozlišení přibližně 20 m. Radarový zpětný rozptyl měří množství mikrovlnného záření odraženého zpět na snímač od povrchu země. Toto měření je citlivé na drsný povrch.

Příklady použití

Distribuované archivy pro integraci neurofyziologických dat (DANDI)

biologie zobrazování buněk elektrofyziologie infrastruktura vědy o živé přírodě neuroimaging neurofyziologie neurověda

DANDI je veřejný archiv datových sad neurofyziologie, včetně nezpracovaných a zpracovaných dat a souvisejících softwarových kontejnerů. Datové sady jsou sdíleny podle licencí Creative Commons CC0 nebo CC-BY. Archiv dat poskytuje širokou škálu buněčných neurofyziologických dat. To zahrnuje elektrodové a optické záznamy a související zobrazovací data pomocí sady komunitních standardů: NWB: N - NWB: Neurophysiology, BIDS - Brain Imaging Data Structure, and Details & rarr

Příklady použití

Data meteorologického radaru finského meteorologického ústavu

zemědělství pozorování Země meteorologická udržitelnost počasí

Aktuální meteorologický radar z radarové sítě FMI je k dispozici jako Open Data. Data obsahují jak jednotlivá radarová data, tak kompozity z Finska ve formátech GeoTIFF a HDF5. Dostupné složené parametry se skládají z radarové odrazivosti (DBZ), intenzity srážek (RR) a akumulace srážek 1, 12 a 24 hodin. Jednotlivé parametry radaru se skládají z radarové odrazivosti (DBZ), radiální rychlosti (VRAD), klasifikace deště (HCLASS) a výšky vrcholu mraku (ETOP 20). Data o hrubém objemu z jednotlivých radarů jsou také poskytována ve formátu HDF5 s konvencemi ODIM 2.3. Radarová data budou k dispozici.

Příklady použití

Klinická datová sada nadace pro dospělé proti rakovině (FM-AD)

Klinický datový soubor Foundation Medicine Adult Cancer (FM-AD) je studie, kterou provedla Foundation Medicine Inc (FMI). Data genomického profilování pro přibližně 18 000 dospělých pacientů s různorodou řadou rakovin byla generována pomocí komerčně dostupného komplexního testu genomického profilování FoundationeOne, FMI 's. Tato datová sada obsahuje otevřená klinická a biologická data.

Příklady použití

  • Cílené sekvenování pokročilé rakoviny prostaty příští generace identifikuje potenciální terapeutické cíle a heterogenitu onemocnění. od Beltran H, Yelensky R, Frampton GM, Park K, Downing SR, MacDonald TY, Jarosz M, Lipson D, Tagawa ST, Nanus DM, Stephens PJ, Mosquera JM, Cronin MT, Rubin MA
  • High-throughput Genomic Profiling of Adult Solid Tumors Reveals Romanly Insights into Cancer Pathogenesis by Ryan J. Hartmaier, Lee A. Albacker, Juliann Chmielecki, Mark Bailey, Jie He, Michael E. Goldberg, Shakti Ramkissoon, James Suh, Julia A. Elvin , Samuel Chiacchia, Garrett M. Frampton, Jeffrey S. Ross, Vincent Miller, Philip J. Stephens a Doron Lipson
  • Genomic Data Commons od National Cancer Institute

Japonské slovníky Tokenizer

csv zpracování japonského přirozeného jazyka

Japonské slovníky Tokenizer pro použití s ​​MeCab.

Příklady použití

MIMIC-III („Informační informační trh pro intenzivní péči“)

bioinformatika zdraví vědy o živé přírodě zpracování přirozeného jazyka nás

MIMIC-III („Medical Information Mart for Intensive Care“) je rozsáhlá databáze s jedním centrem, která obsahuje informace týkající se pacientů přijatých na jednotky kritické péče ve velké nemocnici s terciární péčí. Data zahrnují vitální funkce, léky, laboratorní měření, pozorování a poznámky mapované poskytovateli péče, bilanci tekutin, kódy procedur, diagnostické kódy, zobrazovací zprávy, délku pobytu v nemocnici, údaje o přežití a další. Databáze podporuje aplikace včetně akademického a průmyslového výzkumu, iniciativ na zlepšování kvality a výuky v oblasti vysokoškolského vzdělávání. MIMIC-I.

Příklady použití

Lékařská segmentační desetiboj

počítačová tomografie zdraví zobrazování biologické vědy magnetická rezonance medicína nifti segmentace

S nedávným pokrokem ve strojovém učení se sémantické segmentační algoritmy stávají stále více obecnými účely a lze je přeložit do neviditelných úkolů. Mnoho klíčových pokroků v oblasti algoritmů v oblasti lékařského zobrazování je běžně ověřováno na malém počtu úkolů, což omezuje naše chápání obecnosti navrhovaných příspěvků. Model, který funguje hned po vybalení na mnoha úkolech, v duchu AutoML, by měl obrovský dopad na zdravotnictví. V oblasti lékařského zobrazování také chybí plně otevřený zdroj a komplexní měřítko pro obecné algoritmické validace.

Příklady použití

NASA NEX

klima pozorování Země udržitelnost přírodních zdrojů satelitní snímky

Sbírka datových souborů o vědě o Zemi, kterou spravuje NASA, včetně projekcí klimatických změn a satelitních snímků povrchu Země a#39 s.

Příklady použití

Nová předpověď systému NOAA Global Ensemble Forecast System (GEFS)

zemědělství klima meteorologická udržitelnost počasí

NOAA vygenerovala sadu více dekadických dat pro opětovnou analýzu a přepracování, která doprovází verzi nové generace jejího systému predikce souborů, Global Ensemble Forecast System, verze 12 (GEFSv12). Předpovědi v reálném čase doprovázejí „recasty“ počasí, tj. Retrospektivní předpovědi na období 2000–2019. Tyto recasty nejsou tak početné jako data v reálném čase, která byla generována pouze jednou denně, z počátečních podmínek 00 UTC, a bylo poskytnuto pouze 5 členů, s následující výjimkou. Jednou týdně bylo generováno 11členné přepracování a tyto ex.

Příklady použití

NOAA Global Historical Climatology Network Daily (GHCN-D)

zemědělství klima meteorologická udržitelnost počasí

Global Historical Climatology Network - Daily je datový soubor od NOAA, který obsahuje každodenní pozorování nad globálními pevninami. Obsahuje staniční měření z pozemních stanic po celém světě, asi dvě třetiny z nich jsou určeny pouze pro měření srážek. Mezi další meteorologické prvky patří, ale bez omezení na ně, denní maximální a minimální teplota, teplota v době pozorování, sněžení a hloubka sněhu. Jedná se o soubor záznamů o klimatu z mnoha zdrojů, které byly sloučeny dohromady a podrobeny společné sadě přezkumů zajišťování kvality. Některých údajů je více.

Příklady použití

Národní databáze slunečního záření NREL

energie pozorování Země geoprostorová meteorologická sluneční udržitelnost

Národní databáze slunečního záření (NSRDB), uvolněná pro veřejnost v rámci iniciativy Department of Energy 's Open Energy Data Initiative, je sériově kompletní sbírka hodinových a půlhodinových hodnot tří nejběžnějších měření slunečního záření-globální horizontální , přímé normální a difúzní horizontální záření - a meteorologická data. Tato data byla shromážděna na dostatečném počtu míst a časových a prostorových měřítcích, aby přesně reprezentovala regionální klima slunečního záření.

Příklady použití

  • Příklady HSDS Caleb Phillips, Caroline Draxl, John Readey, Jordan Perr-Sauer, Michael Rossol
  • Prohlížeč NSRDB od Manajit Sengupta, Yu Xe, Anthony Lopez, Aron Habte, Galen Maclaurin, James Shelby, Paul Edwards
  • The National Solar Radiation Data Base (NSRDB) by Manajit Sengupta, Yu Xe, Anthony Lopez, Aron Habte, Galen Maclaurin, James Shelby

Národní herbář NSW

zemědělství biologická rozmanitost biologie klima digitální ochrana ekosystémy životní prostředí

Národní herbář Nového Jižního Walesu je jedním z nejvýznamnějších vědeckých, kulturních a historických botanických zdrojů na jižní polokouli. 1,43 milionu zachovalých rostlinných vzorků bylo zachyceno jako snímky s vysokým rozlišením a metadata biologické rozmanitosti spojená s každým ze snímků zachycených v digitální podobě. Botanické vzorky pocházejí z roku 1770 až dodnes a tvoří sbírky poukázek, které dokumentují distribuci a rozmanitost světové flóry v čase, zejména v NSW, Austalii a Pacifiku. Data se používají při hodnocení biologické rozmanitosti, syste.

Příklady použití

OpenEEW

hluboké učení reakce na katastrofy pozorování Země zemětřesení udržitelnost strojového učení

Společnost Grillo vyvinula systém včasného varování před zemětřesením na bázi internetu věcí se senzory, které jsou v současné době rozmístěny v Mexiku, Chile, Portoriku a Kostarice, a nyní otevírá světu celý svůj archiv nezpracovaných dat akcelerometru, aby podpořil vývoj nových algoritmů schopných rychle detekovat a charakterizovat zemětřesení v reálném čase.

Příklady použití

PoroTomo

seismologie geoprostorového geotermálního zpracování obrazu

Tyto údaje, které byly zveřejněny v rámci iniciativy Department of Energy 's Open Energy Data Initiative, představují údaje o vertikálním a horizontálním distribuovaném akustickém snímání (DAS) shromážděné v rámci projektu Poroelastic Tomography (PoroTomo) financovaného částečně z prostředků Energetického úřadu Účinnost a obnovitelná energie (EERE), americké ministerstvo energetiky.

Příklady použití

  • DAS and DTS at Brady Hot Springs: Postations about Coupling and Couled Interpretations by Douglas E. Miller, Thomas Coleman, Xiangfang Zeng, Jeremy R. Patterson, Elena C. Reinnisch, Michael A. Cardiff, Herbert F. Wang, Dante Fratta, Whitney Trainor-Guitton, Clifford H. Thurber, Michelle ROBERTSON, Kurt FEIGL a tým PoroTomo
  • PoroTomo DAS Data Processing Tutorial by Nicole Taverna and Ross Ring-Jarvi
  • Reakce pohybu země na zemětřesení ML 4.3 pomocí společně umístěných distribuovaných akustických snímacích a seismometrických polí od Herberta F Wanga, Xiangfang Zenga, Douglase E Millera, Danteho Fratty, Kurta L Feigla, Clifforda H Thurbera, Roberta J. Mellorse

Serratus: Ultra -deep Search for Novel Viruses - Versioned Data Release

bam COVID-19 genetické genomové vědy o životě MERS SARS SARS-CoV-2 virus

Serratus je společný otevřený vědecký projekt ultrarychlého objevování známých i neznámých koronavirů v reakci na pandemii COVID-19 prostřednictvím opětovné analýzy veřejně dostupných genomických dat. Naše výsledná data o zarovnání viru obratlovců jsou zjistitelná pomocí programu Serratus Explorer a jsou přímo přístupná na Amazonu S3.

Příklady použití

  • Zarovnání sekvence v měřítku v petabázi katalyzuje objev virů Edgar R., Taylor J., Lin V., et al (2021)
  • Tantalus: balíček R pro průzkum dat Serratus týmem Serratus
  • coronaSPAdes. Od klastrů biosyntetických genů po virové sestavy RNA od Meleshko D., Hajirasouliha I. a Korobeynikov A. (2021)
  • Klasifikace riboviru sekvencí polymerázového čárového kódu od Babaiana A. a Edgara R. (2021)
  • Diverzifikace savčích deltavirů posunem hostitele Bergner L.M., Orton R.J., et al (2021)

Sophos/ReversingLabs 20 milionů dat detekce malwaru

hloubkové učení počítačové bezpečnosti označené jako strojové učení

Datová sada určená k podpoře výzkumu technik strojového učení pro detekci malwaru. Obsahuje metadata a funkce EMBER-v2 pro přibližně 10 milionů benigních a 10 milionů škodlivých přenosných spustitelných souborů s odzbrojenými, ale jinak úplnými soubory pro všechny vzorky malwaru. Všechny vzorky jsou označeny pomocí interních metod značení Sophos, mají funkce extrahované pomocí sady funkcí EMBER-v2, metadata získaná prostřednictvím knihovny python pefile, počty detekce získané pomocí telemetrie ReversingLabs a další značky chování, které indikují hrubé chování samp.

Příklady použití

Storm EVent ImageRy (SEVIR)

počasí meteorologických satelitních snímků

Sbírka prostorově a časově zarovnaných satelitních snímků GOES-16 ABI, radarových mozaik NEXRAD a detekce blesků GOES-16 GLM.

Příklady použití

Projekt lidského mikrobiomu

aminokyselina fasta fastq genetická genomová vědy o životě metagenomika mikrobiom

Human Microbiome Project (HMP) financovaný NIH je snahou více než 300 vědců z více než 80 organizací komplexně charakterizovat mikrobiální komunity obývající lidské tělo a objasnit jejich roli v lidském zdraví a chorobách. Pro splnění tohoto úkolu byly izolovány vzorky mikrobiální komunity z kohorty 300 zdravých dospělých lidských subjektů na 18 specifických místech v pěti oblastech těla (ústní dutina, dýchací cesty, urogenitální dráha, kůže a střevo). Bylo provedeno cílené sekvenování genu 16S bakteriálního markeru a/nebo sekvenování celé metagenomové brokovnice.

Příklady použití

  • Kmeny, funkce a dynamika v rozšířeném projektu Human Microbiome od Jasona Lloyd-Price, Anup Mahurkar, Gholamali Rahnavard, Jonathan Crabtree, Joshua Orvis, A. Brantley Hall a kol.
  • Nové genomové varianty mikrobů ve fekální komunitě pacientů po chirurgickém narušení horního lidského gastrointestinálního traktu Ranjit Kumar, Jayleen Grams, Daniel I. Chu, David K.Crossman, Richard Stahl, Peter Eipers, et al
  • Projekt lidského mikrobiomu Peter J. Turnbaugh, Ruth E. Ley, Micah Hamady, Claire M. Fraser-Liggett, Rob Knight & amp; Jeffrey I. Gordon

Prediktor efektu varianty (VEP) a modul pro odhad efektu přepisu efektu přepisu (LOFTEE)

genomová široká asociační studie genomové vědy o životě loftee vep

VEP určuje účinek genetických variant (SNP, inzerce, delece, CNV nebo strukturální varianty) na geny, transkripty a sekvenci proteinů, jakož i regulační oblasti. Evropský institut pro bioinformatiku vytváří nástroj/db VEP a vydává aktualizace každých 1 až 6 měsíců. Poslední vydání obsahuje 267 genomů z 232 druhů obsahujících 5567663 genů kódujících protein. Tento soubor dat obsahuje posledních 5 vydání pro lidi, krysy a zebrafy. Je také hostitelem požadovaných referenčních souborů pro plugin LOFTEE (Loss-Of-Function Transcript Effect Estimator), jak se běžně používá s VEP.

Příklady použití

Plány obyvatelstva pro sčítání lidu z roku 1940, mapy okresu výčtu a popisy oblastí výčtu

1940 sčítání lidu archivy sčítání lidu demografie nara

Plány obyvatelstva pro sčítání lidu z roku 1940 byly vytvořeny předsednictvem sčítání lidu ve snaze vyjmenovat každou osobu žijící ve Spojených státech 1. dubna 1940, i když některé osoby chyběly. Plány sčítání lidu z roku 1940 byly digitalizovány Národním archivem a správou záznamů (NARA) a zveřejněny veřejně 2. dubna 2012. Mapy okresů sčítání lidu z roku 1940 obsahují mapy krajů, měst a dalších drobných civilních divizí, které ukazují okresy sčítání, sčítání lidu trakty a související hranice a čísla použitá pro každé sčítání. Pokrytí je celonárodní a zahrnuje.

Příklady použití

4D Nucleome (4DN)

bioinformatika biologie genetické genomové zobrazování biologické vědy

Cílem programu 4D Nucleome (4DN) společného fondu National Institutes of Health (NIH) společného fondu je studovat trojrozměrnou organizaci jádra v prostoru a čase (4. dimenze). Jádro buňky obsahuje DNA, genetický „plán“, který kóduje všechny geny, které živý organismus používá k produkci proteinů potřebných k provádění život udržujících buněčných funkcí. Pochopení konformace jaderné DNA a jejího udržování nebo změn v reakci na environmentální a buněčné podněty v průběhu času poskytne pohled na základní biologii a aspekty lidského zdraví.

Příklady použití

Africa Soil Information Service (AfSIS) Chemie půdy

zemědělství environmentální bezpečnost potravin vědy o životě strojové učení udržitelnost

Tento soubor dat obsahuje infračervená spektrální data půdy a párovaná referenční měření vlastností půdy pro georeferencované vzorky půdy, které byly shromážděny prostřednictvím projektu Africa Soil Information Service (AfSIS), který trval od roku 2009 do roku 2018. Do této verze zahrnujeme data shromážděná během fáze I ( 2009–2013.) Georeferencované vzorky byly shromážděny z 19 zemí subsaharské Afriky pomocí statisticky spolehlivého schématu vzorkování a jejich půdní vlastnosti byly analyzovány pomocí oba konvenční metody zkoušení půdy a spektrální metody (infračervená difúzní reflektanční spektroskopie). Dva .

Příklady použití

Datová sada obrázků Amazon Bin

amazon.science počítačové učení strojové učení

Datová sada obrázků Amazon Bin obsahuje více než 500 000 obrázků a metadat z popelnic v provozovaném centru Amazon Fulfillment Center. Obrázky zásobníků v této datové sadě jsou zachyceny, když robotické jednotky nesou lusky v rámci běžných operací centra Amazon Fulfillment Center.

Příklady použití

Atmosférické modely z Météo-France

zemědělství klima reakce na katastrofu pozorování Země environmentální strojové učení meteorologický model udržitelnost počasí

    ARPEGE World pokrývá celý svět v základním horizontálním rozlišení 0,5 ° (

Příklady použití

Široké reference genomu

bioinformatika biologie rakovina genetická genomová Homo sapiens vědy o živé přírodě referenční index

Široce udržovaná reference lidského genomu vytváří odkazy hg19/hg38 a návnady.

Příklady použití

Iniciativy charakterizující genom rakoviny - Burkittův lymfom, HIV+ rakovina děložního čípku

vědy o rakovině, genomické vědy o životě STRIDES transkriptomika

Program CGCI (Cancer Genome Characterization Initiatives) podporuje špičkový genomický výzkum rakoviny dospělých a dětí. Vyšetřovatelé CGCI vyvíjejí a používají pokročilé metody sekvenování, které zkoumají genomy, exomy a transkriptomy v různých typech nádorů. Program zahrnuje projekt Burkitt Lymphoma Genome Sequencing Project (BLGSP) a HIV+ Tumor Molecular Characterization Project - Cervical Cancer (HTMCP -CC). Datový soubor obsahuje otevřený klinický dodatek, doplněk biologického druhu, kvantifikaci genové exprese RNA-Seq, kvantifikaci izoformové exprese miRNA-Seq.

Příklady použití

Segmentace buněčných organel v elektronové mikroskopii (COSEM) na AWS

buněčná biologie počítačové vidění elektronová mikroskopie strojové učení organela

Obrázky subcelulárních struktur s vysokým rozlišením.

Příklady použití

  • Korelační trojrozměrná superrozlišovací a bloková elektronová mikroskopie celých sklovitě zmrazených buněk. David P. Hoffman1, Gleb Shtengel, C. Shan Xu, Kirby R. Campbell, Melanie Freeman, Lei Wang, Daniel E. Milkie, H. Amalia Pasolli, Nirmala Iyer, John A. Bogovic, Daniel R. Stabley, Abbas Shirinifard , Song Pang, David Peale, Kathy Schaefer, Wim Pomp, Chi-Lun Chang, Jennifer Lippincott-Schwartz, Tom Kirchhausen1, David J. Solecki, Eric Betzig, Harald F. Hess.
  • Vylepšené systémy FIB-SEM pro velkoobjemové 3D zobrazování C. Shan Xu, Kenneth J. Hayworth, Zhiyuan Lu, Patricia Grob, Ahmed M. Hassan, José G. García-Cerdán, Krishna K. Niyogi, Eva Nogales, Richard J Weinberg, Harald F. Hess.

Cloudové indexy pro Bowtie, Kraken, HISAT a Centrifuge

bioinformatika biologie genomové mapování medicína referenční index sekvenování celého genomu

Genomické nástroje využívají referenční databáze jako indexy, aby fungovaly rychle a efektivně, podobně jako webové vyhledávače používají indexy pro rychlé dotazování. Zde agregujeme genomické, pangenomické a metagenomické indexy pro analýzu sekvenčních dat.

Příklady použití

Digitální výškový model Copernicus (DEM)

zemědělství reakce na katastrofy pozorování Země nadmořská výška geoprostorové satelitní snímky udržitelnost

Copernicus DEM je digitální povrchový model (DSM), který představuje povrch Země včetně budov, infrastruktury a vegetace. Poskytujeme dvě instance programu Copernicus DEM s názvem GLO-30 Public a GLO-90. GLO-90 poskytuje celosvětové pokrytí na 90 metrů. GLO-30 Public poskytuje omezené celosvětové pokrytí na 30 metrů, protože malá podmnožina dlaždic pokrývajících konkrétní země dosud nebyla programem Copernicus zveřejněna. Všimněte si, že v obou případech oceánské oblasti nemají dlaždice, lze předpokládat hodnoty výšky rovné nule. Data jsou poskytována jako Cloud Optimized Ge.

Příklady použití

DigitalCorpora

počítačová kriminalistika počítačová bezpečnost kybernetická bezpečnost CSI digitální forenzní zpracování obrazu zobrazování získávání informací internetová detekce vniknutí strojové učení strojový překlad analýza textu

Obrázky disků, skládky paměti, zachycení síťových paketů a soubory pro použití ve výzkumu a vzdělávání v oblasti digitální forenzní vědy. Všechny tyto informace jsou dostupné na webových stránkách digitalcorpora.org a jsou k dispozici na adrese s3: // digitalcorpora/.Některé z těchto datových sad implementují scénáře, které provedli studenti, učitelé a další jednající v osobě. Informace jako takové jsou syntetické a mohou být použity bez předchozího povolení nebo schválení IRB. Podrobnosti o těchto souborech dat najdete na stránce Podrobnosti & rarr

Příklady použití

Veřejná data Hubbleova vesmírného teleskopu

Hubble Space Telescope (HST) je jedním z nejproduktivnějších vědeckých přístrojů, které kdy byly vytvořeny. Tato datová sada obsahuje kalibrovaná a nezpracovaná data pro všechny aktuálně aktivní nástroje na HST: ACS, COS, STIS a WFC3.

Příklady použití

NAIP na AWS

letecké snímky zemědělství pozorování Země geoprostorové přírodní zdroje regulační udržitelnost

Program National Agriculture Imagery Program (NAIP) získává letecké snímky během zemědělských vegetačních období v kontinentálních USA. Snímky typu „nahozené“ se typicky pohybují v rozlišení od 60 centimetrů do 100 centimetrů a jsou k dispozici z naip analytické lopaty Amazon S3 jako 4pásmové (RGB + NIR) snímky ve formátu MRF, na svazku zdroje Amazon S3 naip jako 4pásmový (RGB + NIR) v nekomprimovaném formátu Raw GeoTiff a vizualizace naip jako 3pásmový (RGB) formát GeoTiff optimalizovaný pro cloud. Data NAIP jsou dodávána na státní úrovni každý rok, řada států dostává aktualizace, s.

Příklady použití

NOAA Climate Forecast System (CFS)

zemědělství klima meteorologická udržitelnost počasí

Climate Forecast System (CFS) je model představující globální interakci mezi oceány Země, pevninou a atmosférou. Tento model, který vyrobilo několik desítek vědců pod vedením Národních center pro predikci životního prostředí (NCEP), nabízí hodinové údaje s horizontálním rozlišením až na polovinu stupně (přibližně 56 km) kolem Země pro mnoho proměnných. CFS využívá nejnovější vědecké přístupy k přijímání nebo asimilaci pozorování ze zdrojů dat včetně pozorování povrchu, pozorování horního balónu, pozorování letadel a satelitního pozorovatele.

Příklady použití

NOAA National Water Model Reanalysis

zemědělství zemědělství klima reakce na katastrofy udržitelnost životního prostředí doprava počasí

Datový soubor NOAA National Water Model Reanalysis obsahuje výstup z retrospektivních simulací s více dekádami. Tyto simulace používaly jako vstup pozorované srážky a přijímaly další požadovaná meteorologická vstupní pole z datové sady pro opětovnou analýzu počasí. Výstupní frekvence a pole dostupná v této historické datové sadě NWM se liší od polí obsažených v modelu prognózy v reálném čase. Jednou z aplikací této datové sady je poskytnout historický kontext aktuálním proudovým tokům v reálném čase, půdní vlhkosti a sněhové pokrývce v podmínkách NWM. Data pro opětovnou analýzu lze použít k odvození průtokových frekvencí a provedení teploty.

Příklady použití

NOAA Operational Forecast System (OFS)

klima pobřežní katastrofa reakce environmentální meteorologické oceány udržitelnost vodní počasí

Operational Forecast System (OFS) byl vyvinut, aby sloužil komunitě námořních uživatelů. OFS byl vyvinut ve společném projektu NOAA/National Ocean Service (NOS)/Office of Coast Survey, NOAA/NOS/Center for Operating Oceanographic Products and Services (CO-OPS) a NOAA/National Weather Service (NWS )/Centra národních center pro predikci životního prostředí (NCEP) (NCO). OFS generuje hladinu vody, proud vody, teplotu vody, slanost vody (s výjimkou Velkých jezer) a nyní vysílá a předpovídá předpověď čtyřikrát denně.

Příklady použití

NOAA World Ocean Database (WOD)

udržitelnost klimatických oceánů

World Ocean Database (WOD) je největší jednotně formátovaná, veřejně dostupná databáze historických podpovrchových oceánských profilů s kontrolovanou kvalitou. Od druhé plavby kapitána Cooka v roce 1772 až po dnešní automatizované plováky Argo, globální agregace proměnných informací o oceánu včetně teploty, slanosti, kyslíku, živin a dalších vs. hloubek umožňuje studium a porozumění měnícím se fyzikálním, chemickým a do určité míry biologický stav světových oceánů. Prohlédněte si vědro pomocí průzkumníka AWS S3: https://noaa-wod-pds.s3.amazonaws.com/index.html

Příklady použití

Národní archiv katalog

archivy vládní záznamy katalog národních archivů nara

Datový soubor katalogu národních archivů obsahuje všechny digitalizované záznamy autorit popisů a elektronické záznamy a štítky, přepisy a komentáře pro archivní fondy NARA dostupné v katalogu.

Příklady použití

National Cancer Institute Center for Cancer Research - Difúzní velkobuněčný lymfom (DLBCL) genomika a výraz

Studie popisuje integrativní analýzu genetických lézí u 574 difuzních velkobuněčných lymfomů BBC (DLBCL) zahrnující sekvenování exomu a transkriptomu, analýzu počtu kopií DNA založenou na poli a cílené opětovné vyrovnání amplikonů. Datový soubor obsahuje otevřená data kvantifikace genové exprese RNA-Seq.

Příklady použití

Model otevřeného města (OCM)

Open City Model je iniciativa, která poskytuje data cityGML pro všechny budovy ve Spojených státech. Pomocí dalších otevřených datových sad ve spojení s naším vlastním kódem a algoritmy je naším cílem poskytnout 3D geometrii pro každou americkou budovu.

Příklady použití

Dataset Oregon Health & amp Science University Chronic Neutrophilic Leukemia Dataset

biologické vědy o rakovině

Studie OHSU-CNL nabízí celý exom a sekvenování RNA na kohortě 100 případů se vzácnými hematologickými malignitami, jako je chronická neutrofilní leukémie (CNL), atypická chronická myeloidní leukémie (aCML) a neklasifikovaný myelodysplastický syndrom/myeloproliferativní novotvary (MDS/ MPN-U). Tato datová sada obsahuje otevřená data kvantifikace genové exprese RNA-Seq.

Příklady použití

Organoidní profilování rakoviny slinivky

rakovina genetická genomová STRIDES transkriptomika sekvenování celého genomu

Tato studie vytvořila sbírku pankreatických normálních a rakovinných organoidů odvozených od pacienta a byla sekvenována pomocí sekvenování celého genomu (WGS), sekvenování celého exomu (WXS) a RNA-Seq a také odpovídajícím nádorem a normální tkání, pokud jsou k dispozici. Studie poskytuje cenný zdroj pro výzkumníky rakoviny slinivky břišní. Datová sada obsahuje otevřená data kvantifikace genové exprese RNA-Seq a kontrolovaná čtení WGS/WXS/RNA-Seq, somatickou mutaci WXS anotovanou, surovou somatickou mutaci WXS a kvantifikaci spoje RNA-Seq.

Příklady použití

RAPID NRT Povodňové mapy

zemědělství reakce na katastrofy pozorování Země environmentální voda

Data blízké real-time a archivní data ze souboru dat o povodních ve vysokém rozlišení (10 m) přes souvislé Spojené státy, vyvinuté na základě archivu snímků Sentinel-1 SAR (2016-aktuální), pomocí automatizovaného Radarem produkovaného inundačního deníku (RAPID) algoritmus.

Příklady použití

Otevřená data REDASA COVID-19

získávání informací o koronaviru COVID-19 vědy o živé přírodě analýza textu zpracování přirozeného jazyka

Snímek COVID-19 REALTime DAta Synthesis and Analysis (REDASA) obsahuje výstup kurátorského protokolu vytvořeného naší komunitou kurátorů. Podrobný popis najdete v našem příspěvku. První segment S3 uvedený v části Zdroje obsahuje velkou sbírku lékařských dokumentů v textovém formátu extrahovaných z datové sady CORD-19 a další zdroje, které konsorcium REDASA považuje za relevantní. Druhý kbelík S3 obsahuje sérii dokumentů, které vypracovala společnost Amazon Kendra a které byly považovány za relevantní pro každou položenou lékařskou otázku. Konečný segment S3 obsahuje anotace GroundTruth cr.

Příklady použití

  • Curadr - Kurátorská platforma konsorcia REDASA, Imperial College London
  • Použití zabezpečeného, ​​průběžně aktualizovaného kanálu zpracování webového zdroje na podporu syntézy dat a analýzy vědecké literatury v reálném čase: studie vývoje a validace od Uddhav Vaghela, Simon Rabinowicz, Paris Bratsos, Guy Martin, Epameinondas Fritzilas a kol.

Rapid7 FDNS JAKÝKOLI datový soubor

analytika počítačová bezpečnost kybernetická bezpečnost internet

Podskupina JAKÝCHKOLI dotazů FDNS proti názvům domén vytvořených Rapid7 Project Sonar, dostupných v s3. Další informace o schématu najdete na webu Rapid7 's Open Data.

Příklady použití

VzácnéPlanes

počítačové vidění hluboké učení pozorování Země geoprostorové značené strojové učení satelitní snímky

RarePlanes je jedinečná datová sada strojového učení s otevřeným zdrojovým kódem od společností CosmiQ Works a AI.Reverie, která obsahuje skutečné i synteticky generované satelitní snímky. Datový soubor RarePlanes se specificky zaměřuje na hodnotu AI. Obnovte syntetická data, abyste pomohli algoritmům počítačového vidění při jejich schopnosti automaticky detekovat letadla a jejich atributy v satelitních snímcích. Ačkoli existují jiné syntetické/skutečné kombinované datové sady, RarePlanes je největší otevřeně dostupná datová sada s velmi vysokým rozlišením vytvořená k testování hodnoty syntetických dat z nadhledové perspektivy. Skutečná část.

Příklady použití

Datový soubor Sentinel-1 SLC pro jižní a jihovýchodní Asii, Tchaj-wan, Koreu a Japonsko

reakce na katastrofy pozorování Země udržitelnost geoprostorových družicových snímků životního prostředí

Datová sada S1 Single Look Complex (SLC) obsahuje data radaru Synthetic Aperture Radar (SAR) ve vlnové délce pásma C. Senzory SAR jsou instalovány na dvou-satelitním (Sentinel-1A a Sentinel-1B) souhvězdí obíhajícím kolem Země s kombinovanou dobou opětovného návštěvy šesti dnů, provozovanou Evropskou vesmírnou agenturou. Data S1 SLC jsou produktem úrovně 1, který shromažďuje informace o amplitudě a fázi radaru za každého počasí, ve dne nebo v noci, což je ideální pro studium přírodních nebezpečí a reakce na mimořádné události, pozemní aplikace, monitorování ropných skvrn, podmínky mořského ledu, a s tím spojený účinek změny klimatu.

Příklady použití

Zvuky středoafrických krajin

biologická rozmanitost biologie ekosystémy geoprostorové vědy o živé přírodě vědy průzkum přírodních zdrojů

Archivní zvukové scény zaznamenané v krajině deštných pralesů střední Afriky se zaměřením na vokalizace afrických lesních slonů (Loxodonta cyclotis).

Příklady použití

Vzorkovač dat Terra Fusion

udržitelnost geoprostorových satelitních snímků

Datová sada Terra Basic Fusion je sloučená datová sada původních zářičů úrovně 1 z pěti nástrojů Terra. Byly plně validovány, aby obsahovaly původní data úrovně 1 nástroje Terra. Každý soubor Terra Basic Fusion úrovně 1 obsahuje jednu plnou oběžnou dráhu dat Terra a má obvykle velikost 15 - 40 GB, v závislosti na tom, kolik dat bylo pro tuto oběžnou dráhu shromážděno. Obsahuje záření nástroje ve fyzických jednotkách geolokační indikátor kvality záření pro každý IFOV v jeho přirozeném čase, době pozorování geometrie slunečního pohledu a dalších atributů/metadat. Je uložen v HDF5, v souladu s konvencemi CF a je přístupný vylepšeným modelům netCDF-4. Následuje pojmenování: TERRA_BF_L1B_OXXXX_YYYYMMDDHHMMSS_F000_V000.h5. Stručný popis datové sady spolu s odkazy na kompletní dokumentaci a dostupné softwarové nástroje najdete na stránce projektu Terra Fusion: https://terrafusion.web.illinois.edu. Terra je vlajkovou lodí satelitu systému NASA pro pozorování Země (EOS). Na oběžnou dráhu byla vypuštěna 18. prosince 1999 a nese pět přístrojů. Jedná se o zobrazovací spektroradiometr se středním rozlišením (MODIS), víceúhlý zobrazovací spektroadiometr (MISR), pokročilý vesmírný termální emisní a odrazový radiometr (ASTER), systém mraků a záření Země (CERES) a měření znečištění v troposféře (MOPITT). Datová sada Terra Basic Fusion je snadno přístupným záznamem vyzařování úrovně 1 pro nástroje na.

Příklady použití

UK Met Office Atmosférické deterministické a pravděpodobnostní předpovědi

zemědělství klima pozorování Země meteorologická udržitelnost počasí

Opakovaně využívající meteorologická data mají nyní vzrušující příležitost vzorkovat, experimentovat a vyhodnocovat data atmosférického modelu Met Office a zároveň zažít transformační metodu vyžádání dat prostřednictvím Restful APIs na AWS. Informace o datech najdete na webu Met Office. Příklady použití dat najdete v úložišti příkladů. Pokud potřebujete pomoc a podporu při používání dat, uveďte problém v úložišti příkladů. Vezměte prosím na vědomí: Met Office neustále vylepšuje a aktualizuje své modely provozní prognózy. Naše poslední aktualizace vstoupila v platnost 04/12/2019. Najděte podrobnosti.

Příklady použití

UniProt

bioinformatika biologie chemie enzymový graf vědy o živé přírodě molekulární protein RDF SPARQL

Universal Protein Resource (UniProt) je komplexní zdroj pro údaje o sekvencích proteinů a anotacích. Databáze UniProt jsou UniProt Knowledgebase (UniProtKB), UniProt Reference Clusters (UniRef) a UniProt Archive (UniParc). Konsorcium UniProt a hostitelské instituce EMBL-EBI, SIB Swiss Institute of Bioinformatics a PIR se zavázaly dlouhodobě uchovávat databáze UniProt.

Příklady použití

1000 genomů

genetické genomové vědy o životě

Projekt 1000 genomů je mezinárodní spolupráce, která vytvořila nejpodrobnější katalog genetických variací člověka, včetně SNP, strukturálních variant a jejich haplotypového kontextu. Závěrečná fáze projektu sekvenovala více než 2500 jedinců z 26 různých populací po celém světě a vytvořila u těchto jedinců integrovaný soubor fázovaných haplotypů s více než 80 miliony variant.

Příklady použití

A2D2: Datový soubor Audi Autonomous Driving

autonomní vozidla počítačové vidění hluboké učení lidar strojové učení mapování robotika

Otevřená datová sada s více senzory pro výzkum autonomní jízdy. Tato datová sada obsahuje sémanticky segmentované obrázky, sémantická mračna bodů a 3D ohraničující rámečky. Kromě toho obsahuje neoznačené 360stupňové snímky kamer, lidar a sběrnicová data pro tři sekvence. Doufáme, že tento soubor dat dále usnadní aktivní výzkum a vývoj v oblasti AI, počítačového vidění a robotiky pro autonomní řízení.

Příklady použití

Datová sada diagramu AI2 (AI2D)

4 817 ilustrativních diagramů pro výzkum porozumění diagramu a související otázky.

Příklady použití

Sada dat o smysluplných citacích AI2

Příklady použití

AI2 Reasoning Challenge (ARC) 2018

csv json strojové učení

7 787 vědeckých otázek s výběrem odpovědí a souvisejících korpusů

Příklady použití

Data předpovědi ARPA-E PERFORM

energie environmentální geoprostorový model sluneční udržitelnost

Program ARPA-E PERFORM je program financovaný společností ARPA-E, který si klade za cíl využívat časově shodnou energii a zátěž, a snaží se vyvinout inovativní systémy řízení, které představují relativní riziko dodání každého aktiva a vyvažují kolektivní riziko všech aktiv v celé síti. Paradigma založené na riziku umožňuje operátorům: (i) plně porozumět skutečné pravděpodobnosti udržení rovnováhy mezi nabídkou a poptávkou a spolehlivosti systému, (ii) optimálně spravovat systém a (iii) posoudit skutečnou hodnotu základních služeb spolehlivosti. Tato změna paradigmatu je zásadní pro všechny energetické systémy a je nezbytná pro sítě wi.

Příklady použití

AWS iGenomes

biologie zemědělství Caenorhabditis elegans Danio rerio genetický genom Homo sapiens vědy o životě Mus musculus Rattus norvegicus referenční index

Běžné referenční genomy hostované na AWS S3. Lze použít při zarovnávání a analýze surových sekvenčních dat DNA.

Příklady použití

Allen Brain Observatory - sada veřejných dat AWS s vizuálním kódováním

elektrofyziologie zpracování obrazu biologické vědy strojové učení Mus musculus neurobiologie zpracování neuroimagingového signálu

Allen Brain Observatory-Visual Coding je rozsáhlý, standardizovaný průzkum fyziologické aktivity napříč myší zrakovou kůrou, hippocampem a thalamem. Obsahuje datové sady shromážděné pomocí dvoufotonového zobrazování a sond Neuropixels, dvou komplementárních technik pro měření aktivity neuronů in vivo. Datový soubor dvoufotonového zobrazování obsahuje vizuálně evokované reakce vápníku z neuronů exprimujících GCaMP6 v řadě kortikálních vrstev, vizuálních oblastí a Cre linií. Datová sada Neuropixels nabízí špičkovou aktivitu z distribuovaných kortikálních a subkortikálních oblastí mozku, c.

Příklady použití

Amazon-PQA

amazon.science strojové učení zpracování přirozeného jazyka

Otázky k produktu Amazon a jejich odpovědi spolu s veřejnými informacemi o produktu.

Příklady použití

Odpověď Reformulace

amazon.science strojové učení zpracování přirozeného jazyka

Originální odpovědi StackExchange a jejich hlasová reformace.

Příklady použití

Robustnost chyby automatického rozpoznávání řeči (ASR)

amazon.science hluboké učení strojové učení rozpoznávání řeči zpracování přirozeného jazyka

Datové sady klasifikace vět s chybami ASR.

Příklady použití

CIViC (klinická interpretace variant rakoviny)

genetické genomové vědy o životě vcf

Přesná medicína se týká používání strategií prevence a léčby, které jsou přizpůsobeny jedinečným vlastnostem každého jednotlivce a jeho onemocnění. V souvislosti s rakovinou to může zahrnovat identifikaci specifických mutací, u nichž se ukazuje, že předpovídají odpověď na cílenou terapii. Biomedicínská literatura popisující tyto asociace je rozsáhlá a rychle se rozrůstá. V současné době tyto interpretace existují převážně v soukromých nebo zatížených databázích, což má za následek rozsáhlé opakování úsilí. Realizace přesné medicíny bude vyžadovat centralizaci, diskusi a interpretaci těchto informací.

Příklady použití

CMC6 GCM zmenšeno pomocí WRF

zemědělství atmosféra klima pozorování Země environmentální model oceány simulace počasí

Historické a budoucí simulace klimatu z let 1980-2100 s vysokým rozlišením

Příklady použití

Datová sada sekvence genomu COVID-19

bam bioinformatika biologie koronavirus COVID-19 cram fastq genetický genom zdraví vědy o zdraví MERS SARS STRIDES transkriptomika virus sekvenování celého genomu

Centralizované úložiště sekvencí pro všechny záznamy obsahující sekvenci spojenou s novým koronavirem (SARS-CoV-2) odeslanou do archivu čtení centra (SRA) Národního centra pro biotechnologické informace (NCBI). Zahrnuty jsou jak původní sekvence předložené hlavním řešitelem, tak sekvence zpracované SRA, které pro analýzu vyžadují sadu nástrojů SRA. Vedle údajů vypočítaných NCBI, jako jsou výsledky analýzy taxonomie založené na k-mer, souvislé sestavy (kontigy), je navíc k dispozici metadata poskytovaná poskytovatelem zahrnutá v souvisejících záznamech BioSample a BioProject.

Příklady použití

Sbírka obrazů buněk

biologie buněčné zobrazování buněčné malby fluorescenční zobrazování vysoce výkonné zobrazování biologické vědy mikroskopie

The Cell Painting Image Collection je sbírka volně stažitelných sad mikroskopických obrazů. Cell Painting je nezaujatý vysoce výkonný zobrazovací test používaný k analýze poruch v buněčných modelech. Kromě samotných obrázků každá sada obsahuje popis biologické aplikace a nějaký typ „pozemské pravdy“ (očekávané výsledky).Vědci se vyzývají, aby používali tyto sady obrázků jako referenční body při vývoji, testování a publikování nových algoritmů analýzy obrazu pro biologické vědy. Doufáme, že tento soubor dat povede k lepšímu porozumění w.

Příklady použití

Konformační prostor krátkých peptidů

aminokyselina bioinformatika biomolekulární modelování vědy o živé přírodě molekulární dynamika protein strukturní biologie

Tento soubor dat nám umožňuje prozkoumat konformační prostor všech možných peptidů pomocí 20 běžných aminokyselin. Skládá se ze sbírky vyčerpávajících simulací molekulární dynamiky tripeptidů a pentapeptidů.

Příklady použití

Kryty BR

autorská práva monitorování titulní skladby identifikace živé skladby identifikace hudby funkce hudby datová sada vyhledávání informací o hudbě rozpoznávání hudby

CoversBR je první velkou audio databází s převážně brazilskou hudbou pro úkoly Covers Song Identification (CSI) a Live Song Identifications (LSI). Z důvodu omezení autorských práv nelze zvuk skladeb zpřístupnit, metadata a soubory funkcí však mají veřejný přístup. Zvukové přenosy zachycené z rozhlasových a televizních kanálů za účelem identifikace živé skladby budou zveřejněny. CoversBR se skládá z metadat a funkcí extrahovaných z 102298 skladeb, distribuovaných v 26366 skupinách obalů/verzí, v průměru 3,88 verzí na skupinu. Celá sbírka.

Příklady použití

Crowdsourcovaná batymetrie

udržitelnost pozorování oceánů Země

Společenství poskytlo údaje o batymetrii shromážděné ve spolupráci s Mezinárodní hydrografickou organizací.

Příklady použití

DialoGLUE: Porozumění přirozenému jazyku pro dialog zaměřený na úkoly

amazon.science konverzace dat strojové učení zpracování přirozeného jazyka

Tento segment obsahuje kontrolní body používané k reprodukci výchozích výsledků hlášených v benchmarku DialoGLUE hostovaném na serveru EvalAI (https://evalai.cloudcv.org/web/challenges/challenge-page/708/overview). Přidružené skripty pro použití kontrolních bodů jsou umístěny zde: https://github.com/alexa/dialoglue. Související dokument s popisem benchmarku a kontrolních bodů je zde: https://arxiv.org/abs/2009.13570. Poskytnuté kontrolní body zahrnují model CONVBERT, model ve stylu BERT vyškolený na velké konverzační datové sadě s otevřenou doménou. Obsahuje také popis kontrolních bodů CONVBERT-DG a BERT-DG.

Příklady použití

Diskrétní uvažování nad obsahem odstavců (DROP)

strojové učení zpracování přirozeného jazyka

Datová sada DROP obsahuje 96k párů otázek a odpovědí (QA) přes 6,7K odstavců, rozdělených mezi vlak (77k QAs), vývoj (9,5k QAs) a skrytý testovací oddíl (9,5k QAs).

Příklady použití

Obohacená datová sada aktuálního chatu pro znalostní dialogové systémy

amazon.science konverzace dat strojové učení zpracování přirozeného jazyka

Tato datová sada poskytuje další anotace nad veřejně vydanou datovou sadou Topical-Chat (https://github.com/alexa/Topical-Chat), která pomůže při reprodukci výsledků v našem článku „Generace neurální odpovědi řízená politikou pro znalosti založené na znalostech“ Dialogue Systems & quot (https://arxiv.org/abs/2005.12529?context=cs.CL). Datová sada obsahuje 5 souborů: train.json, valid_freq.json, valid_rare.json, test_freq.json a test_rare.json. Každý z těchto souborů bude mít další anotace nad původní datovou sadou Topical-Chat. Tyto specifické anotace jsou: anotace dialogového aktu a.

Příklady použití

Sezónní datová sada Ford Multi-AV

autonomní vozidla počítačové vidění lidar mapování robotika doprava městské počasí

Tento výzkum představuje náročnou sezónní datovou sadu pro více agentů, kterou shromažďuje flotila autonomních vozidel Ford v různých dnech a časech v letech 2017–18. Vozidla Vozidla byla ručně vedena na průměrné trase 66 km v Michiganu, která zahrnovala kombinaci scénářů řízení, jako je letiště Detroit, dálnice, centra měst, univerzitní kampus a příměstské čtvrti atd. Každé vozidlo použité při tomto sběru dat je Ford Fusion vybavený inerciální měřicí jednotkou (IMU) Applanix POS-LV, čtyřmi 3D lidarovými skenery HDL-32E Velodyne, 6bodovými šedými 1,3MP kamerami uspořádanými na.

Příklady použití

Data testu GATK

bioinformatika biologie rakovina genetická genomová vědy o životě

Balíček zdrojů testovacích dat GATK je sbírka souborů pro opětovné vyrovnání lidských genomických dat pomocí sady nástrojů GATK (Broad Institute 's Genome Analysis Toolkit).

Příklady použití

Geosnap Data, Centrum geoprostorových věd

geoprostorová demografie městská

Tento kbelík obsahuje více datových sad (jako balíčky Quilt) vytvořených Centrem pro geoprostorové vědy (CGS) na University of California-Riverside. Data v tomto segmentu obsahují následující: 1) Tabulková a geografická data z amerického sčítání lidu 2) Snímky Land Cover shromážděné z Consortium Multi-Resolution Land Characteristics Consortium 3) Údaje o silniční síti zpracovávané z OpenStreetMap

Příklady použití

Užitečné věty z recenzí

amazon.science načítání informací json zpracování textu v přirozeném jazyce

Sbírka vět extrahovaná z hodnocení zákazníků označená jejich skóre užitečnosti.

Příklady použití

Human Cancer Models Initiative (HCMI) Cancer Model Development Center

vědy o rakovině, genomové vědy o životě STRIDES sekvenování celého genomu

Iniciativa Human Cancer Models Initiative (HCMI) je mezinárodní konsorcium, které generuje nové modely kultury nové generace, odvozené z nádorů, anotované genomickými a klinickými daty. Modely vyvinuté HCMI a související data jsou k dispozici jako komunitní zdroj. NCI k iniciativě přispívá podporou čtyř center pro rozvoj modelu rakoviny (CMDC). CMDC mají za úkol vyrábět modely rakoviny nové generace z klinických vzorků. Modely rakoviny zahrnují typy nádorů, které jsou vzácné, pocházejí od pacientů z nedostatečně zastoupených populací, chybí jim přesná terapie nebo chybí ca.

Příklady použití

Human PanGenomics Project

cram fast5 fastq genetické genomové vědy o životě

Tato datová sada obsahuje sekvenční data, sestavy a analýzy pro potomky deseti trojice rodič-potomci.

Příklady použití

Detekce humoru ze systémů odpovědí na otázky o produktech

amazon.science strojové učení zpracování přirozeného jazyka

Tato datová sada poskytuje detekci humoru označeného systémem odpovědí na otázky o produktu. Datová sada obsahuje 3 soubory CSV: Humorous.csv obsahující vtipné dotazy k produktům, Non-humorous-unbiased.csv obsahující nehumorní prodcut otázky ze stejných produktů jako vtipné a Podrobnosti & rarr

Příklady použití

IDEAM - kolumbijská radarová síť

zemědělství pozorování Země meteorologické přírodní zdroje udržitelnost počasí

Historická a jednodenní data zpoždění z radarové sítě IDEAM.

Příklady použití

Klasifikace obrázků - datové sady fast.ai

počítačové vidění hluboké učení strojové učení

Některé z nejdůležitějších datových sad pro výzkum klasifikace obrázků, včetně CIFAR 10 a 100, Caltech 101, MNIST, Food-101, Oxford-102-Flowers, Oxford-IIIT-Pets a Stanford-Cars. Toto je součástí kolekce datových sad fast.ai hostované AWS pro pohodlí studentů fast.ai. Podrobnosti o citacích a licencích pro každou datovou sadu najdete v odkazu na dokumentaci.

Příklady použití

Pozorování cyklu 2 LOFAR ELAIS-N1 na AWS

Tato data odpovídají pozorování nebeského pole International LOFAR Telescope ELAIS-N1 (16:10:01 +54: 30: 36) během cyklu 2 pozorování. K dispozici je 11 cyklů po 8 hodinách plus odpovídající pozorování kalibračních cílů před a za cílovým polem. Data jsou sady měření (MS) obsahující křížově korelovaná data a metadata rozdělená do 371 frekvenčních dílčích pásem na cíl se středem na


Michael Sandberg a blog o vizualizaci dat#039s

S vydáním MicroStrategy Analytics Enterprise 9.4.1Logika Analytical Engine byla vylepšena s ohledem na spojování dat z více datových sad v dokumentu Report Services. Jednou z funkcí, které jsou v této verzi k dispozici, je schopnost používat objekty (např. Atributy, metriky) z více datových sad v jedné mřížce v dokumentu.

Pokud atribut na mřížce obsahuje prvky, které lze získat z více datových sad použitých v dokumentu, zobrazené prvky budou z globální vyhledávací tabulky. Navíc pokud má jedna nebo více datových sad obsahujících atribut chybějící data ve formě atributu nebo má jinou formu atributu než ostatní datové sady, analytický stroj bude při sestavování konečného výstupu postupovat podle níže uvedených pravidel:

Pravidlo 1:

Pokud existuje atributový formulář s hodnotou null, Analytical Engine použije hodnotu nenulové formy z jiných datových sad namísto nulového formuláře.

Pravidlo 2:

Pokud má několik datových sad různé informace o formě atributu pro prvek atributu, Analytical Engine použije formulář atributu z největší datové sady.

Pravidlo 3:

Pokud má několik datových sad různé informace o formě atributu pro prvek atributu a tyto datové sady mají stejný počet řádků, Analytical Engine použije první datovou sadu v dokumentu pro hodnotu formuláře atributu (podle posloupnosti přidávání datové sady).

POZNÁMKA: Uživatelé by si měli uvědomit, že pravidla jsou použita pro každý jednotlivý prvek atributu ve výsledku na úrovni řádku, nikoli na úrovni datové sady.

Příklad 1:

Uživatelé mohou zvážit následující datové sady – C01 je datová sada s Customer City, Customer a Order:

C02 je datová sada se zákazníkem, objednávkou a metrikou zisku. Uživatelé si mohou všimnout, že v atributu Customer ve druhé datové sadě chybí formulář DESC:

Pokud je dokument Report Services Document vytvořen s oběma těmito datovými sadami a atributy jsou umístěny v mřížce, mohou být vidět následující výsledky. Jak je uvedeno v Pravidlo 1 , Analytical Engine zobrazí hodnoty, které nemají hodnotu Null C01 pro prvky atributu zákazníka:

Příklad 2:

Nyní mohou uživatelé zvažovat jinou datovou sadu jako C02 – podobný původní datové sadě, ale zde formulář Jméno zákazníka (DESC) obsahuje hodnoty místo NULL. Tentokrát nejsou hodnoty pro atributy konzistentní – vidí, že ID zákazníka 𔃱 ’ má různé hodnoty pro formulář DESC pro různé objednávky (1 a 6).

Jméno zákazníka zákaznické identifikační číslo Objednat Zisk
Zákazník D. 1 1 100
Zákazník B. 2 2 200
Zákazník C. 3 3 300
Xia D. 4 4 400
Kris Du 5 5 500
Zákazník A. 1 6 610
Zákazník E 2 7 720
Zákazník F 6 8 860
Zákazník G 7 9 970
Zákazník H. 8 10 1080

Pokud je pro tuto datovou sadu vytvořena sestava, uživatelé budou pozorovat, že první hodnota prvku atributu v datové sadě je použita jako formulář DESC pro objednávky 1 a amp 6, i když je hodnota v následujících řádcích odlišná (to je stejné jako předchozí analytické Chování motoru).

Když jsou tyto datové sady použity v mřížce v dokumentu Report Services Document Analytical Engine, zvolí hodnoty prvků atributu z datové sady C02, ze kterých se mají zobrazit hodnoty prvků atributu. Je to kvůli Pravidlo 2 vysvětleno výše.

Příklad 3:

Zvažte následující datovou sadu:

Jméno zákazníka zákaznické identifikační číslo Objednat Zisk
Zákazník D 1 1 100
Zákazník E 2 7 720
Xia D. 4 4 400
Kris Du 5 5 500
Zákazník G 7 9 970

Sestava vytvořená z této datové sady vypadá následovně:

Po výměně datové sady ‘C02‘ z předchozího příkladu s novou datovou sadou jsou vidět následující výsledky. Jak je uvedeno v Pravidlo 3 , protože oba C01 an C02 mají stejný počet řádků, budou prvky zobrazené pro atribut Zákazník vyplněny z první datové sady, která bude v tomto případě přidána do dokumentu – C01. Nicméně pro první řádek ve výsledcích, kde v datové sadě není žádný odpovídající zákazník C01, Pravidlo 1 bude použito a místo hodnoty NULL bude vybráno pole Nenulové jméno zákazníka ‘Zákazník G ’ C02. (Pravidla se uplatňují na úrovni jednotlivých prvků).

Další: Proč jsou některé hodnoty metrik prázdné v dokumentech využívajících více datových sad v MicroStrategy Analytics Enterprise 9.4.1

[1] Znalostní databáze MicroStrategy, chování motoru pro mřížky v dokumentu Report Services nebo na řídicím panelu s více datovými sadami, kde chybí některé formuláře atributů nebo mají různé hodnoty datové sady v MicroStrategy Analytics Enterprise 9.4.1 a novějších verzích, TN Key: 45463, 03/ 13/2014, https://resource.microstrategy.com/support/mainsearch.aspx.

POZNÁMKA : K zobrazení znalostní databáze MicroStrategy bude možná nutné se zaregistrovat.


Podívejte se na video: 16. svibnja 2016. (Leden 2022).