Informace

Aplikace simulace molekulární dynamiky (nebo alternativ) pro úplné cesty interakcí proteinů?


Pokud by někdo chtěl ovládat biologický systém (např. K léčbě nemocí nebo stárnutí/stárnutí), měl by do systému zavést léky, které iniciují komplexní cesty interakce proteinů, které (v konečném důsledku) generují potřebné proteiny, které indukují nezbytné biologické mechanismy bez nežádoucích vedlejších účinků z dalších výsledků.

Čtu článek https://www.ncbi.nlm.nih.gov/pubmed/29139324 o aplikaci simulace molekulární dynamiky na objev léku, ale tento článek je v podstatě o simulaci jednoho - cílového proteinu/molekuly. Moje otázka zní: existují metody (molekulární dynamika nebo jiné), které simulují procesy v prodloužených proteinových cestách, které jsou indukovány jednou nebo více iniciačními molekulami/léky? Měla by to být docela složitá simulace, ale od počítačového objevování léků a inženýrství se nic menšího neočekává.

Jsem docela zmatený. Možná taková simulace vůbec není potřeba? Databáze proteinových interakcí pouze poskytují více či méně úplný obraz toho, k čemu nové proteinové interakce vedou, k jakým novým proteinům nebo strukturálním aktualizacím zúčastněných proteinů a není zde nic, co by bylo možné simulovat - existují pouze empirické nebo předpokládané znalosti o tom, jaké molekuly vedou k jakým dalším molekulám/ struktury a stačí jen extrahovat příslušnou cestu (počínaje léčivem blížícím se počátečním proteinům) z databáze a je to?


MD se používá ke studiu strukturálních změn. Simulace biochemických drah zahrnuje kinetiku (ve skutečnosti se nedíváte na to, jak se mění struktura enzymu, když se váže na substrát). Určitě můžete všechny strategie modelování spojit dohromady a vytvořit hybridní víceúrovňový model.

Existuje mnoho lidí, kteří pracují na takovém druhu přístupů k modelování. Můžete hledat víceúrovňové modelování a podívejte se na nedávné recenze. Toto je poněkud nedávný (2016) přehled víceúrovňového modelování farmakokinetiky-farmakodynamiky.


Mezoskopická simulace dynamiky a interakcí biologických molekul pomocí simulace Monte Carlo

Je popsána metoda mezoskopické úrovně pro objasnění dynamiky živých buněk, která využívá Monte Carlo simulaci interakcí biologických molekul. Molekuly jsou popsány jako částice, které podniknou náhodnou procházku v trojrozměrném diskrétním prostoru. Podporováno je mnoho druhů molekul (včetně komplexních forem), takže lze simulovat komplexní reakce s enzymy. Také je popsán polní programovatelný systém hradlového pole s rekonfigurovatelným hardwarem, který bude podporovat kompletní modelování celé buňky. K simulaci komplexních reakcí se používá dvoufázové zpracování (migrace a reakce), takže metodu lze implementovat v omezeném množství hardwaru. Obvody migrace a reakce jsou hluboce propojeny, což má za následek vysoký výkon. Odhadovaný výkon je 30krát rychlejší než u počítače Pentium 4 s 3,2 GHz. Tento přístup by měl umožnit nakonec simulovat buněčné interakce zahrnující jednu miliardu částic.

Toto je náhled obsahu předplatného, ​​přístup prostřednictvím vaší instituce.


1. ÚVOD

Pandemie závažného akutního respiračního syndromu koronaviru 2 (SARS-CoV-2) zaplavila celosvětové zdravotnictví (Zhu et al., 2020). K 28. červnu 2020 bylo potvrzeno 9 843 073 případů COVID-19, včetně 495 760 úmrtí (https://covid19.who.int/). Navíc podle zpráv Světové zdravotnické organizace-53% zkoumaných zemí částečně nebo úplně narušilo lékařské služby pro léčbu hypertenze 49% pro léčbu diabetu a komplikací souvisejících s diabetem 42% pro léčbu rakoviny a 31% pro kardiovaskulární mimořádné situace (WHO , 2020a). Tato virová pandemie nás proto nutí ke kompromitovanému „novému normálu“ pro přežití. Aby bylo možné tuto nemoc překonat, probíhá mnoho klinických zkoušek vývoje vakcín a opětovného použití léků (WHO, 2020b). Bohužel dosud žádná z očkovacích látek nedosáhla celosvětového trhu při léčbě nemocí. Proto je třeba vyvinout profylaktický léčebný režim s použitím přírodních sloučenin jako slibné alternativní terapie pro omezení šíření viru. Fytochemikálie byly identifikovány přístupy počítačového vývoje léčiv jako účinné proti SARS-CoV-2 (Adem, Eyupoglu, Sarfraz, Rasul, & Ali, 2020 Chandel, Raj, Rathi, & Kumar, 2020 Gentile et al., 2020 Gonzalez-Paz et al., 2020 Khaerunnisa, Kurniawan, Awaluddin, Suhartati, & Soetjipto, 2020 Khan, Zia, Ashraf, Uddin, & Ui-Haq, 2020 Kumar, Dhanjal, Kaul, Wadhwa, & Sundar, 2020 McKee, Sternberg, Stange, Laufer , & Naujokat, 2020 Qamar ul, Alqahtani, Alamri, & Chen, 2020 Sharma & Kaur, 2020 Sun, Wong, & Guo, 2020). Například bylo hlášeno, že flavonoidy jsou účinné proti mnoha virům a jsou k dispozici jako přírodní doplňky v denní dávce v rozmezí od 100 do 500 mg (Dai et al., 2019 McKee et al., 2020 Moghaddam et al., 2014) . Velmi málo z nich však prochází klinickými zkouškami (WHO, 2020b). Při pohledu na jejich potenciál lze tedy říci, že je zapotřebí dalšího výzkumu k pochopení účinnosti fytochemikálií při léčbě COVID-19 pochopením jejich funkčního mechanismu inhibice dynamickým zkoumáním jejich interakcí v cílových lokalitách. Srovnání jejich vazebných režimů s režimy repurikovaných léků (procházejících klinickými zkouškami) dále také osvětlí jejich účinnost.

V této souvislosti byl v naší předchozí práci použit racionální screening k identifikaci účinných fytochemikálií z 55 indických léčivých rostlin k léčbě COVID-19 (Parida, Paul, & Chakravorty, 2020). Fytochemikálie sledující vlastnosti podobnosti léčiva byly testovány Withania somnifera a Azadirachta indica proti 8 proteinovým cílům SARS-CoV-2. Bylo také pozorováno, že fytochemikálie mají mnohoúčinnost proti různým cílům SARS CoV-2 (Parida et al., 2020). To potvrzuje zpráva Kumara a kol. (2020), odkud Withanone pochází Withania somnifera bylo ukázáno, že se váže a stabilně interaguje s hlavní proteázou SARS-CoV-2.

Z naší předchozí práce a nedávných zpráv je proto po analýze vazebného potenciálu těchto fytochemikálií s více cíli SARS-CoV-2 nutné prozkoumat jejich vícecílovou vazebnou afinitu a stabilitu prováděním simulací molekulární dynamiky. Multi-potenciální vazebná schopnost těchto fytochemikálií je důležitá, protože může vést k překonání rezistence vůči více léčivům u velmi specifických léků určených pro jednotlivé cíle (Kadioglu, Saeed, Johannes Greten, & Efferth, 2020). Zde lze také zmínit, že je známo, že fytochemikálie se vážou na více cílů (Efferth & Koch, 2011).

Mezi všemi potenciálními cíli zkoumanými v naší předchozí práci a prostřednictvím průzkumu literatury byl špičkový glykoprotein chápán jako lukrativní cíl pro vývoj léčiv, protože usnadňuje vstup virů. Receptor, ke kterému má nejvyšší afinitu, je lidský enzym konvertující angiotensin 2 (ACE2) (Y. Chen, Guo, Pan, & Zhao, 2020 Xu et al., 2020). Rozhraní spike/ACE2 bylo znázorněno na atomové úrovni a účinnost použití ACE2 byla shledána klíčovým determinantem přenosnosti tohoto viru, který činí z spike proteinu primární cíl neutralizace vývoje protilátek, vakcín a léčiv (Li, Li, Farzan a Harrison, 2005 Tian a kol., 2020). Dalším důležitým cílem je hlavní proteáza SARS-CoV-2 (M pro). Lze jej zacílit, aby se zabránilo replikaci viru v buňkách. Bylo hlášeno, že konformace páteře a vazebného místa jsou zachovány v M pro (Joshi et al., 2020). Kromě toho bylo zjištěno, že díky své nízké podobnosti s lidskými proteázami jsou inhibitory M Pro velmi málo cytotoxické (Anand, Ziebuhr, Wadhwani, Mesters, & Hilgenfeld, 2003 Zhang et al., 2020). Lze tedy říci, že SARS-CoV-2 spike (S) glykoprotein a hlavní proteáza jsou rozhodující pro virulenci a přenos viru. Tyto atributy lze prozkoumat pro vývoj léčiv.

Proto byly v této práci provedeny simulace molekulární dynamiky v dlouhém časovém měřítku a výpočet volné energie vazby spolu s analýzou obohacení biologické dráhy na fytochemikáliích zaměřených na glykoprotein Spike a hlavní proteázu SARS-CoV-2. Díky této práci, ve světle vysoké míry infekčnosti SARS-CoV-2 a nedostatečné léčby per se, experimentální testování fytochemikálií z W. somnifera a A. indica protože se navrhují potenciální léky proti SARS-CoV-2.


Teorie dokování

V zásadě je cílem molekulárního dokování poskytnout předpověď komplexní struktury ligand-receptor pomocí výpočetních metod. Dokování lze dosáhnout dvěma vzájemně provázanými kroky: nejprve vzorkováním konformací ligandu v aktivním místě proteinu a poté hodnocením těchto konformací pomocí skórovací funkce. V ideálním případě by vzorkovací algoritmy měly být schopné reprodukovat experimentální vazební režim a skórovací funkce by jej také měla zařadit mezi všechny generované konformace. Z těchto dvou perspektiv dáváme stručný přehled základní dokovací teorie.

Algoritmy vzorkování

Se šesti stupni translační a rotační volnosti a konformačními stupni volnosti ligandu i proteinu existuje mezi dvěma molekulami obrovské množství možných vazebných režimů. Bohužel by bylo příliš drahé výpočetně generovat všechny možné konformace. Byly vyvinuty a široce používány různé algoritmy vzorkování v softwaru molekulárního dokování (tabulka 1).

Stůl 1

Některé algoritmy vzorkování diskutované v tomto článku.

AlgoritmyCharakteristickýOdkaz
Odpovídající algoritmyNa bázi geometrie, vhodné pro VS a databázi
obohacení pro jeho vysokou rychlost
[43-45]
Přírůstková konstrukceFragmentově založené a postupné dokování[30, 49, 50]
MCSSfragmentové metody pro de novo design[55, 56]
LUDIfragmentové metody pro de novo design[57]
Monte CarloStochastické hledání[58, 59]
Genetické algoritmyStochastické hledání[31, 32, 64]
Molekulární dynamikaPro další upřesnění po dokování[68-70]

Algoritmy párování (MA) [43-45] založené na molekulárním tvaru mapují ligand do aktivního místa proteinu, pokud jde o tvarové vlastnosti a chemické informace. Protein a ligand jsou reprezentovány jako farmakofory. Každá vzdálenost farmakoforu v proteinu a ligandu se vypočítá pro shodu nových ligandových konformací se řídí maticí vzdálenosti mezi farmakoforem a odpovídajícími atomy ligandu. Během zápasu lze vzít v úvahu chemické vlastnosti, jako jsou donory a akceptory vodíkových vazeb. Algoritmy párování mají výhodu rychlosti, takže je lze použít k obohacení aktivních sloučenin z velkých knihoven [7]. Algoritmy párování pro dokování ligandů jsou k dispozici v programech DOCK [10], FLOG [46], LibDock [47] a SANDOCK [48].

Metody přírůstkové konstrukce (IC) [30, 49, 50] vložily ligand do aktivního místa fragmentárním a přírůstkovým způsobem. Ligand je rozdělen na několik fragmentů rozbitím svých otočných vazeb a poté je vybrán jeden z těchto fragmentů, aby se nejprve připojil k aktivnímu místu. Tato kotva je obvykle největším fragmentem nebo částí, která může mít významnou funkční roli nebo interakci s proteinem. Zbývající fragmenty lze přidávat postupně. Jsou generovány různé orientace, aby se vešly do aktivního místa, což realizuje flexibilitu ligandu. Metoda přírůstkové konstrukce byla použita v DOCK 4.0 [51], FlexX [30], Hammerhead [52], SLIDE [53] a eHiTS [54].

Kromě IC jsou simultánní vyhledávání více kopií (MCSS) [55, 56] a LUDI [57] metodami založenými na fragmentech pro de novo návrh ligandů a modifikace známých ligandů, které mohou zvýšit jejich vazbu na cílový protein. MCSS vytváří 1 000 až 5 000 kopií funkční skupiny, které jsou náhodně umístěny do požadovaného vazebného místa a podrobeny simultánní minimalizaci energie a/nebo utlumení molekulární dynamiky v silovém poli proteinu. Kopie interagují pouze s proteiny a jakékoli interakce mezi kopiemi jsou vynechány. V důsledku toho je na základě interakčních energií identifikován soubor energeticky příznivých vazebných míst a orientací pro funkční skupinu. Vazebné místo je mapováno pomocí různých funkčních skupin. Nové molekuly, které dokonale odpovídají vazebnému místu, mohou být navrženy spojením těchto různých funkčních skupin.

LUDI se zaměřuje na vodíkové vazby a hydrofobní kontakty, které by mohly vzniknout mezi ligandem a proteinem. Jeho ústředním konceptem jsou interakční místa, což jsou diskrétní polohy v prostoru vhodné pro vytváření vodíkových vazeb nebo pro vyplnění hydrofobní kapsy [57]. Sada interakčních webů je generována buď prohledáním databáze, nebo pomocí pravidel. Fragment je poté připevněn na interakční místa a vyhodnocen podle kritérií vzdálenosti. Posledním krokem je připojení některých nebo všech přizpůsobených fragmentů k jediné molekule.

Stochastické metody prohledávají konformační prostor náhodnou úpravou konformace ligandu nebo populace ligandů. Monte Carlo (MC) a genetické algoritmy jsou dva typické algoritmy, které patří do třídy stochastických metod.

Metody Monte Carlo (MC) [58, 59] generují pózy ligandu rotací vazby, translací tuhého těla nebo rotací. Konformace získaná touto transformací je testována pomocí energetického kritéria výběru. Pokud splní kritérium, bude uloženo a dále upraveno tak, aby generovalo další konformaci. Iterace budou pokračovat, dokud nebude shromážděno předem definované množství konformací. Hlavní výhodou MC je, že změna může být poměrně velká, což umožňuje ligandu překonat energetické bariéry na potenciálním energetickém povrchu, což je bod, kterého nelze snadno dosáhnout simulačními metodami založenými na molekulární dynamice. Mezi příklady použití metod Monte Carlo patří dřívější verze AutoDock [60], ICM [61], QXP [62] a Affinity [63].

Genetické algoritmy (GA) [31, 32, 64] tvoří další třídu známých stochastických metod. Myšlenka GA vychází z Darwinovy ​​evoluční teorie. Stupně volnosti ligandu jsou kódovány jako binární řetězce nazývané geny. Tyto geny tvoří chromozom ‘ ’, který ve skutečnosti představuje pózu ligandu. Mutace a crossover jsou dva druhy genetických operátorů v GA. Mutace vede k náhodným změnám genů crossover výměny genů mezi dvěma chromozomy. Když genetické operátory ovlivňují geny, výsledkem je nová struktura ligandu. Nové struktury budou hodnoceny pomocí skórovací funkce a ty, které přežily (tj. Překročily prahovou hodnotu), lze použít pro další generaci. Genetické algoritmy byly použity v aplikacích AutoDock [31], GOLD [65], DIVALI [66] a DARWIN [67].

Molekulární dynamika (MD) [68–70] je široce používána jako účinná simulační metoda v mnoha oblastech molekulárního modelování. V kontextu dokování, pohybem každého atomu samostatně v poli ostatních atomů, simulace MD představuje flexibilitu ligandu i proteinu účinněji než jiné algoritmy. Nevýhodou simulací MD však je, že postupují ve velmi malých krocích, a proto mají potíže při překračování vysoce energetických konformačních bariér, což může vést k neadekvátnímu vzorkování. Na druhé straně jsou simulace MD často efektivní při místní optimalizaci. Současnou strategií je tedy použít náhodné vyhledávání k identifikaci konformace ligandu, následované dalšími jemnými simulacemi MD.

Bodovací funkce

Účelem skórovací funkce je vymezit správné pózy z nesprávných póz nebo pojiva z neaktivních sloučenin v rozumném výpočetním čase. Skórovací funkce však zahrnují spíše odhad, než výpočet vazebné afinity mezi proteinem a ligandem, a prostřednictvím těchto funkcí přijetí různých předpokladů a zjednodušení. Skórovací funkce lze rozdělit na skórovací funkce založené na silovém poli, empirické a znalostní [5]. Tabulka 2 ukazuje několik příkladů vzorců funkcí bodování náležejících do těchto tří tříd funkcí bodování.

Tabulka 2

Příklady vzorců funkcí bodování

Skóre funkce vzorcůRef.
V = W vdw ∑ i, j (A ijrij 12 − B ijrij 6) + W hbond ∑ i, j E (t) (C ijrij 12 − D ijrij 10) + W elec &# x02211 i, jqiqj ∊ (rij) rij + W sol ∑ i, j (S i V j + S j V i) e (− rij 2 ∕ 2 σ 2) [31]
Rozšířená skórovací funkce založená na silovém poli od AutoDock.
Pro dva atomy i, j je párová atomová energie hodnocena součtem van der Waalsovy, vodíkové vazby, coulombské energie
a desolvation. W jsou vážené faktory pro kalibraci empirické volné energie.
Δ G = Δ G 0 + Δ G rot × N rot + Δ G hb ∑ neutrální H − bondf (Δ R, Δ α) + Δ G io ∑ ioninit. f (Δ R, Δ α) + Δ G a r o ∑ a r o i n t. f (Δ R, Δ α) + Δ G l i p o ∑ l i p o c o n t. f ∗ (Δ R) [30]
Empirická skórovací funkce od FlexX.
ΔG je odhadovaná volná energie vazby ΔG0 je regresní konstanta ΔGtrouchnivění , ΔGhb , ΔGio , ΔGaro a ΔGlipo jsou
regresní koeficienty pro každý odpovídající termín volné energie FR., Δα) je funkce škálování penalizující odchylky od
ideální geometrie N.trouchnivění je počet vazeb s volnou rotací, které jsou imobilizovány v komplexu.
PM _ score = ∑ k I r < rcut − offij A ij (r) A ij (r) = − k BT ln [f V ol _ corrj (r) ρ segij (r ) ρ hromadně] [84]
Znalostní bodovací funkce PMF.
kB je Boltzmannova konstanta T je absolutní teplota r je vzdálenost páru atomů. f V o l _ c o r r j (r) je objem ligandu
korekční faktor ρ s e g i j (r) ρ b u l k i j označuje radiální distribuční funkci atomu proteinu typu i a atomu ligandu typu j.

Klasické skórovací funkce založené na silovém poli [71–73] hodnotí vazebnou energii výpočtem součtu nevázaných (elektrostatických a van der Waalsových) interakcí. Elektrostatické členy jsou vypočteny Coulombickou formulací. Protože takové výpočty bodového náboje mají problémy s modelováním skutečného prostředí proteinu, je k modulaci příspěvku interakcí náboje – obecně použita dielektrická funkce závislá na vzdálenosti. Van der Waalsovy podmínky jsou popsány potenciální funkcí Lennard-Jones. Přijetí různých sad parametrů pro Lennard-Jonesův potenciál může měnit “hardness ” potenciálu, který řídí, jak blízký kontakt mezi atomy proteinu a ligandu může být přijatelný. Funkce bodování založené na silovém poli mají také problém pomalé výpočetní rychlosti. Mezní vzdálenost se tedy používá ke zpracování nevázaných interakcí. To má také za následek snížení přesnosti efektů dlouhého dosahu zapojených do vazby.

Rozšíření skórovacích funkcí založených na silovém poli zohledňují vodíkové vazby, solvatace a příspěvky entropie. Softwarové programy, jako DOCK [10, 50, 51, 74], GOLD [65] a AutoDock [31], nabízejí uživatelům takové funkce. Mají určité rozdíly v léčbě vodíkových vazeb, formě energetické funkce atd. Kromě toho lze výsledky dokování pomocí funkcí založených na silovém poli dále upřesnit jinými technikami, jako je energie lineární interakce [75] a metody rušení volné energie (FEP) [71, 76] ke zlepšení přesnosti při předpovídání vazebných energií.

V empirických skórovacích funkcích [77–81] se vazebná energie rozkládá na několik energetických složek, jako je vodíková vazba, iontová interakce, hydrofobní efekt a vazebná entropie. Každá složka se vynásobí koeficientem a poté sečte, aby se získalo konečné skóre. Koeficienty jsou získány z regresní analýzy přizpůsobené testovací sadě komplexů ligand-protein se známými vazebnými afinitami.

Empirické skórovací funkce mají relativně jednoduché energetické termíny k vyhodnocení. Není však jasné, jak dobře jsou vhodné pro komplexy ligand-protein nad rámec tréninkové sady. Kromě toho může být s každým termínem v empirických skórovacích funkcích zacházeno odlišným způsobem jiným softwarem a také počet zahrnutých výrazů je odlišný. LUDI [57], PLP [78, 79, 82], ChemScore [83] jsou příklady odvozené z empirických skórovacích funkcí

Znalostní skórovací funkce [84–89] používají statistickou analýzu krystalových struktur komplexů ligand-protein k získání interatomických kontaktních frekvencí a/nebo vzdáleností mezi ligandem a proteinem. Vycházejí z předpokladu, že čím je interakce příznivější, tím vyšší bude frekvence jejího výskytu. Tato frekvenční rozdělení jsou dále převedena na párové potenciály atomového typu. Skóre se vypočítá upřednostněním preferovaných kontaktů a penalizací odpudivých interakcí mezi každým atomem ligandu a proteinem v rámci dané mezní hodnoty.

Přitažlivostí funkcí založených na znalostech je výpočetní jednoduchost, kterou lze využít k prověřování velkých složených databází. Mohou také modelovat některé neobvyklé interakce, jako je síra-aromatické nebo kationty-π, které jsou často špatně zpracovány v empirických přístupech. Stále se však potýkají s problémem, že některé interakce jsou nedostatečně zastoupeny v omezených tréninkových sadách krystalových struktur, jakož i v důsledku zaujatosti vlastní výběru proteinů pro úspěšné určení struktury, takže získané parametry nemusí být vhodné pro široké použití, zejména s interakcemi zahrnujícími kovy nebo halogeny. PMF [84], DrugScore [90], SMoG [91] a Bleep [85] jsou příklady funkcí založených na znalostech, které se liší hlavně velikostí tréninkových sad, formou energetické funkce, definicí typů atomů, vzdáleností cutoff nebo jiné parametry.

Consensus scoring [92] je nedávná strategie, která kombinuje několik různých skóre pro posouzení dokovací konformace. Póza ligandu nebo potenciálního pojiva by mohla být přijata, pokud dobře skóruje v řadě různých skórovacích schémat. Konsensuální hodnocení obvykle podstatně zlepšuje obohacení (tj. Procento silného pojiva mezi ligandy s vysokým skóre) ve virtuálním screeningu a zlepšuje predikci vázaných konformací a póz [93]. Predikce vazebných energií však může být stále nepřesná. Také užitečnost konsensuálního bodování klesá, když termíny v různých skórovacích funkcích významně korelují [5, 93]. CScore [94] je příkladem, který kombinuje skórovací funkce DOCK, ChemScore, PMF, GOLD a FlexX.

Typické skórovací funkce čelí problému predikce afinity částečně kvůli omezenému zpracování solvatačního účinku. Jedním ze způsobů, jak tento problém vyřešit, je bodování založené na fyzice, např. MM-PB/SA a MM-GB/SA (MM je zkratka pro molekulární mechaniku, PB a GB pro Poisson-Boltzmann a Generalized Born, v uvedeném pořadí, SA pro povrchovou plochu přístupnou rozpouštědlům), která se podílí na resorcingu nebo optimalizaci olova za účelem zlepšení přesnost predikce vazebné afinity. Slibné výsledky byly získány použitím MM-PB/SA [95, 96] nebo MM-GB/SA [97] v některých studiích. V poslední době však Guimar ฾s a Mathiowetz uvedli, že model GB/SA špatně odhadoval desolvataci proteinů na určitých systémech, zatímco začlenění WaterMap do metody MM-GB/SA namísto GB/SA proteinové desolvace dalo nejlepší výsledek hodnocení [98]. Singh a Warshel porovnali několik metod pro hodnocení afinity komplexů protein-ligand a navrhli, že PDLD/S-LRA/β (proteinové dipóly Langevinovy ​​dipóly lineární aproximace odezvy) se zdá být lákavou možností pro konečné fáze masivních VS a naproti tomu se zdá, že PB/SA poskytuje chybné odhady absolutních vazebných energií kvůli svému nesprávnému odhadu entropií a problematickému zpracování elektrostatických energií [99].


Diskuse

U komplexu enzym -inhibitor barnase -barstar, jednoho z nejlépe experimentálně charakterizovaných komplexů protein -protein (26), jsou naše simulace v souladu s předchozí experimentální a výpočetní prací, včetně rozsáhlé mutační analýzy (5, 29) a simulací Brownovy dynamiky (30 , 31). Kombinací informací ze temperované vazby a konvenčních simulací MD jsme odhadli volnou energii vazby ΔGb, být 19,2 (2) kcal⋅mol −1 [Kd = 1,0 (2) × 10 −14 M], míra asociace, kna, být 2,3 (2) × 107 M −1 ⋅s −1, a rychlost disociace, kvypnuto, být 2,3 (3) × 10 −7 s −1. Tyto hodnoty odvozené ze simulace poměrně dobře odpovídají známým experimentálním hodnotám ΔGb = 19 kcal⋅mol −1, kna = 6 × 10 8 M −1 ⋅s −1, a kvypnuto = 8 × 10 −6 s −1 (32). (Další diskuse o tom, jak byly vypočítány simulační hodnoty, najdete v Příloha SI.)

Náš atomový obraz přechodového stavu souhlasí s mutačními a kinetickými studiemi od Schreibera a spolupracovníků (5, 33), které naznačují, že přechodový stav nastává před vytvořením většiny nativních interakcí a zatímco rozhraní protein -protein je stále vysoce solvatovaný. Novější experimentální práce na spojeném skládání a vazbě neuspořádaných proteinových domén také naznačují, že většina nativních kontaktů vzniká po přechodném stavu (34).

Navíc naše pozorování, že sdružování proteinů již mělo relativní polohy podobné těm v nativním komplexu při navázání kontaktu během úspěšných simulovaných asociačních událostí, je v souladu s myšlenkou takzvaného „trychtýřského“ asociačního procesu, ve kterém je elektrostatická přitažlivost na velké vzdálenosti je zapojen do rychlé asociace barnase – barstar (31, 35) a dalších párů protein – protein s opačně nabitými vazebnými místy (36). Toto pozorování je také v souladu s předchozími atomistickými simulačními studiemi MD na vazbu protein-peptid, ve kterých byly úspěšné asociační cesty podobné trychtýři, často kvůli elektrostatickému řízení (7, 11, 14). Podobně v nedávné simulační studii peptidové vazby na PDZ doménu byly před úspěšnou asociací pozorovány vícenásobné vazebné a nevázané události a peptid při navázání rozsáhle neprohledával povrch (11).

Silná afinita barstar k barnase a hydrofilní povaha rozhraní z něj činí relativně neobvyklý systém protein -protein, takže je pozoruhodné, že vlastnosti přechodového stavu a komplexu setkání pozorované v našich simulacích byly společné asociačním mechanismům všech systémů protein – protein studovaných v této práci (obr. 4). Tento sdílený mechanismus se tedy může vztahovat také na širší třídu komplexů protein -protein, které - stejně jako zde studované systémy (Příloha SI(Tabulka S1) - po vazbě nepodstupujte velké konformační změny.

Pozorovali jsme reverzibilní asociaci sady pěti systémů protein -protein s jejich příslušně experimentálně určenými strukturami pomocí vylepšené metody vzorkování, která umožnila zvýšení účinnosti vzorkování až o devět řádů. Spolu s našimi konvenčními simulacemi MD s dlouhým časovým horizontem, které přinesly mnoho spontánních asociačních událostí, poskytují naše výsledky pohled na atomové úrovni mechanismů asociace protein-protein. V budoucnu by tato metodika mohla být použita ke stanovení struktur a asociačních mechanismů alespoň některých komplexů protein -protein, které dosud nebyly experimentálně charakterizovány. V této souvislosti by mohla být zvláště užitečná schopnost pozorovat asociační i disociační události, která pomáhá odlišit termodynamicky stabilní komplexy od kineticky zachycených stavů, které jsou řídce osídlené.


MATERIÁLY A METODY

Soubor vstupní struktury

Jedinými požadovanými daty jsou soubor proteinové struktury (zadaný jako kód PDB nebo nahraný uživatelem). Soubor vstupní struktury musí být poskytnut ve formátu PDB (http://www.wwpdb.org/docs.html). Jsou akceptovány pouze jednoduché a kontinuální (bez přestávek) proteinové řetězce (až 400 standardních aminokyselin). Nestandardní aminokyseliny nejsou přijímány. Každý zbytek musí mít kompletní sadu atomů postranního řetězce (N, Ca, C a O), atomy postranního řetězce mohou chybět. Pokud je v souboru PDB poskytnuto více konformací pro jakýkoli jediný zbytek, použije CABS-flex pouze první. Heteroatomy (např. Voda nebo ligandy) nejsou v simulacích brány v úvahu. Je možné nahrát soubory PDB obsahující alternativní proteinové struktury (například určené metodami nukleární magnetické rezonance), ale poté je jako vstup použit pouze první model v souboru PDB.

Protokol modelování CABS a jeho validace

Jak je znázorněno na schématu uvedeném na obrázku 1, vstupní struktura se používá jako výchozí bod pro simulační postup CABS pro téměř nativní dynamiku (2). Kromě souřadnic vstupní struktury jsou data sekundární struktury automaticky vyhodnocená metodou DSSP (16) (a redukována pouze na definice šroubovice/β/cívky - ostatní definice jsou považovány za oblast cívky) používána modelem CABS.

Kanál serveru CABS-flex. Výstupní soubory (označeny modře) jsou generovány v následujících, připravených k použití, formáty souborů: PDB, Protein Data Bank (pro celou trajektorii dynamiky v reprezentaci stopy Ca a stejně jako zástupci trajektorie v rozlišení všech atomů) TXT, textový PNG, přenosná síťová grafika (online zobrazená grafika) EPS, zapouzdřená postskriptová grafika MOV, film (online zobrazení a ke stažení v OGV nebo MP4 - v závislosti na webovém prohlížeči - formáty souborů).

Kanál serveru CABS-flex. Výstupní soubory (označeny modře) jsou generovány v následujících, připravených k použití, formáty souborů: PDB, Protein Data Bank (pro celou trajektorii dynamiky v reprezentaci stopy Ca a stejně jako zástupci trajektorie v rozlišení všech atomů) TXT, textový PNG, přenosná síťová grafika (online zobrazená grafika) EPS, zapouzdřená postskriptová grafika MOV, film (online zobrazení a ke stažení v OGV nebo MP4 - v závislosti na webovém prohlížeči - formáty souborů).

Model CABS [podrobně popsaný jinde (17)] používá hrubozrnnou reprezentaci proteinového řetězce s vysokým rozlišením, ve které je jediný proteinový zbytek reprezentován až čtyřmi atomy (atomy Ca a Cβ a dva virtuální pseudoatomy : těžiště postranního řetězce a střed virtuální vazby Cα −Cα). Silové pole CABS zahrnuje statistické potenciály založené na znalostech (konformační preference krátkého dosahu závislé na sekvenci, kontextově závislý potenciál párových interakcí postranních řetězců a model vodíkových vazeb hlavního řetězce), které implicitně zohledňují účinek rozpouštědla. Dynamika CABS je simulována náhodnou sérií malých lokálních tahů (řízených schématem Monte Carlo), jejichž dlouhodobý vývoj dobře popisuje dynamiku proteinů (2–6).

Profil fluktuace reziduí (k dispozici ke stažení ve formátech souborů txt, eps a png, obrázek 1) ukazuje relativní náchylnost proteinových zbytků odchýlit se od struktury průměrné dynamiky (trajektorie). Hodnoty fluktuace reziduí jsou rovněž zahrnuty do konečných výstupních modelů PDB (sloupec teplotního faktoru, 61–66 sloupců v souboru PDB, je nahrazen hodnotami fluktuace, které lze vizualizovat jako barvy pomocí standardního softwaru pro molekulární vizualizaci).

Procedura simulace CABS byla parametrizována a ověřena pomocí podmnožiny microMoDEL (18) databáze MoDEL (19). Podskupina microMoDEL se skládala ze simulací MD (all-atom, explicitní voda), využívající čtyři nejoblíbenější silová pole (Amber, Gromos, OPLS a Charmm) pro každý z 22 proteinů představujících různé metafold. Průměrný Spearmanův korelační koeficient pro profily fluktuace reziduí mezi CABS a MD z 2násobného testu křížové validace na sadě microMoDEL byl ukázán na 0,7 [toto měřítko konzistence a další metriky dynamiky se zdály být blízké těm, které byly nalezeny když se porovnávají různá silová pole MD (2)]. Tato úroveň predikce je lepší než analogické předpovědi, kterých bylo v poslední době dosaženo jinými metodami: podpora vektorové regrese a model Gaussovy sítě [v uvedeném pořadí, 0,67 a 0,64, jak bylo uvedeno dříve v Jamrozu a kol. (20)]. Kromě toho jsme metodu validovali na parametrizačně nezávislém souboru proteinů s 10-ns MD trajektoriemi uloženými v databázi MoDEL (19). Souprava na testování proteinů obsahovala 393 neredundantních proteinů (<30% identity sekvence), až 400 zbytků na délku. Výsledky potvrdily dřívější validační test a ukázaly průměrný Spearmanův korelační koeficient pro profily fluktuace reziduí mezi CABS a MD rovný 0,70 (histogram korelačních koeficientů získaný pro testovací sadu je uveden na obrázku 2). Podrobné výsledky benchmarku jsou uvedeny v online dokumentaci CABS-flex pod následujícím odkazem: (http://biocomp.chem.uw.edu.pl/CABSflex/benchmarks.php).

Spearmanův korelační koeficient mezi fluktuačními profily MD a CABS-flex pro testovací sadu 393 proteinů.

Spearmanův korelační koeficient mezi fluktuačními profily MD a CABS-flex pro testovací sadu 393 proteinů.

Následné zpracování a analýza dat

Postup simulace CABS se řídí třemi po sobě následujícími kroky: (i) strukturální shlukování, (ii) rekonstrukce modelů na reprezentaci všech atomů a (iii) superpozice, analýza a vizualizace modelů (obrázek 1). Všechny tyto úkoly jsou prováděny v kanálu CABS-flex zavedenými a rozsáhle testovanými metodami (typickými pro postupy modelování proteinů ve více měřítcích) nebo vědeckým softwarem pro všeobecné účely. Strukturální shlukování se provádí klasickou metodou K-means (pro každou predikci jsou podrobné výsledky shlukování uvedeny na kartě podrobností). Po dokončení klastrování je vybrán každý zástupce klastru (vždy model, jehož průměrná podobnost se všemi modely v klastru je minimální). Predikované proteinové modely uvedené na kartě modelů (obrázek 3) jsou zástupci každého klastru (klastry a odpovídající modely jsou označeny stejnými čísly, např. Model 1 představuje klastr 1). Klastry jsou očíslovány/seřazeny podle hodnot hustoty klastrů, od nejhustších (číslovaných jako první) po nejméně husté.

Je uveden snímek obrazovky příkladů výsledků serveru CABS-flex (horní část karty modelů) pro soubor 1AGI pdb (v popředí ukazuje profil fluktuace reziduí a obrázek předpokládaného souboru).

Je uveden snímek obrazovky příkladů výsledků serveru CABS-flex (horní část karty modelů) pro soubor 1AGI pdb (v popředí ukazuje profil fluktuace reziduí a obrázek predikovaného souboru).

Další krok postprocesingu, tj. Rekonstrukce modelů, je realizován pomocí BBQ (21) (Backbone Building from Quadrilaterals Algoritm for the integration of páteřních atomů z Cα stopy) a následně metodou ModRefiner (22) (zodpovědný za rekonstrukci atomy postranního řetězce a optimalizace finálních modelů). Jak bylo nedávno uvedeno (22), ve srovnání s jinými nejmodernějšími programy ukazuje ModRefiner zlepšení v globálních i lokálních strukturách, které mají přesnější polohy postranních řetězců, lepší sítě spojující vodík a méně atomových překryvů.

Poslední krok následného zpracování zahrnuje více úloh superpozice prováděných softwarovým balíkem Theseus (23). Theseus současně superponuje více proteinových struktur a najde optimální řešení problému superpozice pomocí metody maximální pravděpodobnosti. Snížením váhy variabilních oblastí superpozice a opravou pro korelace mezi atomy přináší metoda superpozice maximální pravděpodobnosti mnohem přesnější výsledky než konvenční metody využívající kritéria nejmenších čtverců (23). Automaticky se provádějí následující úlohy superpozice: na souboru všech predikovaných modelů, na souboru všech predikovaných modelů a vstupní struktuře a mezi vstupní strukturou a každým predikovaným modelem. Všechna data superpozice (ve formátu souborů pdb, txt nebo eps) jsou k dispozici ke stažení nebo jsou vizualizována (jako grafika png) na kartě Modely a jejích dílčích záložkách (Multimodel, Model 1, Model 2 a další) pro ukázkový snímek obrazovky viz obrázek 3). Kromě toho je film automaticky generován vytvářením rámců z obrázků předpokládaných modelů v různých rotačních stavech a je dostupný na kartě souhrn [příklady filmů pro proteiny různé velikosti a architektury (kódy pdb: 1ass, 1hui, 1k40 (1mhn a 1qhd), jsou k dispozici v doplňkových datech].

Pro generování online prezentovaných obrázků a souborů eps plot se používá Gnuplot 4.5: interaktivní grafický program.Pro generování online prezentovaných obrázků a filmů zobrazujících soubor predikovaných modelů v kresleném zobrazení se používá vizualizační software Open Source PyMOL.

Dokumentace

Dokumentace CABS-flex je k dispozici online a je k ní přístup pomocí odkazů v nabídce v horní části každé stránky serveru. Obsahuje popis metody, návod, srovnávací data a galerii predikovaných proteinových souborů. Webové rozhraní navíc poskytuje krátké nápovědy k tlačítkům pro stahování nebo výstupní grafice (pro zobrazení nápovědy přetáhněte kurzor na obrázek nebo konkrétní tlačítko pro stažení). Online dokumentace je pravidelně aktualizována podle potřeb uživatelů nebo vylepšení metod.

Dostupnost

Server CABS-flex je bezplatný a otevřený všem uživatelům a není vyžadován žádný požadavek na přihlášení. Po kliknutí na tlačítko Odeslat (kterému předchází vyplnění vstupu - název projektu a soubor pdb - data) se zobrazí webový odkaz na výsledky, který si uživatel může uložit do záložek a později k němu přistupovat. Webové odkazy na odeslané úlohy se zobrazují na stránce fronty, pokud není označena možnost „Nezobrazovat moji úlohu na stránce fronty“ (k dispozici na stránce odeslání).


ZÁVĚR

NAPS je integrovaná platforma pro konstrukci a analýzu síťových reprezentací proteinů, proteinových komplexů, struktury RNA a dat trajektorie MD bez omezení velikosti odesílaného souboru trajektorie. Je to platforma nezávislá na prohlížeči a nevyžaduje žádné instalace a předběžné zpracování vstupních dat. Měření centrality grafu zachycující topologické vlastnosti struktury a analýzu nejkratší cesty zachycující intra-molekulární informační tok lze analyzovat na statickou strukturu (nebo komplex) a srovnávací analýzu mezi časovými kroky trajektorie. Síťové analýzy jsou integrovány s interaktivní vizuální analýzou sítě (2D kontaktní mapa a 3D zobrazení sítě), makromolekulární strukturou, maticí křížové korelace a centrálními grafy. Pro statickou makromolekulární strukturu, analýzy vysoce propojených komponent subgrafu skrz k-kliky a shlukování pomocí analýzy grafových spekter lze také analyzovat. Několik modulů dostupných pro výpočet různých síťových parametrů tedy umožňuje uživatelům rozumně si vybrat z řady možností na základě řešené biologické otázky. Portál je pravidelně aktualizován na základě pokroku v této oblasti a v budoucnu hodláme rozšířit síťovou analýzu trajektorie MD na nukleové kyseliny a komplexy protein -nukleová kyselina.


Úvod

Molekulární dynamika (MD) je běžně používanou metodou ve výpočetní chemii a cheminformatice, zejména pro studium interakcí mezi malými molekulami a velkými biologickými makromolekulami, jako jsou proteiny [1]. Překážka vstupu pro simulaci MD je však vysoká nejen v tom, že je obtížné zvládnout teorii, ale běžně používaný software MD je technicky náročný. Kromě toho generování spolehlivých, reprodukovatelných simulačních dat vyžaduje, aby uživatel vedl podrobné záznamy o všech použitých parametrech a souborech, což opět představuje výzvu pro nováčky v oboru. Jedním z řešení posledně uvedeného problému je použití systému pro řízení pracovního toku, jako je Galaxy [2], který poskytuje výběr nástrojů pro simulaci a analýzu molekulární dynamiky [3]. Simulace MD se v posledních letech zřídka provádějí jednotlivě, do popředí se dostává koncept vysoce výkonné molekulární dynamiky (HTMD) [4, 5]. Galaxy se k tomuto druhu studie dobře hodí, jak ukážeme v tomto článku, a to díky funkcím umožňujícím konstrukci komplexních pracovních toků, které lze následně provádět na více vstupech souběžně.

Tento tutoriál poskytuje podrobný pracovní postup pro vysokovýkonnou molekulární dynamiku s Galaxy, jako případovou studii používá N-koncovou doménu (NTD) Hsp90 (protein tepelného šoku 90). Galaxy [2] je platforma pro analýzu dat, která poskytuje přístup k tisícům nástrojů pro vědecké výpočty. Je vybaven webovým uživatelským rozhraním a automaticky a transparentně spravuje základní detaily výpočtu, což umožňuje strukturovanou a reprodukovatelnou analýzu dat s vysokou propustností. Tento tutoriál poskytuje ukázková data, pracovní toky, praktický materiál a reference pro další čtení. Předpokládá, že uživatel má základní znalosti o platformě Galaxy. Cílem je provést uživatele různými kroky studie molekulární dynamiky, od přístupu k veřejně dostupným krystalovým strukturám, přes provádění simulace MD (využití populárního enginu GROMACS [6, 7]) až po analýzu výsledků.

Celou analýzu popsanou v tomto článku lze efektivně provést na libovolném serveru Galaxy, který má potřebné nástroje. Zejména doporučujeme používat server Galaxy Europe (https://cheminformatics.usegalaxy.eu) nebo server Galaxy South Africa (https://galaxy-compchem.ilifu.ac.za). Pro uživatele, kteří chtějí provozovat svůj vlastní server Galaxy lokálně, poskytujeme kontejner Docker (https://quay.io/repository/galaxy/computational-chemistry-training) obsahující úplnou instalaci Galaxy se všemi nástroji potřebnými pro předinstalovaný výukový program .

Tutoriál představený v tomto článku byl vyvinut jako součást Galaxy Training Network [8] a jeho nejaktuálnější verze je dostupná online na webových stránkách Galaxy Training Materials [9], pod URL https: // training. galaxyproject.org/training-material/topics/computational-chemistry/tutorials/htmd-analysis/tutorial.html.

Co je to vysoce výkonná molekulární dynamika?

Molekulární dynamika (MD) je metoda simulace molekulárního pohybu iterativní aplikací Newtonových pohybových zákonů. Často se používá na velké biomolekuly, jako jsou proteiny nebo nukleové kyseliny. Běžnou aplikací je posouzení interakce mezi těmito makromolekulami a řadou malých molekul (např. Potenciálních kandidátů léčiv). Tento tutoriál poskytuje průvodce nastavením a spuštěním vysoce výkonného pracovního postupu pro screening více malých molekul pomocí open-source nástrojů GROMACS poskytovaných prostřednictvím platformy Galaxy. Po simulaci jsou data trajektorie analyzována pomocí řady nástrojů ke zkoumání strukturních vlastností a korelací v čase.

Proč je studium Hsp90 zajímavé?

Protein tepelného šoku 90 kDa (Hsp90) je chaperonový protein zodpovědný za katalýzu přeměny široké škály proteinů na funkční formu klientely Hsp90, která čítá několik stovek proteinů, včetně receptorů nukleárních steroidních hormonů a protein kináz [10 ]. Mechanismus, kterým Hsp90 působí, se mezi klienty liší, stejně jako vazebné místo pro klienta proces je závislý na posttranslačních modifikacích Hsp90 a identitě ko-chaperonů, které vážou a regulují konformační cyklus [11].

Díky své zásadní biochemické roli chaperonového proteinu, který se podílí na usnadňování skládání mnoha klientských proteinů, je Hsp90 atraktivním farmaceutickým cílem. Vzhledem k tomu, že skládání bílkovin je potenciálním překážkou buněčné reprodukce a růstu, blokování funkce Hsp90 pomocí inhibitorů, které se pevně vážou na vazebné místo ATP NTD, by mohlo pomoci například při léčbě rakoviny, zkoumá se antibiotikum geldanamycin a jeho analogy jako možná protinádorová činidla [12, 13].

Ve struktuře, která bude zkoumána během tohoto tutoriálu, je příslušným ligandem resorcinol, běžná třída sloučenin s afinitou k N-terminální doméně Hsp90. Je registrován v databázi PubChem pod složeným ID 135508238 [14]. Jak je patrné z pohledu struktury PDB, resorcinová část struktury je uložena ve vazebném místě, vázána vodíkovou vazbou na zbytek aspartát-93. Struktura ligandu také obsahuje triazol a fluorfenylový kruh, které leží blíže k povrchu proteinu.


Biomolekulární simulace a modelování: stav, vývoj a vyhlídky

Molekulární simulace stále více ukazuje svou praktickou hodnotu při zkoumání biologických systémů. Výpočetní modelování biomolekulárních systémů je vzrušující a rychle se rozvíjející oblast, která se svým rozsahem výrazně rozšiřuje. Byla vyvinuta řada simulačních metod, které lze použít ke studiu nejrůznějších problémů strukturní biologie a na rozhraní mezi fyzikou, chemií a biologií. Zde uvádíme přehled metod a některé nedávné události v atomistické biomolekulární simulaci. Zdůrazněny jsou některé nedávné aplikace a teoretický vývoj.

1. Úvod

„Mohu věřit modelování?“ Je otázka, kterou si často kladou biologové a biochemici. Jeho zodpovězení vyžaduje informované porozumění silným stránkám a omezením současných výpočetních metod biomolekulárního modelování a simulace a jejich rozsahům použití. Kolemná skepse veškerého biomolekulárního modelování se někdy vyskytuje mezi experimentátory i dnes, stejně špatně je slepé přijímání výsledků modelování bez kritické analýzy. Ukázky praktického přínosu biomolekulárního modelování však vedly k rostoucímu uznání jeho hodnoty. Jedná se o úrodnou a rostoucí oblast se vzrušujícími příležitostmi a obrovskou škálou potenciálních aplikací. Pro biomolekulární modeláře je zásadní porozumět otázkám, které jsou pro biology zajímavé, složitosti biologických systémů a jak je účinně řešit modelováním. Obrovské množství dat poskytuje rozsáhlé výzkumné úsilí v oblasti genomiky, proteomiky, glykomiky a strukturní biologie. Při studiu biomolekulárních systémů se stále častěji uplatňují sofistikované fyzikální techniky. Úkolem pro biomolekulární modelování je pomoci v úsilí využít tato různorodá data k vývoji nových léků, terapií, katalyzátorů a biologicky založené nanotechnologie.

Metody molekulárního modelování a simulace stále více přispívají ke studiu struktury a funkce biologických makromolekul. Aplikace zahrnují studie skládání proteinů a konformačních změn (Daggett 2006 Elcock 2006), asociace proteinů s malými molekulami (Moitessier a kol. 2008) nebo jiné proteiny (McGuffee & amp Elcock 2006 Ritchie 2008), struktura léčiv založená na struktuře (Taft a kol. 2008), výpočet vazebných volných energií pro ligandy (Gilson & amp Zhou 2007), modelování dynamiky iontových kanálů a transportu přes membrány (Beckstein a kol. 2003) a modelování a analýza enzymových mechanismů (Warshel a kol. 2006b Mulholland 2008). Tato poslední oblast (biologická katalýza) je například fascinující z chemického hlediska a představuje důležité rozhraní mezi chemií a biologií.

Vylepšení počítačového hardwaru nadále přinášejí větší výpočetní výkon, což v kombinaci s teoretickým a algoritmickým vývojem vedlo ke zvětšení rozsahu a hloubky aplikací molekulárního modelování v biologii. Celá oblast biomolekulárního modelování je nyní příliš velká na to, aby byla přiměřeně pokryta jediným přehledem. Zde je kladen důraz na atomistickou molekulární simulaci, zejména proteinů. Tento přehled si klade za cíl upozornit na některé vzrušující nedávné aplikace molekulárního modelování a simulačních metod na biologické systémy a nastiňuje důležité současné metody i pozoruhodný současný teoretický vývoj v této oblasti.

Asi nejzjevnější výzvou při simulaci biologických makromolekul je jejich velká velikost, kterou zhoršuje potřeba zahrnout alespoň reprezentativní část jejich prostředí (tj. Okolní rozpouštědlo, možná membrána nebo jiné proteiny nebo kofaktory nebo DNA, které mohou být navázány na protein). Klíčovým rozhodnutím na začátku simulace biomolekulárního systému je volba vhodné metody pro tento konkrétní systém a pro otázky, které nás zajímají. Metoda modelování by měla být schopna poskytnout spolehlivý výsledek v rozumném čase. Zde jsou nastíněny některé klíčové silné a slabé stránky různých současných metod. Pole biomolekulární simulace se stále vyvíjí a zatím není ve fázi, kdy lze rutinně provádět kvantitativní a přesné předpovědi (například) relativních vazebných volných energií, reakčních rychlostí nebo účinků mutací (Van Gunsteren a kol. 2006). Z tohoto důvodu je důležité pokusit se propojit s experimentem za účelem ověření předpovědí z modelování: predikce pKA hodnoty funkčních skupin v proteinech představují užitečný a náročný příklad tohoto typu testu (Nielsen & amp McCammon 2003 Jensen a kol. 2005 Warshel a kol. 2006A Stanton & amp Houk 2008 Bas a kol. 2008). Podobně může být užitečné porovnat aktivační bariéry pro řadu alternativních substrátů s aktivačními energiemi odvozenými z experimentálních rychlostí: demonstrace korelace může ověřit mechanistické výpočty jako skutečně prediktivní (Ridder a kol. 2003).

2. Biomolekulární struktura a modelování

Počet struktur biologických makromolekul nalezených experimenty je velký a stále se zvyšuje. Využití tohoto množství dat je výzvou pro biomolekulární modeláře. Jedním z důležitých aktuálních zdrojů je Research Collaboratory for Structural Bioinformatics (RCSB, www.rcsb.org), která zpřístupňuje (prostřednictvím webu) trojrozměrná biologická makromolekulární strukturální data ze všech experimentálních technik. RCSB Protein Data Bank (PDB) je jediné celosvětové úložiště pro zpracování a distribuci trojrozměrných strukturních dat velkých molekul, jako jsou proteiny a nukleové kyseliny (Berman a kol. 2000) a je zásadním zdrojem pro biomolekulární simulaci.

Široká škála experimentálních metod poskytla pohled do struktury biologických makromolekul a tyto struktury jsou výchozími body pro mnoho simulací. Nejdůležitější experimentální technikou pro studium struktury proteinů byla dosud rentgenová krystalografie. Je zapotřebí dobře uspořádaného krystalu a nalezení vhodných podmínek krystalizace může být obtížné, zejména pro membránové proteiny. Jednou z indikací přesnosti krystalografické proteinové struktury určené rentgenovou krystalografií je rozlišení od velmi nízkého rozlišení, kde může být odhalen snad jen celkový tvar proteinu, až po vyšší rozlišení (1–2 Å), kde většina atomové polohy lze určit, alespoň pro těžké atomy. Modeláři by si však měli pamatovat, že citované rozlišení je měřítkem kvality globálního modelu (např. V závislosti na povaze krystalu a experimentálních podmínkách) a dokonce i ve strukturách s vysokým rozlišením může existovat značná nejistota kvůli dynamické povaze proteinů , což může způsobit konformační variabilitu. Molekulární modely proteinové struktury poskytované krystalografií jsou produktem značných subjektivních lidských zásahů (např. Při vytváření a zdokonalování modelů), a co je důležitější, tyto struktury představují průměr všech molekul v krystalu a po celou dobu experiment. Jedním zřejmým výsledkem tohoto zprůměrování je přítomnost alternativních konformací pro některé skupiny v mnoha strukturách proteinových krystalů-dvě nebo více dobře uspořádaných konformací jsou často pozorovány například u některých postranních řetězců aminokyselin. Podobně některé části struktury nemusí být rozlišeny krystalografií, zejména povrchové smyčky nebo koncové oblasti proteinu mohou být velmi mobilní a nemají žádnou přesně definovanou konformaci a polohu ve velmi velkém počtu molekul v krystalu. Je důležité mít na paměti, že proteinové krystalické struktury nejsou ekvivalentem krystalických struktur s malými molekulami. Krystalografické struktury biologických makromolekul by neměly být považovány za strukturu jedné molekuly - jsou nejvhodnější pro dostupná experimentální data, která, stejně jako zdroje experimentálních chyb, obsahují účinky statických i dynamických poruch. Může být překvapující zjištění, že minimalizace energie molekulární mechaniky (MM) (včetně účinků solvatace) struktury proteinových krystalů obvykle sníží energii struktury proteinových krystalů o velké množství (např. Uvolněním velkého počtu blízkých interatomických kontakty), měnící strukturu jemnými, ale důležitými způsoby. To však neznamená, že metodě MM nelze důvěřovat, ale ani to nenaznačuje, že je krystalová struktura „špatná“. Metody MM mají za cíl poskytnout dobrou strukturu jedné molekuly proteinu, zatímco krystalografická struktura je průměr, jak bylo popsáno dříve, a nejlépe odpovídá experimentálním difrakčním údajům. Proteiny procházejí širokou škálou komplexních vnitřních pohybů. Krystalová struktura obsahuje účinky průměrování mnoha různých proteinových konformací produkovaných těmito pohyby a účinky pohybů samotných během experimentu. Ukazuje se, že u struktur s vysokým rozlišením mohou kombinace dvou nebo více různých strukturálních modelů lépe vyhovovat experimentálním datům než jedna struktura. Proteinová krystalografie obvykle poskytuje jen velmi omezené informace o dynamice, pouze izotropní teplotní faktory (Debye nebo B faktorů), i když při velmi vysokých rozlišeních (např. méně než 1 Å) lze někdy extrahovat podrobnější informace (např. faktory anizotropních teplot).

Pro stanovení struktury proteinů jsou stále důležitější metody nukleární magnetické rezonance (NMR). V NMR se magnetické spinové vlastnosti atomových jader používají k sestavení seznamu omezení vzdálenosti mezi atomy v enzymu, ze kterého lze určit trojrozměrnou strukturu proteinu. Tato metoda nevyžaduje růst krystalů, protože může být použita v koncentrovaných proteinových roztocích. Přímé stanovení struktury pomocí NMR je obecně omezeno na menší proteiny. K řešení a zpřesnění proteinových struktur byla také použita prášková rentgenová difrakce s vysokým rozlišením (Von Dreele a kol. 2000). Tato metoda sdílí tu výhodu, že nevyžaduje proteinový krystal.

3. Simulace molekulární dynamiky biologických makromolekul

Dopad biomolekulární simulace na biologii byl pravděpodobně největší při studiu dynamiky biologických makromolekul (Karplus & amp Kuriyan 2005). V této oblasti se vybudovala úzká integrace experimentu a modelování. Simulace proteinů s molekulární dynamikou pomohly prokázat, že se proteiny ohýbají a podléhají složitým vnitřním pohybům, které v některých případech přímo souvisejí s funkcí (Karplus a kol. 2005). Simulace molekulární dynamiky skládání a odvíjení proteinů (Daggett & amp Fersht 2003) ukázaly svou hodnotu při interpretaci experimentálních dat a doplňujících experimentech (starosta a kol. 2003).Simulace molekulární dynamiky také pomáhají při zpřesňování biomolekulárních struktur při strukturálních výzkumech pomocí rentgenové krystalografie (Brunger & amp Adams 2002) a NMR (Chen a kol. 2005 Fossi a kol. 2005) a také v analýze NMR dat o spinové relaxaci (případ 2002) a dynamice, např. dynamika postranních řetězců bílkovin (Best a kol. 2005). Mezi další důležité oblasti aplikace simulace biomolekulární dynamiky patří studie proteinových konformačních změn (Elber 2005 Woods a kol. 2005 Pentikäinen a kol. 2008 obrázek 1), simulace iontových kanálů a dalších membránových proteinů (Roux 2002 Warshel 2002 Gumbart a kol. 2005 Sansom a kol. 2005), studie úlohy biomolekulární dynamiky v enzymové katalýze, fotosyntéze a vidění (Warshel 2002) a studie funkčních makromolekulárních sestav, jako je F1-ATPase (Strajbl a kol. 2003b Dittrich a kol. 2004). Nyní široká aplikace metod biomolekulární dynamiky je důkazem rostoucí zralosti oboru. Studie zahrnující simulace dynamiky vícesekundových sekund jsou nyní běžné. Odborné znalosti jsou však stále nutné a je třeba dbát na to, aby aplikace metody biomolekulární simulace na konkrétní problém byla smysluplná a užitečná.

Obrázek 1 Simulace molekulární dynamiky lidského zachycovacího dekapovacího enzymu DcpS (Pentikäinen a kol. 2008), identifikovat rozsáhlé konformační změny, které jsou pravděpodobně důležité pro jeho funkci. DcpS je dimerní enzym se dvěma aktivními místy, který katalyzuje hydrolýzu víčka mRNA. Během simulace se konformace enzymu mění z (přibližně) symetrického na asymetrický (kde je jedno aktivní místo uzavřené a druhé otevřené) a zpět na symetrický, což ukazuje na kooperativní chování vazebných míst proteinu.

Kromě jejich využití ke studiu struktury, dynamiky a kinetiky lze pro výpočet termodynamických vlastností použít také simulace biomolekulární dynamiky. Simulace molekulární dynamiky poskytuje způsob vzorkování konfiguračního fázového prostoru, čímž se vytváří soubor struktur, ze kterých lze akumulovat termodynamické průměry. Simulace molekulární dynamiky lze například použít ke generování souborů nezbytných pro výpočet relativní vazby volných energií mezi proteinem a ligandem (Charlier a kol. 2007 Deng & amp Roux 2008), bez solvatačních energií (Johansson & amp Lindahl 2008) a bez aktivačních energií pro enzymem katalyzované reakce (Garcia-Viloca a kol. 2004 Pang a kol. 2006 Bowman a kol. 2007 Liu & amp Warshel 2007). Problém při používání molekulární dynamiky jako algoritmu odběru vzorků je ten, že potenciální energetické povrchy biomolekulárních systémů mohou být velmi frustrované, a tak se trajektorie může snadno zachytit při vzorkování v rámci místního minima s vysokou energií (Friesner & amp Gunn 1996). Pro zlepšení vzorkování bylo vyvinuto několik metod, například aplikace předpínacího „deštníkového“ potenciálu k vynucení vzorkování podle konkrétní reakční souřadnice (Torrie & amp Valleau 1977 Bowman a kol. 2007 Piccinini a kol. 2008), spojením více trajektorií dohromady a umožněním jejich výměny parametrů (Sugita & amp Okamoto 1999 Kamberaj & amp van der Vaart 2007 Mu a kol. 2007 Nymeyer 2008 Sindhikara a kol. 2008), jako je teplota (Hansmann 1997 Hofinger a kol. 2007 Huang a kol. 2007 Patriksson & amp van der Spoel 2008) a zaměstnávají generalizované soubory (Kinnear a kol. 2004 Okamoto 2004), například multikanonický soubor (Kamiya a kol. 2008). Oblast vylepšených metod vzorkování pro molekulární dynamiku je velká a pokrývá ji několik vynikajících recenzí (Kinnear a kol. 2004 Okamoto 2004 Tai 2004 Christen & amp Van Gunsteren 2008 Gao a kol. 2008 Piccinini a kol. 2008).

Práce na proteinu α-synukleinu (který je vnitřně neuspořádaný a podílí se na patogenezi Parkinsonovy choroby Dedmon a kol. 2005) poskytuje příklad synergie mezi experimenty a simulacemi biomolekulární dynamiky. Jednalo se o mapování interakcí na velké vzdálenosti pomocí kombinace simulací souborové molekulární dynamiky a spin-label NMR. Pro sestavení simulací molekulární dynamiky obsahující 20 proteinových replik se silovým polem CHARMM19 byly použity distanční omezení odvozená z paramagnetické relaxační vylepšení NMR spektroskopie (viz § 4). Výsledky ukázaly, že nativní stav a-synukleinu je tvořen širokou distribucí konformerů. Nalezený souhrnný průměr hydrodynamického poloměru byl výrazně menší, než se očekávalo u jednoduché struktury náhodných cívek. Strukturální studie ukázaly, že tato kontrakce je poháněna interakcemi mezi vysoce nabitým C-koncem a velkou hydrofobní centrální oblastí proteinové sekvence. Na základě těchto zjištění tito pracovníci navrhli, že tento typ struktury může být zodpovědný za inhibici tvorby agregátů α-synukleinu (předpokládá se, že jde o cytotoxické druhy zodpovědné za neurodegeneraci při Parkinsonově chorobě). Simulace molekulární dynamiky byly podobně použity ke generování konformací při experimentálním určování souboru struktur představujících denaturovaný stav hovězího proteinu vázajícího acyl-koenzym A (Lindorff-Larsen a kol. 2004).

Nedávná práce Leontiadou a kol. (2007) demonstruje některé silné stránky a omezení současných nejmodernějších simulací atomistické biomolekulární dynamiky. Tato studie zkoumala účinky iontové koncentrace na transport iontových druhů přes póry v lipidové membráně. Tato práce zahrnovala řadu velkých simulací zahrnujících 128 dipalmitoylfosfatidylcholinových lipidů (každý obsahující 130 atomů) a přibližně 6000 molekul vody. Tato práce posunula hranice toho, co je možné dosáhnout současnou atomistickou molekulární dynamikou. Pomocí aproximací, jako je modelování elektrostatiky s dlouhým dosahem pomocí reakčního pole, a pomocí vazebných vazeb tak, aby bylo možné použít časový krok integrace 5 fs, bylo možné spustit několik simulací mezi 50 a 100 ns, každá na délku. Navzdory působivé velikosti těchto simulací jsou stále omezeny na biologicky malá délková a časová měřítka. Sto dvacet osm lipidů je pouze membránová dvojvrstva osm na osm, což je příliš malé na modelování efektů, jako je zakřivení membrány nebo membránové vlny (Ayton & amp Voth 2004 Chu a kol. 2007). Sto nanosekund také není dost času na zachycení událostí, jako je agregace membránových proteinů nebo tvorba lipidového raftu v membráně (Ayton & amp Voth 2004).

Hrubozrnné modely poskytují cestu k delším časovým a délkovým měřítkům v biomolekulárních simulacích. Jedná se o třídu mesoscale modelu, ve kterém jsou skupiny atomů zpracovány jejich seskupením dohromady a modelováním jako jediné interakční místo. Ve skutečnosti se skupiny atomů shromažďují dohromady do „kuliček“. Hrubozrnné modely zavedly společnosti Levitt a Warshel pro proteiny ve svých průkopnických dokumentech ze 70. let (Levitt & amp Warshel 1975 Levitt 1976). Papír Levitt & amp Warshel (1975) představil první hrubozrnný model globulárního proteinu. Na zbytek použily dvě hrubozrnné částice: jednu, která byla soustředěna na a-uhlíku aminokyseliny (Ca) a druhou, která představovala atomy postranního řetězce. O částicích Ca působil torzní potenciál, zatímco potenciál Lennardova-Jonesova typu působil mezi páry částic postranního řetězce. Tímto způsobem je zbytek reprezentován jako pár kuliček a protein jako řetězec kuliček. Tento hrubozrnný model byl postaven tak, aby představoval inhibitor hovězího pankreatického trypsinu (BPTI), a byl shledán úspěšným, protože byl schopen správně přetvořit protein počínaje zcela denaturovanou konfigurací. Simulace hrubozrnných modelů jsou výpočetně méně nákladné než jejich atomistické protějšky, protože hrubé zrnění snižuje počet interakčních míst. Hrubozrnné modely navíc obsahují méně stupňů volnosti a používají silová pole, která vedou k hladším povrchům potenciální energie (viz §4). Hladší povrch potenciální energie snižuje problémy spojené s frustrací nebo neergododickým odchytem, ​​což vede k efektivnějšímu vzorkování a kratší době korelace. Hrubé zrnění také typicky odstraňuje nejtuhší stupně volnosti z modelu (např. Vibrační režimy vazby uhlík-vodík), což umožňuje hrubozrnným modelům používat delší časové kroky. Celkově to znamená, že hrubozrnné simulace mají přístup k délkovým a časovým měřítkům daleko za hranicemi těch, které jsou prakticky dosažitelné atomistickou molekulární dynamikou. Hrubozrnné modelovací metody jsou předmětem značného aktuálního zájmu a značné úsilí je věnováno vývoji a aplikaci hrubozrnných metod pro simulace biologických systémů. Zde není možné podrobně diskutovat o tomto nedávném vývoji, několik vynikajících nedávných recenzí poskytuje dobrý popis vývoje a aplikace hrubozrnných metod (Nielsen a kol. 2004 Tozzini 2005 Venturoli a kol. 2006 Sansom a kol. 2008).

Hrubozrnné modely umožňují biomolekulárním simulacím zkoumat časové a délkové škály, které nejsou možné s metodami atomistického modelování. Protože však nepředstavují molekuly v plně atomistických detailech, hrubozrnné modely nemusí představovat některé důležité efekty. Nyní existuje značný zájem na vývoji rámců pro víceúrovňové modelování, například propojení atomistických a hrubozrnných modelů, k překonání těchto problémů (Woods & amp Mulholland 2008).

4. Empirická silová pole „MM“ pro biomolekuly

Empirická silová pole pro biomolekulární simulaci byla poprvé vyvinuta téměř před 40 lety (Warshel a kol. 1970 Warshel & amp. Karplus 1972 Hagler a kol. 1974 Warme a kol. 1974), přičemž první simulace biomolekulární dynamiky byly provedeny brzy poté, např. zkoumání dynamiky fotoizomerizace sítnice (Warshel 1976) a seminálně modelování dynamiky malého proteinu, BPTI, v plynné fázi (McCammon a kol. 1977). Biomolekulární simulace prošla v uplynulých letech dlouhou cestu. Pro simulace proteinů, nukleových kyselin, lipidů a dalších biologických molekul byla vyvinuta řada empirických silových polí „MM“. Je důležité rozlišovat mezi nimi programy používané pro biomolekulární simulaci a sady parametrů MM, které pro ně byly vyvinuty, zejména proto, že názvy mohou být stejné nebo podobné a někdy se používají zaměnitelně. Byla vyvinuta řada kvalitních sad parametrů, které lze použít s několika různými programy, protože použité funkční formy jsou často stejné nebo velmi podobné. Kvalitu konkrétní sady parametrů je třeba zvážit nezávisle na kvalitě samotného počítačového programu. Samozřejmě je nezbytné, aby konkrétní sada parametrů silového pole byla implementována v jakémkoli programu přesně tak, jak byla navržena, a toto by mělo být pečlivě zkontrolováno. V různých programech mohou platit různé protokoly, možná s různými skrytými předpoklady. Testy na modelových systémech jsou důležité k zajištění konzistentního a správného zacházení s interakcemi daným silovým polem.

Mezi nejpoužívanější počítačové programy používané pro simulace biologické molekulární dynamiky, zejména v akademickém výzkumu, patří Amber (Case a kol. 2005), CHARMM (Brooks a kol. 1983), Gromos (Scott a kol. 1999), NAMD (Phillips a kol. 2005) a Tinker (Ponder & amp Richards 1987). K dispozici je několik dalších balíčků simulace molekulární dynamiky, včetně komerčních a akademických programů.

Programy pro molekulární simulaci by neměly být zaměňovány s použitými silovými poli, jak bylo uvedeno výše. Silové pole se skládá z energetické funkce společně s parametry. Je třeba použít jednoduchou energetickou funkci, aby bylo možné studovat velké systémy pro dlouhá (multinanosekundová) časová období. Současná silová pole proteinů používají podobné, jednoduché potenciální energetické funkce (Mackerell 2004), ve kterých jsou například vazby a úhly vazeb reprezentovány harmonickými termíny, elektrostatické interakce jsou zahrnuty prostřednictvím parciálních nábojů atomového bodu a disperzní a výměnné odpuzování je zahrnuto jednoduchá funkce Lennard-Jones (obvykle odrůdy 12–6).

Tento jednoduchý přístup MM má důležitá omezení. Například elektrostatické interakce jsou reprezentovány zahrnutím bodového náboje na každém atomu (a pouze na atomech). Tento jednoduchý model nedokáže zachytit úplné elektrostatické vlastnosti (např. Vícepólové momenty) molekuly, což je zvláštní problém u méně polárních druhů. Například není možné reprezentovat kvadrupólový moment benzenu pomocí atomových nábojů. Modely zahrnující bodové náboje z atomových center, představující mračna elektronů v benzenu, poskytují lepší popis chování kondenzované fáze benzenu a dalších aromatických molekul (Baker & amp Grant 2006, 2007). Byly vyvinuty modely zbytků aromatických aminokyselin, které používají mimostředové náboje (Xu a kol. 2007), u nichž bylo prokázáno, že lépe reprodukují vlastnosti kondenzované fáze. Modelování elektronické polarizace je také výzvou pro přístupy MM. Zatímco silová pole MM, která výslovně zahrnují polarizaci prostřednictvím řady přístupů, jsou vyvíjena a aplikována na biomolekulární systémy (např. Amberovo polarizovatelné silové pole, FF04, bylo nedávno optimalizováno pro simulace proteinů a peptidů Wang a kol. 2006), většina polí biomolekulárních sil je nepolarizovatelná. V těchto silových polích není zahrnuta elektronická polarizace (s výjimkou implicitního, nepřímého smyslu): to znamená, že atomové náboje jsou invariantní, nemění se v reakci na změny molekulárního prostředí nebo konformace. Atraktivní (r −6) složka Lennard-Jonesova potenciálu má určité fyzické opodstatnění pro modelování disperzních interakcí. Odpudivý (r −12) termín je zvolen jednoduše pro výpočetní pohodlí, aby představoval odpuzování výměny na krátké vzdálenosti. Je známo, že exponenciální popis je fyzicky realističtější, ale v kontextu celkového popisu MM je to obvykle malá chyba pro molekuly „organického“ typu. Jednoduché harmonické termíny představují energii roztažení vazby a ohybu valenčního úhlu, s jednoduchými periodickými termíny pro torzní úhly a termíny pro další intramolekulární interakce, kde je to nutné. Energetické funkce tohoto typu nemohou modelovat změny ve vazbě související s chemickou reakcí: podmínky vazby neumožňují vytváření nebo lámání vazby a není povoleno elektronické přerozdělování. Parametry silového pole MM jsou také vyvíjeny na základě vlastností stabilních molekul, a proto obvykle nebudou použitelné pro přechodové stavy a meziprodukty. Je možné vyvinout funkce a parametry MM specificky pro reakce, a to bylo velmi úspěšné při aplikaci na organické reakce v roztoku (Lim a kol. 1999). Toto je však pracný proces a parametry jsou obvykle použitelné pouze pro konkrétní typ reakce, což znamená, že pro každou novou aplikaci může být vyžadována reparametrizace. Forma potenciální funkce také ukládá důležitá omezení, například zanedbání elektronické polarizace.

Silová pole pro biologické makromolekuly spadají do dvou tříd: všechny atomy a spojené atomy. All-atom silová pole, jak název napovídá, výslovně představují všechny atomy v molekulárním systému. Silová pole spojených atomů naopak obsahují pouze těžké (nevodíkové) atomy a polární atomy vodíku, zatímco nepolární atomy vodíku nejsou výslovně zahrnuty, ale místo toho jsou reprezentovány jako součást atomu uhlíku, ke kterému jsou vázány (který bude mít zvětšený van der Waalsův poloměr, tj. průměr srážky Lennard-Jones).

V současné době jsou nejpoužívanějšími silovými atomy všech atomů pro proteiny OPLS/AA (Jorgensen a kol. 1996 Kaminski a kol. 2001), CHARMM22 (MacKerell a kol. 1998) a Amber (PARM99 Cornell a kol. Případ 1995 a kol. 2005). Byla publikována řada dobrých recenzí o výkonu silových polí proteinových MM (Okur a kol. 2003 Pouder & amp Case Case 2003 MacKerell 2005 Hornak a kol. 2006). Parametrizace těchto silových polí je stále více založena na přizpůsobení experimentálním datům kondenzované fáze (jako jsou volné energie solvatace pro postranní řetězce aminokyselin), zejména při optimalizaci Lennard-Jonesových parametrů. To je v kontrastu s dříve dominantní rolí dat v plynné fázi (např. ab initio výpočty heterodimerů) v parametrizaci. Rovněž byla vyvinuta silová pole pro jiné typy biologických makromolekul (např. Lipidy, nukleové kyseliny (Cheatham 2004, 2005) a sacharidy, stejně jako mnoho malých molekul a ligandů) shodná s těmito silovými poli proteinů, která například umožňují simulace proteinů interagujících s DNA a uložených v membránách. Je důležité zajistit, aby silová pole byla konzistentní a dobře vyvážená: různá silová pole by neměla být smíchána dohromady.) Mezi příklady patří silové pole CHARMM27 pro nukleové kyseliny (Foloppe & amp MacKerell 2000 MacKerell & amp Banavali 2000), parametry nukleové kyseliny Amber (Cornell a kol. 1995 Cheatham a kol. 1999), parametry CHARMM pro lipidy (Feller a kol. 1997) a několik různých sad parametrů MM pro běžné sacharidy. Například Kuttel a kol. (2002) vyvinuli parametry sacharidů pro použití se silovým polem CHARMM, vhodné pro simulace molekulární dynamiky nanosekund ve vodném roztoku. Profily volné energie pro rotaci hydroxymethylové skupiny pro dva monosacharidy (β -d -glukóza a β -d -galaktóza) s touto sadou parametrů ukázaly rovnovážné populace rotamerů ve velmi dobré shodě s údaji NMR primární rotační frekvenci alkoholu v roztoku a plynu -Bylo také zjištěno, že fázové vibrační frekvence jsou ve skvělé shodě s experimentem. Podobně Woods a kol. (1995) vyvinuli parametry uhlohydrátů, nazývané GLYCAM_93, pro použití s ​​jantarovým silovým polem. Ukázalo se, že reprodukují strukturální rysy a konformační preference řady derivátů tetrahydropyranu na základě ab initio výpočty. Jeho nejnovější inkarnace, GLYCAM06 (Kirschner a kol. 2008), již není specifický pro uhlohydráty ani není závislý na silovém poli a pracuje se na polarizovatelné verzi. Hemmingsen a kol. (2004) testovali výkon 20 různých silových silových polí MM ve srovnání s (plynná fáze) ab initio a funkční výpočty hybridní hustoty na monosacharidech. Geometricky optimalizované struktury (B3LYP/6-31G (d)) a byly použity relativní energie v plynné fázi pro srovnávací systémy monosacharidových sacharidů. Bylo zjištěno, že většina silových polí sacharidů dává nesprávnou hodnotu pro interakční energii α -d -glukopyranózy – H2O komplex, ve srovnání s ab initio výsledek (na úrovni sdruženého klastru CCSD (T)) žádné jednotlivé silové pole nepůsobilo konzistentně lépe než ostatní pro různé testovací případy (např. pro konformační energie methyl 5-deoxy-β-d-oxylofuranosidu, methyl α-d- glukopyranosid a methyl α -d -galaktopyranosid). Statistické vyhodnocení výkonu silových polí naznačilo, že CHEAT95 (model spojených atomů Kouwijzer & amp Grootenhuis 1995) a některé MM parametrizace vyvinuté na základě Amber (Senderowitz) a kol. 1996), CFF (konzistentní silové pole Siebert a kol. 2000) a MM3 (Allinger a kol. Silová pole Stortz & amp Cerezo 2003) mají nejlepší celkový výkon pro studované monosacharidové systémy v plynné fázi. Je důležité zdůraznit, že několik těchto silových polí využívá komplikovanější a sofistikovanější potenciální energetické funkce, než jaké se obvykle používají pro proteinové simulace. Vývoj parametrů MM pro (poly) sacharidy je notoricky obtížný (Imberty & amp Perez 2000), vzhledem k jejich konformační složitosti, velkému rozsahu možných substitučních vzorců a zvláštní obtížnosti vyvažování inter- a intramolekulárních interakcí (protože cukry obsahují velmi velké množství vodíku -spojovací skupiny). Pro uhlovodany existují jasná omezení invariantního modelu náboje v atomovém bodě. Přístup kvantové mechaniky/molekulární mechaniky (QM/MM) (viz § 7), zpracování cukru metodou kvantové mechaniky (elektronická struktura QM), může být v mnoha případech zlepšením (francouzsky a kol. 2001). Standardní poloempirické molekulární orbitální metody mají pro sacharidy značné nedostatky, ale byly vyvinuty reparametrizované varianty, které poskytují lepší popis konformace sacharidů (např. PM3CARB-1 McNamara a kol. 2004).

Příklady silových polí proteinu spojených atomů pro proteiny jsou Gromos 87 a Gromos 96 (Scott a kol. 1999 Schuler a kol. 2001), CHARMM19 (Neria a kol. 1996), OPLS/UA (united atom Jorgensen & amp Tirado-Rives 1988) a původní silová pole vyvinutá pro program Amber (Weiner a kol. 1984). Silová pole spojených atomů byla vyvinuta za účelem zkrácení času počítače potřebného pro simulace molekulární dynamiky snížením počtu atomů. Jsou stále důležité dnes, ve studiích využívajících buď explicitní nebo implicitní solvatační modely. Jsou zvláště široce používány ve studiích skládání proteinů, často využívající popis solvatace kontinua. Implicitní modely rozpouštědel se vyhýbají explicitní reprezentaci molekul vody a snižují tak výpočetní nároky, což výrazně pomáhá při přístupu k delším časovým měřítkům. Bylo vyvinuto mnoho modelů kontinuální solvatace, včetně Poisson – Boltzmann (Baker 2005A,b) a generalizovaný Born (Chen a kol. 2006 Yu a kol. 2006) modely. Ty představují rozpouštědlo jako dielektrické kontinuum a vypočítávají polarizaci tohoto kontinua způsobenou distribucí náboje rozpuštěné látky. Tato polarizace vede k elektrostatickému reakčnímu poli, se kterým solut následně interaguje. Modely kontinuálního rozpouštědla se používají již mnoho let v kombinaci s QM (Klamt & amp Schuurmann 1993 Park a kol. 2 000 Jang a kol. 2003 Tomasi 2004), MM (Brown & amp Muchmore 2007 English 2007) a hrubozrnný (Brannigan a kol. 2006 Lotan & amp Head-Gordon 2006) solute models. Ty představují velkou třídu metod a byly podrobně přezkoumány mnoha pracovníky (Tomasi 2004 Brannigan a kol. 2006 Carlsson a kol. 2006 Im a kol. 2006 Koehl 2006 Warshel a kol. 2006A). Vyhodnocení výkonnosti (přesnosti i účinnosti) implicitních modelů rozpouštědel (např. Porovnáním s explicitními simulacemi rozpouštědel) je vysoce aktivní oblastí výzkumu.

Většina biomolekulárních silových polí MM byla vyvinuta tak, aby byla v souladu s jednoduchými modely bodových nábojů vody, zejména s vodním modelem TIP3P (Jorgensen & amp Tirado-Rives 2005) a jeho variantami. V modelech, jako je TIP3P, je dipólový moment vyšší než moment pozorovaný v plynné fázi, takže elektronická polarizace je zahrnuta přibližně, invariantně, podobně jako silová pole proteinu MM. Polarizovatelná silová pole pro biologické molekuly jsou předmětem mnoha současných výzkumných a vývojových snah (Kaminski a kol. 2002 Ren & amp Ponder 2003 Kaminski a kol. 2004 Patel a kol. 2004 Anisimov a kol. 2005 Gresh a kol. 2005 těžší a kol. 2005 Vorobyov a kol. 2005 Wang a kol. 2006 Warshel a kol. 2007). Je pravděpodobné, že další generace silových polí proteinů MM bude s elektronickou polarizací zacházet výslovně. Mezi další vylepšení silových polí proteinů MM patří využití výsledků na vysoké úrovni ab initio výpočty pro korekci pro dvourozměrný povrch potenciální energie pro rotaci dvojúhelníkového úhlu peptidové páteře. MacKerell a kol. (2004A,b) vyvinuli mřížkovou korekci CMAP pro silové pole CHARMM22, která modifikuje potenciál páteře φ a ψ torzní úhly. Bylo prokázáno, že zlepšuje celkovou shodu mezi parametry řádu odvozenými ze simulací molekulární dynamiky a experimentálními parametry řádu NMR lysozymu slepičího bílku (Buck a kol. 2006). Podobné úpravy v Amberu vedly k odvození ff99SB (Hornak a kol. 2006) a parmbsc0 (Perez a kol. 2007) opravy. Rozsáhlejší úprava vedla k ff03 (Duan a kol. 2003), který lze považovat spíše za odlišný model silového pole než za rozšíření předchozích jantarových silových polí.

Ilustraci toho, jak daleko pokročily simulace biomolekulární dynamiky, poskytuje „morče“ biologické simulace, BPTI. Simulace tohoto proteinu zkoumaly účinky polarizovatelnosti rozpouštědla a proteinu na jeho strukturu, solvataci a dynamiku (Kim a kol. 2005). Simulace molekulární dynamiky BPTI byly provedeny v explicitní vodě s použitím silových polí MM, které obsahují polarizaci pro oba voda a bílkoviny. Byly použity tři modelové potenciály pro vodu a dva modelové potenciály pro protein, z nichž dva z vodních modelů a jeden z proteinových modelů byly polarizovatelné. Bylo simulováno šest systémů pokrývajících všechny kombinace těchto polarizovatelných a nepolarizovatelných polí proteinů a vodní síly. Bylo zjištěno, že všech šest systémů se chová podobně v méně polárních částech proteinu (buď hydrofobních nebo slabě hydrofilních). V blízkosti částí proteinu, ve kterých se vyskytují relativně silná elektrostatická pole (tj. V blízkosti kladně nebo záporně nabitých zbytků), však bylo zjištěno, že struktura a dynamika vody jasně závisí na modelu použitého proteinu i vody. .

5. Metody empirické valenční vazby

Pro zkoumání některých důležitých otázek souvisejících s působením enzymů (např. Pro analýzu příčin katalýzy, tj. Proč enzymatická reakce probíhá rychleji než ekvivalentní, nekatalyzovaná reakce v roztoku), je nutné použít metodu, která zachycuje nejen základní detaily chemická reakce, ale také zahrnuje explicitní účinky prostředí enzymu a rozpouštědla. Jednou z pozoruhodných metod v této oblasti je model empirické valenční vazby (EVB) (Warshel 2003 Hong a kol. 2006 Truhlar 2007). V přístupu EVB jsou pro reprezentaci reakce zvoleny rezonanční struktury (např. Iontové a kovalentní rezonanční formy). Energie každé rezonanční formy je dána jednoduchým empirickým silovým polem (např. S ​​realistickým zpracováním roztažení důležitých vazeb, např. Pomocí Morseovy funkce). Potenciální energie je dána řešením související sekulární rovnice. EVB Hamiltonian je kalibrován tak, aby reprodukoval experimentální data pro známou a relevantní reakci v roztoku, nebo alternativně ab initio lze použít výsledky (Bentzien a kol. 1998). Okolní protein a roztok jsou modelovány empirickým silovým polem s odpovídajícím zpracováním elektrostatiky dlouhého dosahu. Volnou energii aktivace pro reakci v roztoku a v enzymu lze vypočítat pomocí simulací poruchy volné energie (Warshel 1997).

Jednou z hlavních výhod metody EVB je, že povrchy s volnou energií lze kalibrovat porovnáním s experimentálními daty pro referenční reakce v roztoku. Nicméně, jako v každé reprezentaci valenčních vazeb, je nezbytné, aby formy valenčních vazeb představovaly všechny rezonanční formy, které jsou důležité při reakci. Přitažlivou vlastností metody EVB je to, že je snadné používat při modelování reakce negeometrické reakční souřadnice, což může být u některých reakcí v kondenzované fázi výrazně přesnější. Energii lze použít jako reakční souřadnici sledováním cesty mezi optimy valenčních vazeb. Následuje postup mapování, který se postupně přesouvá z reakční složky do produktu. Při tomto mapování se bere v úvahu jak struktura rozpuštěné látky, tak náboj. Tato metoda vzorkování EVB deštníků lokalizuje správný přechodový stav v kombinované souřadnici reakce rozpuštěná látka - rozpouštědlo. To umožňuje vyhodnocení nerovnovážných solvatačních efektů (např. Warshel 2003). Jiné silné stránky metody byly diskutovány jinde (Villa & amp Warshel 2001). Metoda EVB je účinný a užitečný přístup, který se nyní stal široce přijímaným nástrojem pro studium reakcí v kondenzovaných fázích. Ilustrativní simulace s metodami EVB zahrnovaly studii alternativních mechanismů inzerce nukleotidů pro T7 DNA polymerázu (Florian a kol. 2003), vyšetřování přenosu protonů v 1- (trifluoracetylamino) -naftachinonu (Cembran & amp Gao 2007), modelování transportu protonů v iontovém kanálu (Chen a kol. 2007), studie reakčního mechanismu lidské aldózoreduktázy (Varnai & amp Warshel 2000) a zkoumání povahy protonového úzkého místa v redoxově vázaném přenosu protonů v cytochromu C oxidáza (Olsson a kol. 2005).

V jiné studii s použitím technik EVB použil Bjelic & amp. Aqvist (2004) dobře ověřený model homologie ke zkoumání způsobu vazby substrátu a mechanismu reakce proteázy malárie s novým aktivním místem. Tento enzym (histo-asparagová proteáza z parazita malárie Plasmodium falciparum) je cílem pro návrh léků proti malárii, ale jeho trojrozměrná struktura zatím není známa. Tato práce předpovídala strukturu enzymu a konformaci navázaného substrátu pomocí kombinace modelování homologie, automatizovaného dokování a simulací energetického profilu bez molekulární dynamiky/bez reakce. Jediným zbytkem aminokyseliny zapojeným přímo do reakce v predikovaném mechanismu je katalytický aspartát, přičemž histidinový zbytek zajišťuje stabilizaci. Vypočtená rychlost reakce dobře souhlasila s experimentálními kinetickými daty pro hexapeptidový substrát odvozený z lidského hemoglobinu.

6. Modelování pomocí kvantově chemických (elektronických struktur) metod

Kvantově chemické metody (např. ab initio výpočty molekulární orbitální nebo hustotní funkční teorie) lze v současné době prakticky použít ke studiu reakcí v neperiodických molekulárních systémech obsahujících řádově desítky atomů. Malé „shlukové“ modely přibližně této velikosti mohou představovat klíčové rysy enzymové reakce a mohou identifikovat pravděpodobné mechanismy. Aktivní místo enzymu je relativně malá oblast, často v rozštěpu nebo štěrbině proteinu, kde se váže substrát (substráty) (a kofaktor (y) v případech, kdy jsou zapojeny). Obsahuje zbytky, které se přímo účastní chemické reakce, a zbytky zapojené do vazby. Substráty jsou typicky vázány na aktivním místě několika slabými interakcemi, jako jsou vodíkové vazby, elektrostatické a van der Waalsovy síly. Klastry malých molekul lze použít k reprezentaci důležitých funkčních skupin (např. Postranních řetězců klíčových aminokyselin zapojených do katalýzy a (částí) substrátu nebo kofaktorů) s jejich polohami typicky převzatými z reprezentativní rentgenové krystalové struktury komplexu enzymů. Například acetát může představovat aspartátový postranní řetězec, imidazol může představovat histidin atd. Výpočty na modelech tohoto typu mohou zkoumat interakce mezi skupinami na aktivním místě a mohou poskytovat užitečné modely přechodových stavů a ​​reakčních meziproduktů. Lze je také použít k testování přesnosti různých úrovní výpočtů (např. Porovnání výsledků poloempirických s ab initio molekulární orbitální výpočty nebo různé úrovně ab initio léčba). Raha nedávno přezkoumala aplikace modelování QM v designu léčiv a kol. (2007).

Přístup modelování malých klastrů se ukázal zvláště užitečný při studiu reakčních mechanismů metaloenzymů. V mnoha metaloenzymech se všechny důležité chemické kroky odehrávají ve středu kovu (jeden nebo malý počet kovových iontů vázaných na jednom místě). Kovové ionty mohou také držet své ligandy na místě. To dává technickou výhodu omezení požadavku na omezení nebo omezení pro udržení správné aktivní struktury místa ve výpočtech. Spolehlivé výpočty metaloenzymů byly umožněny metodami založenými na teorii funkční hustoty. Populární funkcionály, jako je široce používaná hybridní funkce B3LYP, poskytují dobré výsledky pro mnoho reakcí, aniž by vyžadovaly nadměrné množství času v počítači, paměti nebo místa na disku, pro klastry poměrně velké velikosti. Práce Siegbahna a spolupracovníků (Himo & amp Siegbahn 2003) na mnoha enzymech je vynikajícím příkladem mechanistického vhledu, který mohou poskytnout výpočty na malých klastrech.

V klastrovém modelu obsahujícím různé malé molekuly představující důležité funkční skupiny může být možné optimalizovat geometrii komplexů představujících reaktanty, přechodový stav, meziprodukty a produkty kroků reakce. To může často stačit k diskriminaci alternativních možných mechanismů (Harvey a kol. 2006), protože energetický rozdíl mezi alternativními mechanismy je často velmi velký, větší než pravděpodobné vlivy prostředí na relativní energie. Pro rozlišení mezi alternativními navrhovanými mechanismy lze mechanismus vyloučit, pokud jsou pro něj vypočítané bariéry výrazně vyšší než experimentálně odvozená aktivační energie, v mezích přesnosti výpočetní metody. V malém modelu však mohou chybět některé důležité funkční skupiny a je třeba pečlivě zvážit, které skupiny zahrnout, a vyvážit tak výpočetní proveditelnost oproti touze po větším a rozsáhlejším modelu. Také, možná neintuitivně, větší klastrový model není vždy lepším modelem: větší model bude zahrnovat větší konformační složitost (konformační změny vzdálené od reakčního centra mohou uměle ovlivňovat relativní energie podél reakční cesty) a zahrnutí nestíněných nabitých skupin by také mohlo mít nerealisticky velké účinky na reakční energie. Účinky na životní prostředí, jako je solvatace, mohou být zahrnuty přibližně ve výpočtech na malých klastrových modelech, např. pomocí modelů kontinuální solvatace, ale tyto nemohou plně reprezentovat heterogenní elektrostatické prostředí v enzymu (Shurki & amp Warshel 2003). Důležitým technickým a praktickým aspektem klastrových/supermolekulových výpočtů je, že často může být obtížné optimalizovat geometrii modelu (např. Najít strukturu přechodového stavu) a současně zachovat správnou orientaci skupin v protein.

Přibližnější kvantově chemické metody (jako jsou semi-empirické molekulární orbitální techniky AM1 a PM3) mohou modelovat větší molekulární systémy (obsahující řádově stovky atomů). O semi-empirických metodách je však dobře známo, že jsou pro mnoho aplikací nepřesné (např. Někdy mohou být vystaveny velmi velkým chybám ve vypočítaných reakčních energiích). Rovněž je nelze přímo použít pro některé typy systémů (např. Pro mnoho přechodných kovů). Byly vyvinuty techniky (jako jsou metody „lineárního škálování“), které umožňují poloempirické výpočty elektronické struktury na celých proteinech (Van der Vaart a kol. 2 000 Khandogin a kol. 2003 Khandogin & amp York 2004). Uskutečňují se také významné kroky ke zlepšení škálovacích vlastností kvantových chemických metod vyšší úrovně, což umožní jejich aplikaci na větší systémy (Claeyssens a kol. 2006 Mata a kol. 2008).

Typické komplexy enzym -substrát, zejména pokud jsou modelovány pomocí explicitní reprezentace okolního rozpouštědla, budou obsahovat nejméně tisíce atomů a možná mnoho dalších. To je v současné době přesahuje dokonce i semi-empirické kvantově chemické metody pro modelování reakcí. Neméně důležitým aspektem při modelování reakce je, že výpočet (jednobodových) energií nestačí: důležité body (jako jsou struktury přechodových stavů) a nejlépe celé reakční cesty by měly být optimalizovány. K vytvoření reprezentativního souboru struktur může být nutné rozsáhlé konformační vzorkování. To jsou samy o sobě významné výzvy pro velké molekuly. Je třeba také vzít v úvahu prostředí enzymu: vodný roztok (ale některé enzymy působí v koncentrovaných roztocích, např. Ve vysokých koncentracích jiných proteinů, nebo za kyselých nebo zásaditých podmínek), membránách nebo v komplexech proteinů nebo nukleových kyselin. Vnitřní pohyby proteinů jsou velmi složité: může existovat mnoho konformačních substrátů a jedna struktura nemusí být skutečně reprezentativní (Zhang a kol. 2003). Aby bylo možné provádět rozsáhlé konformační vzorkování (např. Pro výpočet profilů volné energie Gao & amp Truhlar 2002), musí být metoda simulace dynamiky schopna vypočítat trajektorie o délce alespoň mnoha pikosekund. Jedním z užitečných přístupů může být použití simulací MM molekulární dynamiky (které mohou běžet v relativně dlouhých, nanosekundových časových měřítcích) ke generování více modelů pro výpočty mechanismů, čímž se zajistí široké vzorkování možných konfigurací enzymů (Lodola a kol. 2007). Pokud je k dispozici více různých krystalových struktur stejného enzymu, lze je použít jako různé výchozí modely ke zkoumání účinků strukturálních změn na reakci. Pro modelování ve velkém měřítku (např. Pro velké modely nebo pro začlenění konformační variability) může být užitečný přístup QM/MM, jak je popsáno v §7.

7. Kombinované metody QM/MM

Kombinované metody QM/MM jsou stále důležitější při modelování biologických systémů, zejména v rostoucí oblasti výpočetní enzymologie, tj.výpočetní modelování mechanismů reakce katalyzovaných enzymy (Mulholland 2005, 2008). V zásadě je přístup QM/MM jednoduchý: malá část systému je zpracována kvantově mechanicky, zatímco zbytek je zpracován pomocí MM (viz § 4). Ve studii mechanismu enzymové reakce by oblast QM byla typicky aktivním místem a zahrnovala reagující skupiny enzymu, substrátu a jakýchkoli kofaktorů, v nichž by oblast MM sestávala z velké nereaktivní části systému (obrázek 2) . Zpracování QM (metodou elektronické struktury, např ab initio nebo semi-empirický molekulární orbitál, nebo úroveň hustoty funkční teorie) umožňuje modelování rozbití a tvorby chemické vazby a elektronické přesmyky a polarizaci. Mohou být použity různé typy léčby interakce mezi oblastmi QM a MM. Pro aplikace na biologické makromolekuly, jako jsou proteiny, které jsou polární, je pravděpodobně důležité zahrnout polarizaci oblasti QM prostředím MM. Kombinace univerzálnosti a rozsahu použitelnosti metody elektronické struktury QM s účinností a rychlostí silového pole MM umožňuje studovat reakce ve velkých systémech. Jak je uvedeno v §4, moderní metody MM se dobře zabývají strukturou a interakcemi proteinů, takže můžeme zajistit, aby s nimi bylo v přístupu QM/MM zacházeno přesně. S nižšími úrovněmi teorie QM (např. Semi-empirické molekulární orbitální nebo přibližné hustotní funkční metody) jsou simulace molekulární dynamiky QM/MM možné.

Obrázek 2 Metody QM/MM jsou dobrým přístupem pro modelování enzymem katalyzovaných reakcí. Tento obrázek ukazuje obecné nastavení pro simulaci enzymu QM/MM. Substrát, katalytické zbytky a jakékoli kofaktory (červené) se ošetří metodou QM, která může zpracovávat procesy vytváření vazeb a lámání. Okolní protein (žlutý) a rozpouštědlo (modrý) se ošetří standardním empirickým silovým polem MM. Oblasti QM a MM interagují, takže jsou brány v úvahu reakční prostředí enzymu a rozpouštědla.

Metoda QM/MM byla poprvé použita na enzymem katalyzovanou reakci Warshel & amp Levitt (1976) v jejich klíčové studii reakčního mechanismu lysozymu slepičího bílku. Pro konjugované biomolekuly, jako je retinal, byly vyvinuty jednoduché metody QM/MM, zahrnující například základní ošetření QM π-elektronů s MM popisem σ-vázaného rámce (Warshel & amp Karplus 1972 Warshel 1976). Zájem o metody QM/MM v posledních letech rychle roste. Je zřejmé, že výpočty QM/MM mohou poskytnout užitečný pohled na reakce katalyzované enzymy (Garcia-Viloca a kol. 2004 Mulholland 2005 Senn & amp Thiel 2007 Mulholland 2008). Příkladem je identifikace katalytických funkcí pro zbytky aktivního místa (jako je konzervovaný prolin ve dvou na flavinu závislých monooxygenázách Ridder a kol. 2000, 2003), zkoumání otázek mechanismu (např. Porovnávání a rozlišování mezi alternativními navrhovanými mechanismy van der Kamp a kol. 2008) a navrhování a testování katalytických principů (jako je možný přínos konformačních efektů a stabilizace přechodových stavů v chorismate mutase Lyne a kol. 1995 Ranaghan a kol. 2003, 2004 Marti a kol. 2004 Ranaghan & amp Mulholland 2004 Claeyssens a kol. 2005 Guimaraes a kol. 2005). I pro tuto zdánlivě jednoduchou enzymatickou reakci (Claisenův přesmyk) se vedou živé debaty o původu katalýzy. Modelování bylo ústřední při formulování a testování navrhovaných mechanismů a hypotéz (obrázek 3).

Obrázek 3 QM/MM modelování reakce v enzymu chorismate mutase (Lyne a kol. 1995 Ranaghan a kol. 2003 Claeyssens a kol. 2006). Je ukázán přechodový stav pro konverzi chorismátu na prephenate, vázaného v aktivním místě enzymu. Chorismate mutase katalyzuje reakci elektrostatickou stabilizací přechodového stavu, zejména nabitým zbytkem argininu (také ukázaným) v blízkosti substrátu (Strajbl a kol. 2003A Claeyssens a kol. 2005 Guimaraes a kol. 2005).

V řadě široce používaných programů je k dispozici mnoho různých implementací QM/MM. Výpočty QM/MM lze provádět na různých různých úrovních výpočtu elektronické struktury QM: ab initio (Mulholland a kol. 2000 Woodcock a kol. 2003) nebo semi-empirický molekulární orbitál (Field a kol. 1990), hustota funkční (Lyne a kol. 1999) nebo přibližná hustota funkční (Cui a kol. 2001) úrovně. Nyní je možné provádět výpočty QM/MM s použitím velmi vysokých úrovní teorie elektronické struktury (např. Teorie spřažených klastrů s jednoduchým a dvojitým buzením). Tyto metody nabízejí potenciál vysoce přesných výsledků, blížících se „chemické přesnosti“ (do 1 kcal mol −1), alespoň pro část výpočtu QM (Claeyssens a kol. 2006 Mulholland 2007).

Struktury přechodových stavů lze optimalizovat ve výpočtech QM/MM (Prat-Resina a kol. 2004 Marti & amp Moliner 2005). Lze také vypočítat rozdíly volné energie, jako jsou aktivační volné energie, stejně jako kvantové efekty, jako je tunelování a korekce nulového bodu. Přibližnější, méně počítačově náročné metody QM/MM (jako jsou semi-empirické nebo self-konzistentní funkční hustá vazba hustoty náboje (SCC-DFTB) QM/MM) mají důležitou roli, protože umožňují provádět rozsáhlejší simulace ( např. molekulární dynamika Ridder a kol. (2002) nebo Monte Carlo simulace pro rozsáhlé konformační vzorkování a výpočet reakčních drah a pytloviny). Parametrizované semempirické metody mohou konkrétně poskytnout lepší přesnost pro konkrétní reakci (Gonzalez-Lafont a kol. 1991 Bowman a kol. 2007). Kromě parametrizace poloempirického (QM) modelu lze optimalizovat Lennard-Jonesovy (MM) parametry pro interakce QM/MM, což může být nezbytné k zajištění správné rovnováhy interakcí mezi oblastmi QM a MM (Martin a kol. 2002). Výpočty QM/MM na vysoké úrovni (např. ab initio nebo Hustota funkční úrovně QM) jsou pro některé systémy potřebné a mají důležitou roli při testování aproximativnějších metod (např. semi-empirických QM/MM), ale jsou velmi náročné na výpočetní prostředky.

Současný vývoj zahrnuje použití metod QM/MM při výpočtech relativních volných energií (např. Buď přímo (Riccardi a kol. 2005) nebo nepřímo prostřednictvím referenčního potenciálu (Muller & amp Warshel 1995 Wood a kol. 1999 Strajbl a kol. 2002, 2003A Ming a kol. 2004 Rod & amp Ryde 2005 Rosta a kol. 2006 Woods a kol. 2008)), například pro výpočet relativních vazebných afinit nebo molekulárního „dokování“ a „skórování“ ligandů v proteinech (Raha & amp Merz 2004). Metody QM/MM poskytují několik výhod oproti metodám MM ve studiích ligandů malých molekul navázaných na proteiny, včetně potenciálně lepšího fyzického popisu ligandu (např. Zahrnutím elektronické polarizace) a vyhýbání se potřebě časově náročného vývoje parametrů MM pro ligand. Metody MM mohou být také neadekvátní pro některé typy farmaceuticky důležitých cílových proteinů, zejména metaloproteinů (jako jsou enzymy cytochromu P450 zapojené do metabolismu léčiv Bathelt a kol. 2005). U takových biomolekulárních systémů může být použití přístupů QM/MM pro předpovědi relativní vazebné afinity nebo vazebného režimu výrazně lepší. S rostoucím výkonem počítače a pokračujícím metodologickým vývojem budou metody QM/MM jistě stále důležitější v praktických aplikacích, jako je návrh léků a související oblasti, jako je predikce metabolismu a toxicity léčiv (Mulholland 2005).

8. Ab initio Simulace molekulární dynamiky (Car – Parrinello)

Stále důležitější technika v biomolekulárních simulacích (Carloni a kol. 2002) je ab initio technika molekulární dynamiky, kterou poprvé navrhli Car a Parrinello asi před 20 lety (Car & amp Parrinello 1985 Remler & amp Madden 1990). Schéma kombinuje simulaci molekulární dynamiky a funkční hustotní teorii: integruje fiktivní dynamiku koeficientu vlnové funkce s klasickou molekulární dynamikou do jednoho rozšířeného Lagrangian. Klíčové je, že funkce elektronických vln jsou zahrnuty jako dynamické proměnné. Zpočátku je určena funkce konvergovaných vln a orbitaly se následně vyvíjejí současně se změnami v jaderné poloze. Orbitální parametry jsou zahrnuty jako proměnné s fiktivními hmotami v dynamice, analogické s jadernými polohami a hmotami. Jaderné síly nejsou v dynamice přesně správné, protože funkce elektronických vln není v prostoru orbitálních parametrů konvergována, ale tato chyba je řízena vhodnou volbou dynamických parametrů (např. Fiktivní masy). Na systém se vztahují omezení, aby se zajistilo, že orbitály zůstanou ortonormální. Nedávno byly přezkoumány aplikace simulací molekulární dynamiky Car – Parrinello na biomolekulární systémy (Dal Peraro a kol. 2007). Jedna relevantní aplikace těchto technik zkoumala katalytické místo galaktosoxidázy a biomimetického katalyzátoru (Röthlisberger a kol. 2000). Nedávná studie molekulární dynamiky QM/MM Car – Parrinello zkoumala protonační stav zbytků v draselném kanálu KcsA (Bucher a kol. 2007).

Navzdory vývoji vysoce efektivních kódů a algoritmů, ab initio simulace molekulární dynamiky jsou extrémně výpočetně nákladné a vyžadují velmi velké množství superpočítačového času. Poskytují výhodu oproti molekulární dynamice využívající empirická silová pole v tom, že metody elektronické struktury jsou schopny popsat reakce lámání a tvoření vazeb, a proto metody Car – Parrinello mohou v zásadě umožnit přímou simulaci chemických reakcí. Podobně překonávají další omezení silových polí MM: například přirozeně jsou zahrnuty efekty elektronické polarizace. Hlavními praktickými omezeními jsou velikost systémů, které lze simulovat, a časové měřítko proveditelných simulací dynamiky. Z tohoto důvodu jsou kombinované přístupy QM/MM také atraktivní ab initio simulace molekulární dynamiky. Parrinello a jeho spolupracovníci například vyvinuli schéma pro simulace molekulární dynamiky Car – Parrinello metodou QM/MM s programy CPMD a EGO (Eichinger a kol. 1999). Pomocí těchto propojených programů lze provádět efektivní a konzistentní simulace velkých systémů QM/MM Car – Parrinello, včetně explicitních sterických a elektrostatických účinků proteinu a jeho rozpouštědlového prostředí.

9. Závěry

Biomolekulární simulace je rychle se rozvíjející oblastí, která stále více přispívá k biologii. Celé pole biomolekulárního modelování je velmi rozsáhlé, a proto zde nebylo možné popsat všechny jeho aspekty. Jednou pozoruhodnou důležitou oblastí aplikace je strukturovaný návrh léčiv. Vývoj ve virtuálním screeningu založeném na struktuře byl přezkoumán například metodami McInnes (2007) dokování ligandů a skórovací funkce byly specificky pokryty jinými (Krömer 2007 Rajamani & amp Good 2007). Aplikace dokování ligandů v designu léčiv a současný vývoj zahrnutí flexibility proteinů popsali Cavasotto & amp Orry (2007) a Joseph-McCarthy a kol. (2007). Jiní diskutovali o oblasti výpočtů volných energií vázajících protein-ligand, včetně pokrytí skórovacích funkcí pro hodnocení vazebných afinit v takových komplexech (Raha & amp Merz 2005) a nových metod založených na fyzice (Huang a kol. 2006). Jednou vzrušující rozvíjející se oblastí, ve které hraje zásadní roli molekulární modelování, je proteinový design (Baker 2006 Lippow & amp Tidor 2007): vývoj zde, spoléhající se na praktické a spolehlivé metody modelování, slibuje cestu k novým katalyzátorům a komponentům pro biologicky inspirovanou nanotechnologii a molekulární medicínu . Rovněž stojí za to poukázat na určitý teoretický vývoj, například ve výpočtu volných energií nerovnovážnými přístupy, například prostřednictvím použití Jarzynského vztahu k výpočtu volných energií ze simulací řízené molekulární dynamiky (Crespo a kol. 2005 Roitberg 2005 Bastug & amp Kuyucak 2007). Celkově oblast biomolekulárního modelování a simulace prospívá a roste a její důležitost se v budoucnu určitě zvýší.


Rámec konečných prvků pro studium mechanické odezvy makromolekul: aplikace na hradlo mechanosenzitivního kanálu MscL

Gatingové dráhy mechanosenzitivních kanálů velké vodivosti (MscL) u dvou bakterií (Mycobacterium tuberculosis a Escherichia coli) jsou studovány pomocí metody konečných prvků. Fenomenologický model považuje transmembránové helixy za pružné tyče a lipidovou membránu za elastickou vrstvu konečné tloušťky, model je inspirován krystalovou strukturou MscL. Interakce mezi různými složkami kontinua jsou odvozeny z molekulárně-mechanických energetických výpočtů pomocí silonového silového pole CHARMM. Oba bakteriální MscL se plně otevírají při napětí v membráně v membráně a variace průměru pórů s napětím membrány je v podstatě lineární. Odhadované napětí brány se blíží experimentální hodnotě. Strukturální variace podél brány jsou v souladu s předchozími analýzami založenými na strukturálních modelech s experimentálními omezeními a zkreslenými simulacemi atomistické molekulární dynamiky. Při ohýbání membrány se ani MscL podstatně neotevře, i když v poloměru pórů dochází k výrazným a nemonotonním změnám. To zdůrazňuje, že chování hradel MscL závisí kriticky na formě mechanické poruchy a posiluje myšlenku, že klíčovým parametrem hradlování je laterální napětí v membráně, nikoli zakřivení membrány. Ve srovnání s populárními technikami založenými na všech atomech, jako jsou cílené nebo řízené simulace molekulární dynamiky, rámec kontinuální mechaniky založený na metodě konečných prvků nabízí jedinečnou alternativu k překlenutí podrobných mezimolekulárních interakcí a biologických procesů, které se vyskytují ve velkých prostorových měřítcích a dlouhých časových intervalech. Předpokládá se, že takový hierarchický víceúrovňový rámec najde velkou hodnotu při studiu různých biologických procesů zahrnujících komplexní mechanické deformace, jako je svalová kontrakce a mechanotransdukce.

Obrázky

Čtyři základní režimy deformace…

Čtyři základní režimy deformace membrány: ( A ) napětí, (...

Strukturní modely a MKP modely…

Strukturní modely a MKP modely Tb a E-coli MscL kanály.…

( A ) Schéma ekvi-biaxiálního napětí lipidové membrány a ...

Přizpůsobení nevázané interakce…

Přizpůsobení nevázané interakce mezi šroubovicemi E-coli -MscL. The X…

Srovnání mezi branami ...

Porovnání mezi branami z Tb -MscL pod ekvi-biaxiálním napětím: ( A )…

Srovnání mezi branami…

Porovnání mezi branami z E-coli -MscL pod ekvi-biaxiálním napětím: ( A…

Výsledky pro ekvi-biaxiální napětí. (…

Výsledky pro ekvi-biaxiální napětí. ( A ) Porovnání zlomkového kanálu ...

Výsledky současného FEM…

Výsledky současného modelu MKP, protože membrána byla podrobena osově symetrickému ...

Výsledky pro osově symetrické ohýbání…

Výsledky pro osově symetrické ohýbání současného modelu MKP. ( A )…


Podívejte se na video: Aplikace inzulínu3 (Leden 2022).