Informace

Jaký je nejlepší způsob výpočtu biologické rozmanitosti vzorků z tabulek bakteriální/virové OTU?


Mám několik velkých tabulek OTU bakteriálních a virových datových sad. Ukázky jsou na různých místech a v různých časech.

Chtěl bych si představit „různorodost“ komunity po celou dobu, pro kterou mám data. Bylo by například zajímavé zjistit, zda rozmanitost komunity vrcholí v letních měsících a klesá v zimních měsících- v opakujícím se vzoru.

Nenarazil jsem na mnoho rad nebo literatury, která by se zabývala hledáním rozmanitosti u velkých datových sad OTU. Vzhledem k tomu, že OTU jsou v podstatě libovolné a že jich jsou tisíce, jaký je nejlepší způsob, jak vypočítat a vizualizovat rozmanitost jednotlivých vzorků?

S veganským balíčkem na R je docela snadné vypočítat index rozmanitosti Shannon/Simpsons pro tabulku OTU. Můžete to jednoduše použít na „surové“ tabulce OTU?


Většinou souhlasím s odpovědí @Nathana, a zejména s odkazy, které poskytl.

Tak jakoShannon&Simpsonindexy mohou být obtížně interpretovatelné a mohou být neintuitivní, dávám přednost použitíKopecrozmanitosti, jak navrhuje Nathan (doporučení z Jost 2006 a 2007 je skvělé si o tom přečíst). Hlavním argumentem je, že různorodost Hill dává efektivní počet druhů které jsou srovnatelné mezi vzorky a dodržují princip duplikace.

Rozmanitost kopců závisí na jednotném vzorci (viz tento článek na Wikipedii) s jedním parametrem,q. Zvyšující se hodnoty proqodpovídají rostoucí váze početností taxonů ve výpočtu rozmanitosti:

  • Dsq = 0neberou v úvahu početnost taxonů, stejně tak počet taxonů, popřbohatství
  • Dsq = 1není definován, ale asymptoticky aproximován pomocíe^HkdeHje Shannonova entropie.D_q1je efektivní počet druhů s váhou hojnosti.
  • Dsq = 2odpovídáInverzní Simpsonindex (1/D_Simpson).D_q2váží hojnější taxony ještě silněji.

Lze zvolit libovolnou hodnotuq(sq = 1s limiteme^H) a porovnání odhadů rozmanitosti pro různéqvám může poskytnout představu o vzorkuvyrovnanost. Nastaveníq = ∞dáváBerger-Parkerův index(podíl jedinců ve vzorku patřících k nejhojnějším druhům).

Důležité je, že pro analýzy alfa div na OTU (na bázi 16S/18S) bych vždy nejprve vygeneroval křivky vzácnosti a poté generoval odhady diverzity při společném, vzácném počtu čtení na vzorek.

Většinu z toho můžete udělat pomocí balíčku R.vegan. Thephyloseqbalíček poskytuje různé odhady alfa div v jednom příkazu, ale žádné různorodosti Hill. Napsal jsem několik jednoduchých funkcí k provedení zředění a výpočtu (zředěného nebo nezředěného) rozmanitosti kopců z matice tabulky OTU:

funkce.rarefaction.R

function.alpha_diversity.R


Theveganbalíček je vhodný pro vaše potřeby, ale možná zjistíte, že potřebujete použít jiné nebo kódovat vlastní funkce.

Kvůli zkreslení sekvenování byste neměli věřit „hrubým“ počtům vašich OTU (pokud k tomu nemáte pádný důvod-nejsem si jistý, jak byly vaše OTU získány). Spíše můžete zvážit relativizaci matice podle jednotlivých druhů. Můžete tak učinit pomocídecostand ()funkce.

Poté můžete použítrozmanitost()funkce pro analýzu rozmanitosti; ale můžete také zvážit prozkoumání dalších přístupů k posouzení místní rozmanitosti, jako jsou přístupy založené na vzácnosti a vzorkování, ekvivalenty druhů a počet kopců (Hill 1973, Gotelli a Colwell 2001, Jost 2006, 2007). Velmi užitečné jsou knihy od Magurrana a McGilla (2011) a Legendra a Legendra (2012).


Computer-Aided Drug Design 9789811568145, 9789811568152

Obsah :
Úvodní slovo
Předmluva
Potvrzení
Obsah
O editoru
1: Výpočetní přístupy při objevování a navrhování léčiv
1.1 Úvod
1.2 Konstrukce léčiv na základě struktury
1.2.1 Identifikace cíle
1.2.2 Modelování a vizualizace struktury makromolekul
1.2.3 Predikce a analýza závazných stránek
1.2.4 Molekulární dokování
1.2.4.1 Flexibilní dokování
1.2.4.2 Pevné dokování
1.2.5 Strukturální virtuální screening
1.2.6 Ověření molekulárního dokování
1.3 Projektování založené na ligandech
1.3.1 Modelování farmakoforu
1.3.2 Vztah kvantitativní struktury a aktivity (QSAR)
1.3.2.1 CoMFA
1.3.2.2 CoMSIA
1.4 Výpočet energie HOMO a LUMO
1.5 Predikce a analýza ADMET
1.6 Simulace molekulární dynamiky
1.7 Identifikace nových léčiv podobných molekul pro hyperurikémii z jáhel: případová studie
1.8 Objev a návrh přírodních sloučenin olova pro rakovinu jater: případová studie
1.9 Příklady léků syntetizovaných pomocí CADD
1.10 Úspěch a omezení
1.11 Závěr
Reference
2: Molekulární modelování proteinů: metody, nedávné pokroky a budoucí vyhlídky
2.1 Úvod
2.1.1 Aminokyseliny
2.1.2 Základní principy struktury bílkovin
2.2 Exploze dat souvisejících s bílkovinami
2.3 Stanovení struktury bílkovin
2.3.1 Rentgenová krystalografie
2.3.2 NMR spektroskopie
2.3.3 3D elektronová mikroskopie
2.4 Predikce struktury bílkovin
2.4.1 Homologie nebo srovnávací modelování
2.4.1.1 Rozpoznání šablony a počáteční zarovnání
2.4.1.2 Oprava zarovnání
2.4.1.3 Modelování strukturálně chráněné oblasti (SCR) a generování páteře
2.4.1.4 Modelování smyčky
Na základě znalostí
Energeticky založené
2.4.1.5 Modelování postranního řetězce
2.4.1.6 Optimalizace modelu
Pole kvantové síly
Samoparametrizující silová pole
2.4.1.7 Ověření modelu
2.4.2 Fold Recognition nebo Threading Method
2.4.3 Metody Ab Initio
2.5 Hodnocení a validace modelované struktury
2.6 Nedávné pokroky v predikčních přístupech
2.7 Aplikace
2.8 Závěr
Reference
3: Přístupy predikce dutin/vazebných stránek a jejich aplikace
3.1 Úvod
3.2 Cílová molekula
3.3 Závazný web a aktivní web
3.4 Molekula ligandu
3.5 Vazba
3.6 Chemická specifičnost
3.7 Vazebný web a molekulární interakce
3.7.1 Interakce protein-léčivo
3.7.1.1 Reverzibilní vazba
3.7.1.2 Nevratné vazby
3.7.1.3 Faktory ovlivňující vazbu protein-léčivo
3.7.1.4 Role molekul vody
3.7.2 Interakce mezi léčivem a nukleovou kyselinou
3.7.3 Interakce protein-protein
3.7.4 Interakce proteinu s nukleovou kyselinou, lipidem a sacharidem
3.8 Předpověď závazného webu
3.8.1 Evoluční algoritmy/předpovědi založené na sekvencích
3.8.1.1 Přístup založený na jediném zbytku
3.8.1.2 Přístup založený na okně
3.8.2 Energetické algoritmy
3.8.3 Algoritmus založený na geometrii/předpovědi založené na struktuře
3.9 Přístupy
3.9.1 Statistický přístup
3.9.2 Strojové učení
3.9.3 Meta-prediktory
3.10 Predikční nástroje a servery
3.11 Ověření závazného webu
3.12 Role vazebného místa v navrhování léčiv
3.13 Nedávné pokroky a budoucí perspektiva
3.14 Závěr
Reference
4: Role nástrojů ADMET v aktuálním scénáři: Aplikace a omezení
4.1 Úvod
4.1.1 Predikce ADMET
4.1.2 Parametry ADMET a jejich role
4.2 Význam ADMET
4.3 Vyvíjející se věda ADMET
4.4 Modely bariéry krve a mozku
4.5 Predikce ADMET
4.6 Strategie pro navrhování modelu ADMET
4.6.1 Výběr experimentálních údajů
4.6.2 Výpočet fyzikálně -chemických parametrů nebo hodnot deskriptoru
4.6.3 Metody a nástroje predikce ADMET
4.6.3.1 Rekurzivní regrese dělení
4.6.3.2 Relace s částečným nejmenším čtvercem (PLS)
4.6.3.3 Náhodné lesy (RF)
4.6.3.4 Rozhodovací stromy
4.6.3.5 Naivní Bayesovy klasifikátory
4.6.3.6 k-nejbližší soused (k-NN)
4.6.3.7 Podpora vektorového stroje (SVM)
4.7 Nástroje ADMET
4.8 Výzvy v současném scénáři a budoucí perspektivě
4.9 Závěry
Reference
5: Zdroje databáze pro zjišťování drog
5.1 Úvod
5.2 Informace o terapeutickém cíli
5.2.1 Universal Protein Resource (UniProt)
5.2.1.1 UniProtKnowledgeBase (UniProtKB)
5.2.1.2 Referenční klastry UniProt (UniRef)
5.2.1.3 Archiv UniProt (UniParc)
5.2.2 Protein Data Bank (PDB)
5.2.3 Databáze molekulárního modelování
5.2.4 Terapeutická cílová databáze
5.2.5 Databáze cílů bylinných přísad (HIT)
5.2.6 SuperTarget
5.3 Chemické informace
5.3.1 PubChem
5.3.2 Zinek
5.3.3 CHEMBL
5.3.4 Chemické subjekty biologického zájmu (ChEBI)
5.3.5 Databáze NCI
5.3.6 ChemDB
5.3.7 ChemSpider
5.3.8 Vazba DB
5.3.9 PDBbind
5.3.10 Toxin a databáze toxinů (T3DB)
5.3.11 BIAdb
5.3.12 Super Natural II
5.3.13 Přirozeně se vyskytující cílová databáze aktivity protirakovinných sloučenin na bázi rostlin (NPACT)
5.3.14 Slovník přírodních produktů online
5.3.15 Ligand Expo
5.3.16 SuperLigandy
5.3.17 Toxikologická datová síť
5.4 Informace o molekule léčiva
5.4.1 DrugBank
5.4.2 SuperDRUG2
5.4.3 PharmGKB
5.4.4 Vyhledávací nástroj pro interakce chemikálií (STITCH)
5.5 Informace o metabolické dráze
5.5.1 Kjótská encyklopedie genů a genomů (KEGG)
5.5.2 Databáze lidských metabolomů (HMDB)
5.5.3 Databáze malých molekulárních cest (SMPDB)
5.5.4 BiGG
5.5.5 Databáze MetaboLights
5.5.6 BioCyc
5.5.7 Reactome
5.5.8 WikiPathways
5.6 Informace o chorobách a fyziologii
5.6.1 Online Mendelian Inheritance in Man (OMIM)
5.6.2 METAGEN
5.6.3 RAMEDIS
5.6.4 Online metabolická a molekulární podstata dědičné nemoci (OMMBID)
5.7 Informace o peptidu
5.7.1 PepBank
5.7.2 StraPep
5.7.3 Antimikrobiální peptidová databáze (APD)
5.7.4 CAMPR3
5.7.5 CancerPPD
5.8 Výzvy a budoucí perspektiva
5.9 Shrnutí
Reference
6: Molekulární dokování a konstrukce léčiv na základě struktury
6.1 Úvod
6.2 Pokyny pro dokování
6.2.1 Hardwarové a softwarové požadavky na molekulární dokování
6.2.2 Proces ukotvení
6.2.3 Příprava ligandu a bílkovin
6.2.4 Strategie konformací ligandů
6.2.5 Funkce bodování
6.2.5.1 Silové pole
6.2.5.2 Empirické bodování
6.2.5.3 Hodnocení založené na znalostech
6.2.6 Dokování souboru
6.2.7 Konsensuální dokování
6.3 Různé typy dokování na základě interakcí
6.3.1 Dokování protein-ligand
6.3.2 Dokování ligandu s proteinovým peptidem
6.3.3 Dokování protein-protein
6.3.4 Dokování protein-nukleová kyselina/dokování nukleových kyselin-ligand
6.4 Rozpouštění vody a dokování
6.5 Dokovací nástroje
6.6 Virtuální promítání
6.7 Analýza výsledků dokování
6.8 Omezení dokovacích algoritmů a budoucí rozsah
6.9 Hlavní vývoj v dokování
6.10 Závěr
Reference
7: Simulace molekulární dynamiky proteinů a komplexů protein-ligand
7.1 Historie a pozadí
7.2 Úvod
7.3 Princip simulace MD
7.3.1 Periodické okrajové podmínky
7.3.2 Ewaldovy sumační techniky
7.3.3 Metoda Ewaldovy částicové sítě
7.3.4 Termostaty v MD
7.3.5 Modely rozpouštědel
7.3.6 Metody minimalizace energie v simulacích MD
7.4 Aktuální nástroje pro simulaci MD
7.4.1 Nedávné pokroky v hardwaru pro spuštění simulace MD
7.4.2 GROMACS
7.4.3 ŽLUTÁ
7.4.4 GUARMM-GUI
7.4.5 NAMD
7.4.6 Kvantová mechanika/molekulární mechanika (QM/MM)
7.4.7 HyperChem
7.5 Další pokročilé metody pro simulaci MD
7.5.1 Metadynamika
7.6 Analýza MD trajektorií prostřednictvím softwaru založeného na GUI
7.6.1 Vizuální molekulární dynamika
7.6.2 PyMOL
7.6.3 Chiméra
7.7 Strukturální parametry pro analýzu simulace MD
7.7.1 RMSD
7.7.2 RMSF
7.7.3 Poloměr otáčení
7.7.4 Kontakty protein-ligand
7.7.5 SASA
7.7.6 Analýza hlavních komponent nebo základní dynamika
7.7.7 Sekundární strukturní analýza
7.8 Aplikace simulace MD
7.8.1 Mutační analýza
7.8.2 Aplikace při navrhování léčiv
7.8.2.1 Navrhování inhibitoru proti MtbICL
7.8.2.2 Navrhování inhibitoru proti Fasciola gigantica Thioredoxin Glutathion reduktáza
7.8.3 Rozbalovací studie
7.8.3.1 Rozvinutí FgGST1 indukované močovinou
7.8.3.2 Analýza rozkládání indukovaná GdnHCl
7.8.3.3 Účinky indukované pH na strukturu a stabilitu proteinu
7.9 Závěry
Reference
8: Výpočtové přístupy k identifikaci drogových cílů
8.1 Úvod
8.2 Cíle na drogy
8.3 Identifikace drogového cíle
8.4 Výpočtové přístupy k identifikaci drogových cílů
8.5 Homologické přístupy
8.5.1 Lidští homologové
8.5.2 Homologové lidského mikrobiomu
8.5.3 Essentiality
8.5.4 Homologové faktoru virulence
8.5.5 Homologové cílící na drogy
8.5.6 Mobilní umístění
8.5.7 Role v biologické dráze
8.5.8 Případová studie: Subtraktivní přístup k identifikaci drogových cílů
8.6 Síťové přístupy
8.6.1 Drogový cíl založený na centrálnosti
8.6.1.1 Rozbočovače jako cíl
8.6.1.2 Cílový cíl založený na vzájemnosti
8.6.1.3 Mezoskopický cíl založený na centrálnosti
8.6.1.4 Cílový lék na základě hmotnosti
8.6.2 Omezení
8.7 Vlastnosti ideálního drogového cíle
8.8 Obchodovatelnost drogového cíle
8.8.1 Význam obchodovatelnosti
8.9 Výpočetní metody pro hodnocení obchodovatelnosti
8.9.1 Metody založené na sekvencích
8.9.2 Metody založené na struktuře
8.9.2.1 Identifikace dutin a vazebných kapes
8.9.2.2 Obchodovatelnost vazebné kapsy
Poloha atomů
Velikost dutiny
8.9.2.3 Posouzení specifičnosti cíle
Posouzení založené na sekvenčním zarovnání
Hodnocení založené na zarovnání struktury
8.9.3 Kvantifikace léčivosti
8.9.4 Hlavní obavy
8.9.4.1 Velikost tréninkových sad
8.9.4.2 Flexibilita vazebného místa
8.10 Zjišťování léčiv na základě cílů
8.10.1 Navrhování víceúčelových léčiv
8.10.1.1 Identifikace sady cílů `` Více cílů``
8.10.1.2 Generace vícecílového farmakoforu
8.10.1.3 Virtuální promítání
8.10.1.4 Generování nebo výběr vícecílové sloučeniny
8.10.1.5 Vyhodnocení a optimalizace sloučeniny specifické pro více cílů
8.11 Shrnutí
Reference
9: Výpočetní techniky pro návrh a vývoj potenciálních zákazníků
9.1 Úvod
9.2 Vysoce výkonný screening
9.2.1 Návrh testu
9.2.2 Biochemické testy
9.2.3 Testy celých buněk
9.2.4 Automatické metody vytváření knihoven a robotiky v HTS
9.2.5 Profilování
9.2.6 Výdaje na screening a outsourcing
9.3 Teorie QSAR
9.4 Molekulární deskriptory používané v QSAR
9.5 Metody QSAR
9.5.1 Metody 2D QSAR
9.5.1.1 Modely volné energie-Hanschova analýza Lineární volný energetický vztah
9.5.1.2 Matematický model
Zdarma Wilsonova analýza
Statistické metody
Diskriminační analýza
Klastrová analýza
9.5.1.3 Analýza hlavních komponent (PCA)
9.5.1.4 Kvantové mechanické metody
9.5.2 3D-QSAR
9.5.2.1 Analýza molekulárního tvaru (MSA)
9.5.2.2 Samoorganizující se analýza molekulárního pole (SOMFA)
9.5.2.3 Srovnávací analýza molekulárního pole (CoMFA)
9.5.2.4 Srovnávací analýza indexů molekulární podobnosti (CoMSIA)
9.5.2.5 3D modelování farmakoforu
9.5.3 4D-QSAR
9.5.4 5D-QSAR
9.5.5 4D vs 5D-QSAR
9.6 ADME Screening
9.6.1 Absorpce
9.6.1.1 Biologické faktory
9.6.1.2 Pasivní difúze
9.6.1.3 Přeprava zprostředkovaná dopravcem
9.6.1.4 Místní průtok krve
9.6.1.5 Doba vyprazdňování žaludku
9.6.1.6 Teorie rozdělení pH
9.6.1.7 Zachycování iontů
9.6.1.8 Chemické úpravy ovlivňují absorpci
9.6.1.9 Optimalizace absorpce
9.6.2 Distribuce
9.6.2.1 Optimalizace distribuce
9.6.3 Metabolismus
9.6.3.1 Fáze I
Oxidace
Snížení
Hydrolýza
9.6.3.2 Konjugace fáze II
9.6.3.3 Faktory ovlivňující metabolismus léčiva
9.6.3.4 Optimalizace metabolismu
9.6.4 Vylučování
9.6.4.1 Faktory ovlivňující vlastnosti ADME a proces modelování
9.6.4.2 Podobnost s drogami
9.6.4.3 Lipofilita
9.6.4.4 Rozpustnost
9.6.4.5 Farmakokinetický proces
9.7 Toxikologický screening
9.7.1 Akutní systémová toxicita
9.7.2 Toxikologické koncové body
9.7.3 Strukturální výstrahy a metoda založená na pravidlech
9.7.4 Přečtěte si metody napříč chemickými kategoriemi
9.7.5 Vztahový model kvantitativní struktury a aktivity pomocí statistických metod
9.7.6 Pokyny Organizace pro hospodářskou spolupráci a rozvoj (OECD)
9.7.6.1 Optimalizace toxicity
9.8 Omezení a budoucí rozsah
9.9 Závěry
Reference
10: Pokroky v modelování farmakoforů a jeho role v navrhování léčiv
10.1 Úvod
10.2 Funkce ve farmakoforu
10.3 Modelování farmakoforu
10.3.1 Farmakor na bázi ligandu
10.3.2 Budování farmakoforu
10.3.2.1 Příprava ligandu
10.3.2.2 Mapování funkcí farmakoforu
10.3.2.3 Hledání v běžném farmakoforu
10.3.2.4 Hodnocení společného farmakoforu
10.3.3 Algoritmy používané k sestavení farmakoforu
10.3.4 Farmakofor na bázi struktury
10.3.4.1 Opětovné dokoupení Co-Crystal Ligand
10.3.4.2 Skóre pro farmakoforická místa
10.3.4.3 Budování farmakoforické hypotézy
10.4 Nástroje pro stavbu farmakoforu
10.5 Ověření hypotézy farmakoforu
10.6 Případová studie struktury a farmakoforu na bázi ligandu
10.7 Použití farmakoforu
10.7.1 Virtuální promítání
10.7.1.1 Instance virtuálního prověřování a jeho pracovní postup
10.7.2 Fingerphore Fingerprint
10.7.2.1 Příklad vyhledání otisku prstu pomocí farmakoforu
10.7.3 De Novo Ligand Design
10.7.3.1 Instance De Novo Ligand Design
10.8 Příběhy o úspěchu při navrhování léčiv založených na farmakoforech
10.9 Význam farmakoforu
10.10 Downside of Pharmacophore Modeling
10.11 Závěr
Reference
11: In Silico Designing of Vaccines: Methods, Tools, and their limitations
11.1 Úvod
11.1.1 Živá oslabená vakcína
11.1.2 Inaktivovaná vakcína
11.1.3 Vakcína podjednotky
11.1.4 Rekombinantní vektorové a DNA vakcíny
11.1.5 Vakcíny na bázi epitopů
11.2 Epitopy B a T buněk
11.2.1 Epitopy B buněk
11.2.2 Epitopy T buněk a jejich zpracování
11.3 Bioinformatika v designu vakcín
11.4 Predikční nástroje pro vazbu MHC třídy I a II
11.4.1 NetMHC
11.4.2 NetMHCPan
11.4.3 SYFPEITHI
11.4.4 ProPred-I
11.4.5 RANKPEP
11,4,6 MHCPred
11.4.7 EpiJen
11.4.8 SVMHC
11.4.9 MULTIPRED
11.4.10 ProPred
11.4.11 MHC2Pred
11.5 Predikce epitopu CTL
11.5.1 NetCTL
11.5.2 CTLPred
11.5.3 NetChop
11.5.4 MAPPP
11.5.5 Pcleavage
11.6 Predikce epitopu B buněk
11.6.1 BCPred
11,6,2 LBtope
11.6.3 ABCPred
11.6.4 BepiPred 2.0
11.6.5 Bcepred
11.6.6 DiscoTope
11.6.7 ElliPro
11.6.8 PEASE
11.7 Metody pro silikonové navrhování vakcín na bázi epitopů
11.7.1 Výběr proteinů
11.7.2 Predikce a analýza epitopu
11.7.3 Molekulární dokování a simulace molekulární dynamiky
11.7.4 Konstrukce vakcíny
11.8 Případové studie navrhování vakcín
11.8.1 Navrhování vakcín pro virové patogeny
11.8.2 Navrhování vakcín pro bakterie
11.8.3 Navrhování vakcín pro jiné parazity
11.9 Omezení a výzvy
11.10 Závěr
Reference
12: Přístupy strojového učení k racionálnímu designu léčiv
12.1 Drogový průmysl
12.2 Potrubí pro objevování léčiv
12.2.1 Zjištění cíle
12.2.2 Ověření cíle
12.2.3 Identifikace svodů
12.2.4 Vedoucí optimalizace
12.2.5 Předklinická fáze
12.2.6 Klinické studie
12.2.6.1 Fáze I
12.2.6.2 Fáze II
12.2.6.3 Fáze III
12.2.6.4 Fáze IV
12.3 Dimenze a složitost problému a role technik ML
12.4 Genetické algoritmy
12.4.1 Práce s genetickými algoritmy
12.4.2 Operátory genetického algoritmu
12.4.2.1 Operátor přirozeného výběru
12.4.2.2 Stochastický odběr s výměnou
12.4.2.3 Stochastický univerzální odběr vzorků
12.4.2.4 Operátor křížení/rekombinace
12.4.2.5 Operátor mutací
12.5 Umělé neurální sítě
12.5.1 Jak funguje lidský mozek?
12.5.2 Jednoduchý umělý neuron
12.5.3 Architektura ANN
12.6 Hluboké učení (DL)
12.7 Podpora vektorových strojů
12.8 Umělá inteligence a objevování drog
12.9 Aplikace ANN, GA a dalších ML algoritmů při zjišťování drog
12.9.1 Molekulární dokování
12.9.2 Modelování farmakoforu
12.9.3 Vztah kvantitativní struktury a aktivity (QSAR)
12.10 Závěry
Reference

Náhled citace

Počítačem podporovaný návrh léčiv

Počítačem podporovaný návrh léčiv

Počítačem podporovaný návrh léčiv

Redaktor Dev Bukhsh Singh Katedra biotechnologie, Ústav biologických věd a biotechnologie Chhatrapati Shahu Ji Maharaj University Kanpur, Uttar Pradesh, Indie

ISBN 978-981-15-6814-5 ISBN 978-981-15-6815-2 https://doi.org/10.1007/978-981-15-6815-2

# Redakce (je -li relevantní) a autoři, na základě výhradní licence společnosti Springer Nature Singapore Pte Ltd. 2020 Toto dílo podléhá autorským právům. Všechna práva jsou výhradně a výhradně licencována vydavatelem, ať už jde o celý materiál nebo jeho část, konkrétně o práva na překlad, dotisk, opětovné použití ilustrací, recitaci, vysílání, reprodukci na mikrofilmech nebo jakýmkoli jiným fyzickým způsobem a přenos nebo ukládání a získávání informací, elektronická adaptace, počítačový software nebo podobná nebo odlišná metodika, která je nyní známá nebo dále vyvinutá. Použití obecných popisných jmen, registrovaných názvů, ochranných známek, servisních značek atd. V této publikaci neznamená, že i když chybí konkrétní prohlášení, že tato jména nepodléhají příslušným ochranným zákonům a předpisům, a proto jsou zdarma pro obecné použití. použití. Vydavatel, autoři a redaktoři mohou bezpečně předpokládat, že rady a informace v této knize jsou k datu vydání považovány za pravdivé a přesné. Vydavatel ani autoři nebo redaktoři neposkytují záruku, vyjádřenou ani předpokládanou, s ohledem na zde obsažený materiál nebo za případné chyby či opomenutí. Vydavatel zůstává neutrální, pokud jde o jurisdikční nároky ve zveřejněných mapách a institucionální vztahy. Tento otisk Springer je publikován registrovanou společností Springer Nature Singapore Pte Ltd. Adresa registrované společnosti je: 152 Beach Road, #21-01/04 Gateway East, Singapore 189721, Singapur

Již od rozbití lidského genomu na začátku tohoto století se vědci zabývají lokalizací drogových cílů a navrhováním a vývojem nových léků prostřednictvím přístupu systému. To vedlo k obrovskému snížení nákladů na výzkum a výrobu. Dříve proces navrhování léků trval mnoho desetiletí a probíhal nahodile bez jakéhokoli směru. Nárůst řešení v bioinformatice již předefinoval způsob, jakým jsou prováděny zkoušky na léčivech, a posun od in vitro k in silico. V této době vícenásobné rezistence vůči léčivům by mohl být design silikonových léků použit ke zkrácení doby objevování a tento problém zůstane největší výzvou pro nadcházející roky. V současném rychle se měnícím scénáři je obtížné zvládnout expresivní soudržnost v této rychle rostoucí oblasti navrhování léků. Jsem rád, že se Dr. Dev odvážil shromáždit dvanáct dobře napsaných kapitol a přinesl upravenou knihu s názvem „Computer-Aided Drug Design“, kterou vydalo Springer Nature, Singapur. Mám pocit, že se autorům docela daří „sloučit“ jinak různorodá témata této rychle se rozvíjející oblasti. Jsem si jist, že tato kniha bude mimořádně užitečná nejen pro studenty bakalářského a postgraduálního studia, ale také pro výzkumné pracovníky, vědce a farmaceutický průmysl zabývající se vývojem nových léků. Doufám, že čtenáři této knihy v budoucnu přispějí k tomu, aby byl text užitečnější pro další rozvoj tohoto důležitého pole designu drog podporovaných počítačem. Hony. Profesor, IIIT-Allahabad Prayagraj, Indie

Počítačově podporovaný návrh léčiv využívá výpočetní přístupy pro analýzu cíle, screening a interakci ligandů, simulaci komplexu cíl-ligand, optimalizaci sloučenin olova, analýzu QSAR a studie ADMET. Při navrhování léčiv na bázi struktury jsou molekuly ligandů stavěny s ohledem na vazebnou dutinu cíle sestavováním malých substruktur postupně. Navrhování léčiv na bázi ligandu zahrnuje 2D/3D analýzu a chemickou modifikaci ligandu, o kterém je známo, že interaguje s lékovým cílem onemocnění. Bylo vyvinuto velké množství výpočetních nástrojů, které splňují různé cíle ve způsobu navrhování léčiv. Existuje mnoho úspěšných příběhů o navrhování drog pomocí počítače. Toto pole přilákalo mnoho vědců pracujících v různých oblastech znalostí, jako je chemie, fyzika, biologie, matematika a počítačová věda. Při navrhování léčiv je vyžadováno systematické a postupné používání různých počítačově podporovaných nástrojů/softwaru pro navrhování léčiv. Čas od času došlo k velkému pokroku v algoritmech a přístupech počítačového navrhování léčiv. Diskutovalo se také o stávajících omezeních nástrojů a přístupů používaných při navrhování léčiv, což může motivovat čtenáře a výzkumné pracovníky k překonání těchto výzev v budoucnosti. Tato kniha „Computer-Aided Drug Design“ byla napsána s ohledem na potřebu výzkumných pracovníků a studentů pracujících v oblasti počítačového navrhování drog. Tato kniha nejenže představuje diskusi o nejnovějších pokrokech v oblasti počítačového navrhování drog, ale také poskytuje základní znalosti o principech, přístupech a nástrojích používaných při navrhování drog. Tato kniha obsahuje diskuzi o zdrojích biologické databáze používaných k objevování léčiv. Jedna kapitola je zaměřena na výpočetní přístupy a zdroje použité při navrhování vakcín. Podobně byla zahrnuta základní diskuse a aplikace přístupů strojového učení, jako je genetický algoritmus, umělá neurální síť a podpůrný vektorový stroj. Rovněž vysvětluje základy a použití různých biologických, fyzikálních a chemických parametrů používaných pro modelování, simulaci a predikci ADMET. Kapitoly poskytují souhrn souvisejících případových studií spolu s aplikací, výhodami/nevýhodami, omezeními a budoucími perspektivami souvisejícími s titulem. Kroky a použití různých výpočetních přístupů byly vysvětleny pomocí jednoduchých, vhodných a úhledných skic a ilustrací. Tato kniha je plná spousty zdrojů, které mohou žáka vést a motivovat, aby pokračoval v navrhování drog. vii

Doufám, že tato kniha bude velmi nápomocná při pochopení základů a nedávných pokroků v navrhování drog podporovaných počítačem. Snažil jsem se ze všech sil představit čtenářům a dalším vědeckým komunitám kvalitní výtvor. Tato kniha pokryje potřebu širokého spektra předmětů, jako jsou bioinformatika, biotechnologie, biochemie a farmaceutické vědy. Během procesu revize a úprav bylo zahrnuto mnoho návrhů, oprav a vhodného přidání nových témat. Přesto se těším na vaše cenné návrhy a zpětnou vazbu související s kvalitou obsahu knihy. Kanpur, Indie

Jsem velmi vděčný Prof. (paní) Krishna Mishra (Prayagraj), proslulému vědci a pedagogovi za její neustálou podporu, vedení a motivaci. Prof. J.V. Vaishampayan, bývalý vicekancléř Univerzity CSJM, Kanpur mě velmi povzbudil k dosažení akademické excelence. Vždy mu budu velmi vděčný za jeho inspiraci, povzbuzení a podporu. Chtěl bych ocenit snahu všech autorů této knihy o jejich rozsáhlou práci, vizi a plánování při psaní kapitol. Děkuji recenzentům, jejichž kritické komentáře knihu podstatně vylepšily. Jsem velmi vděčný Dr. Pankaj Kumar Singh, GBPUA & T, Pantnagar za jeho technickou podporu a návrhy. Jsem velmi vděčný svým rodičům, panu Sudhakarovi Singhovi a Smt. Radhika Singh a dalším členům rodiny za jejich přání, cennou podporu a povzbuzení. Jsem také vděčný svým kolegům Dr. Manish Kumar Gupta, Dr. Satendra Singh, Dr. PK Yadav, Dr. Budhayash Guatam, Dr. Prashant Ankur Jain, Dr. Anil Kumar, Dr. Durg Vijay Singh, Dr. Ajay Kumar Singh , Dr. KK Ojha, Dr. Pramod Katara, Dr. Prem Kumar Singh, Dr. RK Kesharwani, další přátelé a zaměstnanci za jejich podporu. Chtěl bych ocenit úsilí Dr. Rajeshe Kumara Pathaka, pana Rohita Shukla, pana Apoorva Tiwariho, pana Himanshu Avasthiho, pana Ambuje Srivastavy a paní Shikhy Agnihotri o jejich podporu. Jsem vděčný doktoru Bhavikovi Sawhneymu a celému týmu Springer Nature za jejich neustálou podporu a spolupráci během celého procesu publikace.

Výpočtové přístupy při objevování a navrhování léčiv. . . . . . . Rajesh Kumar Pathak, Dev Bukhsh Singh, Mamta Sagar, Mamta Baunthiyal a Anil Kumar

Molekulární modelování proteinů: metody, nejnovější pokroky a budoucí vyhlídky. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Apoorv Tiwari, Ravendra P. Chauhan, Aparna Agarwal a P. W. Ramteke

Přístupy predikce dutin/vazebných stránek a jejich aplikace. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Himanshu Avashthi, Ambuj Srivastava a Dev Bukhsh Singh Role nástrojů ADMET v aktuálním scénáři: Aplikace a omezení. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rajesh Kumar Kesharwani, Virendra Kumar Vishwakarma, Raj K.Keservani, Prabhakar Singh, Nidhi Katiyar a Sandeep Tripathi

Databázové zdroje pro vyhledávání drog. . . . . . . . . . . . . . . . . . . . . Anil Kumar a Praffulla Kumar Arya

Molekulární dokování a konstrukce léků na základě struktury. . . . . . . . . . 115 Shikha Agnihotry, Rajesh Kumar Pathak, Ajeet Srivastav, Pradeep Kumar Shukla a Budhayash Gautam

Simulace molekulární dynamiky proteinů a komplexů protein – ligand. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Rohit Shukla a Timir Tripathi

Výpočetní přístupy pro identifikaci drogových cílů. . . . . . . 163 Pramod Katara

Výpočetní techniky pro návrh a vývoj potenciálních zákazníků. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Pramodkumar P. Gupta, Virupaksha A. Bastikar, Alpana Bastikar, Santosh S. Chhajed a Parag A. Pathade xi

Pokroky v modelování farmakoforů a jeho role v navrhování léčiv. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 Priya Swaminathan

In Silico Designing of Vaccines: Methods, Tools, and their limitations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 Parvez Singh Slathia a Preeti Sharma

Přístupy strojového učení k racionálnímu designu léčiv. . . . . . . . . 279 Salman Akhtar, M. Kalim A. Khan a Khwaja Usama

Dev Bukhsh Singh je odborný asistent na katedře biotechnologie na univerzitě Chhatrapati Shahu Ji Maharaj, Kanpur, Indie. Získal titul B.Sc. a M.Sc. stupně z University of Allahabad, Prayagraj a jeho M.Tech. z indického institutu informačních technologií, Prayagraj. Držitel titulu Ph.D. v oboru biotechnologie se specializací na bioinformatiku z Univerzity Gautama Buddhy se od roku 2009 aktivně podílí na výuce a výzkumu a mezi jeho hlavní oblasti patří molekulární modelování, chemoinformatika, návrh inhibitorů/léčiv a hodnocení silico. Je autorem řady výzkumných článků a knižních kapitol v oblasti lékařského výzkumu, molekulárního modelování, designu léčiv a systémové biologie. Vydal také knihu s názvem „Struktura, funkce a dynamika bílkovin“ (Springer Nature, Singapur). Je členem různých národních a mezinárodních akademických orgánů a je recenzentem několika mezinárodních časopisů.

Výpočtové přístupy při objevování a navrhování drog Rajesh Kumar Pathak, Dev Bukhsh Singh, Mamta Sagar, Mamta Baunthiyal a Anil Kumar

Objev drog je nákladný a komplikovaný proces. Droga musí splňovat některá kritéria, aby byla netoxická, biologicky dostupná a účinná. S ohledem na stále přísnější požadavky na účinnost, účinnost a bezpečnost se hledání nové molekuly podobné léčivu stalo složitým a náročným na zdroje. Dostupnost 3D struktur cílů molekulárních léčiv a pokroky ve výpočetních přístupech a bioinformatice nyní urychlují aplikaci molekulárního modelování při objevování. V této kapitole je diskutováno několik strategií molekulárního modelování použitých v moderním programu objevování léčiv. Byly vysvětleny koncepty navrhování léčiv na bázi struktury a ligandu, modelování a vizualizace proteinů, molekulární dokování, virtuální screening, simulace molekulární dynamiky, modelování farmakoforů a QSAR. Kromě toho také poskytujeme důležité databázové zdroje a nástroje dostupné pro výzkum drog. Nakonec uvádíme případové studie provedené v naší laboratoři, které ukazují, jak lze ve skutečnosti implementovat výpočetní přístupy pro objevování a navrhování nových léčiv z přírodních zdrojů.

RK Pathak · M. Baunthiyal (*) Department of Biotechnology, Govind Ballabh Pant Institute of Engineering & Technology, Pauri Garhwal, Uttarakhand, India DB Singh Department of Biotechnology, Institute of Biosciences and Biotechnology, Chhatrapati Shahu Ji Maharaj University, Kanpur, Uttar Pradesh , Indie M. Sagar Katedra bioinformatiky, University Institute of Engineering and Technology, Chhatrapati Shahu Ji Maharaj University, Kanpur, Uttar Pradesh, India A. Kumar Rani Lakshmi Bai Central Agricultural University, Jhansi, Uttar Pradesh, India # Redaktor (if applicable) and The Author(s), under exclusive licence to Springer Nature Singapore Pte Ltd. 2020 DB Singh (ed.), Computer-Aided Drug Design, https://doi.org/10.1007/978-981-15 -6815-2_1

Molecular modeling · Molecular docking · Molecular dynamics simulation · QSAR · Bioinformatics

Generally, new drugs were discovered from plants and other natural sources through accidental observations and analysis (Singh et al. 2012). The field of drug discovery is extremely challenging and requires adequate infrastructure and lab facilities. People in every nation have used drugs derived from plant or animal origin to treat and prevent disease. The quest for substances to fight sickness and to alter mood and consciousness is nearly as fundamental as search for food and shelter. Various drug molecules derived from plants or animals are highly valued, but most of the drugs in the modern medical system are synthetic chemistry and biotechnology products. Thus a drug is said to be a substance of either natural or synthetic origin that is employed in the prevention, treatment, and diagnosis of disease or modulation of the target or function of the biological systems. Thus, generally, we can say that a drug is a chemical that affects the biological systems and its processes at molecular to the cellular level (Huang et al. 2010). However, the traditional approach utilized for the discovery of novel drug molecules is time-consuming and cost-intensive. Therefore, the new approaches exceed the limitations of traditional research in the field of drug discovery. It evolved based on the following consideration, i.e. the molecular target present in the body and the potential bioactive compound are directly related to each other. For designing a drug, understanding about the disease and molecular mechanism of infectious processes is a must. For structure-based drug design, investigating a molecular target is a first step that is essential to a disease process and an infectious pathogen (Nag and Dey 2010). The next key step is to determine the molecular structure of the target through experimental or computational approaches. The success of structure-based drug discovery depends on accurate target structure with detail information of amino acid residues present in binding sites, which are further utilized by molecular docking program for screening of small molecules database (Kesharwani et al. 2018). Drugs have historically been developed to target a single biological object, usually a protein generally known as the target, with high selectivity to prevent any unintended effects arising from mis-targeting other biological targets. Based on this, the concept of multi-targets drugs has long been marked as undesirable, as it was naturally linked with harmful effects (Bolognesi and Cavalli 2016 Ramsay et al. 2018). Parallel to this, several evidences confirmed that molecules that strike more than one target have a safer profile compared to single targets. Therefore, the idea of multi-target drugs made rapid and dramatic progress from an evolving paradigm when first laid out in early 2000, to one of the hottest drug research topics for the year 2017 (Roth et al. 2004 Ramsay et al. 2018).

Computational Approaches in Drug Discovery and Design

In multifactorial diseases such as cancer and Alzheimer’s disease, there is an urgent need to find multi-target inhibitors. As essential for Alzheimer’s development, β-amyloid cleavage enzyme (BACE-1) and acetylcholinesterase (AChE) were considered promising targets for the drug (Goyal et al. 2014). Besides, numerous pathological manifestations also contribute to cancer. In fact, the medications also lead to serious side effects with their treatments. Thus, multi-indication therapies are required, which can simultaneously inhibit multiple targets and minimize side effects (Lim et al. 2019). Some multi-target drugs are available in the market for the treatment of the diseases. The recently approved (April 2017) multi-target drug is midostaurin it is a well-known multi-kinase inhibitor for the treatment of those newly diagnosed adult patients with acute myeloid leukemia who have a particular FLT3 gene variant. A study has shown that it can inhibit the activity of protein kinase C alpha, KIT, VEGFR2, WT and PDGFR and/or FLT3 tyrosine kinases mutant (Levis 2017 Ramsay et al. 2018). Drug discovery is based on the screening of small molecule databases on a receptor, whereas designing is based on modification in the structure of a lead compound when the lead compound having some therapeutically undesirable side effects. In addition to the above, quantitative structure–activity relationship (QSAR) is one of another potential area in molecular modeling that has helped medicinal chemists in drug designing process. In previous years, the identification of a new drug molecule is a very complex and time-consuming process. After studying more than 5000–10,000 compounds, only a single drug molecule comes to the market. The cost of each drug is about $156 million in the discovery phase. I, II, and III clinical trial and Food and Drug Administration (FDA) processes the cost is another $75 million. This brings the total amount is about $231 million for each drug that comes to the market for benefits of the society. Then, for gaining FDA approval, an extensive and expensive procedure also needs to be followed (Huang et al. 2010 de Ruyck et al. 2016). Considering the high failure levels, considerable costs, and slow speed of new drug identification research, repurposing “existing” medicines to treat common and rare diseases is becoming increasingly desirable as it requires the use of low-risk compounds to develop drugs in a shorter time with cost-effective manner (Pushpakom et al. 2019). Generally, three kinds of approaches that are widely used in drug repositioning include computational, experimental, and mixed approaches (Xue et al. 2018 Talevi and Bellera 2020). The first case of drug repositioning, in the 1920s, was an accidental discovery. After a century of progress, further strategies for accelerating the drug repositioning cycle have been suggested. In this scenario, machine learning algorithms have been implemented to boost drug repositioning efficiency. Over the computational methods, the experimental method was established that provide clear evidence of linkages between drugs and diseases, such as target screening, cell assays, animal model, and clinical approaches. These are effective and trustworthy methods. In recent years, growing numbers of researchers have merged computational and experimental methods for identifying new drug indications, called mixed approaches. Biological experiments and clinical studies confirmed the findings of the computational methods. Mixed approaches

provide incentives for the successful and rapid discovery of repositioned drugs (Xue et al. 2018). Some successful repositioned drugs are Zidovudine, Minoxidil, Sildenafil, Thalidomide, Celecoxib, Atomoxetine, Duloxetine, Rituximab, Raloxifene, Fingolimod, Dapoxetine, Topiramate, Ketoconazole, and Aspirin (Pushpakom et al. 2019). However, there are also major technical and regulatory issues that need to be tackled. It is an intricate process involving several factors including technology, business models, patents, and investment as well as consumer demands. While several medical databases have been developed, it is still a challenge to choose the best approach to make full use of vast amounts of medical data. There is an urgent need to develop a novel approach for drug repositioning. Another highlighted issue to address is the intellectual property (IP). IP safety is limited for repositioning of the drugs. For example, some novel associations of drugtarget-disease discovered by repositioning researchers were verified by publications or online databases however, because of the law, it is difficult to obtain IP protection for these associations. The IP problem prohibits the entry of such repositioned drugs into the market. In fact, some repositioning research initiatives are forced to give up, which is wastage of money and time. Therefore, developing a new commercial model is essential because the current model is a serial model which causes problems related to funding and investment (Xue et al. 2018). Molecular modeling is a data-driven science branch, with many of the algorithms and databases being created or adapted as a response to new data forms (Xia 2017). Today computer experiments play an increasingly important role in research. The advent of high-performance computing has allowed in silico experimentation as a tool for interpolating laboratory experiments and theory (Aminpour et al. 2019). Due to advances in computational algorithms and the development of efficient software, the time requires in the identification of lead compounds reduced dramatically. A detailed flowchart highlighting the different approaches of molecular modeling in drug discovery and design is demonstrated in Fig. 1.1.

Structure-Based Drug Designing

Structure-based designing is a multidisciplinary and iterative process that is wellestablished in the research institution and pharmaceutical industry. It played a tremendous role in the discovery and development of several registered drugs and clinical candidates, for example, zanamivir, nelfinavir, and aleglitazar. In contrast, structure-based designing is relatively new in the agrochemical industry and at present, no products in the market that are directly investigated with the use of this approach. However, there are several databases and software programs where structure-based design has a strong impact (Huang et al. 2010). The major database resources used in a drug discovery program are listed in Table 1.1. Different approaches used in the discovery of lead molecule through computational are discussed in the following sections.

Computational Approaches in Drug Discovery and Design

Fig. 1.1 Application of molecular modeling approaches in drug discovery and design

Drug target identification and its validation is the initial step of the drug discovery process. It is a macromolecule that has an established function in the pathophysiology of a disease. Four major drug targets are found in organisms, i.e. proteins, including receptors and enzymes, nucleic acids (DNA and RNA), carbohydrates, and lipid. The majority of drugs available in the market are addressed to proteins as a target. However, due to the decoding of several genomes of pathogens, nucleic acids could gain big importance as drug targets in the future (Gashaw et al. 2012). The

Table 1.1 Availability of major compound database resources for molecular modeling S. No. 1

Description It is a freely available database of commercially available compounds for molecular docking and virtual screening It is a database of small chemical molecules, their biological activities

It is a chemical structure database used for drug discovery

It is a small molecule database that contains information about ADMET and binding for a huge number of bioactive compounds It is a comprehensive database resource containing information about drugs, their targets, and other useful information

Availability http://zinc. docking.org/

References Irwin and Shoichet (2005)

https:// pubchem. ncbi.nlm.nih. gov/ http://www. chemspider. com/ https://www. ebi.ac.uk/ chembldb/

Pence and Williams (2010) Gaulton et al. (2012)

selection of potential drug targets from thousands of candidate macromolecules is a challenging task. In the post-genomic era, genomics and proteomics approaches are the most important tools for target identification (Singh et al. 2016). Besides, advances in high-throughput omics technologies generated a huge amount of data for host–pathogen interaction. These available data are also integrated and analyzed by the scientific community through network and systems biology approaches to accelerate the process of target identification in drug discovery program.

Modeling and Visualization of Macromolecule Structure

Determination of three-dimensional structure through experimental approaches is a costly and time taking process. Therefore, comparative modeling or homology modeling using sequence information is an accurate method for the prediction of three-dimensional structures, yielding appropriate models for a wide range of applications in the area of drug discovery (Bodade et al. 2010 Pathak et al. 2016). It is generally a choice of an algorithm when a homology among the target protein and a template structure exists (Sussman et al. 1998). This approach is based on the assumption that two identical sequences adopt similar three-dimensional structures. A higher sequence identity between the sequence of the target and template structure promises the generation of a more reliable model. Modeling the 3D structure of a protein from a sequence, in the absence of an X-ray or NMR verified structure is necessary for drug designing (Hekkelman et al. 2010 Bagaria et al. 2012). Besides, threading or fold recognition and ab initio are other methods used in modeling of 3D

Computational Approaches in Drug Discovery and Design

structure when no appropriate template detected in the PDB database (Singh and Tripathi 2020). CASP (critical structure prediction assessment) playing a key role in protein structure prediction. It is a biennial collective project designed to evaluate the state of the art in protein structure modeling. Participants are provided with target protein amino acid sequences, and model the corresponding 3D structures. The independent assessors equate submissions with the experiment. It is a double-blinded experiment, participants do not have exposure to the experimentally determined structures, and the evaluators do not know the identity of those who apply. A variety of other aspects of protein modeling are also tested, in addition to structure models: optimization of an estimated structure similar to the experimental one, estimates of the accuracy of the overall structural model and residue, modeling of the protein oligomer structure, the ability to develop models using a range of sparse data types, and the accuracy of protein structure characteristics relevant to the deduction of functional aspects (Kryshtafovych et al. 2019). CASP studies were designed to achieve an objective for evaluation and assessment of different servers used of protein 3D structure prediction. RasMol, PyMol, Chimera, and other visualization tools play a significant role in viewing and analyzing the predicted and experimentally determined 3D structures of macromolecules at the atomic level. Many efforts have been made in recent years to develop user-friendly simulation environments based on computer graphics for the structural biologist. It is widely used in biology for the presentation of simulation results in post-processing or experiments and by graphic editors for building models for a better understanding of atomic data of 3D co-ordinates (Seeliger and de Groot 2010 Mamgain et al. 2018).

Binding Site Prediction and Analysis

The determination of binding sites is not a simple task researchers have suggested some criteria for selecting a binding site. It is investigated that the functional activity of any protein is governed by such highly conserved cluster of amino acid residues present in binding site pocket. The most available algorithms are based on similarity searches of the molecular surface for functional site databases such as PDB that contain fully reviewed and experimentally validated information of protein structures. Besides, some methods are also developed based on phylogenetic profiling of residues and several other models such as HMM, SVM, and CASP9 (Schmidt et al. 2011 Liu et al. 2014). Generally, binding site residues are highly conserved among closely related proteins. Identification of such binding site residues is also done through the superimposition of the predicted model with their template that provided integrity for homology and assisted in the positioning of conserved active site residues (Nag and Dey 2010 Bajorath 2015). However, many protein–ligand complex structures are also available in public databases as a signature for the binding site where ligand was bound in binding site cavity of a protein. Usually, researchers separate bound

ligand from protein, and this area is considered as binding site area for molecular docking studies using ligand structures because it is an experimentally determined complex structure and yielded significant outcome. Advances in the area of bioinformatics provide several computational tools that can able to predict novel binding site residues present in the cavity of the predicted protein model, which are further utilized in drug discovery research.

Docking intends to precisely fit the structure of a ligand inside the requirements of a receptor binding site and to accurately evaluate the strength of binding (AdrianScotto and Vasilescu 2008). When the binding site is not known in target protein structure, in such case, blind docking is helpful because in which whole protein structure is considered as binding site area, whereas if the binding site is known, sitespecific docking is useful to predict the interacting nature of ligand molecule. Generally, the results of blind docking are less accurate and take more time and memory than site-specific docking because it targets only selected amino acid residues present in the binding site cavity. Nevertheless, the majority of available literature represents case studies where molecular docking has been used to deal with specific issues related to ligand design or target recognition (Huang et al. 2010 Yuriev and Ramsland 2013 Pathak et al. 2016 Rana et al. 2019). A summary of the highly cited molecular docking programs used in drug discovery has been listed in Table 1.2.

Table 1.2 A summary of the highly cited molecular docking programs used in drug discovery S. No. 1

Description Used for molecular docking. It predicts the binding affinity and poses of a small molecule to a 3D structure target protein Used for virtual screening and molecular docking

A complete package for molecular modeling and computer-aided drug discovery (CADD)


Podívejte se na video: Tvorové v nás Úžasný dokument o životě v našich tělech TOP CZ HD (Listopad 2021).