Informace

Jakým směrem je sekvence v databázích zapsána?


V mnoha databázích jsou sekvence DNA pro proteiny uvedeny jako řetězec a, t, g, c, aniž by bylo uvedeno, zda je začátek od 5 'nebo od 3'. Rovněž není uvedeno, zda se jedná o kódující nebo nekódující řetězec.

Je to proto, že všechny sekvence jsou psány z 5 'až 3' z kódování jen pramen?


Směrovost

Skutečně je zvykem reprezentovat sekvence nukleových kyselin ve směru 5ʹ až 3ʹ.

To je obsaženo v dokumentu IUPAC/IUB dne Zkratky a symboly pro nukleové kyseliny, polynukleotidy a jejich složky, i když to není výslovně uvedeno - pravděpodobně proto, že to bylo napsáno v roce 1974, než byly založeny velké databáze nukleových kyselin.

Pramen

Obecně můžete předpokládat nic o tom, na kterém vlákně se konkrétní funkce nachází. Musíte se podívat na kontext nebo dokumentaci pro konkrétní databázi, kterou používáte.

Dávám přednost výrazu „smyslový řetězec“ před „kódujícím vláknem“, jak je vysvětleno v jiném příspěvku. To však má význam pouze v omezeném souboru okolností týkajících se mRNA, zejména s ohledem na kopie cDNA eukaryotických mRNA. Pouze pokud kontext naznačuje, že tomu tak je, můžete předpokládat vlákno prezentované jako „smyslové vlákno“.

Problém vyplývá ze skutečnosti, že pro všechny (nebo téměř všechny) genomy jsou různé geny umístěny na různých vláknech DNA - chromozom nemá žádný jedinečný „smyslový řetězec“ nebo „kódující řetězec“. Tedy pro sekvence DNA v databázi, jako je Genbank, jsou možné následující:

  • Prezentovaná sekvence DNA nekóduje protein ani strukturální RNA.
  • Prezentovaná sekvence DNA obsahuje geny na obou vláknech.

Příklad posledně uvedeného je uveden v záznamu Sample GenBank, který by měl být konzultován, aby porozuměl anotaci funkce v záznamech sekvencí DNA v GenBank. Tento vstup 5028 bp kvasinkového chromozomu kóduje dva geny. První, AXL2, je opatřen poznámkami:

gen 687… 3158 /gen = "AXL2"

Druhý, REV7, je opatřen poznámkami:

genový komplement (3300… 4037) /gen = „REV7“

To naznačuje, že když je gen REV7 prezentován ve směru 5ʹ až 3ʹ, leží na doplněk předloženého vlákna.


Úmluva je poskytnout smyslový řetězec od 5 'do 3'.


Úvod

Databáze je organizovaný sběr dat. Například seznam některých filmů, které se nám líbí, by byl databází filmů:

ID titul rok ředitel
film 1 Hráč 1992 Robert Altman
film 2 Štěstí cookie 1999 Robert Altman
film 3 Muž, který zastřelil Liberty Valance 1962 John Ford

  • Subjekty: Druh věcí, které chceme uložit do databáze. Např .: Geny, sekvence DNA, bibliografické odkazy.
  • Evidence: Konkrétní věci uložené v databázi. Např .: Gen BRCA1
  • Identifikátory nebo klíč: Jedinečný název, který identifikuje záznam
  • Pole: Vlastnosti, které entita má. Např .: Název, sekvence a mutace genu

V předchozích příkladech filmů byly uloženými entitami filmy, uložené záznamy byly: Přehrávač, Cookie's Fortune a Muž, který střílel Liberty Valance. Unikátní identifikátory byly: film1, film2 a film3.

Pokud tedy uvažujeme o databázi jako tabulce, tabulka by ukládala informace o jedné entitě, pole by byla záhlaví sloupců a záznamy by byly řádky tabulky.

Je zcela běžné ukládat různé entity do databáze. Mohli bychom například ukládat filmy, herce a režiséry nebo geny, sekvence a mutace. V takovém případě by různé entity mohly být uloženy v různých tabulkách a záznamy v těchto tabulkách by byly spojeny svými jedinečnými identifikátory. Tato struktura by obsahovala relační databázi.

Databáze obvykle poskytují mechanismy pro ukládání, vyhledávání, načítání a úpravu dat.


Základní nástroje pro manipulaci se sekvencemi


    Svou sekvenci můžete obrátit, doplnit nebo zpětně doplnit. Sekvence je ve výchozím nastavení vyčištěna od znaků jiných než GATC
    V zásadě se jedná o rozhraní k „náhodnému“ modulu Pythonu. Vlastní počet opakování cyklů randomizace povolen. Volitelně vyčistí vstupní sekvenci čističem sekvencí před randomizací. Volitelně formátuje výstupní sekvenci.
    Transeq převádí sekvence nukleových kyselin na odpovídající peptidovou sekvenci. Může překládat v kterémkoli ze 3 dopředných nebo tří zpětných snímacích rámců nebo ve všech třech dopředných nebo zpětných rámcích nebo ve všech šesti rámcích
    Graficky vykreslí ORF přítomné ve vaší předložené sekvenci
    Umožňuje snadné čištění (odstranění nežádoucích mezer, lomítek, čísel atd.) Sekvencí. Tipicky užitečné při načítání sekvencí z online databází. Také umožňuje vlastní číslování výstupní sekvence
    Sada programů pro manipulaci se sekvencemi napsaných v JavaScriptu Paulem Stothardem

Bioinformatické nástroje

Nástroje bioinformatiky jsou softwarové programy pro ukládání, načítání a analýzu biologických dat a získávání informací z nich.

Koncový uživatel (biolog) nemusí být častým uživatelem výpočetní techniky, a proto by měl být velmi uživatelsky přívětivý.

Tyto softwarové nástroje musí být dány k dispozici přes internet vzhledem ke globální distribuci komunity vědeckého výzkumu.

Bioinformatické nástroje lze rozdělit do následujících kategorií:

Homologie a nástroje podobnosti

Termín homologie předpokládá společný evoluční vztah mezi dvěma znaky -ať už jsou to sekvence DNA nebo vzory štětin na nosu mouchy. Homologní sekvence jsou sekvence, které jsou příbuzné divergencí od společného předka. Stupeň podobnosti mezi dvěma sekvencemi lze tedy měřit, zatímco v jejich homologii platí, že jsou pravdivé nebo nepravdivé. Tuto sadu nástrojů lze použít k identifikaci podobností mezi novými sekvencemi dotazů neznámé struktury a funkce a databázovými sekvencemi, jejichž struktura a funkce byly objasněny.

Analýza funkce bílkovin

Funkční analýza je identifikace a mapování všech funkčních prvků (kódujících i nekódujících) v genomu. Tato skupina programů vám umožňuje porovnat vaši proteinovou sekvenci se sekundárními (nebo odvozenými) proteinovými databázemi, které obsahují informace o motivech, podpisech a proteinových doménách. Vysoce významné zásahy do těchto různých vzorových databází vám umožňují přiblížit biochemickou funkci vašeho dotazovacího proteinu.

Tato sada nástrojů vám umožňuje porovnávat struktury se známými strukturními databázemi. Funkce proteinu je spíše přímým důsledkem jeho struktury než jeho sekvence se strukturálními homology, které mají tendenci sdílet funkce. Určení 2D/3D struktury proteinu je zásadní při studiu jeho funkce.

Tato sada nástrojů vám umožňuje provádět další, podrobnější analýzu sekvence dotazů, včetně evoluční analýzy, identifikace mutací, oblastí hydropatie, ostrovů CpG a kompozičních předsudků. Identifikace těchto a dalších biologických vlastností jsou všechny stopy, které pomáhají při hledání, aby se objasnila konkrétní funkce vaší sekvence.

Bioinformatické nástroje

VÝBUCH:
Nástroj Basic Local Alignment Search Tool (BLAST) pro porovnávání genových a proteinových sekvencí s jinými ve veřejných databázích nyní přichází v několika typech, včetně sekvencí PSI-BLAST, PHI-BLAST a BLAST 2. Specializované BLAST jsou také k dispozici pro lidské, mikrobiální, malárie a další genomy, stejně jako pro vektorovou kontaminaci, imunoglobuliny a předběžné lidské konsensuální sekvence.

FASTA
Nástroj pro vyhledávání v databázi používaný k porovnání sekvence nukleotidů nebo peptidů s databází sekvencí. Program je založen na algoritmu rychlé sekvence popsaném Lipmanem a Pearsonem. Jednalo se o první široce používaný algoritmus pro vyhledávání podobnosti databází. Program hledá optimální lokální zarovnání skenováním sekvence pro malé shody zvané & quot; slova & quot ;. Zpočátku se počítají skóre segmentů, ve kterých je více slovních zásahů ("quotinit1"). Později lze skóre několika segmentů sečíst a vygenerovat skóre „quotinitn“. Optimalizované zarovnání, které zahrnuje mezery, je ve výstupu zobrazeno jako „quotopt“. Citlivost a rychlost vyhledávání jsou nepřímo úměrné a řízeny proměnnou "quot-tup", která určuje velikost & quot; slova & quot ;.

VYTEPAT
EMBOSS (The European Molecular Biology Open Software Suite) je nový bezplatný open source softwarový analytický balíček speciálně vyvinutý pro potřeby komunity uživatelů molekulární biologie. V rámci EMBOSS najdete kolem 100 programů (aplikací) pro zarovnání sekvence, vyhledávání v databázi pomocí sekvenčních vzorců, identifikaci proteinového motivu a analýzu domény, analýzu vzorů nukleotidových sekvencí, analýzu využití kodonů pro malé genomy a mnoho dalšího.

Seznam aplikací, které jsou součástí balíčku EMBOSS, najdete na adrese http://www.hgmp.mrc.ac.uk/Software/EMBOSS/Apps/

Clustalw
ClustalW je univerzální program pro zarovnání více sekvencí pro DNA nebo proteiny. Vytváří biologicky smysluplné vícenásobné zarovnání odlišných sekvencí, vypočítá nejlepší shodu pro vybrané sekvence a zarovná je tak, aby bylo možné vidět identity, podobnosti a rozdíly.

RasMol
Je to účinný výzkumný nástroj k zobrazení struktury DNA, proteinů a menších molekul. Protein Explorer, derivát RasMol, je jednodušší program.

JAVA v bioinformatice:
Vzhledem k povaze nezávislosti platformy na platformě Java se Java stává klíčovým hráčem v bioinformatice. Počítačové biologické simulační technologie Physiome Sciences a PatternHunter od Bioinformatics Solutions jsou dva příklady rostoucího přijetí Javy v bioinformatice.

Perl v bioinformatice:
Perl se také používá při zpracování biologických dat. Jedním příkladem projektu perl je projekt BioPerl.

Bioinformatické projekty:

BioJava:
Projekt BioJava poskytuje nástroj Java pro zpracování dat v Javě

BioPerl:
Modul BioPerl projektuje mnoho modulů pro zpracování biologických dat.

BioXML:
Součástí projektu BioPerl je zdroj pro shromažďování dokumentace XML, DTD a nástrojů pro biologii s vědomím XML na jednom místě.


V biologii, co je to konsensuální sekvence? (s obrázky)

Konsensuální sekvence je sada proteinů nebo nukleotidů v deoxyribonukleové kyselině (DNA), která se objevuje pravidelně. DNA se skládá z nukleotidů a každý nukleotid se skládá z fosfátu, cukru a dusičnaté báze. Bází dusíku mohou být adenin (A), thymin (T), guanin (G) a cytosin (C). Sekvence těchto chemických základů určuje genetický kód organismu. Genetický kód je jako instrukce, na které je organismus budován a udržován. Molekulární biologové často používají statistiky k předpovědi umístění sekvencí nebo k pochopení, kde se konkrétní molekuly obvykle váží. Vzorce lze použít k reprezentaci míst, kde aminokyselinové sekvence zůstávají stejné, a míst, kde se liší. V případě konsensuální promotorové sekvence se například konkrétní typ enzymu může vázat na místa podobně sekvenovaných proteinů.

Genetici, stejně jako výzkumníci v mnoha vědních oborech, často používají substituce ke zjednodušení složitých systémů. V těle je tolik aminokyselinových bází a genů, že je vědci nemohou spočítat, pokud pro to neexistuje nějaký obecný systém. Konsensuální sekvence se může objevit na mnoha místech v DNA i v různých živých věcech. Podobnosti a rozdíly, které se obvykle vyskytují, lze naznačit vzorcem.

Statisticky mohou vědci klasifikovat genetické sekvence a hledat vzory. Opakující se vzory, nazývané sekvenční motivy, se obecně používají k reprezentaci genetických oblastí, které řídí specifické biologické procesy. Konsensuální sekvence mohou také nabídnout pohled na to, jak jsou syntetizovány proteiny nebo jak jsou molekuly vedeny v buňce.

V zápisu konsensuální sekvence může umístění některých nukleotidů ukázat, že jsou vždy v reprezentovaném místě. Může být také uvedeno, že tam může být jeden nebo druhý nukleotid. V tomto případě není obecně uvedeno, jak často se místo jiné objevuje aminokyselina. K označení této frekvence se někdy používá grafický model zvýšením nebo zmenšením velikosti symbolů. Některé softwarové programy mohou automaticky generovat loga sekvencí.

Konsensuální sekvence se často shoduje s rozpoznaným vazebným místem pro protein. K přesnému zobrazení sekvencí na genomu se často používají matematické vzorce. Patří sem statistické vzorce, jako jsou logaritmy a číselné hodnoty, které mohou být kladné nebo záporné a představují umístění genetické informace. Tímto způsobem lze analyzovat procesy v genomu pro normální biologické funkce, stejně jako procesy související s chorobami.

Matematické reprezentace konsensuální sekvence obecně poskytují model vzorců DNA a aminokyselin. Přesný obrázek obvykle není k dispozici. Sekvence však mohou vědcům pomoci spojit funkční aspekty různých částí genomu s evolučními vzory organismů.


Zdroje vědecké literatury

Národní centrum pro biotechnologické informace podporuje vědu a zdraví tím, že poskytuje přístup k biomedicínským a genomickým informacím.

PubMed

PubMed obsahuje více než 29 milionů citací biomedicínské literatury z MEDLINE, časopisů o biologii a online knih. Citace mohou zahrnovat odkazy na fulltextový obsah z PubMed Central a webových stránek vydavatele.

DOAJ (Directory of Open Access Journals)

DOAJ je online adresář spravovaný komunitou, který indexuje a poskytuje přístup k vysoce kvalitním, otevřeným a recenzovaným časopisům.


Jakým směrem je sekvence v databázích zapsána? - Biologie

Tato stránka obsahuje sbírku nástrojů, které lze použít k analýze sekvencí proteinů a DNA. Mnoho z nich je propojeno s Biology Workbench a dalšími bezplatnými online bioinformatickými programy a databázemi. Součástí jsou pokyny k používání těchto nástrojů a interpretace výstupu z každého programu. K dispozici jsou také křížové odkazy na teoretické základní informace a konkrétní úkoly.

Jak používat textový procesor jako editor sekvencí.

Hledejte sekvence (ENTREZ), struktury (PDB) nebo články (MEDLINE) podle klíčových slov.

Porovnejte sekvenci DNA nebo proteinu se sekvencemi v databázi (BLAST).

Srovnejte různé sekvence DNA nebo proteinů.

Analyzujte sekvenci DNA na známá restrikční místa.

Přeložte sekvenci DNA do její predikované sekvence aminokyselin.

Získejte reverzní komplement řetězce DNA.

Vypočítejte teplotu tání a další parametry primeru DNA.

Identifikujte potenciální místa sestřihu Intron/Exon, promotory a polyadenylační místa v genu.

Prozkoumejte genomové klony pro sekvence označená místa pro generování kontigů.

Vyhledejte v sekvenci DNA známé proteinové motivy.

Předpovídejte sekundární strukturu na základě primární sekvence aminokyselin.

Předpovídejte transmembránové domény, hydrofobicitu a signální peptidy z aminokyselinové sekvence.

Biology WorkBench (http://workbench.sdsc.edu) je revoluční webový nástroj pro biology. WorkBench umožňuje biologům prohledávat mnoho populárních databází sekvencí proteinů a nukleových kyselin. Hledání v databázi je integrováno s přístupem k široké škále nástrojů pro analýzu a modelování, to vše v rámci rozhraní typu point and click, které eliminuje problémy s kompatibilitou formátů souborů.

Jednou současnou nevýhodou tohoto pracovního stolu je nedostatek výuky pro studenty. K nápravě těchto pokynů slouží níže uvedená tlačítka. Pokud požadujete pokyny, nejpohodlnějším přístupem by bylo otevřít druhé okno Netscape a spustit pracovní stůl v jednom okně a tento web s pokyny ve druhém. Nejjednodušší způsob, jak to udělat na počítači, je kliknout pravým tlačítkem na odkaz na Biology WorkBench a vybrat Otevřít v novém okně.

Na pracovním stole si budete muset založit účet a heslo (nezapomeňte si je zapsat). Je to zdarma a na jejich server můžete ukládat soubory. Když vstoupíte na pracovní stůl, vyberte tlačítko Nástroje relace.

Nyní můžete buď zahájit novou relaci, nebo obnovit stávající relaci. Chcete -li obnovit existující relaci, vyberte ji ze seznamu výše a klikněte na tlačítko Pokračovat.

Každý gen má specifickou sekvenci nukleotidů, běžně nazývanou jeho sekvence DNA. Jakmile klonujeme gen do plazmidu, můžeme určit sekvenci DNA pomocí dideoxynukleotidové metody buď ručně, nebo pomocí automatizovaných sekvencerů.

Aby se DNA oddělila, DNA se nejprve denaturuje a vytvoří se jednovláknová šablona. Poté se přidá specifický primer, který se váže na šablonu. Přidají se volné nukleotidy (dATP, dCTP, dGTP a dTTP), dATP značené fluorescenčním barvivem nebo radioaktivním prvkem a DNA polymeráza a zahájí se syntéza DNA. Po několika minutách se vzorek rozdělí do čtyř nových zkumavek a přidají se dideoxynukleotidy (ddATP, ddCTP, ddGTP a ddTTP). Dideoxynukleotidy jsou poté začleněny do rostoucího řetězce molekuly DNA a reakce se zastaví. Tyto reakce se potom nechají proběhnout na dlouhém tenkém akrylamidovém gelu a produkty různé délky se oddělí podle jejich velikosti. Menší produkty se budou pohybovat nejrychleji a budou ve spodní části gelu.

Poté se gel podrobí autoradiografii (ruční technika) nebo hledá fluorescenční barviva (automatizovaná technika), aby se určilo umístění každého pásu. Trik při čtení sekvenačního gelu je začít ve spodní části gelu a číst směrem nahoru, menší fragmenty budou blíže začátku čtené sekvence.

Jedním ze základních kamenů rychlého pokroku v molekulární biologii a výzkumu genomu je schopnost rychle se vypořádat s velmi velkými sekvencemi DNA pomocí sofistikovaných programů a výkonných počítačů. Rostoucí síla internetu umožnila lepší přístup k těmto programům a databázím. Existuje několik různých forem analýzy, které se běžně provádějí na sekvencích DNA.


Campus Wellome Trust Genome

V areálu kampusu Wellcome Trust Genome Campus poblíž Cambridge (Velká Británie) se nacházejí tři různé instituty, Sanger Center, UK Resource Center pro britské mapování lidského genomu (HGMP-RC) a Evropský institut pro bioinformatiku (EBI). HGMP-RC je orgán financovaný Radou pro lékařský výzkum Spojeného království, který poskytuje výpočetní a biologické služby v rámci programu lidského genomu. Sanger Center je hlavním evropským centrem pro výzkum genomu, založeným společně v roce 1992 Wellcome Trust a Radou pro lékařský výzkum, aby poskytovalo hlavní zaměření na mapování a sekvenování lidského genomu a genomů mnoha dalších organismů. Evropský institut pro bioinformatiku je součástí Evropské laboratoře molekulární biologie (EMBL) a je financován 15 evropskými národy a Izraelem.


Jakým směrem je sekvence v databázích zapsána? - Biologie


Směrovost, v molekulární biologii a biochemii, je end-to-end chemická orientace jednoho vlákna nukleové kyseliny. Chemická konvence pojmenování atomů uhlíku v nukleotidovém cukrovém kruhu numericky vede k a 5′-konec a 3′-end (obvykle se vyslovuje „pět hlavních konců“ a „tři hlavní konce“). Relativní polohy struktur podél řetězce nukleové kyseliny, včetně genů a různých vazebných míst pro proteiny, jsou obvykle označovány buď jako proti proudu (směrem k 5'-konci) nebo po proudu (směrem k 3'-konci). (Viz také stream a downstream.)

Tato konvence pojmenování je důležitá, protože nukleové kyseliny lze syntetizovat pouze in vivo ve směru 5'-to-3 ', protože polymeráza, která shromažďuje nová vlákna, připojuje pouze nové nukleotidy ke skupině 3'-hydroxylové (-OH) prostřednictvím fosfodiesteru pouto. Směrovost je příbuzná, ale nezávislá na smyslu. Při kódování DNA kodony čtou 5′ – ATG– ⋯ –3 ′ na smyslovém řetězci a 3′ – TAC– ⋯ –5 ′ na komplementárním antisense řetězci. Tedy pouzeantisense řetězec bude transkribován do sense (5′ – AUG– ⋯ –3 ′) mRNA. Podle konvence jsou jednotlivá vlákna sekvencí DNA a RNA zapsána ve směru 5'-to-3 '.

5'-konec (vyslovuje se "pět hlavních konců") označuje konec řetězce DNA nebo RNA, který má na svém konci pátý uhlík v cukrovém kruhu deoxyribózy nebo ribózy. Afosfátová skupina připojená k 5'-konci umožňuje ligaci dvou nukleotidů, tj. Kovalentní vazbu 5'-fosfátu na 3'-hydroxylovou skupinu jiného nukleotidu, za vzniku aposfodiesterové vazby. Odstranění 5'-fosfátu zabraňuje ligaci. Aby se zabránilo nežádoucí ligaci nukleových kyselin (např. Vlastní ligace plazmidového vektoru při klonování DNA), molekulární biologové běžně odstraňují 5'-fosfát fosfatázou.

5'-konec rodící se messengerové RNA je místem, kde dochází k post-transkripčnímu cappingu, což je proces, který je životně důležitý pro produkci zralé messengerové RNA. Capping zvyšuje stabilitu messengerové RNA, zatímco prochází translací, poskytuje odolnost vůči degradačním účinkům exonukleáz. [ Citace je zapotřebí ] Skládá se z methylovaného nukleotidu (methylguanosinu) připojeného k messengerové RNA ve vzácné 5'- až 5'-trifosfátové vazbě.

5'-lemující oblast genu často označuje oblast DNA, která není transkribována do RNA. 5'-lemující oblast obsahuje genový promotor a může také obsahovat zesilovače nebo jiná vazebná místa pro proteiny.

5'-nepřeloženo oblast (5'-UTR) je oblast genu, která je transkribována do mRNA a je umístěna na 5'-konci mRNA, ale která neobsahuje sekvenci kódující protein. 5'-netranslatovaná oblast je část DNA začínající od místa cap a zasahující do báze těsně před kodonem iniciace translace AUG. I když není tato oblast sama přeložena, může mít sekvence, jako je vazebné místo pro ribozomy a Kozakova sekvence, které určují účinnost translace mRNA nebo které mohou ovlivnit stabilitu mRNA.

3'-konec řetězce je pojmenován tak, že končí na hydroxylové skupině třetího uhlíku v cukrovém kruhu, a je známý jako ocasní konec. 3'-hydroxyl je nezbytný při syntéze nových molekul nukleových kyselin, protože je ligován (spojen) s 5'-fosfátem samostatného nukleotidu, což umožňuje tvorbu vláken spojených nukleotidů.

Molekulární biologové mohou použít nukleotidy, které postrádají 3'-hydroxylové skupiny (dideoxyribonukleotidy), k přerušení replikace DNA. Tato technika je známá jako metoda ukončení terminace dideoxy řetězce nebo Sangerova metoda a používá se ke stanovení pořadí nukleotidů v DNA.

3'-konec rodící se messengerové RNA je místem post-transkripční polyadenylace, která spojuje řetězec 50 až 250 adenosinových zbytků za vzniku zralé messengerové RNA. Tento řetězec pomáhá určit, jak dlouho RNA posla v buňce vydrží, a ovlivňuje, kolik bílkovin se z ní produkuje.

3'-lemující oblast je oblast DNA, která není kopírována do zralé mRNA, ale která je přítomna v sousedství 3'-konce genu. Původně se předpokládalo, že 3'-lemující DNA nebyla vůbec transkribována, ale bylo zjištěno, že je transkribována do RNA a rychle odstraněna během zpracování primárního transkriptu za vzniku zralé mRNA. 3'-lemující oblast často obsahuje sekvence, které ovlivňují tvorbu 3'-konce zprávy. Může také obsahovat zesilovače nebo jiná místa, na která se mohou vázat proteiny.

3'-nepřeloženo oblast (3'-UTR) je oblast DNA, která je přepsán do mRNA a stane se 3'-koncem zprávy, který ale neobsahuje sekvenci kódující protein. Všechno mezi stop kodonem a polyA ocasem je považováno za 3'-nepřeložené. 3'-netranslatovaná oblast může ovlivnit účinnost translace mRNA nebo stabilitu mRNA. Má také sekvence, které jsou nutné pro přidání poly (A) ocasu ke zprávě, včetně hexanukleotidu AAUAAA.