Základní páry
V molekulární biologii a genetice se propojení dvou dusíkatých bází na protilehlé komplementární DNA nebo určitých typech řetězců RNA, které jsou spojeny vodíkovými vazbami, nazývá párem bází (často zkráceně bp). V kanonickém Watsonově-Crickově párování bází DNA tvoří adenin (A) pár bází s thyminem (T) a guanin (G) tvoří pár bází s cytosinem (C). V RNA je thymin nahrazen uracilem (U). Také se vyskytují alternativní vzory vodíkových vazeb, jako je rozviklaný pár bází a Hoogsteenův pár bází, což vede – zejména v RNA – ke vzniku komplexních a funkčních terciálních struktur. Párování je mechanismus, kterým jsou kodony na molekulách RNA messengeru rozpoznávány antikodony na transferové RNA během proteinového překladu. Některé DNA nebo RNA-vazebné enzymy mohou rozpoznat specifické vzory párování bází, které identifikují konkrétní regulační oblasti genů.
Velikost jednotlivého genu nebo celého genomu organismu se často měří v párech bází, protože DNA je obvykle dvouvláknová. Počet celkových párů bází se tedy rovná počtu nukleotidů v jednom z řetězců (s výjimkou nekódujících jednovláknových oblastí telomer). Haploidní lidský genom (23 chromozomů) je odhadován na délku asi 3 miliardy párů bází a obsahuje 20 000 – 25 000 odlišných genů.[1] Kilobáza (kb) je měrná jednotka v molekulární biologii rovnající se 1000 párů bází DNA nebo RNA.[2]
Vazba vodíku a stabilita
Dvojice bází GC demonstrující tři intermolekulární vodíkové vazby
Mohlo by vás zajímat: Základní pojmy v úvodní psychologii
Dvojice AT bází demonstrující dvě intermolekulární vodíkové vazby
Vazba vodíku je chemická interakce, která je základem výše popsaných pravidel pro párování bází. Vhodná geometrická shoda dárců a akceptorů vodíkových vazeb umožňuje stabilní tvorbu pouze „správných“ párů. DNA s vysokým obsahem GC je stabilnější než DNA s nízkým obsahem GC, ale na rozdíl od všeobecného přesvědčení vodíkové vazby DNA výrazně nestabilizují a stabilizace je způsobena především interakcemi při skládání.[3]
Spárované molekuly DNA a RNA jsou při pokojové teplotě poměrně stabilní, ale oba nukleotidové řetězce se oddělí nad bodem tání, který je určen délkou molekul, rozsahem chybného spárování (pokud existuje) a obsahem GC. Vyšší obsah GC vede k vyšším teplotám tání; není proto překvapením, že genomy extremofilních organismů, jako je Thermus thermophilus, jsou obzvláště bohaté na GC. Naopak oblasti genomu, které se potřebují často oddělovat – například promotorové oblasti pro často přepisované geny – jsou poměrně chudé na GC (například viz rámeček TATA). Obsah GC a teplota tání musí být také vzaty v úvahu při navrhování primerů pro PCR reakce.
Interakce základního skládání v DNA a RNA jsou způsobeny přitahováním disperze, odpuzováním výměny krátkého dosahu a elektrostatickými interakcemi, které také přispívají ke stabilitě.[4] Opět platí, že interakce GC skládání s přilehlými bázemi bývají příznivější. (Všimněte si však, že interakce GC skládání s dalším párem bází je geometricky odlišná od interakce CG.) Účinky základního skládání jsou zvláště důležité v sekundární struktuře a terciární struktuře RNA; například struktury RNA kmenové smyčky jsou stabilizovány skládáním bází v oblasti smyčky.
Základní analoga a mezialatory
Chemické analogie nukleotidů mohou nahradit řádné nukleotidy a vytvořit nekanonické párování bází, což vede k chybám (většinou bodovým mutacím) v replikaci DNA a transkripci DNA. Je to způsobeno jejich izotermickou chemií. Jedním z běžných analogů mutagenních bází je 5-bromouracil, který se podobá thyminu, ale může se ve své enolové formě párovat s guaninem.
Jiné chemikálie, známé jako DNA interalatory, zapadají do mezery mezi sousedními bázemi na jednom vlákně a vyvolávají framovité mutace tím, že se „maskují“ jako báze, což způsobuje, že zařízení pro replikaci DNA vynechává nebo vkládá další nukleotidy do místa mezialace. Většina interalatorů jsou velké polyaromatické sloučeniny a jsou známy nebo existuje podezření na karcinogeny. Příkladem jsou ethidium-bromid a akridin.
Následující sekvence DNA ilustrují párové dvouvláknové vzory. Podle konvence se horní vlákno píše od 5' konce do 3' konce; tedy spodní vlákno se píše od 3' do 5'.
Pro popis délky molekuly D/RNA se běžně používají následující zkratky:
V případě jednovláknové DNA/RNA jsou použity jednotky nukleotidů, zkratka nt (nebo knt, Mnt, Gnt), neboť nejsou spárovány. Pro rozlišení jednotek počítačového úložiště a bází kbp lze pro páry bází použít Mbp, Gbp atd. Délka 16S rDNA pro bakterie je 1542 párů bází na délku.
Centimorgan se také často používá k určení vzdálenosti podél chromozomu, ale počet párů bází, kterým odpovídá, se značně liší. V lidském genomu je centimorgan asi 1 milion párů bází.[5][6]