Univerzita Karlova v Praze Přírodovědecká fakulta
Charles University in Prague Faculty of Science
Doktorský studijní program: Mikrobiologie Ph.D. study program: Microbiology
Autoreferát disertační práce Summary of the Ph.D. Thesis
Studium úlohy aktinobakterií a hub účastnících se degradace rostlinné biomasy kombinací biochemických a moderních sekvenačních metod
Combination of biochemical and high-throughput-sequencing approaches to study the role of Actinobacteria and fungi in the decomposition of plant biomass
Tomáš Větrovský
Školitel/Supervisor: RNDr. Petr Baldrian, PhD.
Prague, 2015
Doktorské studijní programy v biomedicíně
Univerzita Karlova v Praze a Akademie věd České republiky
Program: Mikrobiologie
Předseda oborové rady: doc. RNDr. Ivo Konopásek, CSc.
Školicí pracoviště: Laboratoř environmentální mikrobiologie, Mikrobiologický ústav Akademie věd České republiky, v. v. i.
Autor: Tomáš Větrovský
Školitel: RNDr. Petr Baldrian, PhD.
S disertací je možno se seznámit v příslušných knihovnách Přírodovědecké fakulty Univerzity Karlovy v Praze.
Obsah
Abstrakt (CZ) 4
Abstract (ENG) 5
Úvod 7
Odbourávání rostlinné biomasy houbami a bakteriemi 7
Houbová a bakteriální společenstva v půdě 7
Analýza mikrobiálních společenstev 8
NGS a zpracování dat 9
Cíle práce 11
Materiál a metody 12
Výsledky a diskuse 13
Závěry 18
Introduction 19
Decomposition of plant biomass by fungi and bacteria 19
Fungal and bacterial communities in soil 19
Microbial community analyses 20
NGS and data processing 21
Aims 23
Materials and Methods 24
Results and Discussion 25
Conclusions 31
Použitá literatura – References 33
Publikace, které jsou podkladem disertace 38
Curriculum vitae 39
4 Abstrakt
Odumřelá rostlinná biomasa je klíčovým zdrojem uhlíku v pevninských ekosystémech, a proto je její rozklad významný pro koloběh tohoto prvku na zemi. Mezi nejvýznamnější rozkladače jsou řazeny především houby, a to zejména díky schopnosti produkovat vysoce účinné oxidativní a hydrolytické enzymy. Mnoho současných prací dále ukazuje, že kromě hub mohou být dalšími důležitými rozkladači celulózy a lignocelulózy také bakterie, zejména zástupci kmene Actinobacteria.
Tato disertační práce je zaměřena na zhodnocení role hub a aktinobakterií při rozkladu odumřelé rostlinné biomasy. V rámci jejího řešení byly nejdříve zkoumány mechanismy tohoto rozkladu, týkající se především rozkladu hlavních komponent lignocelulózy: celulózy, hemicelulóz a ligninu, pomocí extracelulárních enzymů. U saprotrofní houby Fomes fomentarius byl důkladně popsán enzymový aparát a to jak in vitro, tak in vivo. Schopnost produkce hydrolytických enzymů byla dále testována u aktinobakterií izolovaných z půdy a u vybraných kmenů byly provedeny experimenty sledující osud polysacharidů a ligninu v průběhu jejich dekompozice.
Aby bylo možno objasnit úlohu rozkladačů lignocelulózy v komplexních prostředích, jako je půda, bylo zkoumáno jejich zastoupení ve společenstvech hub a bakterií se speciálním zaměřením na aktinobakterie. K dosažení tohoto cíle bylo využito metod sekvenace nové generace (NGS), které vyžadovalo navržení a implementaci nástrojů pro práci se získanými daty, v dané době ještě nedostupných. Tato snaha vyústila ve vytvoření programu SEED pro zpracování sekvenačních dat. S pomocí tohoto programu byli na základě porovnání RNA a DNA komunit odhaleni aktivní mikrobiální rozkladači v lesní půdě. Je patrné, že mnohé významné taxonomické skupiny mikroorganismů mají vysoký poměr RNA/DNA nebo jsou obsaženy pouze v RNA, a tak mohou být podceněny nebo úplně chybět ve studiích, kde byla analyzována pouze DNA. Výsledky také potvrdily význam aktinobakterií jako jedné z metabolicky nejaktivnějších bakteriálních skupin, zejména v organickém horizontu půdy.
Pro získání detailního popisu společenstva aktinobakterií žijících v půdách kontaminovaných těžkými kovy, ve kterých mohou aktinobakterie představovat významné rozkladače, byla vyvinuta metoda pro jejich selektivní analýzu pomocí 454 pyrosekvenace.
Použití této metody ukázalo, že diverzita aktinobakterií není ovlivněna obsahem těžkých kovů, přestože koncentrace těchto kovů významně ovlivňují složení jejich společenstva.
Výsledky také podporují předpoklad, že aktinobakterie v těchto extrémních podmínkách prospívají lépe než jiné bakterie a mohou zde představovat důležité rozkladače lignocelulózy.
5
Práci uzavírají studie zaměřené na zlepšení odhadů relativních četností taxonů hub a bakterií zkoumaných metodami NGS. V případě bakterií byl analyzován vliv variability jednotlivých kopií 16S rRNA genů a jejich počtu v bakteriálních genomech na odhad diverzity a četnosti různých taxonomických skupin a byla navržena metoda umožňující zpřesnění tohoto odhadu. V případě společenstev hub byly porovnány výsledky, získané pomocí běžně používaného markeru ITS1 a alternativního markeru odvozeného od genu rpb2, vyskytujícího se v genomech hub obvykle v jedné kopii. Cílem bylo zejména vyřešit problémy spojené s vnitrogenomovou variabilitou a výskytem mnoha kopií ITS markeru v houbových genomech. U nově navrženého markeru rpb2 se podařilo prokázat široké taxonomické pokrytí, vhodnost pro identifikaci taxonomického zařazení a dostatečnou variabilitu pro použití ve fylogenetických analýzách.
Abstract
Dead plant biomass is a key pool of carbon in terrestrial ecosystems. Its decomposition in soil environments is thus an essential process of the carbon cycle. Fungi are considered to be the primary decomposers in soil ecosystems because of their physiological adaptations and enzymatic apparatus composed from highly effective oxidative and hydrolytic enzymes.
Many recent works show that in addition to fungi, bacteria may also play a significant role in lignocellulose decomposition and among bacteria, the members of the phylum Actinobacteria are often regarded to significantly contribute to cellulose and lignocellulose decomposition.
This thesis is focused on the evaluation of the role that fungi and Actinobacteria play in dead plant biomass degradation. First, it explored mechanisms involved in degradation, in particular the enzymatic breakdown of major lignocellulose components as cellulose, hemicelluloses and lignin. Enzymatic apparatus of the saprotrophic fungus Fomes fomentarius was explored both in vitro as well as in vivo. Several Actinobacteria were isolated from soil and comparative experiments, investigating production of hydrolytic enzymes, were carried out to track the transformation of polysaccharides and lignin by these strains.
To explain the roles of lignocellulose decomposers in complex environments like soil, the community composition of fungi and bacteria, with special focus on Actinobacteria, was investigated. The use of next generation sequencing (NGS) methods to cover this task required implementation and design of appropriate tools for data handling, not available at the time when the studies were conducted. This resulted in the development of the software pipeline SEED. With the help of this tool, active degraders in forest soil were identified by the
6
comparison of RNA and DNA communities. Further, it was demonstrated that some microbial taxa show high RNA/DNA ratio or were detected only in RNA pool and thus they are underestimated or missing in studies based on DNA analysis. Results also confirmed the importance of Actinobacteria showing that they belong to the most active bacterial groups especially in soil organic horizon.
To provide an in-depth analysis of actinobacterial communities along the gradient of heavy metal contamination, where they were expected to represent the most metabolically active group, the method for a selective community composition analysis of the Actinobacteria using 454 pyrosequencing was developed that allows community composition at a high resolution. The study showed that diversity of Actinobacteria was unaffected by heavy metal content, but the contamination changed the community composition significantly. Results also confirmed that Actinobacteria thrive better than other bacteria in contaminated soils and may thus serve as important degraders of lignocellulose.
Finally, to get the most accurate estimates of the relative abundance of fungal and bacterial taxa obtained by NGS, methods improving these estimates were proposed. This part of study investigated the impact of the variability of 16S copy numbers among the bacterial genomes on the diversity and abundances of different taxonomical groups and steps to refine the abundance estimates were suggested. In the case of fungal communities, an alternative marker derived from the single-copy gene rpb2 was compared with the widely used multi- copy ITS with the aim to reduce the problems of community analysis due to the intragenome variability and multicopy nature of the latter marker. Broad taxonomic coverage, suitability for taxonomic assignments and sufficient variation for the use in phylogenetic analyses were confirmed for the newly proposed marker.
7 Úvod
Odbourávání rostlinné biomasy houbami a bakteriemi
Hlavní součástí odumřelé rostlinné biomasy (opad a mrtvé dřevo) je lignocelulóza složená z celulózy, hemicelulóz a ligninu. Zatímco lignin je vysoce odolný polyfenolický polymer, plně rozložitelný pouze omezenou skupinou organizmů, celulóza a ostatní polysacharidy jsou snáze odbouratelné a proto představují dostupný zdroj uhlíku a energie pro širokou skupinu organismů. Lignocelulóza představuje více než 60% veškeré biomasy na Zemi a proto je její rozklad zásadní pro uhlíkový cyklus [1, 2].
Za hlavní rozkladače lignocelulózy jsou považovány především saprotrofní houby [3]
a to zejména díky produkci vysoce účinných extracelulárních enzymů a vláknitému růstu, jež umožňují její efektivní využití [4]. V případě bakterií je jejich teoretický potenciál pro rozklad lignocelulózy dosud nejasný, nicméně současné pokroky v sekvenaci genomů odhalily, že geny kódující enzymy, účastnící se odbourávání rostlinných polysacharidů jsou u bakterií relativně široce rozšířené. [5, 6]. Mezi nejperspektivnější skupinu bakterií v tomto ohledu patří aktinobakterie, u kterých byla schopnost odbourávat lignocelulózu intenzivně studována [7-9].
Aktinobakterie představují kmen Gram-positivních bakterií s vysokým obsahem GC párů v genomech. Tato skupina bakterií je známa především díky produktům sekundárního metabolismu, jako jsou různá antibiotika, ale také díky jejich charakteristickému vláknitému růstu [10]. Podobně jako u hub umožňuje tento způsob růstu snadný přístup a zužitkování polymerních substrátů jako je lignocelulóza [11]. Bylo prokázáno, že jejich relativně velké genomy často obsahují geny pro celulolytické enzymy [6] a u mnohých izolátů byla schopnost odbourávat polysacharidy prokázána [8, 12]. Přestože aktinobakterie odbourávají lignocelulózu méně efektivně než houby, mají důležitou roli pro cyklus uhlíku v půdě. Díky jejich rozšířené resistenci k těžkým kovům mohou v kontaminovaných půdách představovat důležitou metabolicky aktivní skupinu mikroorganizmů, jenž může teoreticky nahrazovat citlivější houby [13].
Houbová a bakteriální společenstva v půdě
Půda představuje velmi komplexní prostředí s velmi vysokou diverzitou mikroorganismů. Struktura společenstev těchto organismů a jejich aktivita je závislá především na distribuci živin v půdě, a to zejména polysacharidů obsažených v odumřelé
8
rostlinné hmotě [14]. Živiny nejsou v půdě rozděleny rovnoměrně a tato heterogenita způsobuje vertikální stratifikaci půdy, která je patrná zejména u lesních půd. V lesních půdách je možné odlišit jasně oddělené horizonty tvořené opadem ve svrchní části půdy, po kterém následuje organická humózní vrstva, obsahující především zbytky po enzymatickém rozkladu opadu a minerální horizonty s nízkým obsahem živin ve spodních částech [15].
V temperátních lesích přispívá k nerovnoměrnému umístění uhlíku v průběhu roku také sezónní kolísání fotosyntetické aktivity stromů [16, 17] a představuje jeden z dalších faktorů, podmiňujících výskyt určitých taxonomických skupin mikroorganismů, jako jsou například ektomykorhizní houby.
Houbová společenstva v boreálních a temperátních lesích vykazují téměř úplnou prostorovou separaci saprotrofních a mykorhizních druhů [18]. Saprotrofní druhy osidlují primárně opad, kde mohou získat uhlík díky svému enzymatickému aparátu, zatímco mykorhizní druhy dominují spodním vrstvám půdy, kde mobilizují dusík a poskytují ho rostlinám [18, 19]. Zatímco houby představují dominantní rozkladače opadu, význam bakterií stoupá s hloubkou půdy [20]. Navzdory pozornosti, která je věnována úloze bakterií při odbourávání lignocelulózy, a přestože mnohé bakterie odbourávající lignocelulózu byly izolovány, jejich podíl na dekompozici není dosud zcela objasněn.
Analýza mikrobiálních společenstev
Pro identifikaci izolovaných mikroorganismů a při analýze složení mikrobiálních společenstev pomocí sekvenace nové generace (NGS) jsou často využívány geny kódující ribosomální ribonukleové kyseliny (rRNA) [21, 22]. U bakterií se téměř výhradně používá oblast 16S rRNA genu. Na základě znalostí sekvencí celých genomů mnoha bakterií bylo zjištěno, že tento gen může být přítomen v 1 až 15 kopiích a kopie obsažené ve stejném genomu se mohou navzájem výrazně lišit [23]. Tato proměnlivost způsobuje nadhodnocení, nebo naopak podhodnocení četnosti určitých bakteriálních skupin v analýzách bakteriálních společenstev, nebo nárůst pozorované diverzity.
Pro popis houbových komunit se místo samotných molekul rRNA, které nemají dostatečnou informační hodnotu, obvykle používají nekódující oblasti vnitřních přepisovaných mezerníků (ITS) 1 a 2 oddělujících jednotlivé geny rRNA [24, 25]. V genomech hub je rDNA obsahující tyto oblasti uspořádána do opakujících se skupin (klastrů), kde se počty kopií u testovaných druhů pohybují od 1 do 200 kopií [26, 27]. Repetitivní oblasti představují problém při skládání genomových sekvencí neznámých genomů a proto
9
zastoupení těchto oblastí v již sekvenovaných genomech neodráží jejich skutečné počty.
Variabilní počet ITS kopií a případné rozdíly mezi kopiemi značně stěžuje porovnání četností zastoupených houbových druhů. Abychom mohli odhadnout relativní četnost výskytu houbových taxonů přesněji, můžeme využít alternativních genů, které mají dostatečnou diskriminační sílu a vyskytují se v genomu obvykle v jedné kopii. Jako vhodní kandidáti se jeví zejména β-tubulin (tub2), translační elongační faktor 1-α (tef1α) a druhá největší podjednotka RNA polymerázy II (rpb2).
NGS a zpracování dat
S příchodem sekvenace nové generace v roce 2005, se výrazně zvýšilo využití molekulární biologie v ekologickém výzkumu [28]. Tyto metody poskytují veliké množství nukleotidových čtení (pohybující se od desítek tisíc do milionů čtení za jeden běh) v relativně krátkém čase a za zlomek ceny v porovnání s dřívějším Sangerovským sekvenováním.
Molekulární ekologové používají NGS především k analýze složení společenstev mikroorganismů za použití sekvenace PCR produktů získaných amplifikací DNA isolované z různých prostředí.
Na počátku byly pro NGS využívány dvě hlavní platformy vyvinuté firmami Roche a Illumina. Zatímco stroje Roche jsou založeny na pyrosekvenaci, bioluminiscenční metodě, která měří uvolnění anorganického pyrofosfátu, který je následně přeměněn na viditelné světlo sérií enzymatických reakcí, Illumina je založena na sekvenaci pomocí syntézy, při které jsou použity fluorescenčně značené nukleotidy s reverzibilním terminátorem [29]. Pokud porovnáme obě technologie, tak jedním z nejvýraznějších problémů 454-pyrosekvenace je výrazný pokles kvality sekvencí v homopolymerních oblastech. Tento typ chyby zvyšuje pozorovanou diverzitu a tak zkresluje její odhady. Pro překonání tohoto problému bylo vyvinuto několik programů tzv. “denoiserů”, schopných možné problémy predikovat a odstranit, např. PyroNoise, AmpliconNoise and DeNoiser [30].
Dalším problémem způsobujícím zvýšení pozorované diverzity je přítomnost tzv.
chimérických sekvencí. Tyto sekvence jsou hybridními produkty PCR, vzniklými kombinací různých sekvencí a mohou být falešně interpretovány jako nové organismy [31]. Pro odstranění chimérických sekvencí se používají v zásadě dva přístupy. První spočívá v porovnání získaných sekvencí s ověřenou databází nechimerických sekvencí. Tento postup je však omezen velikostí dostupných databází a pro společenstva obsahující neznámé a nové organismy (např. společenstva v lesních půdách) není příliš vhodný [31]. Při druhém přístupu
10
jsou chimery identifikovány de novo na základě vyhledání pravděpodobných rodičovských sekvencí, ze kterých chiméry vznikly a určení četností jejich výskytu. Některé programy umožňují kombinaci obou těchto přístupů jako např. program UCHIME, který je k odstraňování chimér běžně používán [32].
Na závěr je vhodné ještě zmínit význam volby algoritmu, pomocí něhož se získané sekvence seskupují do operačně taxonomických jednotek (OTU, které mají reprezentovat jednotlivé druhy mikroorganismů). Velké množství získaných sekvencí nutí molekulární ekology používat rychlé heuristické algoritmy místo přesných, ale pomalých hierarchických algoritmů. Většina používaných heuristických algoritmů zjednodušuje porovnání sekvencí na lineární problém a je základem programů jako např. CD-HIT and USEARCH [33, 34].
Přestože některé studie doporučují použití přesnějších hierarchických algoritmů, poslední verze rychlého heuristického programu UPARSE dosahuje přesnosti srovnatelné s hierarchickými algoritmy a je pro tvorbu OTU běžně používána [35].
Pro efektivní zpracování NGS dat byly vyvinuty programy pokrývající všechny nezbytné kroky. Tyto programy se nazývají „pipelines“, protože umožňují spojení jednotlivých kroků v závislosti na potřebě uživatele. Mezi nejpoužívanější patří programy MOTHUR [36] a QIIME [37]. I když jsou tyto programy velmi rozšířené, je pro jejich správné použití nutné umět pracovat v příkazové řádce a mít alespoň základní bioinformatické znalosti, což může být překážkou pro řadu uživatelů. Proto se jeví jako nezbytné vyvinout vhodný software, který by kombinoval existující bioinformatické nástroje pro práci se sekvenačními daty a uživatelsky příjemné rozhraní.
11 Cíle práce
Cílem této disertační práce bylo charakterizovat nejdůležitější organismy účastnící se rozkladu odumřelé rostlinné hmoty, jenž mohou být reprezentovány saprotrofními houbami a některými bakteriemi, především aktinobakteriemi.
V průběhu mého doktorského studia v laboratoři environmentální mikrobiologie se směr mojí práce několikrát změnil a postupně vystřídal různá odvětví od biochemie, molekulární biologie až po bioinformatiku. Přestože se může zdát, že některé části mojí práce přímo nesouvisí s ústředním tématem práce, jsem přesvědčen, že jsou její nedílnou součástí.
Tyto části práce jsou ovlivněné především příchodem nových metod v molekulární ekologii, které zásadně změnily způsob myšlení v oboru molekulární ekologie.
Cíle mého výzkumu byly následující:
· Porovnat enzymovou produkci u běžných dřevokazných a opad degradujících hub a pokusit se najít “modelovou” houbu rozšířenou v prostředí našich lesů.
· Prozkoumat ekologii dřeva kolonizovaného houbou bílé hniloby Fomes fomentarius, zmapovat rozložení enzymových aktivit a zhodnotit vliv přítomné houbové a bakteriální komunity na produkci enzymů.
· Optimalizovat metodu pro sledování aktivity hydrolytických enzymů na površích různých substrátů ve vysokém rozlišení.
· Ověřit schopnost půdních aktinobakterií rozkládat lignin a porovnat aktivity produkovaných enzymů degradujících celulózu.
· Vyvinout metodu pro zpracování a analýzu NGS dat za účelem identifikace aktivních mikrobiálních rozkladačů porovnáním DNA a RNA komunit.
· Získat detailní obraz složení aktinobakteriálních komunit v půdách kontaminovaných těžkými kovy, kde mohou představovat metabolicky nejaktivnější skupinu.
· Vylepšit odhady relativních četností houbových a bakteriálních taxonů identifikovaných pomocí NGS.
12 Materiál a metody
Bioinformatické zpracování sekvenačních dat (Článek V, VI, VII, VIII, IX) Kultivace hub a bakterií (Článek I, IV)
Měření enzymových aktivit (Článek I, II, III, IV)
Sledování přeměny lignocelulózy pomocí 14C-značených substrátů (Článek IV) Odhad diverzity společenstev (Článek VI, VII, VIII, IX)
Příprava knihoven pro amplikonovou pyrosekvenaci (paper VI, VII) Purifikace a charakterizace enzymu (Článek I)
Taxonomická identifikace houbových a bakteriálních druhů (Článek II, IV, VIII, IX) Vývoj počítačového programu (Článek V)
Vzorkování dřeva (Článek II) Vzorkování půdy (Článek VI, VII)
13 Výsledky a diskuse
Saprotrofní basidiomycety hrají klíčovou roli při rozkladu odumřelé rostlinné hmoty na Zemi, a proto je důležité pochopit mechanismy, které pro tento rozklad využívají. Jedním z prvních kroků této práce bylo porovnat produkci hlavních enzymů účastnících se dekompozice lignocelulózy u několika saprotrofních basidiomycetů a vybrat vhodného kandidáta pro další experimenty. Podle očekávání byla prokázána vyšší produkce enzymů degradujících lignin u hub bílé hniloby, houby hnědé hniloby naopak produkovaly pouze celulolytické a hemicelulolytické enzymy a opad degradující houby měly obě skupiny enzymů shodně zastoupeny (Článek I). Z porovnávaných hub vynikal v produkci lakázy, celobiohydrolázy a zvláště β-glukosidázy troudnatec kopytovitý (Fomes fomentarius).
Protože celulázy patří mezi třetí nejpoužívanější skupinu industriálních enzymů na světě [38]
a zejména β-glukosidáza má široké uplatnění v biotechnologických aplikacích [39], byl tento enzym izolován a charakterizován. Tento enzym byl podobný malým extracelulárním enzymům produkovaným houbami z rodu Pleurotus nebo Phanerochaete a řada parametrů naznačovala jeho vysoký potenciál pro aplikační využití [40].
Abychom lépe pochopili, jak enzymový rozklad u této houby probíhá v dřevní hmotě, byla popsána produkce a prostorová distribuce extracelulárních enzymů v kolonizovaném dřevě (Článek II). Z porovnání kolonizovaných vzorků dřeva buku a břízy je patrné, že se enzymová produkce výrazně liší v závislosti na hostitelském stromě a abychom získali detailní pohled na ekologii této dřevokazné houby byla provedena podrobná analýza segmentu kolonizovaného kmene břízy. Výsledky ukazují vysokou diverzitu bakterií ve dřevě, kolonizovaném troudnatcem, což je v souladu s předchozími studiemi zaměřujícími se na bakterie spojené s dřevní hmotou [41-43]. Na druhou stranu byl F. fomentarius překvapivě jediným významným druhem houby, přítomným v kmeni, což je charakteristické spíše pro počáteční kolonizaci dřeva [41, 44]. Porovnáme-li biomasu bakterií ve dřevě s biomasou hub je bakteriální biomasa mnohem nižší, toto zjištění podporuje předpoklad, že bakterie pravděpodobně nejsou efektivní rozkladači dřevní hmoty [4]. Ze získaných dat se zdá, že naměřené enzymové aktivity odrážejí především produkci enzymů samotné houby a prostorově nehomogenní hodnoty naměřených enzymových aktivit indikují, že kolonizace dřeva je realizována v na sebe navazujících etapách.
Hydrolytické enzymy, účastnící se dekompozice, jako celobiohydroláza, β-xylosidáza, β-glukozidáza nebo N-acetylglukosaminidáza a mnohé další, mohou být měřeny s využitím fluorogenních substrátů konjugovaných s 4-methylumbelliferolem (MUB) nebo 4-
14
amidomethylkumarinem s velmi vysokou citlivostí [45, 46]. Pomocí imobilizace fluorescenčních substrátů byla vyvinuta metoda pro enzymová měření s rozlišením 2,3 mm a detekčním limitem 1,8 nmol·h-1·cm-2 (Článek III). Tato metoda může být použita pro detailní studium prostorové heterogenity enzymových aktivit, podobně jako v případě houbou kolonizovaného dřeva v Článku II.
Jak je obecně známo, některé aktinobakterie produkují enzymy schopné degradace polysacharidů nebo fenolických sloučenin pocházející z odumřelých rostlin [7, 47] a mohou tak plnit stejnou ekologickou roli jako houby. Abychom identifikovali aktinobakterie schopné produkovat tyto enzymy, testovali jsme více než sedmdesát aktinobakteriálních kmenů isolovaných z luční a lesní půdy na produkci extracelulárních enzymů β-glukozidázy a celobiohydrolázy (Článek IV). Ze zkoumaných kmenů jich 32 % neprodukovalo žádný testovaný enzym, zatímco 31 % produkovalo oba enzymy. Protože celobiohydroláza často představuje enzym limitující rychlost dekompozice celulózy [48, 49], byly kmeny vykazující zvýšenou produkci tohoto enzymu vybrány pro další experimenty. V těchto experimentech byly vybrané kmeny aktinobakterií kultivovány společně se substráty značenými 14C (lignin, katechol a dehydrogenační polymer analogický ligninu (DHP)) po dobu 76 dnů a bylo měřeno množství uvolněného radioaktivního CO2. Zkoumané kmeny byly schopny mineralizovat 1.1
% ligninu a až 4 % solubilizovat. Katechol byl mineralizován až z 11 % a solubilizován až z 64 %. V případě DHP byla pozorována jen minimální mineralizace. Mineralizace 14C značeného ligninu zástupci rodu Streptomyces byla poprvé popsána Crawfordem (1978), který naměřil hodnoty pohybující se mezi 1,5 a 3 % po 42 dnech kultivace. Podobné hodnoty byly také popsány Pastim (1990). Některé práce zmiňují i vyšší hodnoty mineralizace [50, 51], musí být však přihlédnuto ke způsobu přípravy značeného ligninu, která může měřené hodnoty výrazně ovlivnit. Výsledky ukazují, že se aktinobakterie mohou výrazně podílet na degradaci lignocelulózy, přestože se zdá, že tato dekompozice je omezena na kmeny představující pouze malou část z celého společenstva. Celkově se dá říci, že aktinobakteriální rozklad ligninu je zřejmě dosti omezený oproti saprotrofním houbám, avšak jejich podíl na solubilizaci fenolických látek může být významný zvláště v případě nízkomolekulárních sloučenin.
Rozklad rostlinné biomasy je z velké části situován prostředí opadu a půdy, kde je diverzita mikroorganizmů zpravidla mnohonásobně vyšší než v houbami kolonizovaném dřevě [52, 53]. Z důvodu této vysoké diverzity se pro studium houbových a bakteriálních společenstev jeví metoda amplikonové pyrosekvenace jako jednoznačně nejvhodnější. Tato metoda byla zpočátku používána především pro analýzy bakteriálních společenstev, pro které
15
se postupy zpracování získaných dat relativně rychle ustálily. V případě houbových sekvencí bylo potřeba postupy ještě optimalizovat. Analýzou více jak 40 prací, publikovaných mezi roky 2009 a 2013 (Článek V) jsme zjistili, že přes některé snahy standardizovat popis a publikaci NGS datasetů [54], stále ještě mnoho autorů podceňuje důležité kroky při zpracování dat (např. denoising a odstraňování chimérických sekvencí). V Článku V jsme navrhli vhodný postup pro zpracování amplikonových dat a jednotlivé kroky jsme implementovali do programu SEED. Tento program byl později použit pro zpracování houbových a bakteriálních dat v Článku VI, aktinobakteriálních dat v Článku VII a dat z pyrosekvenace funkčních genů cbhI a rpb2 ve Článcích VI a IX.
Zatímco analýza mikrobiálního společenstva založená na použití DNA ukazuje společenstvo všech přítomných organismů, použití RNA přináší možnost identifikovat jeho metabolicky aktivní část [55]. Metoda cílené amplikonové pyrosekvenace s použitím DNA i RNA izolované z půdy smrkového lesa (Picea abies) byla pro analýzu bakteriálních a houbových společenstev použita vůbec poprvé (Článek VI). Výsledky odhalily vysokou diverzitu bakterií oproti houbám a ukázaly značný rozdíl mezi opadovým a humózním horizontem pro celkové i relativní množství bakteriální a houbové biomasy. Zatímco složení bakteriálního společenstva na základě DNA a RNA se značně překrývalo, společenstvo hub bylo na úrovni RNA podstatně různorodější a mnohé taxony se vyskytovaly pouze v RNA.
Výsledky jednoznačně ukazují, že přístupy založené pouze na analýze DNA mohou opomenout důležitou a funkčně významnou část mikrobiálního společenstva a naše znalosti, z velké části založené na tomto přístupu, mohou být neúplné. Studie dále ukázala, že dominantními bakteriálními kmeny v půdách smrkového lesa byly proteobakterie, acidobakterie a aktinobakterie, které dohromady představovaly 80-90% všech sekvencí odvozených z DNA z opadu i půdy a jejich dominance byla ještě silnější u dat odvozených z RNA. V půdě představovaly aktinobakterie nejpočetnější aktivní skupinu.
Z Článku VI je tedy patrné že aktinobakterie tvoří důležitou část aktivního mikrobiálního společenstva v lesních půdách. Jejich význam může ještě narůstat v půdách kontaminovaných těžkými kovy především díky jejich rezistenci vůči nim [56, 57].
Aktinobakterie zde mohou představovat hlavní metabolicky aktivní skupinu organismů, která může konkurovat více citlivým houbovým zástupcům [13, 58]. Abychom získali podrobnější informace o složení aktinobakteriálního společenstva, vytvořili jsme metodu pro selektivní amplikonovou pyrosekvenaci aktinobakterií a otestovali tuto metodu na vzorcích luční půdy, získaných podél gradientu znečištění těžkými kovy (Cd, Cu, Zn and Pb; Článek VII). Ve shodě se studií Berga a kol. [59] se nám pomocí kvantitativní PCR podařilo prokázat, že
16
celkové množství bakterií negativně koreluje s úrovní znečištění, zatímco množství aktinobakterií zůstává nezměněné. Diverzita aktinobakterií nebyla zvyšující se koncentrací těžkých kovů významně ovlivněna, kontaminace však měla vliv na složení jejich společenstva. V získaných datasetech se nám podařilo také odhalit některé aktinobakteriální rody často spojované se schopností odbourávat lignocelulózu, jedná se především o zástupce rodu Streptomyces (analyzované v článku IV), dále rodu Acidothermus, který zahrnuje některé účinné rozkladače celulózy jako např. Acidothermus cellulolyticus [60] a rodu Microlunatus také často spojovaný s rozkladem odumřelé rostlinné biomasy [61]. Tato studie ukázala velký potenciál specifické amplifikace spojené s NGS pro analýzu vybrané taxonomické skupiny a podpořila hypotézu, že aktinobakterie mohou v kontaminovaných oblastech zprostředkovávat důležité funkce jako je podíl na rozkladu organické hmoty.
Počet sekvencí zařazených do OTU je často interpretován jako míra výskytu daného taxonu a využívá se pro kvantitativní porovnání podobnosti mikrobiálních společenstev.
Jedním z nejčastěji používaných genů pro studium bakteriálních komunit je gen pro 16S rRNA, a to především pro svojí univerzální distribuci a variabilitu dostatečnou pro určení příbuznosti mezi taxony [62, 63]. V Článku VIII jsme analyzovali 1,690 kompletních bakteriálních genomů patřících do 909 různých druhů a 454 rodů, u kterých jsme identifikovali 7,081 16S rRNA genů. Počet kopií těchto genů se v genomech pohyboval od 1 do 15 s průměrnou hodnotou 4,2 kopií na genom. Přestože 15% bakteriálních genomů obsahovalo pouze jednu kopii, je patrné, že většina bakteriálních kmenů obsahuje bakterie s více než jednou kopií, nejčastěji s pěti a více. Již předchozí studie ukázaly, že počet kopií 16S rRNA genů může vykazovat jak úzkou, tak širokou variabilitu v rámci testovaných rodů [64, 65], tak různé sekvenční varianty v rámci genomu [66]. Na základě analyzovaných dat jsme ukázali, že velikost genomu se zdá být více konzervovaná než počet kopií 16S rRNA na všech testovaných taxonomických úrovních a pouze malá část bakteriálních genomů obsahuje identické kopie. Pokud je použit standardní práh 97% podobnosti, běžně používaný pro odlišení bakteriálních druhů, jsou často sekvence jednoho druhu, ale i genomu, zařazeny do více různých OTU z důvodu vnitro-genomové nebo vnitro-druhové variability. Na druhou stranu, při použití stejného podobnostního prahu druhy některých rodů nejsou separovány (41,7% procent zkoumaných rodů mělo nepodobnost 16S rRNA nižší než 97%). Toto rozdělení také výrazně závisí na požité oblasti 16S rRNA genu. Na příkladu bakterií z lesních půd, analyzovaných v Článku VI, jsme demonstrovali, že v současné době široce rozšířený odhad četnosti pouze na základě získaných 16S rRNA sekvencí poskytuje nepřesný popis složení bakteriálního společenstva. Na základě těchto poznatků byl v Článku VIII navržen
17
postup pro získání přesnějšího odhadu relativní abundance individuálních bakteriálních taxonů pomocí znalosti velikostí nejbližšího známého genomu a obsaženého počtu kopií rRNA. Tento postup by se měl stát standardním krokem při zpracování dat odvozených od bakteriálních 16S rRNA genů a byl také aplikován při odhadech relativních četností v případě aktinobakteriálních komunit popsaných v Článku VII.
Přestože použití rRNA genů pro studium bakteriálních společenstev má jisté limitace, zvyšující se množství sekvenovaných bakteriálních genomů může výrazně pomoci získat dostatečně přesné odhady. V případě hub je situace mnohem složitější. Místo genů, kódujících houbové rRNA, jsou pro identifikaci používány oblasti rDNA (ITS1 a ITS2) které jsou díky své variabilitě vhodnější [21]. Podobně jako u bakteriálních rRNA genů je informace o relativní četnosti jednotlivých taxonů a diverzitě ovlivněna výskytem mnoha kopií rDNA v genomech a možností existence ITS paralogů. Abychom získali alternativní pohled na složení houbových společenstev, použili jsme pro jejich analýzu pomocí amplikonového sekvenování gen, vyskytující se v houbových genomech často pouze v jedné kopii, a to druhou největší podjednotku RNA polymerázy II (rpb2). Získaná data jsme poté porovnali s daty odvozenými od běžně používaného markeru ITS1 a možnost použití rpb2 genu jsme dále ověřili pomocí analýzy uměle vytvořené houbové komunity kombinující DNA 130 druhů hub (Článek IX). Dataset, získaný z environmentálních vzorků pomocí amplifikace rpb2 obsahoval více nehoubových sekvencí než ITS dataset, ale na druhou stranu ho silně převyšoval v diverzitě a četnosti sekvencí zařazených mezi bazální linie hub. Mezi ně patří například zoosporické houby, jejichž výskyt byl již popsán v prostředích, analogických studované lesní půdě [67], avšak doposud byly dosti podceňovány pravděpodobně kvůli nedostatečné komplementaritě s používanými ITS primery nebo nízkému počtu kopií rDNA v genomech. V Článku IX byla prokázána celková shoda v identifikaci houbových rodů a houbových tříd získaných pomocí rpb2 a ITS, avšak tato shoda nebyla pozorována u četností hlavních rodů a hlavních houbových skupin. Nízký počet kopií v genomu a konstantní délka amplikonů představuje pro rpb2 důležitou výhodu pro správný odhad diverzity a relativní četnosti zkoumaných taxonů. Dále použití kódujícího genu, u kterého lze přeložit nukleotidovou sekvenci do aminokyselinové sekvence, umožňuje identifikaci případných pseudogenů a konstrukci robustních fylogenetických stromů. Naše výsledky ukazují, že tento marker vykazující citlivost převyšující ITS [21], přináší mnohé výhody pro analýzu houbových společenstev a je vhodný především pro studium bazálních houbových linií.
18 Závěry
Tato práce je založena na devíti článcích, týkajících se objasnění role hub a bakterií při rozkladu odumřelé rostlinné hmoty a použití NGS pro analýzu složení mikrobiálních společenstev. Jednotlivé studie se zabývají jak dřevní hmotou jako homogenním substrátem kolonizovaným především saprotrofickými houbami, tak půdním prostředím, které díky své vysoké komplexitě a heterogenitě může hostit až stovky bakteriálních a houbových druhů.
U houby bílé hniloby Fomes fometarius byly podrobně zkoumány enzymy účastnící se dekompozice lignocelulózy a jejich prostorová distribuce. Produkce těchto enzymů byla také zkoumána u izolovaných půdních aktinobakterií, kde u některých byla prokázána schopnost degradovat fenolické substráty.
Abychom mohli využít výhody NGS pro popis houbových a bakteriálních společenstev v půdě, byl vyvinut program SEED, který výrazně usnadnil zpracování NGS dat.
Poprvé v historii bylo provedeno srovnání houbových a bakteriálních společenstev v lesní půdě s dostatečnou hloubkou, umožňující odhady diverzity založené na srovnání DNA a RNA, společně s analýzou eukaryotního funkčního genu významného pro dekompozici celulózy. Pro doplnění byl také proveden detailní popis společenstva aktinobakterií z půd kontaminovaných těžkými kovy, potvrzující jejich toleranci ke znečištění těžkými kovy a jejich potenciál podílet se na dekompozičních procesech.
Na závěr se tato práce zabývá problematickými aspekty analýzy mikrobiálních komunit pomocí NGS, kde určitá úskalí představuje především variabilní počet kopií genů pro rRNA běžně používaných pro tyto analýzy. Jako řešení byl pro bakterie navržen postup využívající informace obsažené v sekvencích kompletních bakteriálních genomů a v případě společenstev hub bylo zkoumáno možné použití alternativních genů, které bývají obsaženy v genomu obvykle v jedné kopii.
Publikace zahrnuté v této práci odrážejí rostoucí důležitost moderních molekulárních metod, zejména NGS, pro mikrobiální ekologii a část z nich poskytuje užitečné informace pro efektivní použití těchto metod a zlepšení práce s daty. Půdní ekosystémy představují cenný zdroj znalostí o důležitých procesech s celosvětovým dopadem. Přes velký přínos nových metod a pochopení mnohých procesů v půdě jsou tyto složité systémy stále velmi neprozkoumané. Abychom získali lepší vhled do jejich fungování, je nezbytné využít možnosti v současné době se rychle rozvíjející metagenomiky a metatranskriptomiky společně s novými pokroky v bioinformatice a výpočetních technologiích.
19 Introduction
Decomposition of plant biomass by fungi and bacteria
Dead plant biomass is an organic material derived from plants as plant litter and dead wood. Dominant part of this material is represented by lignocellulose composed from cellulose, hemicelluloses and lignin. While lignin represents a highly resistant polyphenolic material degradable by a limited group of organisms, cellulose and other polysaccharides can be cleaved relatively easily and thus represent a good source of carbon and energy for a wide range of microorganisms and herbivores. Lignocellulose represents more than 60% of total biomass on Earth and thus the decomposition of lignocellulose in the soil environment is an essential process of the carbon cycle [1, 2].
Fungi are often regarded to be the major lignocellulose decomposers [3] because of their highly effective extracellular enzymes and filamentous growth that make them well suited for the exploitation of bulky lignocellulose substrates [4]. Theoretical potential of bacteria to degrade lignocellulose has been studied for a long time and current advances in genome sequencing identified that genes involved in cellulose and lignocellulose decomposition are relatively widespread [5, 6]. One of the most promising groups of bacteria is the group of Actinobacteria where ability of lignocellulose degradation was intensively studied [7-9] and where the genes for cellulolytic enzymes are often found in genomes [5].
Actinobacteria represent a phylum of Gram-positive bacteria with high GC content in their genomes. They are mainly known for their powerful secondary metabolism, especially production of various antibiotics, and typical filamentous mycelial growth [10]. Their filamentous growth may help them to access and utilize the polymeric substrates and make Actinobacteria good candidates for lignocellulose decomposition [11]. Although Actinobacteria are less efficient degraders of lignocellulose than fungi, they have important role in the carbon cycle in soil. Due to their frequent heavy metal resistance they may theoretically replace the more sensitive fungi as the main decomposers in heavy metal contaminated soils and may potentially represent an important metabolically active group in such soils [13].
Fungal and bacterial communities in soil
20
Soil represents a complex environment with a high diversity of microorganisms.
Microbial community composition and activity are dependent on the distribution of nutrients, the most abundant of which are the polysaccharides contained in the dead plant biomass [14].
These nutrients typically show uneven distribution along the soil profile and cause the vertical stratification of soil properties characteristic especially for forest soils. In forest soils, it is possible to observe clearly distinct horizons of plant litter on the top, followed by the organic (humic) horizon composed of recalcitrant residues resulting from enzymatic digestion of litter and mineral soil with low nutrient contents [15]. Moreover, in temperate forests, seasonal changes of photosynthetic activity of trees generates unequal allocation of soil carbon during the year [16, 17] and represents another driver of spatial and temporal distribution of certain taxonomical groups of microbes such as the ectomycorrhizal fungi.
Fungal communities in boreal and temperate forests show vertical distribution with more or less complete spatial separation of saprotrophic and mycorrhizal fungi [18].
Saprotrophic fungi primarily inhabit litter, where carbon can be accessed by their enzymatic apparatus, while mycorrhizal fungi dominate in deeper layers where they mobilize nitrogen and provide it to plants [18, 19]. While fungi dominate the decomposition of litter material, the importance of bacteria increases with soil depth [20]. Despite the continuous attention to the question of bacterial contribution to lignocellulose decomposition, and although many lignocellulose-decomposing bacteria were found, a clear answer is still missing.
Microbial community analyses
The ribosomal ribonucleic acid (rRNA) genes are frequently used as a target for identification of isolated organisms or for microbial community analyses through next- generation sequencing (NGS) [21, 22]. For bacteria, the most widespread and almost exclusive target for the description of their communities is 16S rRNA gene and through the analysis of fully sequenced genomes, it was observed that bacterial genomes may contain between 1 and 15 copies of the 16S and that the 16S copies in the same genomes may differ [23]. This variability, if not addressed, causes overestimation or underestimation of abundance of certain bacterial taxa or inflation of diversity in bacterial community composition studies.
For the description of fungal communities, the noncoding internal transcribed spacer (ITS) regions 1 and 2 of the rRNA are most often used instead of the rRNA molecules which are often insufficient for fungal species discrimination [24, 25]. Fungal genomes typically
21
contain multiple copies of ribosomal genes which are estimated to range from dozens to hundreds and are typically grouped into repetitive clusters on fungal chromosomes [26, 27].
Because the information on rDNA copy numbers in fungal genomes is unavailable, it is difficult to compare relative abundances of fungal taxa properly. To make estimations of the relative abundances of fungal taxa more accurate, genes appearing in fungal genomes in a single copy that exhibit sufficient taxonomic discriminative power, seem to represent a suitable alternative. β-Tubulin (tub2), translation elongation factor 1-α (tef1α), and the second largest subunit of RNA polymerase II (rpb2) are examples of such candidate genes for molecular taxonomy.
NGS and data processing
Since the next generation sequencing (NGS) became commercially available in 2005 [28], it substantially increased the applicability of molecular biology in ecology research.
NGS provides from tens of thousands to hundreds of millions of nucleotide reads per run and cost of sequencing rapidly decreased as its techniques became popular all over the world.
Molecular ecologists use NGS primarily to analyze community composition using ultra-deep sequencing of PCR products amplified from extracted DNA (or RNA) isolated from various environment.
At the beginning there were two major platforms developed by Roche and Illumina.
While the approaches used by Roche are based on pyrosequencing, a bioluminescence method that measures the release of inorganic pyrophosphate by proportionally converting it into visible light using a series of enzymatic reactions, Illumina has based it on the sequencing-by- synthesis approach using fluorescently labeled reversible-terminator nucleotides [29]. When Illumina and pyrosequencing are compared, one of the most problematic aspects of pyrosequencing is the high quality decrease when homopolymeric regions are present in sequences. This common type of error inflates the observed diversity. To overcome this problem several algorithms called denoisers were developed, e.g. PyroNoise, AmpliconNoise and DeNoiser [30].
Another significant problem causing an inflation of observed diversity is the presence of chimeric sequences in the data. Chimeric sequences (chimeras) are hybrid products between multiple parent sequences often formed during the initial PCR, which can be falsely interpreted as novel organisms [31]. To remove chimeric sequences from the datasets, two main approaches are often used. The first approach is based on using curated reference
22
database of non-chimeric sequences, which is quite problematic when unknown communities (e.g., the forest soil communities) are investigated [31]. The second approach identifies chimeras de novo and is based on identification of parent sequences directly from the dataset comparing the frequencies of sequence parts. Some software tools, such as UCHIME allowing to combine both of the chimera removal approaches [32].
Finally, the choice of the algorithm for clustering sequences into operational taxonomic units (OTUs) has significant influence on observed diversity. Large amount of obtained sequence reads force molecular ecologists to prefer fast heuristic algorithms over slow accurate hierarchical algorithms. Most used heuristic approach simplifies the problem of sequence comparison to a linear problem and was implemented in several programs, e.g. CD- HIT and USEARCH [33, 34]. The latest improved version of fast heuristic program UPARSE has accuracy comparable to hierarchical algorithms [35].
To simplify the processing of NGS data, programs covering all necessary steps were developed. These programs are called "pipelines" because they allow an appropriate custom workflow depending the user’s needs (e.g., MOTHUR [36] and QIIME [37]). Still up to now, the most widespread and well-established pipelines for amplicon data analysis are difficult to comprehend and handle by biologists who lack the necessary command line skills and background in bioinformatics. These reasons made it necessary to develop a suitable software application combining existing bioinformatic tools and an extended array of options for data handling with a user friendly interface.
23 Aims
The thesis focuses on the characterization of main drivers involved in dead plant biomass degradation which can be represented by saprotrophic fungi and some bacteria, especially Actinobacteria.
During the years of my PhD study in the Laboratory of Environmental Microbiology the direction of my work has changed several times and branched to cover biochemistry, molecular biology, and bioinformatics. Even though some of the pieces of my work appeared to be quite distant from the original topic of my thesis, I am convinced that they all represent integral parts of my research efforts, shaped largely by the arrival of novel methods in molecular ecology. These methods changed the paradigm in molecular biology, especially the expansion of next generation sequencing (NGS).
The aims of my research were:
· To compare enzyme production in common wood rotting and litter decomposing fungi and search for the “model” fungus presented in our forest environment.
· To explore ecology of coarse wood colonized by white rot fungi Fomes fomentarius, measure local distribution of enzyme activity and evaluate the influence of fungal and bacterial community to enzyme production.
· Optimize the method for monitoring of hydrolytic enzymes activities on various substrate surfaces at high resolution.
· Screen the cellulose degrading enzymes produced by soil Actinobacteria and explore their ability to decompose lignin.
· Develop methods for NGS data processing and analysis to identify the active microbial decomposers through the comparison of DNA and RNA communities.
· Get in-depth insight into the actinobacterial community composition in heavy metal contaminated soils where they may potentially represent the major metabolically active group.
· Improve the estimates of the relative abundance of fungal and bacterial taxa obtained by NGS.
24 Materials and Methods
Bioinformatic analysis of sequencing data (paper V, VI, VII, VIII, IX) Cultivation of fungi and bacteria (paper I, IV)
Diversity and statistical analysis (paper VI, VII, VIII, IX) Enzyme assays (paper I, II, III, IV)
Enzyme purification and characterization (paper I)
Library preparation for tag-encoded amplicon pyrosequencing (paper VI, VII) Tracing of substrate utilization using 14C-labelled substrates (paper IV) Software development (paper V)
Soil sampling (paper VI, VII)
Taxonomical identification of fungal and bacterial strains (paper II, IV, VIII, IX) Wood sampling (paper II)
25 Results and Discussion
Saprotrophic wood-inhabiting basidiomycetes play the key role in lignin and cellulose decomposition of dead plant biomass and thus the knowledge of decomposition mechanisms they use represents an important question. In the beginning of this work the in vitro characterization of major enzymes involved in lignocellulose decomposition produced by several saprotrophic basidiomycetes was tested and showed, as expected, that white-rot species produced high levels of lignin-degrading enzymes, brown-rot fungi produced only cellulolytic and hemicellulolytic enzymes, and litter-colonizing saprotrophic fungi produced both types of enzymes. Because cellulases are currently the third largest group of industrial enzymes used worldwide according to market size [38] and β-glucosidase has a broad range of uses in biotechnological applications [39] this enzyme produced by F. fomentarius in very high amount was purified and characterized (Paper I). The F. fomentarius 1,4-β-glucosidase is similar to the small extracellular enzymes produced by Pleurotus or Phanerochaete spp. [40]
with several interesting characteristics suitable for industrial application.
To better understand how the degradative enzymes work under in vivo conditions, the production and spatial distribution of extracellular enzymes in coarse wood colonized by the Fomes fomentarius were explored (Paper II). Enzyme production varied significantly depending on host tree and to get the detailed information about ecology of fungus colonized wood an in-depth analysis of a B. pendula log segment was done. Results showed that bacterial diversity in fungus-colonized wood was high which is in accordance with previous studies on bacteria associated with decaying wood [41-43] On the other hand, F. fomentarius was surprisingly the single dominant fungal representative in the log, which is a feature more characteristic for initial decay [41, 44]. The biomass of bacteria in wood was very low when compared to fungal biomass content, which supports the view that bacteria are not supposed to be efficient decomposers of bulky lignocellulose like wood [4]. As a consequence, it is most likely that the measured enzyme activities reflected the degradative activity of the fungus. It seems that colonization of wood by fungus is often done in consecutive processes which were apparent from spatially inhomogeneous rates of coarse wood biodegradation and differential enzyme production.
Hydrolytic enzymes, including cellobiohydrolase, β-xylosidase, β-glucosidase, and N- acetylglucosaminidase which were measured in the case of colonized wood (paper II) and several others can be measured by enzyme assays using fluorogenic 4-methylumbelliferyl- or 4-amidomethylcoumaryl-labeled enzyme substrates with sufficient sensitivity based on the
26
fluorescence of reaction products [45, 46]. With a methodology based on the immobilization of fluorescent substrates, a method was developed for enzyme measurement at a 2.3-mm resolution with a detection limit of 1.8 nmol·h-1·cm-2 (Paper III) that can be used for detailed studies of spatial heterogeneity in various substrates like the fungus-colonized wood in Paper II.
It is well known that several Actinobacteria produce enzymes that decompose polysaccharides or phenolic compounds in dead plant biomass [7, 47] and may thus fulfill the same ecological role as fungi. To get an insight into the actinobacterial lignocellulose decomposition, more than seventy isolated actinobacterial strains from meadow and forest soils were screened for the production of extracellular cellulolytic enzymes β-glucosidase (BG) and cellobiohydrolase (CBH) (Paper IV). Of these strains, 32% did not produce any of the tested enzymes, while 31% produced both of them. CBH often represents the rate-limiting enzyme in the decomposition of cellulose, the most abundant and rapidly decomposable polysaccharide in plant litter [48, 49] thus the strains with high production of CBH were selected for further experiments. In those experiments selected strains of Streptomycetes were cultivated with 14C-labelled phenolic substrates (dehydrogenation polymer (DHP), lignin and catechol) for 76 days and amount of radioactive CO2 released was measured. Tested strains were able to mineralize up to 1.1% of poplar lignin and to solubilize up to 4% of it. Catechol was mineralized up to 11.4% and solubilized up to 64%, while only minimal mineralization of DHP was observed. The mineralization of lignin by Streptomycetes was first reported by Crawford (1978), who found that mineralization rates of 14C-lignin labelled fir varied from 1.5 to 3% after nearly 42 days [9]. Similar rates were also reported by Pasti [68].
Occasionally, higher lignin mineralization rates were reported [50, 51], but care must be taken in these comparisons because the modes of lignin labelling and preparation greatly affect mineralization rates. The results showed that Actinobacteria could be significantly involved in lignocellulose degradation, although it is likely that the decomposition of biopolymers is limited to strains that represent only a minor portion of the entire community. Actinobacterial cometabolic degradation of lignin seems to be limited when compared to saprotrophic fungi, but they may significantly contribute to the solubilization of phenolics, especially low- molecular-mass compounds.
Majority of plant biomass decomposition is carried out in soil (in particular in litter layer) and the microbial diversity there could be many times higher than in fungus colonized wood [52, 53]. To get insight into the fungal and bacterial diversity and community composition and to identify important groups potentially responsible for lignocellulose
27
degradation in soils, amplicon pyrosequencing was the method of choice. Bacterial community NGS data analyses were well established in contrast to fungal communities, therefore there was a need of a unified workflow for fungal-derived sequence data. Even though there were attempts to standardize the description and publication of NGS datasets of fungal communities [54], investigation of 40 publications concerning fungal community analyses from time period between years 2009 and 2013 (Paper V) showed that many authors underestimated important steps in data treatment (e.g. denoising and chimera removal). Paper V proposed a suitable workflow for fungal-amplicon pyrosequencing data and incorporated all important steps of this workflow into the developed software pipeline and sequence editor SEED. The developed software was also used to process bacteria-derived data in Papers VI and VII and data from amplicon pyrosequencing of functional genes cbhI and rpb2 in Papers VI and IX.
While DNA-derived approaches to community analyses can reveal the static image of total community of microorganisms, RNA-derived approaches may bring unique insights into the metabolically active part of the community due to rapid RNA turnover [55]. Using the method of targeted amplicon library preparation for pyrosequencing the structure of DNA as well as RNA-derived community of fungi and bacteria in spruce (Picea abies) forest soil was analyzed for the first time and to specifically target an important decomposition process, diversity estimation of a functional eukaryotic gene for cellobiohydrolase (exocellulase) cbhI was investigated (Paper VI). Analysis of fungal and bacterial communities revealed considerably higher diversity of bacteria than fungi and show that the litter and humic horizons differ significantly in both the total and relative amounts of bacterial and fungal biomass. While the diversity estimates for DNA- and RNA-derived communities of bacteria were similar and composition largely overlapped, the fungal communities showed that a more diverse community was present in RNA. Results shows that the DNA sequencing approaches miss a significant and functionally relevant part of microbial communities and the current knowledge largely based on this approach is incomplete. The analysis of bacterial community showed that Proteobacteria, Acidobacteria and Actinobacteria were the most dominant phyla comprising 80–90% of all DNA derived sequences in both horizons and this dominance was even stronger in the RNA pool, where especially Actinobacteria showed high presence in the active part of the community in H horizon and where they may contribute in recalcitrant phenolic compounds decomposition.
From the comparison of active and total communities in forest soils (Paper VI) it is apparent that Actinobacteria represent an important fraction of the active part of the microbial
28
community in soil. Because their heavy metal resistance [56, 57] they may potentially represent the major metabolically active group in heavy metal contaminated soils where they could compete with more sensitive fungi [13, 58]. In order to get deeper insight into actinobacterial community composition, a method for selective amplicon pyrosequencing of Actinobacteria was developed and tested on actinobacterial communities in grassland soils along the gradient of heavy metal contamination (Cd, Cu, Zn and Pb) (Paper VII). Using quantitative PCR, it was demonstrated that the amount of bacteria negatively correlated with heavy metal concentration, but Actinobacteria stayed unchanged which is in agreement with study of Berg [59]. The diversity of Actinobacteria in samples seemed to be unaffected by increasing heavy metal content, but heavy metals had a slight effect on community composition with Cu found to be the most significant factor. There were also found several genera where can be suspected ability to degrade lignocellulose, especially mentioned Streptomyces (Paper IV), further genus Acidothermus, which also includes efficient degraders of cellulose, e.g. Acidothermus cellulolyticus [60], and Microlunatus, which are involved in the decomposition of plant biomass [61]. This study demonstrated the potential of specific amplification combined with next-generation sequencing, here used to analyze the actinobacterial community composition in metal polluted soil. Actinobacteria seem to be less affected by heavy metals than other bacteria, and considering their metabolic potential, they can provide important soil functions, such as a contribution to organic matter decomposition.
In pyrosequencing datasets, the abundance of reads belonging to a certain OTU is commonly interpreted as a measure of taxon abundance, useful for quantitative comparisons of community similarity. The most commonly used target in ecology studies of bacterial communities is 16S rRNA gene, because of its universal distribution and sufficient variability to determine phylogenetic relationships among taxa [62, 63]. We investigated a total of 1.690 fully sequenced bacterial genomes belonging to 909 bacterial species and 454 genera where total of 7.081 16S rRNA genes were identified (Paper VIII). 16S rRNA gene copy numbers varied from 1 to 15 copies per genome with average of 4.2 and although 15% of bacterial genomes contain only a single 16S rRNA copy, it seems that most bacterial phyla may contain bacteria with more than one copy and one half of the currently analyzed genomes harbor five or more copies. Previous works showed that 16S rRNA copy numbers have shown both narrow and wide variation within the tested bacterial genera [64, 65] and also the variability between the different copies within the genomes [66]. We showed that genome sizes appear to be more conserved than 16S rRNA copy numbers at all tested taxonomical levels and only a minor part of the bacterial genomes contain identical gene copies. If the
29
standard level of 16S rRNA similarity of 97% is used, a few species, even genomes, can fall to different OTUs due to intragenomic or intraspecific differences. In contrast, species of several genera will not be separated at the same similarity level because in 41.7% of genera, the 16S rRNA differences were lower than 97%. This, however, depends on the part of the 16S rRNA gene used for OTU construction. On the example of forest soil bacteria described in Paper VI it could be demonstrated that the recently widely applied 16S rRNA-based abundance estimates provide an imperfect description of bacterial community composition.
Based on this work, it was proposed that 16S rRNA copy numbers together with genome sizes of closest related taxon may be used for more precise estimates of the relative abundance of individual bacterial taxa in environmental samples. This approach should be a standard part of 16S-derived data processing and it was also applied in estimation of relative abundances of Actinobacteria in Paper VII.
Although there are limitations in the use of rRNA genes (16S rRNA) for bacteria community studies, the increasing amount of sequenced bacterial genomes could help to get sufficiently accurate predictions. In the case of fungi, the situation is less favorable. Instead of using fungal rRNA coding genes, internal transcribed spacer regions of rDNA (ITS1 and ITS2) are well suited for their taxonomic identification [21] and similarly to bacterial rRNA genes the information on the relative abundance of taxa and diversity is negatively affected by the multi-copy nature of rDNA and the possible existence of ITS paralogues. To get an alternative view of fungal community composition we used the single-copy gene encoding the second largest subunit of RNA polymerase II (rpb2) for the analysis of fungal communities by amplicon pyrosequencing in spruce forest topsoil and we compared the obtained results with ITS1 derived data. The applicability of rpb2 as an alternative marker was verified on comprehensive mock community composed of 130 species (Paper IX). The rpb2 data set contained much more non-fungal sequences than the ITS data set, but on the other hand greatly exceeded the ITS in the diversity and abundance of sequences classified into various groups of the basal fungal lineages. Basal fungal lineages are often zoosporic and it is seems that zoosporic fungi are abundant in the studied ecosystem [67] and yet were underestimated by the ITS marker due to the lack of complementarity of ITS primers or possibly due to the proportionally lower rDNA copy numbers per genome in these fungi. Similar levels of OTU inflation were observed for both markers in the soil community as in the defined mock community perhaps suggesting that the real diversity in the soil is closer to the estimate obtained using the rpb2. The present study shows that the single-copy, protein-encoding gene rpb2 may be a viable option for fungal metabarcoding. Paper IX shows general agreement in
30
the identity of the fungal genera and fungal classes recovered using rpb2 marker and ITS, but no such agreement was found in the sequence abundance of the main genera or major fungal groups. The single copy nature and the constant length of the rpb2 amplicon represent an important advantage for proper estimations of diversity and relative abundance. The use of a translatable protein coding gene also enables the identification of potential pseudogenes and the construction of robust phylogenetical trees. The rpb2 gene has taxonomic sensitivity superior to the ITS [21], and our results reveal that this sequence is well suited for the study of basal fungal lineages.