ООО "ПРОПИОНИКС"
пн-пт с 09:00 до 18:00 | +7 (966) 348-80-35 |
СОДЕРЖАНИЕ:
В продолжение раздела «Идентификация желудочно-кишечной микробиоты» в настоящем разделе мы опишем одно очень важное направление исследований (метагеномный анализ), благодаря которому стало возможным идентифицировать кишечную микробиоту не только по видовому составу, но и по функциональному профилю, при этом культуро-независимым способом, т.е. без обязательного культивирования (выращивания) микроорганизмов. Также кратко коснемся и др. направлений исследований микробиома, нацеленных на выявление прочих значимых характеристик микробного сообщества (например, их метаболитов и т.п.). Однако данный раздел невозможно воспринять без базовых заний о ДНК и методах секвенирования нуклеиновых кислот (ДНК, РНК). Поэтому для неискушенных читателей мы рекомендовали бы перед прочтением данного материала немного "пройтись по базе" или освежить уже имеющиеся начальные знания в молекулярной биологии. Это займет немного времени, тем более, что предлагаемая тема является ни чем иным, как основой движения к персонализированной медицине, т.е. к будущему всей здравоохранительной практики. Если знания достаточно свежие, то ниже представленные кнопки-ссылки можно пропустить.
В 1920 году ботаник Ганс Винклер (Hans Winkler) не мог и предположить, какая судьба ждет термин «геном», который он предложил для обозначения совокупности хромосом организма. Некоторые «омы» тогда уже существовали: например, биом (совокупность живых организмов) и ризом (корневая система растения). Все они основаны на греческом суффиксе «-ом», означающем «имеющий природу». Но именно популяризация слова «геном» при участии проекта «геном человека» привела к появлению моды на -омы и -омики.
Позднее ученые начали осознавать маркетинговый потенциал этого вдохновляющего суффикса. И, несмотря на то, что названия некоторых -омик заставляют удивленно приподнять бровь (например, цилиомика — изучение различных выростов на поверхности клеток), исследователи убеждены, что часть из них действительно заслуживает права быть отдельной областью исследований. При этом некоторые омики уже прочно заняли свое место в современной биологии — например, геномика, транскриптомика, протеомика и метаболомика, — названия других все еще звучат непривычно, но все они отражают движение к новой «большой», интегративной биологии.
Мультиомика - это подход к биологическому анализу, в котором наборы данных представляют собой несколько «омов»
Классические «ОМы»
Классические «ОМИКИ»
Для изучения микроорганизмов в основном используют четыре подхода: метагеномное - исследование ДНК, метатранскриптомное - изучение РНК, метапротеомика - изучение белков, метаболомика - изучение метаболитов.
Метагеном — набор генов всех организмов в изучаемой среде. Суть такого анализа в секвенировании гена 16S рРНК, который отвечает за работу рибосомальной РНК, или в секвенировании всей ДНК. Обычно под исследованием микробиоты обычно имеют в виду именно этот тип анализа, потому что его первым стали масштабно использовать для изучения бактерий. После появления технологии секвенирования ДНК ученые запустили глобальный проект по изучению почв, морей, горячих источников. Благодаря метагеномному анализу, база данных микроорганизмов росла в геометрической прогрессии. Секвенирование позволяет изучать бактерии в естественной среде, тогда как в лабораторных условиях многие из них погибают.
В 2007 году исследователи США начали проект по изучению микробиома тела человека Human Microbiome Project (HMP). Он стал толчком к масштабному изучению состава бактерий кишечника на основе метагеномных данных. Вслед за HMP в Европе в 2008 году запустили похожий проект по изучению микробиоты человека — MetaHit. Суть метагеномных исследований в том, чтобы понять, какие микроорганизмы живут в образце, сколько их там и какие функции они выполняют. Анализ не позволяет напрямую оценить, какие соединения производит сообщество бактерий. Однако, благодаря множеству метагеномных исследований, мы можем прогнозировать это опосредованно. Например, если у человека больше бактерий-производителей масляной кислоты — его микробиота, вероятно, хорошо ее вырабатывает.
Метагеномные исследования получили широкое распространение потому, что их проще провести в сравнении с другими методами. Для изучения РНК, белков и метаболитов требуется сложная очистка образцов и более трудоемкие анализы. По метагеномным данным мы имеем больше всего результатов. Это наглядно видно по базе всех научных статей и клинических исследований PubMed.
Метатранскриптомное секвенирование
Транскриптом — совокупность всех молекул матричной РНК (мРНК), которые синтезирует одна клетка или группа микроорганизмов. При метатранскриптомном анализе изучают непосредственно РНК, а не ген, который ее кодирует.
Бывает так, что бактерия есть, но она никак не участвует в жизни микробного сообщества: у нее есть неактивные гены, которые не копируются молекулой РНК. Метатранскриптомные исследования позволяют оценить именно активную часть микробиоты. Однако молекула РНК не так стабильна, как ДНК, и быстро распадается. Поэтому выделить и сохранить ее для анализов сложнее и дороже.
Часто транскриптомные исследования используют для изучения определенных функций генов. В таком случае результаты исследования РНК сверяют с метагеномными данными. Так ученые получают более полную информацию о работе микроорганизмов. Метатранскриптомные исследования микробиома могут быть полезны, чтобы более точно определить потенциал к синтезу различных метаболитов.
При таком подходе изучаются все белки, которые находятся в образце. Метапротеомика дает информацию о структуре, функциях и динамике микробного сообщества. Ученые узнают больше о том, как организмы взаимодействуют друг с другом, соревнуются за питание, производят метаболиты.
Сначала из образца выделяют белки. Часто для этого используют жидкостную хроматографию. Затем проводят дополнительный анализ для определения молекулярной массы — масс-спектрометрию. Так мы получаем информацию о фрагментах белка (пептидах), но не о белке целиком. Чтобы собрать осколки в единое целое, используется специальные программы, и ученые получают готовые данные.
Стоит отметить, что метопротеомика сталкивается с определенной сложностью проведения исследований и высокой вероятностью ошибки, т.к. в образце может быть много белков человека или еды. Однако метапротеомика все же помогает ученым пролить свет на взаимодействия между бактериями и нарушения работы микробиоты у людей с заболеваниями.
См. отдельно:
При таком типе анализа исследуются метаболиты — вещества, которые бактерии производят. Это могут быть аминокислоты, липиды, сахара, жирные кислоты и другие соединения. Сейчас описано несколько десятков тысяч метаболитов тела человека, и все они зафиксированы в большой базе данных.
В качестве образца для исследования метаболитов можно использовать любую жидкость из тела человека: кровь, слюну, мочу, кишечный лаваж (смыв) и даже спинномозговую жидкость. В среднем в плазме крови содержится около 4200 метаболитов, в моче — 3000, спинномозговой жидкости — 500, а слюне — 400. Однако для исследования микробиоты в качестве биоматериала используют лаваж (от французского «le lavage» – промывание, орошение полого органа).
Процедура исследования метаболитов похожа на анализ белков. С помощью той же жидкостной или газовой хроматографии сначала метаболиты выделяют, а затем измеряют их молекулярную массу с помощью масс-спектрометра.
Исследование метаболитов имеет свои ограничения. Например, на основе этого исследования мы не можем узнать точно, какие метаболиты выделяет именно микробиота кишечника, а какие мы получили с пищей.
Также по нему невозможно подсчитать, сколько тех или иных бактерий содержится в микробиоте. Поэтому для более полной картины данные по метаболитам сопровождаются результатами метагеномных анализов. Такой подход иногда используют, чтобы изучить, как микробиота и ее метаболиты участвуют в развитии заболеваний.
Метагеномный анализ обеспечивает подробные количественные измерения таксономического (видового состава) и функционального профилей (генных функций) сложных микробных сообществ, которые содержатся в природе, в т.ч. в макроорганизмах, пищевых и производственных средах. Эти сообщества являются частью уникальных экосистем, сформированных такими факторами, как доступность питательных веществ, pH и осмолярность, а также внешними факторами, такими как температура и дезинфицирующие средства. Сложность и динамические свойства этих сообществ можно измерить с помощью секвенирования на основе 16S рибосомальной РНК или метагенома на основе дробовика на машинах NGS, которые могут быть выполнены собственными силами или сторонними организациями.
На рисунке: шаги, обычно предпринимаемые при анализе микробиома стула.
В исследованиях на людях наиболее распространенным методом характеристики микробиома кишечника является отбор образцов стула, поскольку он легко доступен, неинвазивен и густо заселен микробами, представляющими микробиоту просвета кишечника. После сбора образцы фекалий замораживают и сразу же хранят, как правило, при -80 °C. ДНК извлекается из фекалий в два основных этапа. Во-первых, образец очищается с помощью нескольких реагентов и центрифугирования, что позволяет микробам быть очищенными от других компонентов фекалий. Последующая стадия включает лизис бактериальных клеток путем инкубации образцов с лизисным буфером с перемешиванием, таким как энергичное встряхивание с шариками или без них, и проведение дальнейшего центрифугирования. После этого полученная ДНК амплифицируется с использованием таких подходов, как многократная амплификация замещения (проще говоря проводится ПЦР). Выбирают праймер 16S рРНК и используют для секвенирования гена. Полученные данные последовательности проходят фильтрацию, чтобы гарантировать соблюдение пороговых значений качества. Впоследствии количество последовательностей нормализуется перед анализом операционных таксономических единиц (OTU); метод, с помощью которого группируются родственные бактерии. Алгоритм кластеризации OTU применяется для идентификации родов и видов бактерий. Общий протокол кратко представлен на рисунке выше.
Впервые слово «метагеномика» появилось в 1998 году в статье Molecular biological access to the chemistry of unknown soil microbes a new frontier for natural products (Handelsmanet. al, 1998). Авторы предложили называть словом «метагеномика» науку об изучении совокупности генетического материала микроорганизмов, полученных непосредственно из среды, в данном случае из стоков железодобывающих шахт, в которых наблюдается низкое разнообразие. Сложнее сообщество, обитающее, пример, в сыре. Метагеном среднего уровня (несколько сотен видов) представлен, например, в кишечнике. Бактериальные сообщества океана и почвы обладают высокой сложностью.
Биологические объекты метагеномики: бактерии, археи, вирусы, эукариоты (грибы, вирусы), хозяева (если изучать метагеном кишечника коровы, то можно ожидать что несколько процентов информации получатся коровьими), лабораторные загрязнения.
Основные задачи метагеномики: определить какие бактерии есть, чем они занимаются (то есть нахождение таксономического (филогенетического) и функционального состава) и как они друг с другом взаимодействуют в плане тотального метаболизма.
Исторически бактериальный состав определялся культивированием клеток бактерий и написанием отчетов. Таким способом определяется низкое разнообразие бактерий, к тому же при бак-посеве более 70% бактерий просто не культивируется.
Можно изолировать отдельно вид и изучать его геном, но это долго, так как видов много. Изощреннее метод изолирования бактерий в так называемых гнотобиотических животных. Для этого микробиота подсаживается к стерильным мышам, несколько раз разбавляется до тех пор, пока там не останется несколько видов. Тогда уже можно делать обычную изоляцию на чашке Петри и далее секвенировать (о секвенировании скажем чуть позже). Итак, что же такое метагеномика?
Метагеномика – один из самых развивающихся разделов геномики, посвященный изучению генетического материала (метагенома) сообществ микроорганизмов в совокупности [1]. Объектами изучения метагеномики могут являться любые популяции микроорганизмов, обитающих в воде, почве, организме животного, человека или любой другой среде. Данное направление стало логическим продолжением геномики индивидуальных микроорганизмов, связанным с исследованием каждого генома в отдельности. Главной целью метагеномики является получение и анализ всех геномов для установления видового состава и метаболических взаимосвязей в сообществе [2]. Однако в настоящий момент эта цель труднодостижима по ряду причин.
Сборка даже одного бактериального генома является нетривиальной задачей, так как современные методы секвенирования позволяют получать нуклеотидную последовательность не целого генома, а его относительно коротких участков, из которых его еще необходимо собирать. Если же количество анализируемых микроорганизмов в сообществе превышает несколько тысяч, то задача сборки из трудной превращается в практически неразрешимую [3]. Однако в сборке полных геномов, как правило, нет необходимости [4], так как зачастую информацию о видовом составе популяции можно получить из анализа отдельных генов, который также позволяет выстроить и метаболические сети [5; 6].
Важной особенностью метагеномных исследований можно считать отсутствие необходимости в изоляции и культивировании микроорганизмов, что является принципиальным моментом, поскольку не все из них растут на микробиологических средах. К тому же это позволяет включить в анализ присутствующие в популяции вирусы и бактериофаги, что, несомненно, расширяет представление о метагеноме.
Первичной информацией для метагеномных исследований являются нуклеотидные последовательности, получаемые при секвенировании нуклеиновых кислот (НК). Золотым стандартом секвенирования до сих пор является метод Сэнгера. Мы не будем здесь подробно останавливаться на принципах различных технологий секевенирования (определения нуклеотидных последовательностей ДНК (РНК)), которые отдельно и очень доступно (даже для новичков) описаны в разделе «Секвенирование биополимеров». Остановимся лишь на основных моментах.
Плюсы секвенирования в том, что оно не культурозависимое, то есть берем всю ДНК из образца, и в отрыве от него получаем короткие или длинные риды (в зависимости от прибора) и затем с ними работаем. Для начала нужно выбрать стратегию проведение секвенирования, основываясь на том, что нужно изучить, какие приборы понадобятся, сколько нужно получить прочтений и т.д..
Секвенирование может отличаться по генному составу: секвенирование маркерных последовательностей (например, 16S рРНК) или полногеномное секвенирование. Может отличаться производительность разных методов секвенирования. Высокопроизводительное секвенирование следующего покколения (NGS, new generation sequencing) осуществляется приборами Illumina, SOLiD, 454, Ion Torrent. Различают длинные прочтения (больше 400 пар нуклеотидов) и короткие (35–100 п. н.).
Популярный анализ метагенома — секвенирование 16S рРНК. Ген 16S рибосомальной РНК входит в состав рибосомы (на рисунке слева) в комплексе с белком и участвует в таком важном процессе в клетке как трансляция. Преимущество гена 16S РНК в том, что его края очень консервативны и универсальны для большого диапазона организмов. Некоторые внутренние области вариабельные и поэтому они удобны для отслеживания путей эволюции. По этому гену можно построить бактериальное дерево, и оно будет отражать состав бактериального сообщества. Внутри одного вида сходство гена 16S рРНК достигает 98–99%.
Для того чтобы как можно большее разнообразие вынести из образца необходимо использовать универсальные праймеры. Также можно секвенировать целиком ген, либо только вариабельные участки. Такой метод подходит только для бактерий и архей, для эукариот нужно использовать и 18S РНК.
После получения и выравнивания последовательностей их можно классифицировать. Классификаторы могут быть основаны либо на выравнивании последовательностей, либо на анализе спектра, либо на чем-то еще. Необходимо получить филогенетическое дерево, листьями которого будут конкретные операционные таксономические единицы.
Операционная таксономическая единица (OTU) — абстрактное понятие. Если последовательности достаточно похожи по составу, то они называются таксономической единицей и включаются в дерево. Самый простой способ анализа деревьев — это оценить разнообразие (число листьев). Например, при некоторых заболеваниях кишечника может наблюдаться уменьшение разнообразия микробиоты. Можно также получать метрику сходства, то есть оценивать, насколько два дерева близки друг другу (например, сравнение биоты двух кишечников или сравнение бактерий в кишечнике и в почве, воде или сыре). Для этого испоьльзуют метрику UniFrac (unique fraction), которая представляет собой способ сравнения двух сообществ с учетом таксономического состава.
Как уже было отмечено выше, нуклеотидные последовательности генов 16S и 18S рибосомальной РНК (рРНК) отличаются высокой степенью консервативности, что позволяет определять филогенетическую принадлежность прокариот и эукариот соответственно [8].
Примечание: Возможным минусом использования праймеров на гены рРНК для таксономической идентификации может быть тот факт, что их консенсусные последовательности получены исходя из анализа уже известных бактериальных генов. Это потенциально может привести к сложностям выявления тех микроорганизмов, сиквенсы которых отличаются и еще не известны. Также необходимо понимать, что анализ 16S и 18S генов метагенома не позволяет говорить о наличии вирусов и бактериофагов, для которых подобные универсальные консервативные нуклеотидные последовательности отсутствуют.
C помощью праймеров к константным районам гена рРНК проводят полимеразную цепную реакцию (ПЦР) и получают набор ДНК-фрагментов. Однако секвенирование по Сэнгеру предполагает, что каждый ампликон должен секвенироваться отдельно, что приводит к необходимости их изоляции друг от друга. Классическим способом разделения является клонирование анализируемых фрагментов в плазмидных векторах [9]. В последовательность праймеров с 5′- конца вводится дополнительный участок, необходимый для формирования сайта рестрикции, который позволит провести лигирование ПЦР-фрагмента в вектор. В настоящее время появились и другие подходы, позволяющие разделять фрагменты. В первую очередь, это цифровая ПЦР (digital PCR), основанная на разбавлении анализируемой ДНК до уровня единичных молекул и проведении большого количества параллельных ПЦР [10; 11]. Кроме того, существует метод молекулярных колоний, принцип которого заключается в получении отдельных колоний ДНК-фрагментов при проведении ПЦР в полиакриламидном геле на подложке [12]. Оба метода потенциально могут позволить получить отдельные молекулы ПЦР-фрагментов для дальнейшего секвенирования.
Проблемы метагеномного анализа с помощью секвенирования 16S рРНК:
С помощью 16S рРНК можно оценивать таксономический состав, но большей информации, например, о том, чем организм занимается, получить нельзя.
Рис. 1. BAC-клонирование и метагеномный анализ (секвенирование) методом дробовика
Как отмечалось выше, тема секвенирования отдельно описана в разделе «секвенирование биополимеров», поэтому мы не останавливаемся на ней подробно, а лишь кратко опишем основные применяемые технологии (методики) и платформы:
Поскольку размер метагенома зачастую превосходит размер генома человека, использование метода Сэнгера неоправданно с точки зрения временны́х и финансовых затрат. В последние годы на первый план вышло высокопроизводительное параллельное секвенирование (ВПС), позволяющее получать миллиарды нуклеотидов в день. Появление платформ ВПС нуклеиновых кислот стало новым «толчком» к развитию метагеномных исследований. В настоящий момент используются три основных технологии (платформы) ВПС, обладающие максимальной производительностью: 454 («Roche»), SOLiD («Applied Biosystems») и HiSeq («Illumina»). Неоспоримыми плюсами данных приборов является стоимость секвенирования одного нуклеотида, объем получаемых данных и скорость их получения. Все три технологии ВПС можно свести к нескольким этапам, а именно: получение библиотеки ДНК-фрагментов, ее амплификация и определение нуклеотидных последовательностей. На рынке присутствуют и другие коммерчески доступные секвенаторы, которые также относятся к ВПС: Ion Torrent («Applied Biosystems»), MiSeq («Illumina») и Junior («Roche»). Однако производительность этих приборов значительно ниже, и позиционируются они, скорее, для изучения отдельных геномов, чем для метагеномных исследований.
На начальных этапах развития метагеномики в первую очередь изучался видовой состав сообществ. Как было отмечено выше, для этой цели до сих пор анализируются нуклеотидные последовательности генов 16S и 18S рибосомальной РНК (рРНК). С появлением платформы 454, длина прочтения на которой вполне сопоставима с методом Сэнгера, стало возможным одновременное секвенирование сотни тысяч ПЦР-фрагментов. Это позволило за несколько дней получать информацию о видовом составе микробиоты [13].
Исторически термин «метагеном» впервые использован в работе J. Handelsman и соавт. [14], в которой из почвы выделялась тотальная ДНК, обрабатывалась рестриктазами, после чего полученные фрагменты ДНК клонировались в BAC-векторах. BAC-клонирование позволяло работать с индивидуальными протяженными фрагментами размером до нескольких сот тысяч нуклеотидов, однако даже сотни таких фрагментов, как правило, не сравнимы с размерами метагенома.
Одним из первых продуктивных подходов к секвенированию метагенома был «метод дробовика» (shotgun sequencing), основанный на фрагментации ДНК, клонировании полученных коротких фрагментов и их секвенировании методом Сэнгера. Исходно основным назначением этого метода было проведение полногеномного секвенирования индивидуальных организмов, однако и для метагеномных исследований он оказался вполне применим. Shotgun позволяет анализировать метагеном независимо от типа микроорганизмов и вирусов. Одна из первых работ с использованием shotgun-секвенирования выполнена при изучении морской вирусной микробиоты [15]. Среди недостатков подхода необходимо отметить трудоемкость и дороговизну. Также следует указать, что некоторая часть фрагментов ДНК не клонируется вследствие цитотоксичности.
Платформа 454 используется в метагеномных исследованиях не только для изучения видового состава микробиома, но и как более эффективный аналог shotgun-секвенирования [16; 17]. Полученные нуклеотидные последовательности, как в случае shotgun, так и при пиросеквенировании, собираются в более длинные фрагменты (контиги) с помощью специальных алгоритмов. Существует несколько вариантов дальнейшего анализа. Во-первых, это анализ видового разнообразия, например генов 16/18S рРНК; во-вторых, поиск генов, основанный на алгоритмах обнаружения открытых рамок считывания (ORF). Из найденных генов строятся метаболические сети, характеризующие микробиом как единый симбионтный надорганизм.
Как указывалось ранее, принципиальными характеристиками секвенаторов SOLiD («Applied Biosystems») и HiSeq («Illumina») являются их высокая производительность и короткая длина читаемых фрагментов. Сотни миллиардов нуклеотидов, выдаваемых этими приборами, соответствуют объемам заложенной информации в метагеноме. Сложность в использовании этих платформ заключается в короткой длине получаемых последовательностей, что затрудняет дальнейший анализ, в особенности анализ последовательностей, не имеющих гомологов в базах данных. Однако к настоящему моменту уже накоплен большой объем информации как по полным геномам, так и по отдельным генам, что делает использование этих платформ все более перспективным [18; 19].
В отличие от секвенирования маркерных последовательностей (16S рРНК) для полногеномного анализа используется тотальная ДНК и читается настолько, насколько это возможно. Секвенировать можно либо длинными, либо короткими ридами. Для правильного выбора длины нужно понимать, что нужно в эксперименте получить. Если использовать короткие риды (например, с помощью секвенатора SOLiD), получится много прочтений и это будет дешево. Если длинные (около 1000 п.н.) (секвенаторы по Сэнгеру или 454) — получится немного довольно дорогой информации.
Эти последовательности без сборки и обработки можно использовать для:
Полногеномный анализ микробиоты человека
Рис. 2. Результат полногеномного анализа микробиоты человека
Основным объектом полногеномного анализа является микробиота (микробиом) человека. Эти слова часто употребляются как синонимы, но есть различия в значении: микробиота отражает таксономический состав, микробиом — генный потенциал. В нескольких странах стартовали программы по изучения микробиоты человека и уже сделаны важные открытия относительно микрофлоры кишечника. На рисунке 2 каждая точка соответствует одному метагеному с определенной части тела, чем ближе точки, тем более похож их метагеном.
Одним из важнейших вопросов, который волнует современных ученых — наш второй геном в микробиоте кишечника человека. Бактерии участвуют в человеческом метаболизме, предотвращают заселение человека патогенами, играют роль в становлении и поддержании иммунитета, защите от воспалительных заболеваний. Также есть ось «кишечник-мозг», новейшая область, где ведутся активные исследования.
Проект MetaHit
Рис. 3. График представленности бактерий
Проект MetaHit посвящен изучению метагенома кишечика. Основные участники — 13 институтов из 8 стран. В проекте секвенировали тотальную ДНК из кишечника у более чем сотни человек (здоровых и больных) и составили по этим данным каталог генов микробиоты, которым можно пользоваться в качестве шаблона для выравнивания.
На рисунке 3 представлены около 50 видов бактерий и график их представленности в логарифмическом масштабе. Кроме бактерий, которые широко представлены в кишечнике, есть довольно редкие виды. В метагеноме также было найдено геннное ядро, отвечающих за набор функций, представленных у значительного количества испытуемых. У 90% было найдено порядка 200 тыс. генов генного ядра.
Проект Human Microbiom Project, США
Задачей проекта HMP являлась каталогизации генов и метаболических реконструкций совокупного генного потенциала. Было получено более 600 секвенированных геномов не только из кишечника, но из других частей тела человека, по которым были получены различные результаты. Отдельно измеряли экспрессию генов для поиска функциональных маркеров заболевания. По бактериальному составу можно определять болен человек или нет, или есть ли риск заболевания, и есть он есть, то как можно предотвратить болезнь.
Рис. 4. В зависимости от того, какое семейство и род бактерий доминирует в микробиоте, все профили можно условно разделить на три вида. Их еще называют энтеротипами (названия на рисунке условны (о названиях см. ниже).
Как только стали появляться первые метагеномные исследования, была осуществлена попытка выявить устойчивые типы кишечной микробиоты, по аналогии с группами крови. В 2011 году вышла работа европейских ученых из консорциума MetaHIT, в которой было показано существование трех типов микробных сообществ, названные энтеротипами. Эти группы характеризовались преобладанием определенных бактериальных родов: центральным в первом энтеротипе был род Bacteroides, во втором - Prevotella , в третьем – несколько представителей отдела Firmicutes, включая рода Ruminococcus и Faecalibacterium. Разделение образцов на энтеротипы никак не коррелировало ни с национальной принадлежностью, ни с возрастом или полом. Наличие энтеротипов было подтверждено еще в нескольких исследованиях на других больших группах, но их число варьировало: третий энтеротип иногда не удавалось идентифицировать. В связи с этим, в научном сообществе возникла критика этой теории. Так, выдвигается мнение, что микробиота не поддается категоризации, а правильнее говорить о «непрерывном градиенте состава».
Энтеротипы удобны в сфере диагностики: например, если у больного человека один энтеротип, то какое-то лекарство будет менее эффективно, а если другой — то более эффективно. Также было проведено сравнение микробиоты здоровых людей и диабетиков и также были получены некоторые маркеры.
Вне зависимости от подхода к классификации, таксономический состав микробиоты кишечника человека значительно варьирует на индивидуальном уровне, при этом он играет важную роль в жизнедеятельности организма человека, образуя, фигурально выражаясь, отдельный орган, выполняющий жизненно-важные функции.
Рис. 5. Филогенетические различия между энтеротипами (Источник: Arumugam M, et al. Enterotypes of the human gut microbiome. Nature. 2011 May 12; 473(7346):174-80). Межклассовый анализ, который визуализирует результаты анализа основных компонентов и кластеризацию, составов родов (а) 33 метагеномов Сэнгера, оцененных путем картирования метагеномных чтений, на 1511 эталонных последовательностей генома с использованием 85%-ного порога сходства, (b) датского подмножества, содержащего 85 метагеномов из опубликованного набора данных Illumina и (c) 154 основанных на пиросеквенировании последовательностей 16S, выявляет три устойчивых кластера, которые мы называем энтеротипами. Два главных компонента нанесены с использованием пакета ade4/R, где каждый образец представлен закрашенным кружком. Центр тяжести каждого кластера отмечен прямоугольником, а цветной эллипс покрывает 67% образцов, принадлежащих кластеру. (d) Изобилие основных вкладчиков каждого энтеротипа из метагеномов Сангера. (e) Совокупность сетей трех энтеротипов из метагеномов Сангера. Неклассифицированные роды под более высоким рангом отмечены звездочками в b) и e).
Рис. 6. Положительныый корреляционный граф бактерий построенный с помощью Cytoscape
Кружки (см. рис. 6) — бактериальные роды, чем больше кружок, тем выше его представленность во всех образцах. Линии соответствуют корреляции численности между двумя бактериальными родами. Например, в тех образцах, где встречается Faecalibacterium, встречается Coprococcus, и наоборот. Если линии между бактериями нет, то корреляция между ними меньше, чем 0,4. Отрицательные корреляции на графе не изображены. Судя по всему, бактерии образуют некоторые устойчивые сообщества, и это дает толчок к изучению совокупных метаболизмов этих групп.
Рис. 7. Иллюстрация функционального гомеостаза микробиоты
У людей в микробиоте могут быть разные микробы, но схожий общий метаболизм. На Ррисунке 7. изображен упорядоченный бактериальный состав для сотни образцов, на правой картинке то же самое, но в функциональном плане.
Не смотря на то, что бактериальный состав различается, функции присутствуют в каждом метагеноме примерно на одном уровне. То есть бактерии могут быть разные, но функционально заниматься похожими вещами. На правой картинке представлено общее количество генов, представленных в образце. Сравнивая микрофлору здоровых людей и больных воспалительными заболеваниями кишечника замечено, что у больных заниженное видовое разнообразие.
Об определении функций выявленных последовательностей:
Метаболическая реконструкция — это когда мы имеем в руках геном бактерии, выписанный в виде последовательности символов, и хотим понять, как эта бактерия живет. На самом деле это применимо не только к бактериям, но для бактерии это реально. Для более сложных существ это пока что хуже получается. Геном бактерии — это последовательность ее ДНК. И сейчас имеются методы, которые позволяют эту последовательность определять довольно легко. Типичный геном — это где-то от полумиллиона до нескольких миллионов нуклеотидов, вот этих элементарных бактериальных кирпичиков.
Ген — это участок генома, который кодирует белок (может быть, что-то другое, но в первом приближении достаточно считать, что белок). Есть статистические разные другие методы, для того чтобы определять эту непрерывную цепочку нуклеотидов и определять на участке соответствующие гены. Это делается стандартными методами, они были сделаны где-то в 90-х годах и с тех пор немножко совершенствуются, но, в общем-то, идеи там уже готовые. А вот дальше начинается этап определения функций этих последовательностей. И самое простое, что можно сделать, — это взять какой-то белок, закодированный в геноме, и сравнить его со всеми белками, функции которых уже известны.
Автор видеолекции: Михаил Гельфанд - доктор биологических наук, профессор, Центр наук о жизни Сколтеха, заместитель директора Института проблем передачи информации РАН, член Европейской Академии, лауреат премии им. А. А. Баева, член Общественного совета Минобрнауки. В своей видеолекции профессор кратко, но доступно рассказывает о том, как построен процесс определения геномной последовательности? Какие существуют методы метаболической реконструкции? И какое значение они приобретают в биоинформатике?
Таким образом, метагеномика хороший инструмент для изучения микробных сообществ, но будущее за интеграцией meta...omics (см. -омики). Для примера стоит отметить, что ранее американские исследователи секвенировали 16S рРНК и с помощью биоинформационного программного комплекса и уже получили не только таксономический состав, но и функциональный. С помощью инструмента PICRUSt, который отображает метагеномный потенциал по секвенированию маркерных генов, ученые сравнивали полученные последовательности 16S рРНК с базой данных и находили похожие геномы, а оттуда получали функциональный состав. Результатом этой работы были интересные выводы. PICRUSt - это биоинформационный программный комплекс, предназначенный для прогнозирования функционального содержания метагенома по маркерным генам (например, 16S рРНК) и полным геномам. Подробнее об информационном комплексе см. в материале: «PICRUSt: филогенетическое исследование сообществ путем реконструкции ненаблюдаемых состояний».
В этой части нашего раздела будет уделено больше внимания вопросам функциональной составляющей результатов применения метагеномики в анализе кишечной микробиоты человека - иными словами речь пойдет о функциональной метагеномике.
Рисунок 8. Применение метагеномики в микробиоме кишечника человека. При изучении микробиома кишечника человека метагеномный анализ может дать достаточную информацию в следующих областях исследований: выявление микробного состава и разнообразия, новых генов, микробных путей, функционального дисбиоза, генов устойчивости к антибиотикам, а также определение взаимодействий и коэволюции между микробиотой и хозяином.
Резюме
В сложном кишечнике человека обитает более 1000 видов микроорганизмов. Микробное сообщество кишечника играет важную роль в защите хозяина от патогенных микробов, в модуляции иммунитета, регуляции метаболических процессов и даже рассматривается как эндокринный орган. Однако традиционные методы культивирования очень ограничены для выявления микробов.
С применением молекулярно-биологической технологии в области кишечного микробиома, особенно метагеномного секвенирования с использованием технологии секвенирования следующего поколения, был достигнут прогресс в изучении кишечного микробиома человека. Метагеномика может быть использована для изучения разнообразия кишечного микробиома и дисбиоза, а также его связи со здоровьем и болезнями. Кроме того, функциональная метагеномика может идентифицировать новые функциональные гены, микробные пути, гены устойчивости к антибиотикам, функциональный дисбиоз микробиома кишечника и определять взаимодействия и коэволюцию между микробиотой и хозяином, хотя существуют некоторые ограничения. Метатранскриптомика, метапротеомика и метаболомика представляют собой огромное дополнение к пониманию кишечного микробиома человека. Цель этого обзора - продемонстрировать, что метагеномика может быть мощным инструментом для изучения микробиома кишечника человека с обнадеживающими перспективами. Ограничения метагеномики, которые необходимо преодолеть, также обсуждаются. Метатранскриптомика, метапротеомика и метаболомика в связи с изучением кишечного микробиома человека также кратко обсуждаются.
Основной посыл: метагеномика играет роль в понимании микробиома кишечника человека, включая разнообразие кишечного микробиома, выявление новых генов и определение этиологии функционального дисбиоза. Сочетание метагеномики, метатранскриптомики, метапротеомики и метаболомики может способствовать пониманию функциональной активности микробиома кишечника человека и, возможно, обеспечить новую стратегию диагностики и лечения заболеваний.
Желудочно-кишечный тракт человека содержит чрезвычайно сложное и динамичное микробное сообщество, включающее архей, бактерий, вирусов и эукариот [20]. Большинство микроорганизмов, находящихся в желудочно-кишечном тракте, представляют собой бактерии с плотностью приблизительно 1013-1014 клеток / г фекалий, в которых 70% всех микробов колонизируют толстую кишку [21]. Микробное сообщество кишечника играет важную роль в защите хозяина от патогенных микробов [22-24], в модуляции иммунитета [25,26], регуляции метаболических процессов [27,28] и рассматривается как забытый эндокринный орган [29]. В последнее время роль кишечного микробиома человека хорошо изучена [39-32]. Классические исследования кишечного микробиома в значительной степени зависели от методов культивирования. Однако традиционные методы культивирования выращивают только 10-30% кишечной микробиоты [33-35]. С быстрым развитием передовых молекулярных технологий, таких как ПЦР-денатурирующий градиентный гель-электрофорез (DGGE), было показано, что кишечная микробная экосистема намного сложнее, чем считалось ранее [36]. В последние годы было разработано несколько технологий секвенирования следующего поколения [37,38], которые дополнительно облегчают анализ большого количества микроорганизмов в различных средах [39-41] и участках тела человека [42], включая кишечник человека. [43-45]. Анализ последовательности 16S рДНК и метагеномика являются двумя эффективными подходами секвенирования ДНК, и оба были использованы для изучения некультивированных кишечных микробных сообществ.
Первый фокусируется на секвенировании консервативного гена 16S рДНК, присутствующего во всех микробах [46,47], и установил ряд новых связей между составом кишечной микробиоты и заболеванием [48-50]. Исследование, основанное на последовательности 16S рДНК, пытается выявить «кто там?» В данном микробном сообществе, в то время как метагеномное секвенирование методом дробовика может быть использовано для ответа на дополнительный вопрос «что они могут сделать?» [51,52]. Метагеномика была впервые описана в 1998 году Хендельсманом и Родоном [53,54] и стала еще одним методом секвенирования ДНК для изучения сложного кишечного микробного сообщества. Метод направлен на каталогизацию всех генов из сообщества путем случайного секвенирования всей ДНК, выделенной из образца [55-57]. Во-первых, общая ДНК всех микроорганизмов извлекается из образцов кала. Перед секвенированием все образцы ДНК случайным образом сдвигаются методом «дробовика». Комплексные последовательности затем анализируются для получения либо видовых профилей, основанных на филогенетических маркерах (16S рДНК) [58], либо геномных профилей, основанных на целых геномах [41]. Считывания последовательности дробовика фильтруются для получения высококачественных последовательностей для всего геномного профиля с помощью метагеномики. На основе перекрытий последовательностей отфильтрованные последовательности затем собирают для формирования более длинных контигов геномных последовательностей. Вычислительные методы необходимы для кодирования последовательностей в контигах. Затем для аннотирования генов используется интеллектуальный анализ данных и поиск в базе данных с применением различных мощных алгоритмов [59]. Информация, полученная в результате последовательной и функциональной метагеномики, позволяет получить более полное представление о структуре и функциях микробных сообществ, чем когда-либо ранее.
Метагеномика: выявление разнообразия микробиома кишечника человека
Европейский проект MetaHIT [56] и Американский проект микробиома человека [44,60] способствовали доступности каталога эталонных генов. Эти проекты способствовали изучению микробиома кишечника человека с помощью метагеномики. Используя метагеномику для исследования образцов фекалий от 124 европейских индивидуумов, консорциум MetaHIT впервые обнаружил 3,3 миллиона не избыточных генов в микробиоме кишечника человека. Удивительно, но набор генов был в 150 раз больше, чем человеческий ген. Более того, более 99% генов в микробных сообществах кишечника человека были бактериальными, что указывало на то, что во всей когорте было более 1000 видов бактерий [56]. Однако число генов в микробиоме кишечника человека было увеличено более чем в три раза в результате последующих анализов [61,62]. Эти наблюдения дополнили каталог эталонных генов в микробиоме кишечника человека.
Был также исследован основной микробиом кишечника человека [63]. Средний кишечный микробиом человека в настоящее время лучше определен и включает приблизительно 160 видов бактерий у каждого человека [56]. Более того, в среднем, отдельные микробиоты могут обладать долгосрочной стабильностью [64,65]. Применяя методы секвенирования (определения последовательности) 16S рибосомальной РНК с низким уровнем ошибок и последовательности полного генома для характеристики состава бактериальных штаммов в фекальной микробиоте у 37 пациентов в Соединенных Штатах, Джеремия (Jeremiah) и его коллеги [64] обнаружили, что в среднем их индивидуальная микробиота была на удивление стабильной, и 60% штаммов оставались в течение пяти лет. На основании глубокого профилирования метагеномных наборов данных, полученных из фекальных метагеномов здоровых людей, было постулировано, что кишечник человека состоит из трех энтеротипов, характеризующихся относительным доминированием определенных групп организмов: Prevotella, Ruminococcus и Bactericides spp [66]. Кроме того, исследования с использованием различных методов, включая метагеномику, выявили ряд факторов, которые могут влиять на состав и разнообразие микробиома кишечника, таких как диета [67-69], возраст [70,71], география [70,72], лекарственные средства [73,74] и вещества окружающей среды [75]. Например, исследование показало, что из-за различий в долговременных привычках питания, численность и пропорции кишечного микробиома человека варьировались между людьми в Соединенных Штатах. Кроме того, видовой состав, но не энтеротип, у этих испытуемых был подвержен влиянию кратковременных изменений в питании [76]. В исследовании MARS-500 Марданов и др. [77] обнаружили динамические изменения в микробиоме кишечника у участников с использованием метагеномного анализа.
Функциональная метагеномика: открытие новых генов и микробных путей
В последние годы, благодаря быстро развивающимся вычислительным методам, необходимым для анализа метагеномных данных, и более ранним исследованиям, выполненным для морского и другого микробиома окружающей среды, все больше и больше исследований были сосредоточены на функциональной метагеномике микробиома кишечника человека [56,57,70,78]. Escherichia coli (E. coli) является наиболее часто используемым микроорганизмом для функциональной метагеномики, и гены из большого разнообразия бактерий могут быть экспрессированы внутри E. coli [52]. Кроме того, другие виды, такие как Streptomyces, Bacillus subtilis и Lactococcus lactis, также могут быть использованы для стимулирования гетерологичной экспрессии грампозитивной бактериальной ДНК [79]. Хехеманн (Hehemann) и его коллеги [80] обнаружили гены, кодирующие ферменты порфираназу и агаразу из кишечного микробиома у японцев, но не у североамериканцев. Интересно, что морские Бактериоидеты широко распространены в морских водорослях, и многие японцы регулярно едят морские водоросли [80], таким образом, вероятно, что эти функции были получены от этих организмов путем латерального переноса генов. Катаболизм пищевых волокон важен для здоровья человека [51]. Углеводно-активные ферменты (Казимы - CAZymes), вырабатываемые кишечными микроорганизмами человека, могут разлагать компоненты пищевых волокон на метаболизируемые моносахариды и дисахариды. Однако, прежде чем метагеномика была использована для изучения кишечного микробиома человека, изучение CAZymes было ограничено культивируемыми бактериальными видами. Несколько исследований в области метагеномики, посвященных изучению микробиома кишечника, определили разнообразие CAZymes, выявив, что кишечный микробиом человека является удивительно богатым источником активных углеводных ферментов [55,57,81,82]. Кроме того, Tasse и соавторы [83] обнаружили новые CAZymes, используя функциональную метагеномику генов кишечника человека. Функционально-ориентированный скрининг библиотек кишечных метагеномов также выявил большой генетический репертуар генов, кодирующих ферменты желчно-солевой гидролазы [84]. Эти функции были избирательно обогащены кишечными микроорганизмами. Кроме того, новая активность β-глюкуронидазы, доминирующая у здоровых взрослых и детей, из Firmicutes, была выявлена путем функционального скрининга больших вставочных метагеномных библиотек клонов E. coli, не зависящих от культивируемости [85]. Недавно Витал (Vital) и его коллеги [86] провели обширный анализ путей продуцирования бутирата и отдельных генов путем скрининга тысяч секвенированных бактериальных геномов из интегрированной базы данных микробного генома (Integrated Microbial Genome). Они обнаружили, что геномы 225 бактерий обладают потенциалом для производства бутирата, включая множество ранее неизвестных кандидатов. Большинство кандидатов принадлежали к различным семьям внутри Firmicutes [86]. Эти авторы также использовали установленный каталог генов для скрининга путей синтеза бутирата в 15 метагеномах, полученных из образцов кала здоровых людей. Результаты показали, что высокий процент общих геномов демонстрировал путь, продуцирующий бутират, и наиболее распространенным был путь ацетилкоэнзима А, за которым следовал путь лизина [86].
Функциональная метагеномика: исследование генов антибиотикорезистентности
Многие бактериальные инфекции становятся все более трудноизлечимыми, отчасти из-за повышения антибиотикорезистентности патогенов человека [87-89]. Недавние исследования показали, что некоторые комменсальные микроорганизмы человека содержат многочисленные гены устойчивости к антибиотикам (ARGs - antibiotic resistance genes), которые привели к резистоме, ассоциированной с кишечником человека [90,91]. Таким образом, важно понимать вклад всей микробиоты отдельных систем в устойчивость к антибиотикам [92].
Первый популяционный анализ распространенности генов резистентности в кишечнике человека был проведен Seville et al [93]. Интересно, что они обнаружили, что некоторые из протестированных генов были общими в микробиомах человека, используя микроразрядные зонды для идентификации 14 генов устойчивости к тетрациклину и макролидам в образцах фекалий и слюны 20 здоровых добровольцев из Англии, Финляндии, Франции, Италии, Норвегии и Шотландии. Однако образцы кала из Франции и Италии показали значительно более высокие уровни некоторых генов тетрациклина и эритромицина, чем образцы из Скандинавии или Соединенного Королевства. По сравнению с предыдущими методами, метагеномный подход является мощным инструментом, который может помочь нам получить более полное понимание ARGs в кишечных микробах человека. Анализируя геномное содержание микроорганизма, можно предсказать фенотип резистентности и адаптировать специфическое лечение. Функциональная метагеномика может быть использована для выделения совершенно новых ARGs из некультивируемой фракции микробиоты и выявления сложного фонового контекста, в котором резистентность к антибиотикам развивается как в микробных, так и в принимающих сообществах.
Используя метагеномные данные о фекалиях из разных стран, исследования подтвердили, что распространенность генов устойчивости существует в микробиоме кишечника человека и распределение ARGs в разных странах различно [75,76]. Более того, Forslund и соавторы [75] обнаружили ассоциации между транспонируемыми элементами в тестируемых генах, что согласуется с тем, что ARGs могут обмениваться между желудочно-кишечными микробами [77], особенно во время стресса хозяина [78]. Sommer и соавторы [72] провели скрининг генных вставок, которые вызывали резистентность в E.coli к 13 различным антибиотикам, выполнив функциональный метагеномный скрининг фекальных и пероральных образцов от двух доноров-людей. Затем они сравнили эти гены с предыдущими гомологами в патогенах и обнаружили значительное разнообразие ARGs в микробах. Чен (Cheng) и его коллеги [79] впервые применили стратегию скрининга относительно большой библиотеки fosmid (фосмидов), полученных из кишечной микробиоты четырех здоровых кандидатов. Библиотека использовалась для скрининга ARGs против семи антибиотиков. Авторы выявили целый ряд ранее неизвестных детерминант резистентности и обнаружили, что только N-конец придает устойчивость к канамицину после функционального исследования нового гена устойчивости к канамицину. Недавно Мур (Moore) и его коллеги [80] использовали функциональную метагеномику фекальной микробиоты от 22 здоровых младенцев и детей для выявления ARGs. Они не только идентифицировали три новых гена резистентности, но и сообщили о своих результатах по устойчивости к ингибиторам синтеза фолатов, которые были получены с помощью предсказанной Nudix-гидролазы, которая была важной частью пути синтеза фолатов. Кроме того, их функциональные метагеномные исследования показали, что фекальные резистомы здоровых детей имеют более высокое разнообразие, чем предполагалось ранее.
Обнаружение функционального дисбиоза
Как сообщалось, дисбиоз кишечного микробного сообщества связан с различными заболеваниями, включая такие, как: воспалительные заболевания кишечника [100-102], ожирение [57,103-105], диабет [106-108], аллергия [109,110], синдром раздраженного кишечника (СРК) [111], колоректальный рак [112-115], цирроз печени [116-118], неалкогольный стеатогепатит [119,120], расстройства развития нервной системы [121,122], сердечно-сосудистые нарушения [123], холестериновые желчные камни [124], диарея [125], недоедание [126], болезни почек [127] и полипы толстой кишки [128].
Недавно в метагеномном анализе микробиома кала у пациентов, получавших трансплантацию аллогенных стволовых клеток, Holler et al [129] обнаружили относительный сдвиг от преобладания комменсальных бактерий к энтерококкам, что было особенно заметно у пациентов, которые впоследствии страдали от активного заболевания желудочно-кишечного тракта «трансплантат против хозяина» (GvHD). В дополнение к выявлению дисбиоза кишечного микробиома человека при некоторых заболеваниях, метагеномика может определять новые изменения в микробных функциях. Исследование, проведенное с использованием метагеномного подхода у пациентов с диабетом 2 типа, проведенное Цинь (Qin) и др. [106], выявило умеренное изменение микробного состава кишечника между больными и контрольной группой. Микробные функции, обеспечивающие снижение уровня сульфатов и устойчивость к окислительному стрессу, также были более распространенными у пациентов с диабетом 2 типа, чем у здоровых людей. Точно так же Wei и соавторы [117] проанализировали фекальную микробиоту 20 пациентов с циррозом печени гепатита В и 20 здоровых контрольных индивидуумов, используя метагеномные методы, и обнаружили очевидное изменение фекальной микробиоты между двумя группами. Важно отметить, что по сравнению с контролем функциональное разнообразие фекальной микробиоты у пациентов было значительно снижено. Кроме того, в фекальной микробиоте у больных отмечался обильный метаболизм глутатиона, глюконеогенеза, аминокислот с разветвленной цепью, азота и липидов, но наблюдалось снижение уровня ароматических аминокислот, желчных кислот и метаболизма, связанного с клеточным циклом.
Метагеномика также может быть использована для определения взаимодействия между кишечными бактериями и хозяином. Кишечные бактерии играют важную роль в здоровье человека. Однако возможные механизмы, связанные с взаимодействиями кишечных бактерий и хозяина, не поняты. Lakhdari и соавторы [130] использовали высокопроизводительную технологию скрининга для исследования кишечных микробных путей и обнаружили, что метагеномные клоны E. coli могут модулировать пролиферацию слизистой оболочки кишечника путем активации пути ядерного фактора kB (NF-kB) в эпителиальных клетках [131-133]. Недавно, применяя функциональную метагеномику, Добриевич и др. [134] обнаружили, что секретируемые и экспонированные на поверхности белки из грамположительных бактерий в кишечной микробиоте человека играют роль в иммунной модуляции.
Метагеномика также полезна при скрининге плазмидных кодирующих элементов, особенно при совершенствовании методов очистки высококачественной и высокоурожайной плазмидной ДНК [135]. Плазмида содержит многочисленные подвижные генетические элементы. Глубокое понимание мобильных генетических элементов, связанных с микробиотой кишечника человека, имеет смысл, поскольку они могут отражать коэволюцию хозяина и микроба в кишечнике человека [51]. Джонс (Jones) и Марчези (Marchesi) [136] выделили новые плазмиды из микробиоты кишечника человека и обнаружили, что некоторые важные гены были обогащены в кишечнике человека по сравнению с другими системами, использующими независимую от культуры транспозонную систему захвата. Недавно, на основе метагеномного анализа, несколько исследований показали, что горизонтальный перенос генов может осуществляться между филогенетически удаленными бактериальными группами [83,84,137]. Однако, триггеры, которые способствуют этому обмену генов, не известны. Smillie и соавторы [138] показали, что экология может быть основным двигателем обмена генами.
Из приведенных выше результатов (рис. 8) было показано, что метагеномика является невероятно мощной технологией в изучении микробиома кишечника человека. Однако все еще существуют некоторые ограничения в использовании метагеномики. Во-первых, невозможно идентифицировать микробную экспрессию. Во-вторых, поскольку метагеномика требует гораздо более широкого охвата последовательностей, чем анализ последовательностей 16S рДНК [139], затраты и время, затрачиваемые на проекты секвенирования ДНК для метагеномики кишечника, намного больше, чем при анализе последовательностей 16S рДНК. В-третьих, для получения высокого покрытия, необходимого для метагеномики, необходимо достаточное количество и высокое качество образцов ДНК. Хотя меры предосторожности выполняются, человеческие загрязняющие вещества обнаруживаются в 50-90% последовательностей [43]. Различные наборы для извлечения ДНК и лаборатории также оказывают влияние на оценку микробиоты кишечника человека [140]. Сравнение данных по исследованиям, использующим различные методы извлечения бактериальной ДНК, затруднительно [141]. В-четвертых, для успешного проведения метагеномного исследования очень важно качество лежащих в основе функциональных аннотаций фрагментов метагеномной последовательности. Однако значительная часть данных не может быть назначена функцией из-за отсутствия близких соответствий в справочных базах данных [56]. Для вирусных данных эта ситуация особенно серьезна, так как 80% или более последовательностей считываются без известных совпадений [142]. Миллионы последовательностей в каждом образце необходимы для функционального анализа генов сложного микробного сообщества. Трудно идентифицировать и повысить точность информации, полученной из относительно коротких фрагментов генов, генерируемых секвенированием следующего поколения, из-за многих биоинформационных проблем, предлагаемых огромным метагеномным секвенированием дробовика.
Кроме того, сложно однозначно назначить функцию, основываясь только на подобии последовательности, что может привести к неправильному пониманию [143]. Кроме того, при наличии менее обильных членов микробиома или сообщества, содержащего много близкородственных видов, может быть затруднительно собрать геномы [144]. Это может привести к ситуации, когда, даже если какая-то функция может быть установлена, ее назначение конкретным видам внутри микробного сообщества может оказаться проблематичным. Кроме того, ДНК является материалом, используемым при метагеномном секвенировании, и экспрессию каждого функционального гена в образце в данной среде очень трудно определить.
Метагеномика - это чрезвычайно мощный инструмент, который может быть использован для описания генетического потенциала микроорганизмов, присутствующих в данной среде. Однако он имеет очень ограниченную функцию в выявлении их активности или экспрессии генов. При быстром развитии метатранскриптомики [145], метапротеомики [146] и метаболомики [147] можно выявить функциональную активность микробного сообщества. Метатранскриптомное секвенирование может быть использовано для определения активности генов в определенной среде. Gosalbes et al [148] использовали метатранскриптомный анализ фекальных микробиомов десяти здоровых людей и обнаружили, что углеводный обмен, производство энергии и синтез клеточных компонентов являются основными функциональными ролями микробиоты кишечника.
Напротив, метаболизм аминокислот и липидов в метатранскриптоме был снижен. Метатранскриптомика также имеет некоторые ограничения. Во-первых, очень трудно получить качественные и достаточные количества РНК из проб окружающей среды. Во-вторых, трудно отделить интересующую нас мРНК от более распространенных типов РНК, таких как рРНК. В-третьих, короткий период полураспада мРНК приводит к трудностям в обнаружении быстрых и кратковременных реакций на изменения окружающей среды [149]. В-четвертых, справочных баз данных недостаточно. Анализ белков также важен для понимания функций микроорганизмов. Недавно исследование продемонстрировало, что фекальный метапротеом у здоровых взрослых специфичен для субъекта и относительно стабилен в течение одного года [150]. С другой стороны, полученные метаболиты смешиваются, поэтому очень трудно идентифицировать информацию от хозяина и микробных метаболитов. Как показано на рисунке 2, хотя эти подходы имеют некоторые ограничения, они имеют значительные потенциальные клинические применения. Сочетание мета-омики может быть достаточно мощным для выяснения экологических ролей кишечного микробиома человека [156].
Таким образом, метагеномика позволяет не только выявить разнообразие микробиома кишечника человека, но и выявить новые гены и микробные пути, а также выявить функциональный дисбиоз. Применение метагеномики имеет огромный потенциал в раскрытии механизмов и корреляций между микробиомом кишечника человека и заболеваниями. Однако метагеномика также имеет ограничения и требует совершенствования [157]. Благодаря быстрому развитию и применению метагеномики, а также метатранскриптомики, метапротеомики и метаболомики стало возможным идентифицировать новые микробные диагностические маркеры, которые обеспечат раннюю диагностику и новые методы лечения. Максимизация вклада микроорганизмов и выявление большего количества пробиотиков также очень перспективны. Основываясь на более глубоком понимании роли микробиома человека в болезнях и их взаимодействиях, а также межиндивидуальных различий и физиологических параметров, исследование персонализированной медицины будет продвигаться чрезвычайно далеко.
Кроме того, можно исследовать новые антибиотики, которые нацелены на антибиотикорезистентные микробиомы, основанные на глубоком понимании ARGs в микробиоме кишечника. Современные метагеномные исследования микробиома кишечника человека проводились в ограниченных когортах, поэтому необходимо расширить наше понимание микробиома кишечника человека путем изучения популяций людей из разных стран, в течение более длительных периодов, и включать в себя несколько возрастных групп [51], а также различные стадии заболевания. Изучение особенностей микробиома кишечника человека на различных стадиях заболевания поможет нам понять взаимосвязь между микробиомом кишечника и развитием заболевания, а значит, поможет установить оптимальные стратегии профилактики, улучшения и даже обращения вспять заболеваний. Поскольку метагеномика все еще имеет некоторые ограничения, необходимо сочетать другие микробиологические подходы, включая методы культивирования, с изучением метагеномики в кишечном микробиоме. Это гарантирует, что результаты будут более точными и убедительными.
В последнее время несколько исследований успешно использовали эту комбинацию и получили значимые результаты [75,158-160]. Для преодоления ограничений метагеномики важно также создать единый метод извлечения ДНК микроорганизмов, усовершенствовать вычислительные алгоритмы и дополнить справочную базу данных. Применение метагеномной технологии в микробиоме кишечника человека находится в зачаточном состоянии. Однако в течение некоторого времени она использовалась и в других средах, включая почву и море. Таким образом, успех применения метагеномной технологии в изучении этих сред может сопровождаться дальнейшим изучением микробиома кишечника человека. Кроме того, в кишечнике человека обитают не только бактерии, но и эукариоты и вирусы. На сегодняшний день проведено мало исследований по эукариотам и вирусам с использованием метагеномного подхода, таким образом, будущее изучение микробиома кишечника человека с использованием метагеномного подхода является перспективным и срочно требуются дополнительные усилия.
В последнее время анализ кишечной микробиоты на ее дисбиотические изменения все больше рассматривается как маркер развития или риска различных патологий. При этом подобный анализ проводится разными методами. При этом бесспорным является то, что диагностика воспалений и заболеваний должна проводиться методами, которые имеют высокий уровень доказательности, определенную степень чувствительности, низкую вероятность ложноположительных результатов и осложнений гипердиагностики. К таким методам как раз относится метагеномное секвенирование микробиоты.
Микробиоту кишечника в большинстве случаев выделяют из образца стула. Это просто, безопасно и дешево. Анализ микробиоты в таком случае получается точным: мы можем измерить доли бактериальных семейств и родов. Однако картина будет характерной только для толстой кишки.
Из образца кала в лаборатории выделяют фрагменты ДНК, которые относятся к специфичному гену 16S рРНК. Об этом гене рибосомальной РНК мы уже писали выше. Данный ген является одним из основных факторов классификаций бактерий и архей: по его последовательности мы определяем, кто к какому роду и семейству относится, насколько бактерии близки между собой. Ген 16S рРНК уникален тем, что сочетает консервативные и вариабельные участки, которые позволяют определять родословную бактерий (таксономию). Мы читаем нуклеотидную последовательность каждого такого фрагмента и узнаем, к какому роду и семейству принадлежит бактерия. Это можно сравнить с определением региона по номеру автомобиля. Чем больше одинаковых фрагментов 16S рРНК находится в образце, тем выше доля определенных бактерий, которым он принадлежит.
В итоге мы получаем процентный состав с долей для каждого вида микробов. А от количества видов микроорганизмов зависит и функция микробиоты. Например, если у вас много бактерий, которые производят масляную кислоту (бутират), значит, ваша микробиота хорошо справляется с этой задачей.
Каждый профиль микробиоты сравнивается со средними показателями по популяции из базы, которая собирается на основе научных работ. Так мы анализируем, насколько изучаемая микробиота отличается от состава бактерий здоровой популяции.
По составу бактерий кишечника можно определить, как микробиота справляется с переработкой клетчатки, синтезом масляной кислоты, производством витаминов, а также насколько она разнообразна и схожа с микробиотой людей с заболеваниями.
Это первый признак, с которым можно ознаомиться по результатам метагеномного секвенирования. От разнообразия кишечной микробиоты зависит, насколько стабильно сообщество бактерий и как хорошо оно защищает хозяина от патогенных микроорганизмов. Чем больше разнообразных бактерий обитает в кишечнике, тем лучше чувствует себя человек и тем меньше у него риск развития воспалений. Это доказано в ряде многочисленных исследований.
К сожалению, завести новый вид микроорганизмов, которого нет в результатах, — довольно сложно. Бывает, что из-за рекомендаций вырастают те бактерии, которые изначально представлены ниже нашего порога (0,02%). Однако это скорее исключение.
Известно, что некоторые виды бактерий приносят человеку большую пользу. Они помогают клеткам кишечника регулировать иммунитет, защищают от ожирения, связывают и выводят из организма тяжелые металлы и др. токсины, производят короткоцепочечные жирные кислоты, бактериоцины, антиоксидантные ферменты, антимутагенные вещества и другие важнейшие метаболиты. При анализе микробиома можно определить долю таких микроорганизмов, а данные многочисленных исследований позволяют узнать информацию про каждую пробиотическую бактерию, какие функции она выполняет и сколько ее обычно у здоровой популяции.
Повысить долю этих бактерий можно, если они есть в микробиоте. Достаточно употреблять кисломолочные продукты с живыми бактериями, квашеную капусту, комбучу (чайный гриб), продукты с типами клетчатки, на которых растут эти микроорганизмы, или специальные пробиотические добавки.
По поводу приема добавок сначала лучше проконсультироваться со специалистом. Что интересно, пробиотические бактерии приносят пользу, даже если их нет в микробиоте человека и они просто проходят через желудочно-кишечный тракт.
Пока что плохо изучено, как бактерии влияют на развитие болезней и как они взаимодействуют с лекарствами. Тем не менее есть данные, что у людей с заболеваниями состав бактерий кишечника сильно отличается. Поэтому часто в исследованиях микробиоты используют следующий принцип: анализируемую микробиоту сравнивают с микробиотой, характерной для человека с заболеванием, и оценивают, насколько профили различны. Если анализируемая микробиота совсем непохожа на микробиоту пациента — значит повезло, скорее всего, риск заболевания ниже. Однако если профили схожи — тогда надо обратить внимание на здоровье организма и состояние бактерий кишечника.
В зависимости от того, какое семейство и род бактерий доминирует в микробиоте, все профили можно условно разделить на три вида. Их еще называют энтеротипами (об энтеротипах говорилось выше). В микробиоте любителей западной диеты часто преобладают бактерии рода Bacteroides. Такой тип можно условно назвать «Городским жителем». У тех, кто любит злаки и продукты с крахмалом обычно выше доля семейства Firmicutes и бактерий-производителей масляной кислоты. Представителей этого типа можно условно назвать «Деревенскими жителями». У любителей овощей, фруктов и сладостей часто доминирует род Prevotella. Обычно этот тип чаще встречается у племенных народов, поэтому представителей такого типа можно условно назвать «Обитателями джунглей». В различной научной литературе энтеротипы называются по-разному, однако в своем наименовании они всегда несут понятную смысловую нагрузку, ассоциированную с традиционным питанием и образом жизни.
От такого (условного) энтеротипа зависит, как хорошо бактерии справляются с переработкой клетчатки, синтезом бутирата и витаминов и т.д. Иногда у одного человека может быть смешанный тип микробиоты. В таком случае зоны проекции бактерий, характерных для каждого типа, наслаиваются друг на друга. Но доминировать будет все равно один энтеротип (тот, что в верхнем слое на графике).
Результаты метагеномного секвенирования кишечной микробиоты могут дать сигнал к изменению образа жизни. По сути выявляются т.н. дисбиотические изменения микробиома. С учетом того, что диета является наиболее существенным фактором, влияющим на микробный пейзаж ЖКТ, то для каждого проблематичного признака обычно есть список рекомендованных продуктов. Исключение составляет только признак разнообразие, о котором написано выше. Перечень продуктов составляется на основе идентифицированных бактерий кишечника. Для этого анализируется, каких бактерий в микробиоте мало, какой тип клетчатки (пищевых волокон) они любят, а также где эти волокна содержатся. Получается список, который может увеличить долю нужных бактерий.
Микробиота постоянно обновляется в зависимости от диеты. Когда вы едите больше мяса и сладостей, расщепляющих клетчатку бактерий становится мало. Микробиота хуже справляется с патогенными микроорганизмами, повышается риск воспалений. Когда включаете в рацион много овощей, злаков и фруктов — доля полезных бактерий растет. Поэтому за микробиотой нужно следить постоянно.
Рисунок 9. Для примера показана средняя статистика от биомедицинского холдинга «Атлас» по результатам анализа кишечной микробиоты жителей из РФ. Большая часть образцов для анализа поступала из Москвы, поэтому такое соотношение характерно скорее для жителей больших городов.
Для сравнения также можно посмотреть различия в микробиоте у деревенских детей из Африки из Буркина-Фасо (BF) и детей из Европы (EC), выявленные итальянскими учеными в исследовании влияния рациона питания на формирование микробиома кишечника. Исследования генов 16S рРНК показывают четкое разделение двух исследованных популяций детей (диаграммы при клике увеличиваются).
A и B) Круговые диаграммы средних значений бактериальных родов, присутствующих в образцах фекалий детей из Буркина-Фасо (БФ) и Европейского Союза (ЕС) (>3%), найденных с помощью классификатора RDP v. 2.1. (Ribosomal Database Project (RDP) классификатор для 16S рРНК- ред.). Кольца представляют собой соответствующие типы (Bacteroidetes в Зеленом и Firmicutes в Красном) для каждого из наиболее часто представленных родов.
D) Относительное содержание (процент последовательностей) четырех наиболее распространенных бактериальных типов в каждом ребенке среди детей БФ и ЕС. Синяя область в середине показывает обилие актинобактерий, в основном представленных родом бифидобактерий, в пятерке самых маленьких детей ЕС и БФ.
Е) Относительное обилие (процентное соотношение последовательностей) грамотрицательных и грамположительных бактерий в каждом индивидууме. Различные распределения грамотрицательных и грамположительных клеток в популяциях БФ и ЕС отражают различия в двух наиболее представленных типах - Bacteroidetes и Firmicutes.
Ближе к практике. Итак, процедура метагеномного анализа кишечной микробиоты упрощенно выглядит следующим образом: сначала выделяется генетический материал микробиоты, затем с помощью ДНК-секвенатора проводится метагеномное секвенирование. Чтение нуклеотидной последовательности производится для каждого фрагмента, после чего прочтенная последовательность соотносится с базой данных (описанием известных бактерий) для определения конкретного вида.
Как все население Земли можно поделить на страны и популяции, так и все бактерии кишечника можно разбить на семьи и роды. Семейство бактерий объединяет роды похожие по строению, но разные по функциям. А отделы объединяют разные семейства. Большинство родов бактерий микробиоты относится к двум отделам: Bacteroidetes и Firmicutes. В первом отделе наиболее распространены роды Bacteroides и Prevotella, а во втором — Faecalibacterium, Ruminococcus, Eubacterium, Blautia, Roseburia, Coprococcus. Еще есть род бактерий Akkermansia, наличие которого считается маркером здоровья. В кишечнике человека это единственный представитель отдела Verrucomicrobia (стоит отметить, что сведения об Akkermansia не так однозначны - см. здесь →).
В ряде исследований упоминается отношение Bacteroidetes к Firmicutes. В одних работах отмечается, что Firmicutes больше у полных людей, а в других — наоборот. На деле же все более запутанно. Род бактерий Bacteroides ассоциирован с западной диетой, которая скорее способствует набору веса, а Firmicutes — главные производители энергоемкого вещества, которое помогает нашему организму оставаться здоровым. Поэтому остается неясным, почему преобладание Firmicutes по результатам исследований может быть признаком ожирения. Одну из последних информаций о правильном соотношении Бактероидетов к Фирмикутам (B / F > 1) можно посмотреть в разделе "Микробиом кишечника и сахарный диабет 2 типа"
(на заметку)
Bacteroides
Главная роль Bacteroides - расщеплять и помогать человеку усваивать клетчатку. Как мы уже говорили в первой статье, у человека просто нет генов, которые кодируют информацию о расщеплении сложных углеводов (кроме крахмала и гликогена). Эту способность мы добираем за счет генома бактерий.
Bacteroides способны распознавать и перерабатывать более дюжины волокон, а некоторые виды содержат более 260 генов для их метаболизма. Также они обрабатывают сахара и белки, поэтому большая представленность этого рода связана с западной диетой, богатой мясными и сладкими блюдами.
Bacteroides заботятся не только о своем хозяине, но и помогают соседям. Они создают благотворную среду для других полезных бактерий кишечника. Например, Bacteroides снижают уровни кислорода, что позволяет анаэробным родам расти.
Высоким значением считается 13,78%
Prevotella
Роды Prevotella и Bacteroides относятся к одному отделу, однако представленность Prevotella связана с растительной диетой и чаще встречается среди племен Африки и Амазонии, до которых западная диета не дошла. В западных странах преобладание Prevotella встречается у вегетарианцев и приверженцев Средиземноморской диеты. В то же время этот род связан с большим содержанием не только сложных углеводов, но и простых сахаров. Поэтому численность Prevotella часто выше у сладкоежек.
Тем, у кого представленность Prevotella выше, чем Bacteroides, повезло немного больше. Исследование шведского университета Гётеборга показало, что увеличенное число Prevotella в микробиоте нормализует обмен глюкозы (cv/^ Fredrik Bäckhed et al. Dietary fiber-induced improvement in glucose metabolism is associated with increased abundance of Prevotella. Clinical and Translational Report. Volume 22, ISSUE 6, P971-982, December 01, 2015). У мышей с микробиотой людей из исследования, отмечалось повышенное содержание гликогена в печени. Это значит, что гормон инсулин у мышей с такой микробиотой правильно выполняет свою работу и переносит поступающую глюкозу в печень, где она запасается в виде гликогена.
Когда инсулин не может переносить глюкозу, развивается резистентность и повышается риск ожирения и диабета 2 типа. Исследователи отмечают, что причиной высокого уровня Prevotella может быть диета богатой клетчаткой.
Высоким значением считается 16,87%
Faecalibacterium
Faecalibacterium — главный производитель масляной кислоты. Эта короткоцепочечная жирная кислота составляет 90% питания клеток, выстилающих стенки кишечника. Когда ее не хватает, клетки хуже выполняют свои функции или вовсе отмирают, из-за чего снижается иммунная реакция организма и повышается риск воспалений. Поэтому Faecalibacterium считаются маркером здоровья: чем их больше, тем лучше.
Faecalibacterium производят масляную кислоту за счет расщепления сложных углеводов. Поэтому этого рода больше среди любителей овощей, фруктов и злаков.
Еще этот вид бактерий связан с удовлетворенностью качеством жизни. К такому выводу пришли ученые из Бельгии и Нидерландов (см.: Jeroen Raese et al. The neuroactive potential of the human gut microbiota in quality of life and depression. Nature Microbiology, volume4, p. 623–632 (2019)). Они оценивали состав микробиоты и просили участников заполнить анкету об общем восприятии здоровья, ограничениях, связанных с физическими или эмоциональными проблемами, эмоциональном благополучии, физической боли, усталости или наличии сил. Исследователи отметили, что многие критерии, связанные с удовлетворенностью качеством жизни, положительно коррелировали с большой представленностью Faecalibacterium и Coprococcus. О втором роде мы расскажем ниже.
Высоким значением считается 11,64%
Ruminococcus
Ruminococcus — любители устойчивого крахмала, который содержится в зеленых бананах, чечевице, зеленом горошке, белой фасоли, остывшей пасте и картошке. В отличие от простого крахмала, устойчивый не расщепляется до простых сахаров и не переваривается организмом, и поэтому доходит до микробиоты целым. Также Ruminococcus — род бактерий, который способен перерабатывать целлюлозу, хотя большая ее часть оcтается непереваренной и помогает формировать каловые массы, которые быстрее проходят по кишечнику и меньше контактируют со стенками.
Сейчас активно изучается связь между Ruminococcus и развитием язвенного колита и болезни Крона. Несколько исследований показали, что у пациентов с воспалениями кишечника представленность определенного типа Ruminococcus – выше (см.: Hall, Andrew Brantley et al. A novel Ruminococcus gnavus clade enriched in inflammatory bowel disease patients. Genome Medicine volume 9, Article number: 103 (2017)).
Высоким значением считается 3,7%
Eubacterium
На рис. слева: Относительный вклад филогрупп в микробиоту долгожителей, пожилых и молодых людей. Указаны филогруппы типа phylum / order, которые вносят по меньшей мере 0,5% в один из профилей.
Eubacterium, как и Faecalibacterium, при расщеплении клетчатки синтезируют большую часть масляной кислоты. Численность Eubacterium увеличивается при добавлении в рацион цельных злаков и бурого риса и уменьшается, когда клетчатки в рационе становится мало. Eubacterium превращают лактат в кишечнике в масляную кислоту, что снижает кислотность и помогает стабилизировать микробиоту.
Ученые сравнивали микробиоты молодых, людей 70 лет и долгожителей, которые прожили более 100 лет (см.: Biagi E et al. Through ageing, and beyond: gut microbiota and inflammatory status in seniors and centenarians. PLoS One. 2010 May 17;5(5):e10667). Оказалось, микробиота молодых и 70–летних практически не отличается, а у долгожителей наблюдалось слабое хроническое воспаление (inflammageing). Ученые выявили даже характерную для таких людей бактерию — Eubacterium limosum. У них число этой бактерии было увеличено более чем в 10 раз.
Высоким значением считается 3,25%
Blautia
Во время расщепления сложных углеводов Blautia производит ацетат, который, как и масляная кислота, является короткоцепочечной жирной кислотой. Он всасывается клетками кишечника, проходит гематоэнцефалический барьер и попадает в мозг.
Ацетат - важный источник питания для клеток глий, которые окружают нейроны и обеспечивают надежную передачу импульсов между ними. Согласно исследованию из журнала Nature при большом употреблении клетчатки ацетат запускает в гипоталамусе сигнал, подавляющий аппетит. Эта работа немного проливает свет на то, как богатая волокнами диета защищает человека от ожирения (см.: Gary Frost et al. The short-chain fatty acid acetate reduces appetite via a central homeostatic mechanism. Nature Communications volume 5, Article number: 3611 (2014)).
Несмотря на плюсы повышенная представленность Blautia связана с диабетом 2 типа. Это выяснили путем сравнения микробиот трех групп: пациентов с диабетом, преддиабетом и здоровых людей с нормальным метаболизмом глюкозы.
Высоким значением считается 2,23%
Roseburia
Roseburia расщепляет растительные маннаны. Эти вещества содержатся в орехах, бобовых, кокосах, томатах, кофейных зернах, а также они широко используются в пищевой промышленности как загустители и желирующие агенты. Маннаны могут увеличиваться в объеме до 200 раз, что уменьшает аппетит и дает чувство сытости.
Несколько исследований показали, что Roseburia играет важную роль в контроле воспалительных процессов в кишечнике, защите от атеросклероза и в иммунных реакциях организма. Ученые предполагают, что главным образом эти процессы происходят за счет синтеза масляной кислоты при употреблении достаточного количества клетчатки. Исследование показало, что те мышки, в микробиоме которых много Roseburia, но которые не получают достаточно клетчатки - не защищены от атеросклероза (см.: Kazuyuki Kasahara et al. Interactions between Roseburia intestinalis and diet modulate atherogenesis in a murine model. Nat Microbiol, 2018 Dec; 3(12): 1461-1471).
Меньшая представленность Roseburia отмечается у людей с воспалительными заболеваниями и колоректальным раком.
Высоким значением считается 3,5%
Coprococcus
Тот самый род, который вместе с Faecalibacterium связан с удовлетворенностью качеством жизни. Кроме этого выяснилось, что Coprococcus связаны с развитием депрессии. Согласно исследованию из журнала Nature микробиота пациентов с депрессией содержит меньше Coprococcus и бактерий рода Dialister (см.: Jeroen Raese et al. The neuroactive potential of the human gut microbiota in quality of life and depression. Nature Microbiology, volume4, p. 623–632 (2019)).
Coprococcus так же, как и многие другие роды отдела Firmicutes, расщепляют разные виды волокон и производят масляную кислоту. Еще, согласно др. исследованию, представленность Coprococcus связана с низким индексом массы тела и высоким разнообразием микробиоты (см.: Wang L et al. Structural modulation of the gut microbiota and the relationship with body weight: compared evaluation of liraglutide and saxagliptin treatment. Sci Rep. 2016; 6: 33251).
Высоким значением считается 2,74%
Bifidobacterium и Lactobacillus
Эти роды начинают заселять наш организм с самого детства, так как содержатся в грудном молоке. Относительно других родов Bifidobacterium и Lactobacillus у взрослого человека немного, а иногда и нет совсем, но это не значит, что они бесполезны. Даже если эти бактерии не могут поселиться в вашей микробиоте и просто проходят через ЖКТ - они все равно взаимодействуют с другими бактериями и приносят пользу. Однако тем, у кого они представлены в микробиоте, повезло немного больше.
Bifidobacterium и Lactobacillus относятся к пробиотическим бактериям. Они способны подавлять рост патогенных бактерий, укреплять защитную функцию стенок кишечника и подавлять провоспалительные цитокины. Lactobacillus, так же как и Coprococcus, связаны с низким весом, а Bifidobacterium защищают кишечник от воспалительных заболеваний и колоректального рака. Еще Bifidobacterium и Lactobacillus синтезируют гамма-аминомасляную кислоту (ГАМК). Этот нейромедиатор отвечает за внимание, эмоциональный и двигательный контроль. Сейчас активно изучается связь между приемом пробиотиков с Lactobacillus и снижением симптомов депрессии и тревожности.
Bifidobacterium и Lactobacillus содержатся в ферментированных продуктах, например кефире или хлебе на закваске, чайном грибе, квашеной капусте. Bifidobacterium и Lactobacillus микробиоты питаются галактоолигосахаридами, которые содержатся в топинамбуре, сое, чесноке, томатах, луке, бананах, яблоках, спарже и меде. Исследование на людях с непереносимостью лактозы показало, что такой тип волокна помогает этим пробиотическим видам расти (см.: M. Andrea Azcarate-Peril et al. Impact of short-chain galactooligosaccharides on the gut microbiome of lactose-intolerant individuals. PNAS. 2017 Jan 17; 114(3): E367-E375).
Akkermansia
Большая представленность этой бактерии считается маркером здоровья человека, так как малый процент Akkermansia часто сопровождает диабет 2 типа, болезнь Крона и язвенный колит. Большой процент этой бактерии ассоциируется с низким весом и индексом массы тела, а также низким уровнем холестерина и глюкозы натощак.
В отличие от других родов Akkermansia питается слизистым слоем кишечника — муцином, поэтому во время периодов голодания, когда остальные бактерии не получают достаточного количества веществ, ее численность значительно увеличивается.
Бактерия не только потребляет муцин, но и помогает его производить. Ученые предполагают, что Akkermansia синтезирует жирные кислоты, которыми питаются клетки-производители слизистого слоя кишечника. А исследование с использованием эпителиальных клеток кишечника показало, что Akkermansia прилипает к клеткам и усиливает защиту, а не разрушает их провоцируя, воспаление (следует отметить, что споры о безусловной полезности данной бактерии еще продолжаются).
Высоким значением считается 0,23%
См. дополнительно: Кишечная микробиота в клинической диагностике
Примечание редактора. Многие могут задаться вопросом, а как скорректировать свой рацион в пользу нужных популяций кишечных бактерий, чтобы избежать рисков неинфекционных заболеваний, таких как ВЗК, диабет 2 типа, ССЗ, метаболический синдром и т.д., которые опосредуются дисбиозом. Это все определяется на основе проведенных исследований. Для примера предлагаем ознакомиться с материалами некоторых обзоров, где рассматриваются, как диеты и питательные вещества влияют на разнообразие и обилие представителей различных таксонов (с различными функциональными свойствами по отношению к здоровью хозяина):
В данной части нашего раздела, посвященного метагеномике, мы предлагаем ознакомиться с научной работой, в которой описан универсальный алгоритм метагеномных исследований и результаты первого популяционного исследования микробиома кишечника жителей Российской Федерации.
С целью предварительного ознакомления с материалом рукописи предлагаем интересные выдержки из данной работы, дающие общее представление о проблеме.
Изучение микробных сообществ имеет фундаментальное значение: исследования общих и частных взаимосвязей внутри микробиоты, способов поддержания гомеостаза, механизмов ответа на раздражители внешней среды значительно расширят наши познания в области экологии и молекулярной биологии микробных сообществ. Наиболее многочисленной и разнообразной является микробиота кишечника человека. Микробиота человека интересна и с медицинской точки зрения.
Первым шагом в изучении микробиомов является определение их видового состава. Классические биологические подходы, такие как бактериальный посев или выделение отдельных клонов, весьма затруднительно использовать для этой цели ввиду большого количества видов, составляющих отдельный микробиом, и невозможности культивировать до 99% бактерии. Поэтому, действительно широкое распространение микробиомных исследований стало возможным с появлением высокопроизводительных секвенаторов нового поколения, которые позволяют за короткие сроки массово секвенировать совокупный геном микробиомов – метагеном. Так настоящим первым прорывом в области метагеномики стало исследование микробиома Саргассова моря, в ходе которого было секвенировано рекордное на тот момент количество ДНК – 1,045 миллиарда нуклеотидов. Но новые экспериментальные методы исследования требуют новых подходов к обработки данных. Анализ столь огромного и разнородного материала стал своего рода вызовом для биоинформатки. Задача определения количественного и качественного бактериального, а также генного, состава по смеси коротких последовательностей ДНК все еще остается сложной.
Метагеномика начиналась с исследований микробиомов окружающей среды, как то микробиомов почв, морей, горячих источников, но последние несколько лет особое внимание уделяется исследованиям микробиома человека. Только за 2011 - 2013 года было уже выпущено более 700 научных статей по метагеномике человека. Такое лавинообразное появление метагеномных работ вызвано организацией крупных консорциумов: европейский MetaHIT, специализирующийся только на метагеноме кишечника человека, и американский HMP, целью которого является изучение всего микробиома человека. Первые работы этих сообществ стали фундаментом для дальнейших исследований во многих странах мира. Первые исследования носили в большей степени эпидемиологический характер. Ученые пытались выявить, что есть эталон здорового микробиома, как он варьирует в зависимости от географического и социального факторов.
Несомненно, микробиом человека, и микробиом кишечника в особенности, непосредственно влияет на организм хозяина. Бактерии кишечника способны переваривать сложные углеводы и другой субстрат, неусвояемый человеком, при этом производя витамины, короткоцепочечные жирные кислоты (КЖК). Достоверно неизвестно, какая доля из потребляемой пищи переваривается бактериями в кишечнике человека, однако гнотобиотическим грызунам – животным, лишенным микробиоты, приходится потреблять на 30% больше пищи для сохранения массы тела.
Помимо общих популяционных исследований, изучается связь между составом микробиома кишечника человека и различными заболеваниями: рак, атеросклероз, диабет второго типа. Исследования в данной области носят больше описательный характер, а механизмы взаимодействия микробиома и организма человека все еще слабо изучены.
Несмотря на довольно большое количество метагеномов кишечника собранных из разных регионов Земли, все еще не был сделан метагеном жителей Российской Федерации. Россия представляет собой уникальный пример совокупности совершенно разных географических, этнографических и социальных факторов. Популяционное исследование российских метагеномных образцов позволило расширить представление о существующих микробных сообществах. В процессе исследования был создан алгоритм поточной обработки данных, который позволяет анализировать метагеномы, полученные с приборов ABI SOLiD4 и SOLiD5500, чего не существовало ранее.
Цель исследования.
Разработать алгоритм анализа метагеномных данных для прикладных медицинских и научных исследований.
Задачи исследования.
Научная новизна исследования.
Практическая значимость.
Таблица 1. Отражение некоторых патологий на состав кишечной микробиоты
|
||
Патология
|
Понижено
|
Повышено
|
ВЗК
|
Firmicutes (Clostridium IXa и IV группы и Bifidobacterium)
|
Сульфат-редукторы (Bilophila wadsworthia), E.coli
|
Колоректальный рак
|
Eubacterium rectale и Faecalibacterium prausnitzii
|
Enterococcus faecalis, Fusobacterium nucleatum
|
Диабет 2 типа
|
Prevotella, Bifidobacterium spp и Bacteroides vulgatus
|
Bacteroides, Clostridium leptum(?)
|
Атеросклероз
|
синтез бутирата и антиоксидантов
|
Метаболизм пептидогликанов
|
Алкоголизм
|
Bacteroidetes
|
Proteobacteria (E. coli)
|
Квашиоркор
|
Bifidobacteria (B. longum, B. bifidum), Lactobacilli (L. reuteri и L. gasseri) и Ruminococcus
|
Bilophila wadsworthia, Clostridium innocuum
|
В ходе исследования был разработан универсальный алгоритм обработки метагеномных данных, получаемых с использованием любой платформы высокопроизводительного секвенирования. Этот полуавтоматизированный алгоритм успешно применяется в текущих медицинских проектах по изучению таксономических изменений состава микробиоты при различных патологических состояниях. Полное описание состава микробиома когорты здоровых жителей Российской Федерации позволило расширить знания о нормофлоре человека, а так же предоставило контрольный набор данных для последующих исследований микробиоты в России. Дополнительно, была создана предварительная модель метаболизма КЖК, которая в будущем может быть использована для предсказания концентраций КЖК в зависимости от состава микробиоты кишечника человека.
Методика проведения метагеномных исследований
Исследование микробиоты является сложной экспериментальной и математической задачей. Изначально, состав микробиоты оценивался с помощью бактериального посева, и до сих пор это является основной диагностической методикой в медицине. Но у этого метода есть ряд недостатков. Микрофлора кишечника состоит из факультативно аэробных и строго анаэробных микроорганизмов, чья культивация весьма затруднительна. При высевании теряется количественная оценка микробиоты. Поэтому, исследователи начали изучать микробиоту при помощи секвенирования. Здесь есть два основных подхода. Первый, и наиболее применяемый ввиду своей доступности, относительной дешевизны и методической простоты, является секвенирование 16S рРНК генов – основного фактора классификации бактерий и архей. Таким образом, удается оценить филогенетическое разнообразие микробиоты, в том числе выявить новые микроорганизмы. Количественная оценка также возможна при использовании этого метода, с поправкой на копийность 16S рРНК генов в геномах. Однако, в этом случае теряется информация о функциональном составе микробиоты: нельзя детектировать метаболические пути и гены, можно лишь строить предположения, исходя из известных последовательностей геномов найденных бактерий. Для решения этой проблемы применяют куда более дорогостоящий и сложный с точки зрения обсчета и эксперимента подход – полногеномное секвенирования (Whole Genome Sequencing, WGS). При этом, выделяется тотальная ДНК из метагеномных образцов и секвенируется на высокопроизводительных приборах (Illumina, ABI SOLiD). На выходе с секвенаторов получаются гигабайты данных с информацией о короткоцепочечных (50-100 нуклеотидов, в зависимости от прибора) нуклеотидных последовательностях, именуемые ридами. Помимо стандартной фильтрации по качеству, риды проходят проверку на наличие загрязнения человеческим геномом путем картирования на него.
Состав метагенома, как геномный, так и генный, определяется путем картирования ридов на референсные наборы последовательностей. Есл первые исследователи были вынуждены картировать риды на всю мировую базу данных нуклеотидных последовательностей из NCBI, то теперь, благодаря усилиям консорциумов MetaHIT и HMP существуют референсные наборы геномов кишечных бактерий и неизбыточный каталог преобладающих 3,5 млн. бактериальных генов. Бывают также специфические референсные наборы, в зависимости от целей исследования, например, используют базу данных генов устойчивости к антибиотикам ARDB. Само картирование может проводится различными способами в зависимости от длины ридов. При длине от 100 нуклеотидов, возможна de novo сборка кантиков из ридов. Далее полученные более длинные последовательности либо выравниваются на набор референсных геномов, либо в них производится поиск открытых рамок считывания, и уже они выравниваются на каталог генов.
Однако, при меньшей длине, например 50 нуклеотидов, получаемой при секвенировании на приборе ABI SOLiD 4, сборка контигов представляется едва ли возможной, слишком высока вероятность получения «химер» – контигов, собранных из оригинально разных геномов. Поэтому в этом случае риды сразу картируют на референс. Для этого существует специальные программы, наиболее распространенная – bowtie.
Степень представленности той или иной референсной последовательности в метагеноме высчитывается в основном как отношение количества выравненных нуклеотидов на длину референсной последовательности с поправкой на общую длину картированных ридов9. Иногда высчитывается гипотетическое значение представленности тех геномов или генов, которых нет в референсном наборе, но присутствуют в метагеноме. В случае функционального анализа также используют raw counts – количество ридов, картировавшихся на референсную последовательность, без каких-либо нормировок или поправок. Эти значения используются в анализе, схожим с транскриптомным анализом на микрочипах, для этого существуют готовые библиотеки для статистического языка программирования R, например пакет metagenomeSeq.
Метагеномные данные, поступающие в статистическую обработку, от WGS или секвенирования генов 16S рРНК, имеют вид набора векторов представленности, где по одной оси расположены образцы, по другой – признаки, гены или геномы, а значения – их представленность в данном образце, их процентное содержание, также по этим данным можно оценить состав всей выборки, альфа- и бета-разнообразие. Для сравнения образцов между собой необходимо ввести меру сходства, т.к. рассматривать каждый признак в отдельности крайне непродуктивно. Для этого считают расстояния между образцами, основываясь на векторах представленности. Есть несколько наиболее используемых метрик в метагеномике. Одна из первых используемых было расстояние Дженсона-Шэннона, позволяющее измерить сходство между двумя распределениями случайных величин. Впоследствии более используемым стало расстояние по Брэй-Кертису, часто встречающееся в экологических исследованиях. Метагеномный инновацией стала метрика UniFrac, используемая для изучения метагеномов по 16S рРНК генам. Ее особенность заключается в том, что она учитывает филогенетические расстояния между бактериями. Данная метрика включена в популярный сервис анализа данных по 16S рРНК генам QIIME.
Имея матрицу расстояний, становится возможным представить изначально многомерные данные в двухмерном пространстве, с помощью MDS (англ. Multidimensional Scaling). Еще один способ визуально оценить метагеномные образцы это метод главных компонент (англ. Principal Component Analysis, PCA). С помощью этого метода можно выявить, по каким признаком наблюдается наибольший разброс образцов, а также оценить результаты кластеризации.
****
В случае исследования различий между метагеномами здоровых людей и пациентов, проводят дискриминантный анализ. Какой-либо устоявшейся схемы анализа не существует. Часто используют линейные регрессионные модели, дисперсионный анализ (ANOVA) или алгоритм Random Forest, или иные комбинации статистических методов. Не существует универсального протокола обработки метагеномных данных, каждое следующее исследование добавляет модификации. Но в целом, алгоритм почти не меняется (Рисунок 2*).
Рисунок 2*. Схема анализа метагеномных данных от полногеномного секвенирования.
Актуальность метагеномных исследований в Российской Федерации
К настоящему времени исследование метагенома кишечника человека является одной из центральных тем биомедицинских исследований. Исследовано несколько тысяч метагеномных образцов человека по всему миру методами секвенирования 16S РНК генов и полногеномного секвенирования. Накоплено много данных, позволяющих охарактеризовать нормофлору, найдены некоторые зависимости состава микробиоты от образа жизни, возраста и т.д. Начинается период клинических исследований, изучение патологий желудочно-кишечных и аутоиммунных заболеваний, обусловленных микробиотой. Кроме того, исследуются механизмы взаимосвязи организма хозяина и кишечных микробных сообществ. Методы исследования также значительно продвинулись вперед, но какого-либо единого цельного протокола исследования пока не выбрано. Тем не менее, до проведения настоящего исследования оставался неохваченным значительный многокультурный регион – Российская Федерация.
Особенность изучения микробиоты жителей нашей страны заключается в чрезвычайном разнообразии образов жизни. Здесь есть как мегаполисы мирового уровня, возможные источники урбанистической микробиоты, так и удаленные регионы, в которых люди продолжают соблюдать традиционный уклад. Изучение российского метагенома, как на таксономическом, так и на функциональном уровне, потенциально может значительно расширить рамки определения здоровой микрофлоры, выявить новые зависимости состава от образа жизни.
2. МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ
Забор образцов кала
Образец кала забирали у здоровых людей в возрасте 36±18 лет на основе информированного согласия и использовали для выделения ДНК. Забор образцов производился медицинским персоналом. Дальнейшая экспериментальная часть проводилась сотрудниками геномного центра из ФГБУ ФНКЦ ФХМ ФМБА России (см. также лаборатория биоинформатики).
ФЕДЕРАЛЬНЫЙ НАУЧНО-КЛИНИЧЕСКИЙ ЦЕНТР ФИЗИКО-ХИМИЧЕСКОЙ МЕДИЦИНЫ
Опускаем параграф о выделении ДНК- ред.
Методы секвенирования
Подготовку shotgun-библиотек и их секвенирование с использованием генетического анализатора SOLiD 4 (Life Technology, США) осуществляли согласно рекомендациям производителя с использованием наборов SOLiD TM Fragment Library Construction Kit, SOLiD TM Fragment Library Barcoding Module 1 – 16, SOLiD TM EZ Bead TM E80 System Consumables, SOLiD™ ToP Sequencing Kit. Фрагментные библиотеки были созданы из 5 мкг тотальной ДНК для каждого образца с баркодами. Были получены риды по флагу F3 длиной 50 нуклеотидов.
Подготовку шотган-библиотек и их секвенирование с использованием генетического анализатора Ion Torrent PGM (Life Technology, США) осуществляли согласно рекомендациям производителя с использованием наборов Ion Xpress™ Plus Fragment Library Kit, Ion OneTouch™ Template Kit, Ion Sequencing Kit, Ion OneTouch™ 200 Template Kit, Ion Sequencing 200 Kit, Ion 318 Chip Kit.
Подготовку shotgun-библиотек и их секвенирование с использованием генетического анализатора GS FLX+ (Roсhe, США) осуществляли согласно рекомендациям производителя с использованием наборов GS Rapid Library Prep Kit, GS Titanium SV emPCR Kit (Lib-L) v2, GS Titanium LV emPCR Kit (Lib-L) v2 и GS FLX Titanium Sequencing Kit XL+.
Подготовку shotgun-библиотек и их секвенирование с использованием генетического анализатора HiSeq 2000 (Illumina) осуществляли согласно рекомендациям производителя с использованием наборов TruSeq DNA sample prep kit v.2, TruSeq PE Cluster Kit v3-cBot-HS TruSeq SBS Kit v3-HS с длиной чтения 101 п. н. с каждого конца фрагмента. Демультиплексирование проводилось с помощью программы CASAVA v. 1.8.2.
Подготовка фрагментной библиотеки ДНК и полногеномное секвенирование на платформе SOLiD 5500 W (Life Technologies, Foster City, CA, USA) были произведены в соответствие с инструкциями от производителя с применением следующих наборов: 5500 SOLiD™ Fragment Library Core Kit, 5500 SOLiD™ Fragment Library Barcode Adaptors 1-16, 5500 W Conversion Primers Kit, 5500 W FlowChip V2, 5500 W FlowChip Prep Pack, 5500 W Template Amplification Kit v2, 5500 W FWD1 SP Kit, Double, 5500 W FWD2 SP Kit, Double, 5500 W FWD SR Kit, Double, 5500 W FWD Ligase Kit, Double, 5500 W Run Cycle Buffer Kit, 5500 W FWD Buffer, Double, 5500 W Buffer D. Выходная длина ридов составила 75 п.н.
Опускаем следующие параграфы (для самостоятельного прочтения - ред.):
3. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЕ МЕТАГЕНОМНЫХ ОБРАЗЦОВ: РАЗРАБОТКА МЕТОДОЛОГИИ И АНАЛИЗ
Опускаем все параграфы (для самостоятельного прочтения - ред.):
Рисунок 5*. Гистограмма среднего процента представленности отделов в российских образцах и в остальных. В целом, метагеномные образцы из России, так же, как и в остальном мире, содержат в себе представителей двух отделов – Bacteroidetes и Firmicutes. Однако их соотношение значительно различается - добавлено ред..
Создание программного комплекса по обработке метагеномных данных
В ходе данной работы был разработан и реализован алгоритм обработки метагеномных данных. Отличительная особенность этого алгоритма заключается в способности обрабатывать данные, полученные с разных платформ секвенирования, в том числе и с приборов ABI SOLiD 4, генерирующие риды в цветовом формате малой длины, что составляет определенную вычислительную сложность.
Фильтрация ридов
Секвенаторы SOLiD 4 и SOLiD 5500 не проводят предобработку ридов, поэтому начальным этапом является фильтрация по среднему значению качества. Это позволяет отсеять риды, содержащие ошибки секвенирования, такие как неправильное определение цвета и поликлональные риды. Кроме того, обрезаются низкокачественные 3’ концы ридов алгоритмом SAET. В итоге отсеивается в среднем 18±3% ридов. Следующий этап фильтрации – картирование на геном человека. Это стандартный этап при обработки метагеномных данных, его наличие связано с возможным загрязнением во время получения образцов или во время пробподготовки. Помимо оценки качества экспериментальных процедур, результат этой фильтрации служит первичным маркером возможных патологий. Так, наличие большого количества ДНК человека в метагеномном образце может объясняться воспалительными процессами, такими как мукозит.
Картирование на референсный каталог геномов
Оставшиеся после фильтрации высококачественные риды картируются на референсный каталог геномов. Картирование происходит программой bowtie. Допускается при картировании наличие максимум трех несовпадений, делеции и инсерции невозможны. В существующих метагеномных программных комплексах часто используется алгоритм выравнивания BLAST, однако он не подходит для картирования коротких ридов и ридов в цветовом формате, в отличии от bowtie. Для картирования более длинных ридов не в цветовом формате, полученных с прибора Ion Torrent, была использована оптимизированная для этих целей программа bowtie.
Референсный каталог геномов базируется на наборе кишечных бактерий, составленный HMP (Human Metagenome Project). Это американский проект по изучению всего метагенома человека, в рамках которого запланировано секвенировать около 3000 геномов культивируемых и некультивируемых бактерий и архей. В созданном программном комплексе были использованы геномы из этого проекта, относящиеся к метагеному кишечника. Каталог также был расширен геномами бактерий патогенов и другими, ассоциированными с теми или иными патологическими состояниями согласно литературным данным. Также были добавлены геномы эукариот, а именно несколько представителей рода Candida и Blastocystis hominis. Это было сделано для более глубокого анализа клинических образцов. Дело в том, что смещение микробного гомеостаза в следствие кишечных заболеваний, приема антибиотиков или химиотерапии предположительно может дать возможность для заселения освободившихся экологических ниш патогенными организмами. Далее полученный каталог геномов был приведен к неизбыточному виду, т.е. все последовательности были выравнены друг против друга и кластеризованы по порогу 80% сходства на 80% длины. В итоговый набор вошли геномы, непохожие ни на один другой и по одному представителю из каждого кластера гомологии. Это было сделано для того, чтобы избежать разбавления представленностей геномов. В том случае, если в каталоге несколько схожих геномов, ввиду равновероятного покрытия ридами схожих участков, они становятся равнопредставленными, хотя в действительности это может быть не так. Поскольку основной смысл определения бактериального состава сводится к выявлению функционального потенциала всего метагенома, а схожий геном означает чаще всего одинаковый функционал, то целесообразней использовать по одному представителю от кластера гомологии, тогда возможные различия между группами метагеномных образцов будут значительно лучше детектироваться. Такой подход имеет свое отражение в метагеномном анализе по последовательностям 16S рРНК генов. В таком виде анализа оперируют термином OTU (от англ. Operational Taxonomic Unit) – условная таксономическая единица, соответствующая роду, виду или штамму и выделяемая по гомологии 16S рРНК гена. Ее появление связано с наличием большого количества бактерий, чьи геномы неизвестны. По этой же причине, нельзя назвать используемый каталог конечным. Каждое новое метагеномное исследование выявляет маркеры тех или иных состояний кишечника, секвенируются новые геномы из микробиоты. Увеличение каталога приводит к получению большего количества информации, а следовательно, к расширению исследования, что постепенно нивелирует недостаток описываемого метода, заключающийся в том, что можно детектировать только те микроорганизмы, которые есть в каталоге. В настоящий момент, каталог насчитывает 353 неизбыточных генома.
Подсчет покрытия референсных последовательностей
После картирования происходит подсчет покрытия, которое является числовой оценкой представленности геномов в образце. Существуют два вида покрытия – суммарное количество позиций генома, оказавшихся покрытыми хотя бы одним ридом (ширина покрытия), и суммарная длина всех ридов, картировавшихся на референсную последовательность (глубина покрытия). Ширина покрытия используется в качестве эмпирического порога отсечения: геном считается хоть сколько-нибудь представленным, если покрыт хотя бы на 1% своей длины. Это сделано для того, чтобы избежать ложно-положительной детекции признаков по случайным причинам. Глубина покрытия нормируется на длину референсной последовательности и общее количество картировавшихся ридов образца. Такая нормировка соответствует преобразованиям, выполненными в других метагеномных исследованиях9. Таким образом для каждого образца формируется его вектор представленности признаков, в данном случае – геномов. Значения представленностей приводятся к процентам для более адекватного сравнения образцов между собой. К сожалению, на данный момент не существует способа сравнения абсолютного количества представленности геномов в метагеномных образцах, т.к. глубина секвенирования может значительно варьировать не только между различными приборами, но и в рамках одного запуска секвенатора. Помимо нормированных значений, в анализе используются и значения числа легших на референсную последовательность ридов – каунты. Такой метод позволяет детектировать статистически достоверные различия между группами образцов по низкопредставленным таксонам. Однако подсчет расстояний между образцами по таким данным затруднителен. Например, используемая в данной работе расстояние Брэй-Кертис требует суммы по образцам равной единице.
Статистический анализ
Имея количественную и качественную оценку состава метагеномов, появляется возможность для их анализа. Первая возможная оценка – индекс альфа-разнообразия. В экологии существует понятие «Принцип биоразнообразия», частично приписываемое закону Эшби. Его суть состоит в том, что чем разнообразнее экосистема, тем сложнее в ней сдвинуть равновесие и разрушить. Вероятно, что большое разнообразие является признаком здоровой устойчивой микробиоты. Помимо общей оценки, появляется возможность оценить представленность тех или иных бактерий. Особое значение имеют различные патогены, такие как Clostridium difficile, Pseudomonas aeriginosa, Candida albicans, Blastocystis hominis и другие микроорганизмы, в норме не встречающиеся в метагеноме. Их наличие может быть следствием произошедшего смещения микробного равновесия, приведшее к возможности заселения патогенами. Подобное событие возможно, например, вследствие употребления антибиотиков, из-за которого комменсальная микробиота погибает, а патогены, несущие механизмы резистентности к этим антибиотикам, напротив выживают, занимая освободившиеся роли и активно размножаются. Помимо появления патогенов в значимых количествах, сигналом патологических состояний может стать значительное изменение представленности некоторых бактерий. Так, например Escherichia coli в норме составляет примерно 1-10% от общего микробного состава. Однако в случае воспалительных процессов, ее количество может возрастать свыше 80%. В дальнейшем вероятно будут выделены организмы-маркеры тех или иных заболеваний и будут выявлены точные границы нормы их представленности. Это станет новым мощным диагностическим инструментом, неинвазивным и достаточно удобным.
Помимо общей оценки видового или родового состава микробиоты, используются различные методы сравнения образцов по всем признакам сразу. Для этого между образцами подсчитывают расстояние. Обычное Евклидово расстояние не подходит для метагеномики, т.к. не выполняется условие ортогональности: в геномах есть консервативные участки, секвенированный с них рид может картироваться в таком случае равновероятно на несколько последовательностей, пропадает условие линейной независимости. В метагеномике есть 2 наиболее используемые расстояния – Брэй-Кертис (BC) и UniFrac.
Первая метрика: Согласно определению Брэя и Кертиса, индекс несходства равен:
Где Cij наименьшая сумма представленностей таксонов, общих для двух сообществ, Si и Sj общее количество найденных таксонов на обоих местах. Различие Брей-Кертиса ограничено между 0 и 1, где 0 означает, что два участка имеют одинаковый состав (то есть они разделяют все виды), а 1 означает, что два участка не имеют общего вида. На участках, где BC является промежуточным (например, BC = 0,5), этот индекс отличается от других широко используемых индексов.
Вторая метрика применяется исключительно в метагеномике, и изначально была создана для анализа по 16S рРНК генов. Ее особенность заключается в том, что в ней учитываются не только представленности бактерий, но и филогенетические расстояния между ними. Мной (автором рассматриваемой работы) эта метрика была изменена для допустимости использования с результатами полногеномного секвенирования и также использована в анализе (см. Материалы и методы в файле PDF).
Обе метрики показали схожие результаты, в частности при кластеризации по k-средним результат различался у 18 образцов из 96, что довольно немного, учитывая что степень кластеризации метагеномов недостоверна. Это в свою очередь делает спорным теорию о трех энтеротипах9 – дискретных кластеров микробиоты, дифференцированных по составу. Изначально предполагалось, что они станут своего рода кишечными аналогами групп крови, однако в последующих исследованиях энтеротипы либо находили лишь частичное подтверждение, либо утверждалось обратное, что кластеров микробиоты не существует, а стоит говорить о непрерывном градиенте сообществ.
Одна из главных задач исследования микробиоты это выявление различий между группами образцов, например здоровыми и больными или представителями различных стран. В метагеномике применяется ряд различных статистических методов для обнаружения достоверных различий и этот список расширяется с каждым новым исследованиям. Сложность заключается в невозможности использовать параметрические статистческие тесты, например t-тест, т.к. метагеномные данные распределены не нормально. Поэтому, он заменяется на непараметрический тест Манна-Уитни (он же U-тест) в качестве фильтрации различающихся признаков. Если необходимо сравнение нескольких групп образцов, используются также вариации от известного метода ANOVA или дисперсионный анализ, например PERMANOVA или ANOSIM, последний был использован в данной работе для выявления различий между группами образцов по географическому признаку.
Реализация программного комплекса
Алгоритм с базовым набором функций статистического анализа доступен для общественного пользования через веб-сервис MALINA. Полная версия алгоритма реализована на сервере НИИ ФХМ и активно используется в текущих метагеномных исследованиях. Программный комплекс состоит из нескольких модулей, написанных на языках программирования bash, Python 3.2, Perl 5. Данные об образцах и результаты картирования хранятся в СУБД Oracle 11.2. Статистический анализ реализован на языке программирования R 3.1. Весь комплекс был создан совместно с А. В. Тяхтом.
Анализ образцов из Российского метагеномного проекта
Программный комплекс был использован для анализа 96 сельских и городских образцов от здоровых доноров, собранных в рамках Российского метагеномного проекта (www.metagenome.ru). Экспериментальная работа и секвенирование проводилась в геномном центре НИИ ФХМ. Полный анализ образцов проводился совместно с А.В. Тяхтом, состоял из таксономической и функциональной частей. В этой работе рассмотрена таксономическая составляющая анализа.
Анализ включал в себя сравнение с метагеномными образцами из других исследований и его результаты были описаны выше. Была проведена процедура проверки состоятельности сравнения этих образцов, с учетом их получения с разных платформ секвенирования. Так один из российских образцов был дополнительно секвенирован дважды на приборе Ion Torrent и еще 5 образцов на приборе Illumina. Полученные вектора представленностей хорошо коррелировали между одними и теми же образцами, что стало подтверждением приемлемости сравнения образцов, секвенированных на различных приборах. Независимыми методами была подтверждена состоятельность работы алгоритма и адекватность получаемых результатов: некоторые образцы были обработаны этим программным комплексом и сервисом MetaPhlan, полученные вектора представленностей также хорошо коррелировали.
В ходе исследования было выявлено, что российские метагеномы характеризуются меньшим содержанием представителей рода Bacteroides, чем европейские или американские. Было показано разделение российских образцов на 2 группы: в одной группе преобладал род Prevotella, в другой доминировало несколько родов из отдела Firmicutes, что приблизительно соответствует 2 из 3 ранее найденных энтеротипов. Еще один энтеротип, с родом Bacteroides в качестве доминанты, выявлен не был. Разделение сельских и городских метагеномов между кластерами оказалось примерно одинаковое. Для сравнения, на Западных и Китайских образцах было показано существование 2 или 3 кластеров9,32,16: всегда присутствовал энтеротип с преобладающим родом Prevotella, энтеротип с Bacteroides, но не всегда удавалось найти энтеротип с доминирующими Firmicutes. Стоит заметить, что метагеномы с преобладанием рода Bacteroides ассоциированы с высоким потреблением животного белка и жира и меньшим потреблением клетчатки. Вероятно, рацион российских доноров в меньшей степени состоит из мяса, и в большей – из круп и другой пищи, богатой углеводами.
В выборке российских метагеномных образцов были найдены уникальные микробные сообщества, не встречающиеся в ранее изученных метагеномах. Что характерно, преимущественно такие образцы – от доноров из сельских регионов, что вызывает предположение, что дальнейшие изучение микробиоты кишечника жителей удаленных районов позволит выявить большее разнообразие сообществ. Оригинальность этих сообществ была определена по тройкам преобладающих родов. Такая оценка была выбрана в связи с тем, что около 70% всего покрытия составляют первые три рода, что делает такую классификацию удобной в применении для общей характеристики микробиоты. Хотя безусловно, патоген представленный хотя бы на 1% будет иметь значительное влияние на всю микробиоту. Около 43% российских метагеномов содержали уникальные тройки, не обнаруженные в не-российских образцах. Большая часть содержавшихся в них родов относилась к отделу Firmicutes, но были и представители Bacteroidetes, Verrucomicrobia, Actinobacteria, Proteobacteria, Tenericutes и Archaea.
Из отдела Firmicutes наиболее представленными родами были Roseburia, Coprococcus, Faecalibacterium, Eubacterium, Ruminococcus, Blautia, Butyrivibrio и неклассифицированные представители семейства Lachnospiraceae. Так же встречались метагеномы с нетипичными доминантами, к примеру в двух образцах преобладали микроорганизмы Akkermansia muciniphila и Methanobrevibacter smithii. Каждый из них в отдельности достаточно часто упоминается в исследованиях в той или иной ассоциации. Однако вместе они встречаются редко и ассоциированы со здоровым кишечником, как маркеры микробиоты с большим метаболическим потенциалом. Доминирование архей рода Methanobrevibacter вероятно отражает высокий уровень производства водорода бактериями, что также подтверждается отсутствием более эффективных водород-утилизирующих бактерий, таких как Desulfovibrio и Desulfitobacterium.
Стоит отметить единичные случаи доминирования бактерий родов Phascolarctobacterium и Lactobacillus в образцах из Омской области и Хакассии соответственно. Было найдено, что эти же бактерии являются доминантами в микробиоте монголов из сельских районов, и их количество меньше у монголов из городов.
Некоторые из обнаруженных оригинальных метагеномов имели в качестве доминант оппортунистические патогены. Так в нескольких образцах преобладала бактерия Escherichia coli, которая встречается в больших количествах при воспалительных процессах в кишечнике. В одном из образцов из Санкт-Петербурга было отмечено высокое содержание бактерии Streptococcus infantarius, являющейся маркером колоректального рака.
Помимо обычной для метагеномного исследования процедуры кластеризации по k-средним, была применена особая методика, определяющая компактные достоверно схожие подгруппы образцов. Ею были выделены две подгруппы. Первая подгруппа состояла из образцов из Омской области, чьими донорами были представители одной семьи. Ранее было показано, что фактор совместного проживания значительно влияет на метагеном. Отличительная особенность таксономического состава этой группы заключается в высоком содержании родов Prevotella, Coprococcus и Faecalibacterium, что напоминает состав метагеномов из Малави и Венесуэлы. Вторая выделенная подгруппа состояла из образцов из сельского района Татарстана. Интересно заметить, что все эти образцы относятся к носителям уникальных сообществ. В частности, они на 80% состоят из представителей родов Roseburia, Coprococcus, Faecalibacterium и Ruminococcus. Наиболее представленными организмами из этих родов являются Eubacterium rectale, C. eutactus, F. prausnitzii и R. bromii соответственно. Такое сообщество может являться примером объединенного метаболизма и приносить пользу организму хозяина. В частности, R. bromii и E. rectale способный ферментировать устойчивый крахмал второго и третьего типа. Высокое содержание представителей родов Roseburia и Coprococcus, отличало метагеномы здоровых пожилых людей от пожилых пациентов, проживающих в стационаре, а снижение доли представителей рода Ruminococcus было ассоциировано c ухудшением состояния здоровья. Метаболомный анализ фекальных вод показал, что эти виды ассоциированы с повышенным уровнем бутирата68, который играет важную роль в поддержании гомеостаза кишечника. Кроме того, E. rectale, F. prausnitzii и Roseburia spp. превалировали в образцах контрольной здоровой группы в исследовании метагенома больных диабетом 2-го типа, а последние 2 бактерии превалировали в контрольной группе по сравнению с метагеномами, больных атеросклерозом. Таким образом, это новые выявленные сообщества могут быть примером действительно здоровой микробиоты, являющейся крайне полезной для организма хозяина. Предположительно, такой состав микробиоты поддерживается диетой, богатой натуральными продуктами с преобладанием углеводов, в частности клетчатки и резистентными формами крахмала.
Современный стиль жизни мегаполисов значительно ограничивает нас от взаимодействия с микробным окружением. Антибактериальные средства гигиены, пастеризованная пища, консерванты, все это несомненно влияет на нашу микробиоту, однако степень влияния все еще предстоит оценить. Но уже сейчас имеются свидетельства того, что утеря некоторой ее составляющей, а также уменьшение взаимодействия с другими микроорганизмами приводит к росту аллергий и метаболических заболеваний. В связи с этим возникает вопрос – какую микробиоту следует принять за золотой стандарт? Одно из предположений заключается в поиске здоровой микробиоты среди жителей удаленных регионов, ведущих здоровый образ жизни, питающихся натуральными продуктами. Микробиота таких доноров должна быть достаточно богата ввиду отсутствия потребления антимикробных агентов и разнообразного здорового питания. Подобные сообщества представляют медицинский интерес, как универсальный материал для трансплантации микробиоты, с целью лечения кишечных заболеваний и облегчения болезненных состояний.
Видовое разнообразие метагеномов при различных диагнозах
Безусловно изучение микробиоты человека имеет фундаментальное значение, но не менее важным является использование полученных знаний на практике. Она тесно связана с нашим организмом, претерпевая изменения вместе с ним, при кардинальном изменении образа жизни или же при болезнях. Следовательно, метагеном может содержать в себе маркеры патологических состояний, даже на ранних стадиях и служить детектором начинающихся изменений в организме. Поэтому следующим этапом после определения нормофлоры кишечника стало проведение медицинских исследований. Описание здоровой микробиоты кишечника населения РФ позволило дополнить знания о нормофлоре, расширить выборку контролей. Эти образцы были использованы в данной работе для выявления специфических черт метагеномов из трех выборок образцов: от онкологических больных, страдающих алкоголизмом и работников на вредном производстве.
Не только болезни, но и методы лечения могут значительно сказываться на здоровье организма. Одним из наиболее тяжелых по своим последствием видом лечения является химиотерапия. Противоопухолевые лекарственные препараты блокируют рост и деление клеток, что приводит к целому ряду побочных эффектов, включая снижение иммунитета. В связи с этим, радикально изменяется состав кишечной микробиоты. При сравнении группа образцов от детей с окологическими заболеваниями со здоровой когортой, в ней были выявлены несколько значительно перепредставленных родов, в норме не содержащихся вовсе или же в малых количествах, например Klebsiella, дрожжи Candida, Streptococcus, Pseudomonas. Все они являются патогенными микроорганизмами и их появление является отражением тяжелой дисфункции иммунитета. Даже в численном соотношении метагеном онкологических больных отличается от здоровых образцов: глубина секвенирования отличается на порядок, что говорит о значительно меньшей концентрации бактерий в кале. В некоторых образцах содержание ДНК человека превышало 40%, что может быть следствием мукозита, не являющегося редкостью для онкологических больных, проходящих химиотерапию. Помимо общего количества, снижено и бактериальное разнообразие по сравнению с контролем, в свою очередь это может означать неустойчивость микробиоты пациентов к внешним воздействиям, что еще более усугубляет положение.
Микробиота человека является неотъемлемой частью его метаболизма, синтезируя КЖК, витамины, аминокислоты. Нарушения микробиотного гомеостаза ухудшает состояние больных, осложняет процесс и восстановление. Это исследование микробиоты онкологических больных было пилотным проектом, одним из первых исследований медицинского значения, с использованием метагеномного подхода. Уже сейчас существуют методы лечения, основанные на знаниях о микробиоте. Существуют примеры успешного лечения клостридиальной инфекции методом трансплантации кала. Дальнейшая работа в этом направлении позволит помочь онкологическим больным, компенсировать дисфункцию микробиоты, а следовательно повысить долю успешных исходов.
Исследование образцов микробиоты больных алкоголизмом и сотрудников предприятия из Сарова, работающих с радиоактивными материалами не выявило кардинальных отличий от контрольной выборки из 96 российских образцов (Рисунок 19).
Рисунок 19*. График MDS метагеномных образцов из клинических исследований и контрольной выборки. Цветом отмечена принадлежность к группам.
Обе группы можно условно отнести к первому и второму энтеротипу, т.к. доминантными родами в них являются Bacteroides и Prevotella, хотя у трех образцов из Сарова преобладают рода из отдела Firmicutes, что их относит к условному третьему энтеротипу. Метагеном больных алкоголизмом также отличился повышенным содержанием бактерий рода Escherichia и наличием ряда патогенов, в частности Salmonella и Klebsiella. Тем не менее, при более детальном рассмотрении в обоих случаях есть статистически достоверное повышенное содержание оппортунистических патогенов и бактерий, асоциированных с болезненнными состояниями. Это может быть первым сигналом изменений в иммуной системе доноров и как следствие – изменения иммунной толерантности к этим микроорганизмом. Хотя на данном этапе картина не выглядит критичной, но при более продолжительном воздействии вредных условий иммунитет может претерпевать куда более сильные изменения, приводящие микробиотному дисбалансу, который наблюдается у онкологических больных.
Моделирование производства короткоцепочечных жирных кислот
До сих пор метагеномные исследования оставались вещью в себе. Влияние микробиоты кишечника на организм хозяина предполагалось лишь исходя из ее общего метаболического потенциала, т.е. по найденным в метагеноме биохимическим путям. Однако, для подтверждения такого взаимодействия необходима привязка к другим биохимическим параметрам организма. Таким параметром могут служить концентрации короткоцепочечных жирных кислот (КЖК), померенные в кале. Связывая эти значения с составом микробиоты можно получить представление о степени и характере влияния на организм хозяина. До текущего момента было предпринято несколько попыток создания подобной модели, однако ни одну из них не представляется возможным использовать для реальных данных, т.к. создаваемые предсказания работали только для модельных организмов с заданным составом микробиоты.
В этой работе была создана первичная обучаемая модель предсказания концентраций КЖК, поступающих в организм человека, в зависимости от состава метагенома. В ходе исследования были выявлены бактериальные рода, значительно влияющие на результат. Наиболее ожидаемая из найденных зависимостей, это влияние представленности бактерии Faecalibacterium prausnitzii на значение константы скорости при реакции образования бутирата из ацетата. У этой бактерии есть фермент бутирил КоА: ацетат КоА трансфераза, позволяющий преобразовывать из ацетата бутират, что экспериментально подтверждает полученные результаты. Также представленность этого рода влияет на производство ацетата из субстрата, что подтверждается экспериментально. Также было обнаружено отрицательное влияние представленности бактерий Ruminococcus и Bifidobacterium на константу скорости преобразования субстрата в пропионат. В случае Bifidobacterium это может быть объяснено тем, что в кислой среде они активно размножаются и производят лактат, но из-за низких pH он не перерабатывается в КЖК, в том числе в пропионат.
Информация которая была использована – концентрации трех основных КЖК в фекалиях – может быть недостаточной для однозначной идентификации значений параметров модели. Дело в том, что эти концентрации являются суммарным результатом действия многих процессов, происходящих в течение продолжительного времени в разных отделах толстого кишечника. Это вклады в метаболизм КЖК различных групп бактерий, изменение содержания полисахаридного субстрата по ходу толстого кишечника, абсорбция КЖК энтероцитами.
Важно помнить, что измеренные концентрации КЖК в фекалиях не однозначно отражают их производство в кишечнике. Вероятно, что именно по этой причине не выявлена связь между уровнем ацетата и/или пропионата и плотностью семейства Bacteroidetes, – основного продуцента ацетата и пропионата из полисахаридов. С одной стороны, тот факт, что в нашей модели-реконструкции не удалось учесть вклад Bacteroidetes в метаболизм КЖК в качестве ковариационной зависимости может быть следствием ее несовершенства. С другой стороны, может быть так, что в исследуемой популяции за синтез ацетата и пропионата отвечают в равной мере как представители Bacteroidetes, так и Firmicutes.
Результатом данной работы является разработанный программный комплекс для проведения таксономического анализа метагеномных данных. Программа была опробована на первых 96 полногеномно секвенированных метагеномных образцах от жителей Российской Федерации. Было проведено сравнение полученных метагеномов в общемировом контексте, выявлены таксономические особенности метагеномов кишечника жителей удаленных районов.
Описанные 96 образцов также были использованы в качестве контроля при исследовании трех клинических групп: онкологических больных, проходящих курс химиотерапии, страдающих от алкоголизма и людей, работающих на производстве с повышенным радиационным фоном. У онкологических больных
также наблюдались серьезные изменения состава микробиоты и низкая концентрация бактериальной ДНК, минимальное бактериальное разнообразия. Больные алкоголизмом обладают микробиотой, схожей со здоровой, но есть отличия, включая появления патогенных организмов. Данный метод показал себя перспективным диагностическим инструментом.
Была построена первая механистическая модель производства короткоцепочечных жирных кислот микробиотой с последующим потреблением их организмом хозяина и выведением наружу. В отличии от существовавших ранее моделей, она применима не только к модельным организмам с заданным составом микробиоты, но и к реальным метагеномным данным от существующих людей. Аналогичный метод может быть использован для поиска взаимосвязей ряда биохимических параметров с составом микробиоты человека, что может способствовать более глубокому пониманию механизмов взаимодействия бактерий с организмом хозяина.
приглашают к сотрудничеству
Новые технологии, прежде всего молекулярно-генетические, создали благоприятные предпосылки к появлению принципиально новых направлений в изучении как самих микробных популяций, так и особенностей межмикробных взаимоотношений и взаимовлияния микро- и макроорганизмов. Но только с разработкой и внедрением в широкую практику методов высокопроизводительного параллельного секвенирования появилась реальная возможность перейти к осуществлению метагеномных исследований с достаточной для системного подхода глубиной. Использование генетических платформ типа GS FLX (Roсhe), HiSeq 2000 (Illumina), SOLiD™ 4 System (Applied Biosystems) позволяет проводить глубокие метагеномные исследования не только на основании анализа генов 16S рРНК, но и по результатам полного секвенирования генов микроорганизмов, их плазмид и вирусов, что существенно облегчает создание целостной картины взаимодействия организма человека с кишечным микробиоценозом в целом за счет полной метаболической реконструкции взаимодействий внутри рассматриваемой системы.
Консорциум Российского метагеномного проекта открыт к сотрудничеству по анализу метагеномных данных, относящихся как к кишечнику человека, так и к любым другим сообществам микроорганизмов. Специалисты оказывают помощь в виде консультации или совместной аналитической работы над метагеномными данными.
Для желающих сотрудничать с концорциумом, ниже представлены ссылки на документы по участию в совместных метагеномных проектах. В этих документах можно найти всю необходимую информацию по организации биомедицинского исследования и необходимым критериям для участия:
Ниже приведен список и краткая аннотация программного обеспечения и метагеномных web-сервисов, которые можно использовать при анализе данных:
MG-RAST (http://metagenomics.anl.gov/):
Служба автоматической аннотации метагеномных данных.
IMG/M (https://img.jgi.doe.gov/cgi-bin/m/main.cgi):
Интегрированная система для изучения микробных геномов, разработанная для метагеномных исследований.
QIIME (http://qiime.org/):
Кнвейерная система обработки метагеномных данных, включающая в себя программные инструменты всех стадий, от препроцессинга/фильтрации до филогенетического анализа и сравнения сложных сообществ (публикация).
Protein Peeling (http://www.dsimb.inserm.fr/dsimb_tools/peeling/):
Одним из вариантов рассмотрения разнообразия белковых молекул в метагеномике является представление функциональных частей белков в виде т.н. белковых единиц (protein units). На основе данных о трехмерных структурах белков французским консорциумом был создан сервис Protein Peeling, позволяющий выделять структурно функциональные белковые единицы.
DODO (http://www.cosmologic-services.de/downloads/TM72-documentation/DOKse19.h...).
Зачастую рассмотрение комплексного набора генов сводится к обобщению генов на основе ортологий. Для не аннотированных в базах данных геномов необходимо осуществлять поиск ортологов на осове последовательностей ДНК. Задача такого рода может быть решена с помощью алгоритма DODO.
Будьте здоровы!
Список литературы: