译--人类肺组织微生物的特征及其与流行病学和临床特征的关系

微生物学习笔记

Posted by zd200572 on February 2, 2018

原文发表在Genome Biology, IF 11.908。

原标题:Characterizing human lung tissue microbiota and its relationship to epidemiological and clinical features

原文地址:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-1021-1

摘要

背景:人肺组织的微生物组在很大程度上仍然是未知的,虽然有一些基于呼吸道样本研究表明一个可能的人体肺部的微生物的存在。在这里,我们的描述了165例肺癌患者非恶性肺组织样本的肺菌群分类及其功能图谱。

结果:肺菌群不同于口腔、鼻、粪便、皮肤和阴道的微生物群落,Proteobacteria为占主导地位的门(60%)。微生物分类α多样性随着环境暴露的增加而增加,如空气颗粒物、低到高人口密度地区的居住地和吸烟年数,以及有慢性支气管炎病史的人减少。栖热菌属在晚期的组织更丰富(IIIB、IV)的患者含量更高,而患者发生转移,军团菌含量更高。非恶性肺组织的α多样性高于相应的肿瘤组织。

结论:我们的研究结果加深了对人类肺菌群组成和功能的认识,以及它们与人类生活方式和临床结果的联系。需要研究没有肺癌的受试者来证实我们的发现。

1.背景

人体内含有极其多样的微生物群体(微生物群落),这些微生物群体越来越被认为对人类健康至关重要。 最近的研究显示人类微生物群的特定模式与各种疾病之间有趣的相关性,包括自身免疫性疾病,糖尿病,肥胖和甚至精神病.

一般认为健康的人类肺脏是无菌的。然而,自从哮喘气道首次报道不依赖于培养的微生物群落以来,超过30项使用多种分子技术的研究表明,健康的人类肺部也是细菌的家园(参见[8,9] )。因为肺活检采样在健康的人类受试者中是不道德的,所以肺微生物群的研究主要基于支气管肺泡灌洗(BAL),支气管镜刷检或痰样品。依靠这些样本来确定肺微生物群是由于上呼吸道或口腔微生物群的污染而产生问题[8]。迄今为止,仅有四篇有关人类肺组织微生物的研究已经发表。这些研究具有相当大的局限性,包括样本量小(n <33),以及大部分患有严重肺部疾病的患者,如慢性阻塞性肺疾病(COPD)或囊性纤维化[10-13]。因此,肺组织微生物群的特征在很大程度上还不清楚。

在这项研究中,我们描述了165个肺癌患者的非恶性肺组织样品中微生物群的分类学及其功能概况,并将其与其他身体部位(和来自人类微生物组计划[14]的包括口腔,鼻腔,肠道,皮肤, 的阴道)进行了比较。 我们还评估了非恶性肺微生物群与流行病学和临床特征之间的关系。 最后,我们比较非恶性组织和肿瘤肺微生物群。

2.结果

##2.1 研究参与者的特征

总共165个非恶性肺组织样本,每个样本产生至少1000个序列读数(平均值±标准差(sd),4091±4167)包括在分析中。附加文件1:表S1描述了研究人群。参与者主要是男性(83%),中位年龄66.6岁; 53%居住在米兰市区(参见附加文件2:图S1查看所研究住宅区的地图);大部分是吸烟者(目前为51%,前者为43%),中位数为45.3包 - 年,吸烟为43.5岁; 10%至25%的自我报告有支气管炎,肺气肿和肺气肿的病史;基于肺功能测定,45%的受试者有COPD病史。大部分在上或下叶有肿瘤,3%在主支气管有肿瘤;鳞状细胞癌38%,腺癌59% IA,IB,IIA,IIB和IIIA分期中有92%被诊断出,而预期的只有8%的患者有更晚期的癌症分期(IIIB,IV),因为晚期癌症患者通常接受全身治疗而不是手术。手术前没有患者接受过化疗,放疗或其他肺癌治疗。肺癌诊断后患者存活中位数为201.9周。

2.2 非恶性肺组织微生物群的分类学和功能概况

肺微生物群的分类和功能概况如图1所示。在这里,我们定义了核心菌群为如果在80%的样品中观察到该微生物,无论相对丰度如何。 门级别上,非恶性组织样本的核心肺微生物包括变形杆菌,厚壁菌,类杆菌和放线菌(图1a)。 在属类水平上,核心肺组织微生物包括五种变形杆菌属:不动杆菌属,假单胞菌属,罗尔斯通氏菌属和两个未知类属组,分别来自Comamonadacea和Oxalobacteraceae(图1b)科。

我们还检查了NIAID(国家过敏和传染病研究所)定义的PATRIC数据库中A-C类病原体属和机会性“病原体”[15]。 观察到潜在的致病性葡萄球菌,链球菌和伯克霍尔德菌属,平均相对丰度低至2%左右。 尽管在肺组织中经常存在的假单胞菌不包括在NIAID病原体列表中,但它可能在免疫抑制的受试者中是致病的。 除此之外,在非恶性肺组织中很少观察到“病原体”(附加文件1:表S2)。

基于PICRUSt的16S rRNA基因功能的分析结果如图1c所示,展示了最丰富的模块。 与分类谱相比,功能概况表现出较少的变化(比较图1a和1c)。

2.3 阴性对照分析

我们在原始肺组织分析的同时对4个阴性对照进行测序,以测试PCR扩增和测序(“PCR阴性对照”)。 此外,我们测序了另外20个阴性对照,这些阴性对照经过DNA提取和PCR扩增(“提取阴性对照”)。 同时,我们对来自10个先前提取的肺组织标本的PCR进行PCR扩增和重新测序。 所有的样本由同一个实验室和同一个技术人员使用相同的试剂盒,并按照我们原先肺组织标本的相同提取和PCR程序进行提取。 最后,我们将阴道样本和粪便样本作为阳性对照。 我们发现:

  • 1.所有阴性对照的读数(44-351个读数)远低于肺组织样品(1551-12340个读数)和阳性样品(2703-58201个)的读数的数目(附加文件1:表S3)。
  • 2.我们发现了五个操作分类单位(OTU)在所有阴性对照中共享。这五个OTU都不存在于肺组织样品中。
  • 3.在门的层面上,有很大的不同。在肺组织样品和20个提取阴性对照之间的微生物谱中(P = 0.001,通过非参数置换多变量分析(MANOVA),1000排列的Adonis检验,对门系分布的欧几里德距离进行)。肺组织样本也与四种PCR阴性对照不同,尽管由于这些阴性对照样本量小(n = 4),P值没有统计学意义(P = 0.1)。
  • 4.在阴性对照和肺组织样本之间共有173个OTU。当我们从原始分析中排除共享的173个OTU时,关于肺组织的所有结果基本保持不变。

2.4 来自非恶性肺组织和其他身体部位的微生物的比较

我们比较了非恶性肺组织的细菌组成和丰度与人类微生物组计划(HMP,阶段1使用来自16S rRNA基因区域V3-V5的序列数据)建立的其他身体部位的细菌组成和丰度。 我们计算了门/ KEGG模块相对丰度剖面之间的欧几里得距离,提取了相应距离矩阵的主要成分,并绘制了前三个主要成分以可视化样品(图2)。 肺组织微生物群形成了一个独特的群,与健康人身体其他部位常见的口腔微生物群和微生物群大部分分开(图2a)。 基于功能谱(图2b),肺微生物群的分离甚至更清楚,在肺和口腔微生物群之间几乎没有观察到重叠。 布雷 - 柯蒂斯距离提供了类似的结果。

图2c描绘了身体部位平均门相对丰度的聚类。肺微生物群与其他身体部位不同,具有较高的Proteobacteria,Thermi和Cyanobacteria的丰度。有趣的是,Thermi在肺的平均相对丰度为8.8%,但在其他身体部位罕见,左肘窝最高平均为0.05%(附加文件2:图S2)。本研究中使用的Taq DNA聚合酶来自大肠杆菌,而不是水生栖热菌;因此,在我们的样品中观察到的Thermi不太可能是由于污染。为了证实这一点,我们对最初包括Thermi的5个样品和最初没有Thermi的5个样品重新测序。在重新测序数据中,五个阳性样品中有五个保持阳性,五个阴性样品中的五个在重新测序数据中保持阴性(附加文件1:表S4)。这些复制数据强烈不支持在PCR扩增或测序中Thermi来自实验室污染。(Thermi)在肺标本中,其中栖热菌(Thermi)是最丰富的属之一。 在重复测序中,5例阳性病例的Thermi拷贝数低于原始拷贝数样本。 这可能是由于PCR扩增中的批次效应,或者是因为复制测定中剩余的DNA量低于原始分析所用的量。

预测功能的类似聚类(图2d)显示,肺微生物群具有较高的KEGG模块氨基酸代谢,异生物生物降解和代谢以及脂质代谢的相对丰富程度。 功能概况和分类学概况是相关的(附加文件2:图S3)。

##2.5 非恶性肺组织微生物群的人口学和临床相关性

我们发现在分类α多样性和Proteobacteria细菌相对丰度方面,不同居住地的患者存在显著差异(图3a )。特别是,居住在瓦雷泽的参与者样本,其中人口密度较低(1470人/平方公里),具有较低的α多样性和高变形菌丰度,而样本的参与者在米兰生活,具有很高的人口密度(7389人/平方公里),具有较高的α多样性。当对照参与者登记时直径为10微米( PM10 )的大气颗粒物(图3b )浓度绘制时,发现与α多样性和Proteobacteria细菌相对丰度类似的关联,这可能反映先前的暴露。在对支气管炎和肿瘤分期的历史进行回归调整后,这些关联仍然存在(与这些因素的关联见下文)。包括PM10浓度和居住区在内的回归表明,两者的主要影响都不具有统计学意义。KEGG模块/路径相对丰度与居住区或PM10浓度无关(未给出结果)。

按居住区或按支气管炎病史和肿瘤分期调整的PM10对β多样性进行的MANOVA分析显示,基于未加权的UniFrac距离(分别为P = 0.009和0.006 )而非加权的UniFrac距离(分别为P = 0.14和0.16 )的β多样性具有统计学显著性关联。然而,当居住区和PM10都包括在同一模型中时,PM10 ( P = 0.003 )而不是居住区( P = 0.17 )仍然具有统计学意义。

我们观察到来自肺中不同解剖位置的微生物群之间没有统计学显著差异(附加文件1 :表S5 )。主支气管标本的alpha多样性没有显著高于肺叶标本(观察物种(平均SD ),主支气管116.6±53.6,肺叶84.0±24.0 ),但本试验仅基于5个主支气管标本。α多样性在肺的不同叶中相似(附加文件1 :表S5 )

我们观察到吸香的烟包-年数与α多样性显著正相关(香农指数,Ptrend = 0.04,观察物种Ptrend = 0.04 )。根据吸烟状况、吸烟年数或每天吸烟量,未观察到与肺微生物群测量有其他显著关联(附加文件1 :表S6 )。

与无肺部疾病病史的患者相比,有肺气肿、COPD和肺炎病史的患者具有相似水平的分类α多样性(附加文件1 :表S7 ),但有支气管炎病史的患者的α多样性显著降低(观察物种,P = 0.05;全树,P = 0.02 )。在有和没有肺部疾病史的患者之间没有发现β多样性和任何分类单元的相对丰度的差异(数据未示出)。优势门Proteobacteria细菌在包括COPD在内的先前疾病史患者中没有差异(对于有COPD和无COPD的患者,平均SD分别为0.60±0.22和0.62±0.25 )。我们还检查了肺活量、1s用力呼气量、呼气峰流量、1s用力肺活量与用力呼气量之比等肺活量指标与肺组织微生物特征(包括α和β多样性以及分类群相对丰度)的相关性,但未发现相关性(数据未显示)。

来自非恶性肺组织的微生物群在晚期iib和IV中PD _ form _ tree显著增加,但Shannon指数不增加(图3c )。β多样性(调整后的MANOVA分析)也与肿瘤分期显著相关(未加权和加权均P = 0.001 )。Thermus属( Thermi )在阶段iib和IV中具有显著更高的丰度(图3c )。就预测功能而言,在预测的KEGG模块和途径中,微生物群因肿瘤分期而显著不同(附加文件2 :图S4 )。特别地,与IA至IIIA期患者相比,IV期患者的微生物群在排泄系统模块和氨基酸代谢、醛固酮调节钠重吸收和变形虫途径方面相对丰度增加。此外,iib期和IV期患者中的微生物群信号转导的丰度减少(附加文件2 :图S4 )。

我们在诊断后的转移状态中观察到分类α多样性和β多样性没有差异。然而,与未发生转移的患者相比,发生转移的患者的非恶性样本中Legionella (变形菌)的相对丰度显著增加(平均SD为0.003±0.008,P ( Bonferroni ) = 0.01 )。

2.6 肺肿瘤与非恶性组织微生物区系的差异

我们采集了56名受试者新鲜冷冻肿瘤组织标本。排除每个样本读数< 1000的样本后,我们将31个肿瘤样本的数据与非恶性组织进行比较。非恶性组alpha多样性指数明显高于肿瘤肺组织(如PD全树;图4a )。此外,非恶性肿瘤组织和肿瘤组织之间的微生物群在肿瘤学上有显著差异(图4b )。非恶性肿瘤组织学无显著差异,腺癌组织的系统发育多样性显著高于非恶性肿瘤组织( PD _ fortual _ tree;图4b ),增加的Thermus相对丰度(Thermi;.285±0.231对0.017±0.084,P ( Bonferroni ) = 0.02 ),并降低了Ralstonia (变形菌;与鳞状细胞癌的肿瘤组织相比,P ( Bonferroni ) = 0.04。相比之下,加权平均距离在非恶性组织和肿瘤组织之间没有显著差异,并且低于肿瘤组织?(附加文件2 :图S5 )。

3.讨论

在迄今为止对人类非恶性肺组织的最大研究中,我们描述了肺组织微生物的分类和功能谱。肺组织的微生物菌群与人体其他部位的报道明显不同(口腔、鼻腔、肠道、皮肤和阴道)。此外,它表明,随着空气中微粒、居住地的人口密度的和吸烟年-包的增加,α的多样性增加。菌群也随临床分期而变化,晚期患者的非恶性肺组织α多样性增加,慢性支气管炎导致α多样性降低。非恶性肿瘤组织和肺肿瘤组织中α-微生物多样性也有显著差异。

以往对气道微生物群的研究大多基于BAL、支气管镜刷检或痰标本。这些样品的共同问题是它们可能被上呼吸道和口腔微生物群污染。在我们的研究中,样本是从远离肿瘤的肺组织手术切除的,没有肿瘤细胞核的证据。我们发现五个变形杆菌属在有或没有COPD或其他肺部疾病的肺组织中具有较高的相对丰度,并且在80 %的样品中发现每个属。相比之下,以前对BAL的研究显示,高丰度的菌属有:普氏菌属(拟杆菌属)、链球菌属(厚壁菌属)和韦氏菌属(厚壁菌属) (附加文件1 :表S8 ),它们通常存在于口腔中(附加文件1 :表S9 )。令人放心的是,以前仅有的四项非常小的肺组织研究也表明Proteobacteria 细菌门的成员是主要的(附加文件1 :表S6 )。值得注意的是,尽管只有27 %的受试者存在Thermi,但在这些受试者的样品中,Thermi具有较高的相对丰度(平均SD,32±20 % )。据我们所知,只有一项基于BAL的研究报告在一名健康受试者中存在较高的相对丰度( Thermus,约96 % )。此外,我们的数据清楚地表明,健康受试者的肺微生物群与消化道微生物群不同,即使在高分类(门)和功能( KEGG模块)水平(图2a,b )。综合这些数据表明,肺微生物群落是独特的。

一个问题是我们的肺组织检测可能在DNA提取、PCR扩增或测序过程中受到污染。对24个阴性对照的分析以及对10个先前分析过的肺标本DNA的再扩增和再测序强烈不支持污染对我们结果的扭曲。虽然Thermi对环境具有高抗性(Thermus acquaticus可以在50 - 80℃下存活,并且是热稳定Taq DNA聚合酶的来源,该聚合酶通常用于DNA扩增),我们没有发现Thermi污染的证据。重复扩增和测序5个最初Thermi阴性DNA样品产生5个阴性结果,5个最初Thermi阳性DNA样品产生5个重复阳性结果。更一般地说,当排除24个阴性对照样品和任何肺癌样品共有的173个otu时,肺癌分析几乎没有变化。

我们发现肺中微生物群落α多样性与受试者居住区(人口从低密度到高密度)之间存在正相关,有证据表明这种相关性反映了暴露于空气污染( PM10 )。在吸烟状态、吸烟强度或终生吸烟时间方面,我们没有发现肺组织微生物群的显著差异,这可能是因为研究对象之间没有很大差异,因为他们大多数是重度吸烟者。然而,我们确实发现,随着吸烟包-年数的增加,α多样性显著增加。总之,这些发现表明,肺微生物群可能会因累积暴露于烟草烟雾和其他空气污染物或与高密度人群相关的生活方式条件而改变。此前,对16份痰液样本的分析显示,与使用无烟煤的女性相比,使用烟熏煤烹饪和加热的中国女性样本中的α多样性更高。此外,吸烟者和非吸烟者龈下样本中某些分类群的多样性增加和丰度改变。长期吸入灰尘或烟草相关颗粒可通过阻止微生物从支气管肺系统扩散和清除而增加多样性。或者,空气中的微粒可以作为吸入微生物的载体,一项研究表明,有狗或猫的家庭的灰尘与没有毛皮宠物的家庭的灰尘相比具有更高的微生物多样性。

吸烟、粉尘、硅石等吸入物质长期反复刺激可促进支气管炎的发生。支气管炎的早期临床特征包括粘液分泌过多和粘膜下腺体肥大,最终导致慢性气道阻塞和特异性细菌继发生长。这可能与我们在慢性支气管炎患者中发现的低α多样性有关。显然,需要在模型系统中进行更大规模的临床研究和调查,以进一步了解微生物群的生存能力、其在慢性疾病中的作用以及其在预防和治疗策略中的潜在用途。

尽管排除了与肿瘤相邻的样本,但我们观察的是晚期肿瘤患者( IIIB和IV )的非恶性组织样本中肺微生物群的变化。具体来说,与早期肺癌患者的样本相比,这些样本具有更高的系统发育多样性、更高的Thermus ( Thermi)相关性和几个功能模块的增加/减少性。此外,发生转移的受试者具有高相对丰度的军团菌(变形菌)。这些数据提示Thermus和军团菌可能在肿瘤进展中发挥作用,部分通过不同的微生物功能,例如减少信号转导、增加排泄系统、氨基酸代谢、醛固酮调节的钠再吸收或变形虫途径。此外,肿瘤的进展可能影响更大范围内的微环境和微生物群落。根据我们的收集方法和仔细的组织学检查,来自晚期受试者的非恶性组织样品不太可能受到其肿瘤微生物群的污染。事实上,与相应的非恶性组织不同,肿瘤微生物群表现出较低的系统发育多样性。此外,虽然腺癌和鳞状细胞癌患者肿瘤样本中的微生物群落不同,但这些患者非恶性样本中相应的微生物群落没有差异。这表明来自非恶性肺组织样本的微生物群不同于肿瘤肺组织样本的微生物群,如先前对于来自结直肠癌患者的肿瘤/非恶性样本所显示的。探讨晚期非恶性肺组织或晚期病理组织中的微生物群是否在肿瘤进展中起作用,或只是肿瘤进展的被动副产品,将具有重要意义。

本研究包括值得注意的优点和局限性。这是迄今为止对非恶性肺部组织微生物群的最大规模研究。此外,我们使用在无菌条件下进行的同样的手术方法获得立即冷冻的手术样本。此外,我们还检查了与肺微生物群特征相关的详细和有效的流行病学临床变量的综合列表。此外,我们进行了严格的分析,以考虑受试者之间的相关性,配对样本和顺序阴性对照排除污染的可能性。一个重要的警告是,我们将我们的肺数据与健康人的肺数据进行了比较。这两个群体在年龄和健康状况上有很大的不同,在HMP研究中有年轻和极其健康的个体,在本研究中有老年(平均年龄67岁)肺癌患者。此外,DNA提取技术、16S rRNA基因引物和测序平台等都是不同的,并且以前已经证明可能引入一些偏差。然而,我们通过将我们的比较限制在高级和最小变量分类水平(门水平)和功能实体( KEGG模块)来最小化这些差异的影响。此外,微生物群研究的荟萃分析显示,与实验方案、年龄、地理和其他群体特征所驱动的微生物群相比,跨身体部位的微生物群差异显著。另一个限制是我们不能研究抗生素的使用对肺微生物群的影响,因为大多数病人在手术时使用抗生素。此外,与大多数微生物群研究一样,我们不知道我们研究的DNA是对应于活菌还是死菌,需要进一步研究来解决这个问题。此外,由于我们使用了一个严格的阈值( 1000个读数)来获得可靠的微生物群落相对丰度估计,我们不得不分别排除非恶性和肿瘤部位的约23 %和约45 %的样品。如果我们使用较不严格的阈值,例如500次读取(仍然大于大多数阴性对照中确定的读取数),我们将分别排除13 %和25 %的样品。我们选择使用更严格的阈值,因为这是人类肺部组织中微生物群落的第一次大规模研究,重要的是用足够的读数报告数据以准确描述肺部细菌群落。最后,虽然我们没有发现微生物群特征与COPD或肺活量测定的肺功能之间的关联,但我们不能排除肺癌患者的肺异常会影响我们的结果。我们在肺癌患者中的发现,虽然是基于非恶性组织,但可能并不完全适用于健康受试者

4.结论

在迄今为止对非恶性肺组织的最大研究中,我们发现肺微生物群具有不同于口腔和其它身体部位的明显特征,并且以变形菌( 60 % )为主。肺微生物群受空气污染和吸烟的影响,在慢性支气管炎或晚期肿瘤患者中不同。Thermus属在晚期患者的组织中更丰富,而军团菌在发生转移的患者中更高。需要进一步研究肺组织和动物模型系统,以研究微生物群在肺部疾病发展中的作用以及是否可以开发用于治疗目的。

5.方法

5.1 受试者特征及流行病学和临床资料收集

这项研究是嵌套在环境和遗传学在肺癌病因研究(EAGLE),这是之前详细描述过的。简而言之,EAGLE是一项基于人群的肺癌综合研究,旨在捕获肺癌的主要危险因素和遗传基础。这项研究是在意大利伦巴第热区进行的,地区包括五个城市(米兰、蒙扎、布雷西亚、帕维亚和瓦雷塞)及其周边城市(地图见补充文件2 :图S1 )。肺癌病例来自13家医院,约占该区肺癌病例的80 %。流行病学资料在肺癌诊断时通过计算机辅助的个人访谈和自填问卷收集。临床资料由临床医师从临床图表和出院记录中收集。利用国家航空航天局Terra卫星上MODIS (中分辨率成像光谱仪)的气溶胶光学深度数据,结合使用回归数据,估算了受试者居住城市登记期间大气颗粒物( PM10 )的年平均浓度(μg / m3 )。

5.2 生物标本采集

肺组织标本在手术切除20分钟后在液氮中速冻。在切除和样本收集时,外科医生和病理学家一起在手术室中,以确保从肿瘤、邻近肿瘤的区域以及远离肿瘤的附加区域(约1~5 cm )正确采样,而不会对参与者产生不利影响。病理学家将样本分为肿瘤、邻近肺组织和远处非累及肺组织。在本研究中,我们使用从远离肿瘤的区域(此处定义为“非恶性肺组织”)采集的肺组织来降低局部癌场效应的可能性。对于每个受试者,通常收集一个以上的非恶性肺组织样本,并且由病理学家检查至少一个样本以确认肿瘤细胞核的缺失。所有与肺组织接触的工具和材料都是无菌的。根据样本可获得性,我们选择233个非恶性和56个肿瘤样本。结果经过质量控制排除,选择了165例非恶性肿瘤标本和31例肿瘤标本。

5.3 16S基因序列分析

新鲜冷冻肺组织样品保持冷冻,同时将约30 mg的二次样品用于DNA提取到预冷冻的2.0 ml微量离心管中。通过在1 ml 0.2 mg / ml蛋白酶K ( Ambion )的溶胞缓冲液( 10 mM Tris - Cl ( pH 8.0 )、0.1m EDTA ( pH 8.0 )和 0.5 % ( w / v ) SDS )30 mg中于56℃温育24小时,并在热混合器R ( epppendorf )中以850 rpm振荡,产生用于提取的溶胞产物。根据制造商的建议,使用qiaamp DNA血型鉴定试剂盒( Qiagen )从产生的溶胞产物中提取DNA。16S rRNA基因的V3 - V4区在Illumina MiSeq仪器上使用前面所述的马里兰大学医学院基因组科学研究所基因组资源中心的300对末端方案扩增和测序。我们包括两个阳性对照(一个粪便和一个阴道样品)来检查序列运行的性能,20个阴性对照来检查DNA 提取和PCR试剂的潜在污染,以及四个阴性对照来排除PCR扩增过程中的污染。我们表明我们的结果不受潜在污染的影响。

序列读取被处理以去除低质量读取,特别是在基于Phred算法的30bp窗口上平均质量小于20的读取。这些在窗口的第一个步骤之前被修剪并重新评估长度。还删除了至少一个读取长度小于其原始长度75 %的成对读取、与绿色基因参考版本13 _ 8 相似性小于60 %的读取以及嵌合体读取(使用UCHIME 标识)。使用软件包中的命令pick _ open _ reference _ OTUs . py对微生物学的定量分析( QIIME 1 . 8 . 0 ) [ 38 ),将余下的reads聚集到OTUs中,彩97 %的相似度。除了使用usearch61和百分比–子抽样 0.1之外,均使用默认参数。排除仅具有一个reads或仅在一个样本中的OTUs。

通过对20多个稀疏表( 1000个读数/样本)进行平均,将分类学α多样性估计为97 %相同的OTUs (观察物种)、Shannon sindex (利用所研究物种相对丰度的信息) 和系统发育多样性整株树( PD _ form _ tree,利用研究物种相对丰度和系统发育树的信息) 。分类beta多样性根据OTU表定义为未加权的(有无观察物种)和加权的nifurac距离(也使用关于观察物种的相对性的信息)。分类单元的相对丰度由未修订的OTU表计算。

我们从人类微生物组项目( HMP,第一阶段;[ 14 ]。HMP数据包括138–1623个样本,每个样本从每个研究部位(包括口腔、鼻腔、皮肤、粪便和阴道)读取至少100个序列。欧氏距离和Bray - Curtis距离是根据肺组织与其他身体部位之间的系统级相对丰度来计算的。

5.4 16S rRNA基因序列数据的功能预测

用PICRUSt 1 . 0 . 0对HMP数据集和本研究的16S rRNA基因序列分类数据进行了微生物区系功能预测,并以KEGG数据库为参考。picrusts需要使用Greengenes参考版本13 _ 5 [ 36 ]。因此,我们对qiime中的序列数据进行了重新处理。

欧氏距离和Bray - Curtis距离是使用稀有的KEGG正交表( KO )计算的(每个样本430,000次预测读数),用于肺样本之间的比较,KEGG模块表用于与其他身体部位的比较。根据未解释的KO表计算模块/路径的相对丰度。

5.5 统计方法

所有统计分析均在R软件中进行( R统计计算基金会,奥地利维也纳;网址为: / / www。项目组织/ )。在方框图中,黑色中心线表示第一个和第三个四分位数的中值和方框边。Wilcoxon秩和检验和Kruskal - wallstes检验用于分类间的差异,皮尔曼相关检验用于连续变量的关联。对于与微生物区系特征有显著相关性的变量,我们采用多元线性回归模型,以微生物区系测量作为因变量来检验相关性,同时考虑其他协变量(居住区、环境史和肿瘤分期)。为了比较非恶性和肿瘤样本,对配对样本使用Wilcoxon符号秩检验。为了进行比较,包括配对和未配对样本,个体被分成三类,仅具有肿瘤组织的个体,仅具有非恶性组织的个体,以及具有两种类型组织的个体。通过在这些层内对替换的个体进行重采样来估计平均差异的方差,从而形成自举。菠萝刀分析同样从这些地层中一个一个地移除个体,以说明这些个体之间的相关性。分析中仅包括至少10 %样品中相对丰度大于0.001的分类群(门、纲、目、科、目)。除非另有说明,P值被Bonferroni调整用于多次比较( R命令P调整)。

采用R包装Vegan [ 44中的Adonis方法( MANOVA in R )检测β多样性与个体流行病学和临床变量之间的关系,并调整与微生物群(包括受试者的居住年限、支气管炎史和肿瘤分期)具有显著相关性的变量。为了对β多样性进行一些比较,使用刀切法计算允许受试者内部和之间相互关联的方差。

**我的个人博客 **:http://blog.zd200572.comwww.zd200572.com