生物医学数据挖掘国际期刊

生物医学数据挖掘国际期刊
开放获取

国际标准期刊号: 2090-4924

抽象的

分析复杂性状和基因功能的蛋白质组学策略

潘迎红

抽象的

复杂特征的蛋白质组学分析对于理解质量能力和属性工具很有价值。然而,蛋白质组学研究的稳定性受到许多因素的影响,例如遗传基础影响、检测品种和测试条件。在该方法中,对具有不同遗传基础的矮化雄性不育(DS)小麦的四个近等基因系(NIL)进行了检查,并利用来自不同簇的大量质谱(MS)信息来考虑小麦的DS属性。从一开始,就以各种方式建立了来自四个 DS 小麦 NIL 的另一种和幼年刺突蛋白,并通过各种质谱分析进行区分,并从 16 次免费测试中鉴定出总共 58170 个蛋白束。此外,以不同频率和通讯类型识别的蛋白质的财富分配也被分解。通过使用一些熟悉的评估蛋白质表达稳定性的简单公式,建立了包含 58170 个蛋白质组的表达水平的数据库,并建立了对 17187 个蛋白质无重复的深远评估估计。以原子雄性不育特征系统和这些NIL中太谷精灵雄性不育小麦(TGMSW)品质ms2的能力为中心,在相同条件下对来自3个DS小麦NIL的幼穗蛋白质组进行了解剖,得到了160个差异通讯蛋白和43个深度通讯蛋白。将该测试中识别的蛋白质与数据库进行对比。终于,确定28个蛋白质具有雄性不育特征。结果表明,来自不同团块的大量 MS 信息对于检查复杂的特征和质量能力很有用。

 介绍

人类细胞的特征在于其组成部分,例如基因组、表观基因组、蛋白质组、代谢组或转录组以及它们的通讯。这产生了一个复杂的管理系统,我们只是开始理解它,这代表着寻找特定人类疾病的细胞原因的重大考验。尽管包含表征细胞类型的所有观点的框架有机方法最适合理解人类事件和感染的转变,但分析人员只是逐渐开始脱离他们自己特定的组学空间。

全基因组协会(GWAS)发现了可能影响疾病和表型品质的基因组机会位点。这一广泛的资产为提供定制药物的新方法提供了非凡的保证,包括疾病风险预测、预期和集中用药。分析人员在从属关系的根本区分证据与患者的精确治疗之间面临的重大困难之一是认识这些从属关系背后的有机组成部分。目前,解释这些问题的重点在于对全球基因组多样性、质量表达、记录因子权威性、表观遗传图谱和染色质合规性等框架范围内的信息进行综合检查。这些信息的年龄主要取决于尖端测序。无论如何,由于许多持续发生的事件,基于质谱的蛋白质组学目前为 GWAS 领域提供了额外的机会,迄今为止几乎没有机会为实际基因组变异提供可识别的证据,特别是识别和描述(差异) )就像生理客观质量一样束缚蛋白质结构。在本次调查中,我们介绍了这些蛋白质组学推动力,并建议如何在 GWAS 后工作流程中协调它们。我们认为,深刻整合的方法的结合是令人惊奇的,并且可以对 GWAS 基因座及其在感染中不假思索的关联给出公正、真实的描述。迄今为止,GWAS 领域几乎没有意识到有机会提供实际基因组变异的可识别证据,特别是识别和描述(差异)结合的蛋白质结构,就像生理客观质量一样。在本次调查中,我们介绍了这些蛋白质组学推动力,并建议如何在 GWAS 后工作流程中协调它们。我们认为,深刻整合的方法的结合是令人惊奇的,并且可以对 GWAS 基因座及其在感染中不假思索的关联给出公正、真实的描述。迄今为止,GWAS 领域几乎没有意识到有机会提供实际基因组变异的可识别证据,特别是识别和描述(差异)结合的蛋白质结构,就像生理客观质量一样。在本次调查中,我们介绍了这些蛋白质组学推动力,并建议如何在 GWAS 后工作流程中协调它们。我们认为,深刻整合的方法的结合是令人惊奇的,并且可以对 GWAS 基因座及其在感染中不假思索的关联给出公正、真实的描述。我们介绍了这些蛋白质组学推动力,并建议如何在 GWAS 后工作流程中协调它们。我们认为,深刻整合的方法的结合是令人惊奇的,并且可以对 GWAS 基因座及其在感染中不假思索的关联给出公正、真实的描述。我们介绍了这些蛋白质组学推动力,并建议如何在 GWAS 后工作流程中协调它们。我们认为,深刻整合的方法的结合是令人惊奇的,并且可以对 GWAS 基因座及其在感染中不假思索的关联给出公正、真实的描述。

功能变体的识别和表征

通过最近描绘的 GWAS tagSNP 有效识别了 LD 中的大量新颖的正常和不常见变异后,接下来的巨大测试是找出这些变异之间的因果变异。迄今为止,大多数研究都集中在位于质量编码或破译位置的 SNP,因为它们可能会影响蛋白质的基本结构并进而影响其功能(Ng 和 Henikoff 2003; Saccone 等人,2011 年;Cvejic 等人,2013 年)。尽管如此,迄今为止发现的大部分相关规则变化并不在蛋白质编码区域内部或在 LD 中(Easton 等人,2012 年),因此可能与质量连接管理系统有一定的联系。

GWAS 与调控元件表观遗传学信息的整合

例如,位于非编码区域的 SNP 可能会干扰或在功能性管理组件中形成记录因子 (TF) 限制位点 (Reddy et al. 2012)。结果,行政运动以及受该组成部分约束的质量流出可以得到调整(Kasowski 等,2010)。覆盖功能性行政区域或重要细胞类型中暂时认可的 TF 限制位点的 GWAS SNP 随后更有可能具有实际重要性(Jia 等人,2009 年;Harismendy 等人,2011 年;Paul 等人,2011 年) )。

实际上,一份正在进行的报告(包括在 349 个细胞和组织测试中进行全基因组 DNase I 规划)表明,所有非编码 GWAS SNP 中的 76.6% 要么存在于 DNase I 过度敏感位点 (DHS) 中,要么存在于成品 LD 中,其中 SNP 位于靠近 DHS(Maurano 等人,2012 年)。除了通过染色质免疫沉淀和测序 (ChIP-seq) 来考虑组蛋白改变和 TF 偶联示例(Johnson 等人,2007 年;Robertson 等人,2007 年)之外,DNase I 极其敏感的位点可通过测序进行识别证明(DNase-seq)或高级基因组足迹 (DGF)(Crawford 等人,2006 年;Boyle 等人,2008 年;Hesselberth 等人,2009 年)是规划管理组件的重要程序(Visel 等人,2009 年)。

SNP 依赖性差异转录因子结合的预测和验证

协调研究经常使用 DHS 或 DNase I 印象中存在的 TF 限制主题并覆盖 ChIP-seq tops,以预见 SNP 带来的差异 TF 限制(Schaub 等人,2012a;Maurano 等人,2012)。虽然这是一种将与特定表型相关的 SNP 数量限制在可能具有因果关系的 SNP 数量的令人难以置信的方法,但与任何传统方法类似,它也可以发现各种虚假的阳性和阴性结果。虚假点击可能是使用具有不同细胞类型创建的信息的数据库的结果,通常是针对不相关的细胞类型的疾病或质量表型。许多远端管理组件是细胞类型明确的(Heintzman 等人,2009 年;Dimas 等人,2009 年)2009),通过这种方式,与具有 SNP 的地点相关的记录因子可能不会在对特定属性或感染具有重要意义的另一种细胞类型中传播。此外,这些研究通常不考虑数据库中使用的细胞系特定 SNP 的单倍型。尽管人们为描绘 TF 限制主题付出了巨大的努力(Badis 等人,2009 年;Jolma 等人,2013 年;Noyes 等人,2008 年),但仅对超过 1,000 个人类 TF 中的大约一半进行了 DNA 比较限制性主题是已知的,以这种方式呈现出对这些主题的倾向。总而言之,大多数基于主题的方法都在独立的环境中考虑 TF 限制主题。任何状况之下,属于同一个 TF 家族的几个 TF 可能会追求相似的主题,而 TF 官员的亲密关系可能会影响彼此的亲和力。因此,基于期望的技术还不能取代差异 TF 权威和运动的生化描述。

功能性 SNP 或变异体的质谱表征

由于近十年来各种专业和计算方面的改进,通过质谱法对复杂混合物中的蛋白质进行定位和评估已经发展成为标准化程序(在 Ahrens 等人 2010 年进行了检查)。除了对完整蛋白质组的研究(de Godoy et al. 2008)和翻译后改变的测量(Choudhary 和 Mann 2010 中的探索)之外,该策略还被广泛用于以公平的方式检查蛋白质通讯和结构( Vermeulen 等人于 2008 年进行了调查),以这种方式提供了一种与偏向细化相反的选择,然后用显性抗体进行蛋白质印迹。

结束语

GWA 认为提供了有关表型属性和基因组位点之间关系的重要数据。目前,在后 GWAS 时代,一项重要任务是阐明这些关系的自然程序和实际组成部分。这需要范围广阔、多维度的不同领域的信息和技能的充分协调。科学家们在遗传素质、基因组学和表观基因组学方面刚刚建立了各种富有成效的协调努力。这些综合调查是“直接的”,因为它们主要取决于比较创新阶段和尖端测序的信息产量。考虑蛋白质组或代谢组的不同领域依赖于质谱估计,因此完全独特的试验设置和检查流程。

Top