人类血浆蛋白组计划最新研究进展、面临挑战和未来趋势
蛋白质组学技术的快速发展从根本上改变了生命科学领域的研究模式。血液样本的易得性及对人类健康与疾病的指示意义使得使用新技术方法进行血浆蛋白质组研究的关注度日益增加。作为人类蛋白质组计划的第一个项目,人类血浆蛋白质组项目(Human Plasma Proteome Project, HPPP)在蛋白质组学领域扮演了举足轻重的角色。
在2024年度HUPO大会期间,HPPP组织在《Journal of Proteome Research》上发表了2024年人类血浆蛋白质组计划最新研究进展。在这篇观点论著文章中,来自全世界的18名参与HPPP的专家学者共同探讨了:
1、基于亲和力与质谱平台的最新血浆蛋白质组技术;
2、最新人类血浆蛋白质组图谱;
3、血液样本在细胞外囊泡(EV)蛋白质组、翻译后修饰组等场景的应用;
4、血浆蛋白质组未来发展趋势。
详细论文可参阅下述论文:
P. E. Geyer, D. Hornburg, M. Pernemalm, S. M. Hauck, K. K. Palaniappan, V. Albrecht, et al. The Circulating Proteome─Technological Developments, Current Challenges, and Future Trends,Journal of Proteome Research 2024 ,https://doi.org/10.1021/acs.jproteome.4c00586
蛋白质组学技术的最新进展从根本上变革了我们对人类生物学进行表征的能力。当下,人们愈发重视运用这些新方法来探究循环蛋白质组,这是因为血液为洞察人类健康状况提供了一个便利的窗口。然而,每一项方法创新与分析层面的进步,都要求我们重新审视现有的方法和流程,以此确保新数据能够为更广泛的生物医学研究领域增添价值,并避免重蹈以往的覆辙。作为国际人类蛋白质组组织(HUPO)人血浆蛋白质组项目(HPPP)的代表,我们展示了 2024 年针对本领域当前进展所开展的一项调查成果,其中涵盖了最新版的人血浆蛋白质组肽图谱,该图谱如今已囊括在 113 个数据集中所检测到的 4608 种蛋白质。随后,我们探讨了既有蛋白质组学方法的更新情况、新兴技术以及蛋白质形态、蛋白质网络、细胞外囊泡、循环抗体和微量样品方面的研究。最后,我们就循环蛋白质研究中当前及新兴蛋白质组学工具的应用提出了前瞻性的见解。
基于质谱和基于亲和力的蛋白质组学技术已经成为血浆蛋白质组研究中最主要的技术方法,文章对基于这两种原理的主要技术方法的应用特点进行了详细阐述。
基于亲和力的平台,用于分析循环蛋白质组
基于亲和力的方法将蛋白质组研究限制为一组预定义的蛋白质。根据 Antibodypedia (https://www.antibodypedia.com),有近 500 万种亲和试剂产品可供选择,覆盖了 ∼20 000 个蛋白质编码基因的 95%。在过往几年中,基于亲和力的蛋白质组学技术致力于提升覆盖蛋白质的种类。时至今日,Olink技术平台已研发出超过5400对互补的寡核苷酸偶联抗体,Somascan技术平台已研发出11000种核酸适配体,用于蛋白质的捕获与检测。高通量的检测能力带来了一个突出的问题:抗体或适配体的特异性与跨平台的重现性仍待探究,这为基于亲和力的蛋白质组学检测结果验证带来了疑虑。
不同平台来源数据的交互验证是经典的验证方法之一。2023年发表在《Nature》期刊上的研究利用Olink Explore 3072和Somascan v4平台,结合2023年4月发表的最新人类血浆蛋白质组图谱,研究了基于亲和力的蛋白质组学检测结果与相应基因组数据之间的一致性。该研究表明785种蛋白质同时具有基于亲和力与质谱的支持性证据,而质谱能提供独立于基于亲和力的平台的血浆蛋白发现机会,这些蛋白常为更低丰度的蛋白。
2. MS-Based Platforms to Profile the Circulating Proteome
基于 MS 的平台,用于分析循环蛋白质组
近年来,基于质谱的血浆蛋白质组技术在以下几点取得了较大进展:
-
纳米磁珠富集:基于纳米生物界面上蛋白质的竞争结合原理设计的能够适配自动化工作流程的超顺磁性功能化纳米颗粒(NPs)已被用于压缩血浆蛋白极大的动态范围,实现了数小时内对数千种血浆蛋白质的检测,有望扩展到千例级别的大队列。与基于抗体的富集策略不同,基于纳米颗粒的富集策略可无偏性检测整个蛋白质组,这种策略将成为血浆蛋白质组研究的未来趋势。在普睿迈格的血液蛋白冠磁珠(http://www.purimagbead.com/Product/8096211554.html)的推动下,基于纳米颗粒富集策略的蛋白质组学检测可覆盖多达5000种以上的血浆蛋白。
-
自动化样品制备:移液工作站的普及为蛋白质组样品制备的自动化做出了卓越贡献。相比繁琐的手工操作,自动化样本制备平台提高了蛋白质组学样本前处理的通量,促进了ISO13485医疗器械质量管理体系标准的实施与受监管的临床实验室中蛋白质组学研究的开展。
-
液相色谱:新型液相色谱系统的开发采用了新的分析流速(如高流和微流)和更短的梯度,与更灵敏的质谱仪结合,使得每天能够检测超过100个样品。
-
质谱灵敏度:2023年Orbitrap Astral质谱仪的问世使得质谱的灵敏度产生了极大的飞跃,能够实现超过1000种血浆蛋白的检出,与额外的富集方法结合能够实现超过4000种血浆蛋白的检出。
-
质谱稳健性:过去几年,针对大队列样本设计的timsTOF HT质谱仪在几项大规模血浆蛋白质组学研究中展示了其耐久性、稳健性和持续高性能的特点,为未来的大队列血浆蛋白质组研究趋势打下了坚实的基础。
-
数据采集:数据非依赖性采集(DIA)已被证明能够在样品中持续覆盖大量蛋白质的定量,在众多研究中得到了应用。
以上方法提高了血浆蛋白质组检测的样本吞吐量、检测稳定性与定量准确性,并降低了成本。更大的样本量不仅增加了统计学效力以有效应对临床样本的变异性,还允许了机器学习方法在蛋白质组学数据中的应用。
3. Future of Targeted MS-Based Proteomics
基于 MS 的靶向蛋白质组学的未来
2023 Build of the Human Plasma Proteome PeptideAtlas
2023 构建人血浆蛋白质组肽图谱
自2005年以来,HPPP一直致力于建立血浆可检测数据库,以实现对血浆蛋白质组学结果的稳定验证。截至2023年4月,人类血浆蛋白质组图谱覆盖了113个数据集,较2021年7月增加63%,收录肽段数达到了26万个,增加27%,拥有至少2个≥9个氨基酸的非嵌套唯一映射肽的典型蛋白数达到了4608个,增加213个,共占人类蛋白质组的23%。
此外,从血液中提取的细胞外囊泡蛋白质组图谱于2021年首次推出,2023年4月构建的人类细胞外囊泡蛋白质组图谱在此基础上进行了扩展,覆盖了4985个典型蛋白,仅比人类血浆蛋白质组图谱多377个,显示了细胞外囊泡蛋白与血浆蛋白的高度重叠性与良好的丰度相关性。这提示血浆样本能覆盖大量的细胞外囊泡来源信息,助力对疾病机制的深入解析。
血浆/血清样本与细胞外囊泡样本中蛋白质丰度的比较
细胞外囊泡(EV)指各类活细胞向细胞外释放的纳米级脂质双分子层囊泡,以下特点使其作为生物标志物的发现对象与药物递送的载具具有极高的研究意义:
-
携带血液中难以检测到的蛋白质,如疏水蛋白;
-
保护蛋白内容物不因进入循环而发生氧化等改变;
-
反映起源细胞真实状况;
-
将蛋白质转移到受体细胞发挥作用;
-
可在肾滤过过程中留在血液中;
-
蛋白质浓度范围与细胞类似,易检测。
EV的异质性、低丰度及与血浆中某些成分的相似性使得其分离与研究面临挑战。超速离心、尺寸排阻、免疫捕获及能够衔接自动化设备的新兴技术强阴离子交换(SAX)磁珠(厦门普睿迈格公司的SAX磁珠http://www.purimagbead.com/Product/2438711623.html)已被应用于血液中EV的富集。2023年12月发表的国际细胞外囊泡研究指南(MISEV2023)与2024年8月发表的《细胞外囊泡分离与检测技术专家共识》对EV的定义与标准化研究方法进行了详细说明。值得注意的是,国际细胞外囊泡学会 (ISEV) 自 2014 年以来发布了“细胞外囊泡研究的最低信息”(MISEV https://www.isev.org/misev) 指南。这项工作应指导细胞外囊泡场的方案和报告的标准化,以提高 EV 研究的可重复性和质量。这一点至关重要,因为方案的微小变化,例如选择一致的样品起始材料(血浆制备或血清),可能会对 EV 的数量产生重大影响。
post-translational Modifications─Beyond the Canonical Proteome
翻译后修饰 ─ 超越规范蛋白质组
除了经典蛋白外,翻译后修饰 (PTM) 的景观还提供了一个生物学相关层来表征循环蛋白质组。PTM 以多种方式影响蛋白质,包括溶解度、结构、配体结合、定位、稳定性、分泌和活性。LC-MS 具有 400 多种已知的修饰,是研究大量 PTM(如糖基化、磷酸化、甲基化/酰化和泛素化)的强大技术。PTM 之间的串扰产生了另一层复杂性,导致修饰的复杂组合微调生物学结果。从历史上看,大多数研究仅关注一种类型的 PTM,但最近,PTM 组合和串扰已被表征和研究。在这里,我们重点介绍了在血浆蛋白质组中发现的两种类型的 PTM:糖基化和磷酸化。
在血液样本中,糖基化修饰尤受关注。糖基化的变化与多种生理和病理过程相关,但由于糖链结构的高度异质性,蛋白质糖基化的分析具有挑战性。在最近的一篇综述中,Chernykh等人强调质谱技术的进步使得人们能够分辨数千种N/O-连接的糖结构,探索蛋白与其糖基化形式之间的相关性。多重反应监测(MRM)等基于质谱的靶向方法也被用于糖基化蛋白质的检测,如评估健康人血浆中159 种糖肽的丰度,绘制蛋白质内和蛋白质间的糖基化相关性图谱,区分参与者的年龄和性别。糖基转移酶在疾病进展期间经常发生失调,因此血液糖基化蛋白质组同样可应用于疾病生物标志物的发现等研究。有研究表明,糖蛋白有助于卵巢癌、前列腺癌、肾癌、胰腺癌和肝癌等的临床结果、疾病进展或风险预测,识别特定的病理亚型或监测治疗途径。早期诊断公司正在利用这些糖基化变化建立基于血液的诊断测试。针对糖基化,厦门普睿迈格开发了苯硼酸磁珠(http://www.purimagbead.com/Product/379210028.html)用于富集糖基化蛋白和多肽。
与蛋白质糖基化一样,在血液蛋白质组中也观察到磷酸化。虽然这些修饰蛋白在循环中出现的机制有很多,但有三种机制包括高尔基体介导的对主动分泌蛋白的磷酸化、在细胞外修饰蛋白的分泌激酶以及细胞死亡或相关事件中的泄漏蛋白。针对磷酸化,厦门普睿迈格开发了二氧化钛磁珠(http://www.purimagbead.com/Product/1325064453.html)、IMAC-Ti磁珠(http://www.purimagbead.com/Product/7583104713.html)、IMAC-Zr磁珠(http://www.purimagbead.com/Product/6152704851.html)和NTA-Fe磁珠(http://www.purimagbead.com/Product/2819731545.html)用于富集磷酸化蛋白和多肽。
几项大规模发现研究帮助对其中一些细胞外和循环磷蛋白进行了分类,揭示了与疾病进展、治疗和/或监测相关的有趣机制。
Networks and Connections of Circulating Proteins
循环蛋白质的网络和连接
定义亚蛋白质组的一种方法是它们在群体或网络中的共调控,这可能会确定不同的调控网络。共调节的原因可以在各种机制中找到,从器官或组织泄漏到循环细胞的存在、稳定的蛋白质复合物、聚集到脂蛋白颗粒、EV 或对特定刺激的反应。
通常,组织渗漏蛋白是器官损伤的临床标志物(见肌钙蛋白)或用于检测由于癌症相关蛋白(如 CA125)异常分泌而导致的癌症,以早期检测卵巢癌。除了疾病背景之外,组织渗漏蛋白可以起源于生物过程。然而,由于它们的丰度、组织特异性和不太一致的存在,检测更广泛的组织渗漏蛋白非常局限于 COVID-19 等严重表型。 使用肽的等电聚焦和基于 MS 的读数,最近的一项研究报告了怀孕期间循环中释放的胎盘特异性蛋白。将其与遗传信息(表示为蛋白质基因组学)相结合,使该研究能够将那些检测到的具有特定单氨基酸变体的肽分配给胎儿或母亲。这表明孩子和母体循环系统之间存在跨胎盘交换。在一项与酒精相关的肝病研究中,配对的肝-血浆样本可用于识别参与活性信号传导过程的组织损伤标志物和蛋白质。
除了应用差异丰度统计来识别共调控蛋白质外,基于网络的方法还是获得对蛋白质的更深入生物学理解或减少下游统计分析共线性的宝贵工具。对于具有低倍数变化或高个体间差异的蛋白质尤其如此,大部分蛋白质组都是这种情况。共表达网络方法,如加权基因共表达网络分析(WGCNA),使用成对数据描述不同组别之间的相关关系。将相关性矩阵与聚类算法结合,可以构建“全局相关图”,捕捉指向物理互作或功能关联的特征。相关性分析与临床参数或参与者信息的关联可为潜在生物学机制提出假设,进一步结合GO或KEGG富集分析揭示更多生物学线索。
血浆蛋白质组未来发展趋势
在血浆蛋白质组领域,适用性、深度、通量和检测速度的增加是近年及未来的自然发展趋势。未来几年中,血浆蛋白质组的发展趋势包括:
-
提高检测深度,鉴定所有类型样本中的所有循环蛋白;
-
对鉴定到的血浆蛋白提供进一步的可靠证据;
-
对血浆蛋白提供可靠的定量信息与浓度信息;
-
关注血液中的细胞外囊泡蛋白质组、翻译后修饰组等其他类别蛋白;
-
探索血浆蛋白之间的关系及对生物学功能的映射;
-
构建严谨的样本采集制备及标准化检测体系;
-
识别血浆蛋白质中的异构体与未知变异。
血液样本的易获取性使人们能够使用新的更为频繁的采样方案来确定全身性的分子健康轨迹。针对更大队列的研究可以提高检测微小效应、复杂特征(即许多蛋白质组成一个独特的模式)或与队列子集相关的变化的能力。
Examples of Recent Protein Biomarker Projects Using Different Proteomics Techniques across Disease Areas
跨疾病领域使用不同蛋白质组学技术的最新蛋白质生物标志物项目示例
year年
title of studyreference研究reference文献的标题
description of biomarker(s)
disease areas
2017
Role of Exosomal Proteins in Cancer Diagnosis (161)外泌体蛋白在癌症诊断中的作用 (161)
several for different cancers
cancer
2020
Multiomic Blood Correlates of Genetic Risk Identify Presymptomatic Disease Alterations (162)遗传风险的多组学血液相关性识别症状前疾病改变 (162)
766 detectable alterations in proteomic, metabolomic, and standard clinical laboratory measurements
multiple
2020
Proteome Profiling in Cerebrospinal Fluid Reveals Novel Biomarkers of Alzheimer’S Disease (163)脑脊液中的蛋白质组分析揭示了阿尔茨海默病的新型生物标志物 (163)
26 protein panel
neurological
2021
A Time-Resolved Proteomic and Prognostic Map of COVID-19 (164)COVID-19 的时间分辨蛋白质组学和预后图 (164)
different panels for different outcome predictions like altered coagulation and inflammation
infection
2021
Plasma Proteome Fingerprints Reveal Distinctiveness and Clinical Outcome of SARS-CoV-2 Infection (165)血浆蛋白质组指纹图谱揭示了 SARS-CoV-2 感染的独特性和临床结果 (165)
ADM, IL-6, MCP-3, TRAIL-R2, and PD-L1 predictive for death
infection
2021
Lung Proteomic Biomarkers Associated with Chronic Obstructive Pulmonary Disease (166)与慢性阻塞性肺疾病相关的肺蛋白质组学生物标志物 (166)
25 proteins associated with COPD
infection
2022
Noninvasive Proteomic Biomarkers for Alcohol-Related Liver Disease (109)酒精相关性肝病的无创蛋白质组学生物标志物 (109)
nine protein panel for fibrosis, 12 protein panel for steatosis
metabolism
2023
Next Generation Pan-Cancer Blood Proteome Profiling Using Proximity Extension Assay (167)使用邻近延伸测定法进行下一代泛癌性血液蛋白质组分析 (167)
different proteins and panels for specific cancer types
cancer
2023
Targeted Plasma Proteomics Reveals Signatures Discriminating COVID-19 from Sepsis with Pneumonia (168)靶向血浆蛋白质组学揭示了区分 COVID-19 与脓毒症伴肺炎的特征 (168)
TRIM21, PTN, and CASP8
infection
2023
Elevated Plasma Complement Factor H Related 5 Protein Is Associated with Venous Thromboembolism (20)血浆补体因子 H 相关 5 蛋白升高与静脉血栓栓塞有关 (20)
CFHR5
cardiovascular
2023
Associations of Plasma Proteomics with Type 2 Diabetes and Related Traits: Results from the Longitudinal KORA S4/F4/FF4 Study (169)血浆蛋白质组学与 2 型糖尿病及相关性状的关联:纵向 KORA S4/F4/FF4 研究结果 (169)
protein panels for subtypes of prevalent prediabetes
metabolism
2023
Mass Spectrometry-Based Autoimmune Profiling Reveals Predictive Autoantigens in Idiopathic Pulmonary Fibrosis (170)基于质谱的自身免疫分析揭示了特发性肺纤维化中的预测性自身抗原 (170)
immunoglobulin profiling in plasma reveals autoimmune signature
respiratory
2023
Proteomics Reveal Biomarkers for Diagnosis, Disease Activity and Long-Term Disability Outcomes in Multiple Sclerosis (171)蛋白质组学揭示了多发性硬化症诊断、疾病活动和长期残疾结果的生物标志物 (171)
11 proteins in CSF, none in plasma
neurological
2022
Stratifin as a Novel Diagnostic Biomarker in Serum For Diffuse Alveolar Damage (172)Stratifin 作为血清中弥漫性肺泡损伤的新型诊断生物标志物 (172)
eight proteins from SOMA scan are validated
respiratory
2023
Proteome Profiling of Early Gestational Plasma Reveals Novel Biomarkers of Congenital Heart Disease (173)早期妊娠血浆的蛋白质组分析揭示了先天性心脏病的新生物标志物 (173)
nine proteins predict CHD with high accuracy
cardiovascular
2022
Circulating Proteomic Panels for Risk Stratification of Intracranial Aneurysm and Its Rupture (174)用于颅内动脉瘤及其破裂风险分层的循环蛋白质组学面板 (174)
two sets of biomarker combinations to accurately distinguish IA from healthy controls (accuracy: 87.50%) or classify IA rupture patients (accuracy: 91.67%)
cardiovascular
2015
Prediction of Colorectal Cancer Diagnosis Based on Circulating Plasma Proteins (175)基于循环血浆蛋白的结直肠癌诊断预测 (175)
five proteins as predictive diagnostic signature
cancer
2020
Extracellular Vesicle and Particle Biomarkers Define Multiple Human Cancers (176)细胞外囊泡和颗粒生物标志物定义多种人类癌症 (176)
defined a panel of tumor-type-specific EVP proteins in TEs and plasma, which can classify tumors of unknown primary origin
cancer
2023
Absolute Quantification of Pan-Cancer Plasma Proteomes Reveals Unique Signature in Multiple Myeloma (177)泛癌性血浆蛋白质组的绝对定量揭示了多发性骨髓瘤的独特特征 (177)
potential biomarker panel of seven protein targets for the diagnosis of multiple myeloma patients
cancer
2023
High-Throughput Plasma Proteomics to Define the Precursor Multiple Myeloma Proteome and Identify Candidate High-Risk Disease Biomarkers of Progression (178)高通量血浆蛋白质组学,用于定义前体多发性骨髓瘤蛋白质组并确定进展的候选高危疾病生物标志物 (178)
identified proteins that significantly distinguished monoclonal gammopathy of undetermined significance (MGUS), smoldering multiple myeloma (SMM), and NDMM from healthy donors
cancer
2023
Plasma Proteomic Associations with Genetics and Health in the UK Biobank (68)英国生物样本库中血浆蛋白质组学与遗传学和健康的关联 (68)
protein quantitative trait locus (pQTL) mapping of 2923 proteins that identifies 14 287 primary genetic associations, of which 81% are previously undescribed
multiple
2023
Large-Scale Plasma Proteomics Comparisons through Genetics and Disease Associations (22)通过遗传学和疾病关联进行大规模血浆蛋白质组学比较 (22)
Olink Explore 3072 data generated by the UK Biobank Pharma Proteomics Project1 on plasma samples from more than 50 000 UK Biobank participants and compared the results with those of a SomaScan v4 study on plasma from 36 000 Icelandic people2, for 1514 of whom Olink data were also available
multiple
2023
Rare Variant Associations with Plasma Protein Levels in the UK Biobank (67)英国生物样本库中与血浆蛋白水平的罕见变异关联 (67)
variant-level exomewide association study identified 5433 rare genotype–protein associations, of which 81% were undetected in a previous genomewide association study of the same cohort
multiple
2024
High Throughput Plasma Proteomics and Risk of Heart Failure and Frailty in Late Life (179)高通量血浆蛋白质组学与晚年心力衰竭和虚弱的风险 (179)
- 上一篇:双荧光法测定血液中纳米粒子表面形成的蛋白冠 2024/11/30
- 下一篇:糖肽和糖蛋白分离富集方法精要必看 2024/11/9