蛋白质家族是同源蛋白质的组;也就是说,它们在氨基酸序列和三维结构上具有相似性。蛋白质家族通常是由于基因复制而发生的,其中基因的额外拷贝入生物体的基因组中。改变氨基酸但仍允许蛋白质正确合成的突变将导致新的蛋白质家族成员。如果这些新蛋白质在关键位置包含相似的氨基酸, 蛋白质结构域,可能还有整体三维结构,可以保持相似。一个家族中的蛋白质可以具有低至 30% 的氨基酸序列同源性,但仍执行相关功能。
蛋白质超家族
蛋白质超家族是从更遥远的祖先进化而来的较大的蛋白质群。与蛋白质家族相比,它们通常具有较低的序列同源性,但仍具有显著的共同结构特征。每个超家族可以包含多个具有更密切相关结构和功能的蛋白质家族。一些较大的家族甚至进一步分为亚家族。蛋白质是否属于超家族、家族或亚家族的确切区别可能因分类系统而异,并且随着蛋白质序列和结构数据数量的不断增长而不断变化。
免疫球蛋白超家族 (IgSF) 是最大的蛋白质超家族之一;在人类基因组中发现了 700 多个超家族成员。该超家族的所有成员都包含一个或多个免疫球蛋白 (Ig) 结构域。该结构域具有独特的三维结构,由两个反平行 β 折叠的夹层组成,并且大多数参与细胞粘附或配体结合。IgSF 包含许多家族,包括抗原受体、细胞粘附分子 (CAM)、细胞骨架蛋白以及几个生长因子和细胞因子受体组。几个较大的家族进一步分为亚家族。抗原受体家族可进一步分为亚家族:抗体或免疫球蛋白家族和 T 细胞受体家族;CAM 可分为 NCAM、ICAM 和 CD2 相关蛋白家族。
分类数据库
蛋白质家族分类使科学家能够了解蛋白质之间的功能和进化关系。可以使用多种在线资源来搜索已知的蛋白质家族或对新发现的蛋白质进行分类。Pfam 是科学家可以搜索已知蛋白质及其家族成员的几个在线数据库之一。研究人员还可以输入新发现的蛋白质的氨基酸序列,以查看它是否由于序列相似性而属于已知的蛋白质家族。这可以提供一个可检验的假设关于新蛋白质的可能作用,因为家族成员通常具有相似的结构和功能。
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。