在科学研究以及制药研发领域,常常需要制备一些蛋白。而在进行蛋白制备之前,需要开展一系列分析工作,以便选择适宜的制备方案,进而提高制备的成功率。蛋白分析通常要从蛋白的种属、类型、结构以及理化和生化性质等方面着手。目前,对于蛋白制备难度的评判尚无确切标准。为此,我们从Uniprot数据库中提取了7种哺乳动物(Human、Mouse、Rat、Rabbit、Bovine、Pig、Sumatran orangutan)的56547个蛋白的数据,在氨基酸水平上,对氨基酸个数、糖基化位点等信息进行了分析,旨在给科学家在判断蛋白制备难度时提供参考。
我们经过对这些数据进行分析处理后,将符合“氨基酸个数小于等于100或大于等于1000;糖基化位点数大于等于4或百分比大于等于1.0%”任一性质的蛋白判定为制备难度高的蛋白。具体分析如下:
氨基酸个数
我们统计了56547个蛋白,合计氨基酸总个数为29793248,平均每个蛋白的氨基酸个数为527。
氨基酸个数分布见图1,氨基酸蛋白个数区间及百分比见表1。
▲图1. 氨基酸个数分布图
▼表1. 氨基酸蛋白个数区间及百分比
糖基化位点&占比
据统计,无糖基化位点蛋白数占比为78.50%,含0-3个糖基化位点蛋白数占比92.97%,95.30%的蛋白糖基化位点占比位于0-1.0%区间。
糖基化位点数分布见图2,糖基化位点百分比分布见图3,糖基化位点百分比数据见表2。
▲图2. 糖基化位点分布图
▲图3. 糖基化位点百分比分布图
▼表2. 糖基化位点百分比
小结
通过对Uniprot上7种哺乳动物的56547个蛋白进行数据分析获得:
·蛋白的氨基酸个数:每个蛋白平均氨基酸个数为527,86.22%的蛋白氨基酸个数位于101-1000区间;
·糖基化位点数:无糖基化位点蛋白数占比为78.50%,0-3个糖基化位点蛋白数占比92.97%;
·糖基化位点数百分比:95.30%的蛋白糖基化位点占比位于0-1.0%区间。
综合以上数据及分析,我们将符合以下任一性质的蛋白判定为制备难度高的蛋白:
注:由于蛋白的多样性及其他多方面因素的影响,以上判断条件仅为概率上分析,不是必然结果,仅供参考。
关于三优生物
三优生物成立于2015年,是一家国际领先的专注于创新生物药研发和服务的高新技术企业;公司致力于实现“让天下没有难做的创新生物药”的使命;公司建立了“差异化CRO、整合型CDO、协同型CPO、特色CRS”于一体的4C综合业务体系。
公司建立了设施设备先进齐全的创新生物药一体化研发实验室;公司发展起了一支以硕士和博士为主的专业团队;公司打造了居于行业领军水平的“超万亿、一体化、智能化”三大创新药研发技术平台;公司建立了以十万亿噬菌体展示分子库为代表的,涵盖原材料制备、分子发现、分子优化、体内外药效、细胞株构建、上下游工艺、临床前研发及产业化开发等的50多个技术子平台。
公司的业务网络已扩展至中美欧等世界各地,公司在波士顿、费城、圣地亚哥和伦敦等地设有业务网点;公司已和全球1000多家制药公司、药物研发机构、诊断试剂产品公司建立了友好的业务合作关系。公司已获得国家高新技术企业、专精特新、ISO9001质量管理体系、GB/T知识产权管理体系等认证。