药智论坛

查看: 426|回复: 0
打印 上一主题 下一主题

SARS冠状病毒的密码子偏爱性分析

[复制链接]
跳转到指定楼层
主题
发表于 2020-3-13 09:25:11 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式 来自 江苏南京
核酸是蛋白质合成的模板 ,它们之间的对应 关系通过遗传密码的“翻译”而实现. 编码天然蛋 白质 20 种氨基酸的密码子共 61 种. 每种氨基酸 可由 1 个至多个密码子 (最多的有 6 个) 编码. 密 码子的这种简并性特征造成了不同物种密码子使 用偏爱性不同 ,即编码同一个氨基酸的密码子在 不同物种中具有不同的使用频率. 分析密码子的 偏爱性对于外源基因选择合适的宿主表达系统 , 进行基因的体外表达具有重要意义.
SARS(Severe Acute Respiratory Syndrome , 严 重急性呼吸综合症) 在全球范围内得到控制后 ,对 SARS 冠状病毒的蛋白研究成为科学研究的重点. 病毒致病机理和疫苗开发研究都有赖于蛋白的体 外表达 ,分析 SARS 冠状病毒的密码子偏爱性对 于表达系统的选择具有一定的参考意义. 已报道 的 SARS 编码蛋白共有 6 种 ,非结构蛋白 :RNA 聚 合酶、3CL 蛋白水解酶 ;结构蛋白 :S、M、E、N 蛋 白. 本 文 通 过 对 这 6 种 蛋 白 的 CDS ( coding sequence) 进行密码子偏爱性分析 ,初步得出 SARS 冠状病毒的密码子偏爱性特征 ,并将结果与大肠 杆菌、酵母及人的密码子偏爱性 (数据来自 Codon usage database) 进行比较 ,以期获得对病毒蛋白体 外表达有价值的信息.
EMBOSS( The European Molecular Biology Open Software Suite) 是一套免费开放的分子生物学分析 软件包 ,该分析软件适于 Lunix 操作系统 ,对于 Windows 用户则可以直接通过网络递交序列进行 分析[1 ] . 本研究中使用了 EMBOSS 的 CHIPS(CodonHeterozygosity in a Protein2coding Sequence) 和 CUSP (Create a codon usage table) 程序.
1 实验方法
本文数据来源为 SARS 冠状病毒全基因组的 参 考 序 列 TOR2 株 ( GENBANK 登 录 号 NC 004718) [2 ] . 采用 EMBOSS 软件系列包中的 CHIPS 和 CUSP 程序进行分析. CHIPS 可进行密码子使用 频率统计 ,该程序计算了特定序列中有效密码子 的 Frank Wright Nc (effective number of codons) 值[3 ] . 该值是一个基因的密码子使用频率与同义密码子 平均使用频率偏差的量化值. Nc 值的范围为 20 (每个氨基酸只使用一个密码子的极端情况) 到 61(各个密码子均被平均使用) ,可单独由密码子 使用数据计算得出 ,与基因长度及氨基酸组成无 关 ,因此可以对基因的密码子偏爱性程度提供一 个客观的评判标准.
CUSP 是对一个或多个 CDS 进行阅读后计算 出的密码子频率表. 该程序可计算不同密码子在 同一个氨基酸编码中所占的比例 ,并通过外延法 计算密码子在编码基因中出现的频率. 本文将 SARS 冠状病毒的 6 种蛋白的编码序列拼接起来 , 几乎涵盖了除 5′2UTR 区外的所有基因组序列 ,计 算结果可以代表 SARS 冠状病毒的密码子偏 爱性.
2 结果与分析 2.1 CHIPS 分析结果(见表 1)

SARS 冠状病毒的 6 种蛋白及全基因组分析 的 Nc 值均较为接近 61 ,初步表明 SARS 冠状病毒 的密码子偏爱性较均一 ,各密码子在编码氨基酸 时出现的频率较一致.
2.2 CUSP 分析全基因组中编码序列的密码子 偏爱性结果(见表 2)
Fract 表示各个密码子在编码该氨基酸的密 码子中所占的比例(各比例相加总和 = 1) . 1Π1000 代表该密码子在编码基因总密码子中出现的频 率 ,即在 1 000 个密码子中出现的次数.如表 2 所示 ,阴影标志的密码子表示在编码 该氨基酸中出现频率较高 ,为 SARS 冠状病毒的 偏爱密码子 ,方框标志的密码子则表示出现频率 较低. 编码 SARS 冠状病毒 A , P , R , S, T , L 等氨 基酸的不同密码子使用频率有较大差异. 如编码 A(Ala) 的密码子中偏爱密码子为 GCA ,比例达 0. 322 ,而 GCG只有 0. 087 的比例. P(Pro) 的偏爱密 子为 CCA ,出现频率为 0. 411 ,CCG的出现频率则 仅为 0. 064.


2.3 SARS 冠状病毒与大肠杆菌、酵母、人的密 码子偏爱性的比较(见表 3)
1/1000 代表该密码子在编码基因中出现的频 率. SARS E. coli 、SARS Yeast、SARS Human 分别表 示 SARS 冠状病毒与大肠杆菌 ,酵母及人的密码 子出现频率的比值.
如表 3 所示 , SARS 冠状病毒与大肠杆菌等 3种生物密码子使用频率的比值在 0. 5~2 之间的 , 表示对该密码子的偏爱性较为接近 ,反之则差别 较大(在小于 0. 5 ,大于 2. 0 之间的频率比值采用 下划线标志) .
大肠杆菌有 25 个 ,酵母有 12 个 ,人 有 20 个密码子与 SARS 冠状病毒密码子使用偏爱 性差异较大

3 讨论
SARS冠状病毒的蛋白(www.okaybio.com/2019-nCov/)功能研究是揭示其致 病机理和进行疫苗研制的基础 ,要研究蛋白功能 首先要实现其体外表达. 因此选择合适的表达系 统对于基因表达具有重要意义. 不同生物物种的 密码子偏爱性有一定差别 ,所以外源基因在宿主 系统中的表达往往有强弱之分. 本研究对 SARS 冠状病毒编码基因的密码子偏爱性进行分析 ,并 与大肠杆菌、酵母和人的密码子偏爱性做比较 ,希 望能为 SARS 冠状病毒基因在体外表达中宿主系 统的选择提供参考. 已测定全序列的 SARS 冠状 病毒共有 13 株 ,它们的基因同源性很高[4 ] ,本研 究中仅采用了参考序列 TOR2 株 ,数据分析可能 存在一定的偏差 ,但应该具有代表性和可行性. 研 究表明 SARS 病毒与原核生物 (大肠杆菌) 的密码 子偏爱性差别大于真核生物 ,与酵母的密码子偏爱性较为接近. 选择真核表达系统 ,尤其酵母系 统 ,可能更适于 SARS 病毒的基因表达. 另外 ,如 何通过改造密码子而实现目的基因表达量的提高 也是值得思考的问题.


您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

QQ|论坛规则|(渝)-经营性-2021-0017|渝B2-20120028|前往 违法和不良信息举报中心 举报|药智论坛 ( 渝ICP备10200070号-7

渝公网安备 50010802004459号

GMT+8, 2024-5-19 14:44

快速回复 返回顶部 返回列表