CODON OPTIMIZED PRECURSOR GENE AND SIGNAL PEPTIDE GENE OF HUMAN INSULIN ANALOGUE

15-08-2019 дата публикации
Номер:
WO2019154311A1
Принадлежит: 江苏恒瑞医药股份有限公司
Контакты:
Номер заявки: CN43-07-201984
Дата заявки: 01-02-2019

一种密码子优化的人胰岛素类似物前体基因和信号肽基因

技术领域

[1]

本发明涉及一种密码子优化的人胰岛素类似物前体基因和一种密码子优化的α-因子(α-factor)信号肽基因,并提供了所述人胰岛素类似物前体基因的表达方法。

背景技术

[2]

人胰岛素是由51个氨基酸组成的多肽,包含两条链,分别为A链和B链。胰岛素的主要药效是调节糖代谢,在糖尿病治疗中,胰岛素干预作为替代或补充治疗是最直接有效的方法。胰岛素还有促进脂肪合成、抑制脂肪分解、减少酮体生成的作用,所以亦被用来纠正胰岛素相关酮症和酸血症的各种症状。

[3]

胰岛素最早一直由猪、牛等动物胰腺提取而得,但这些产品与人胰岛素结构有所不同,故存在免疫原性。上世纪八十年代初、中期美国礼来和丹麦诺和诺德公司相继开发出基因重组人胰岛素生产技术,从此基因工程表达人胰岛素及其类似物成为工业主流手段。但是人胰岛素作用时间较短,使得病人必须频繁注射,极为不便。因此,人们致力于获得一些能够更长时间作用于人体的胰岛素类似物及其衍生物。其中,使用酰化基团修饰人胰岛素或其类似物,是一种提高其半衰期的有效方法。WO2018024186公开了一种B29位被长链脂肪酸取代、B30位氨基酸缺失的人胰岛素类似物,公开了该人胰岛素类似物的结构和生物活性。WO9507931公开了一种B29位连接一个十四酰基侧链、B30位氨基酸缺失的胰岛素类似物及其制剂。WO2005012347公开了一种B29位被一个谷氨酸和长链脂肪酸取代、B30位氨基酸缺失的人胰岛素类似物。目前常用的表达人胰岛素及其类似物的表达系统主要有是大肠杆菌、酿酒酵母和巴斯德毕赤酵母,其中大肠杆菌表达为包涵体形式,需经过包涵体裂解和复性,工艺繁琐且得率低,酿酒酵母与毕赤酵母有着操作简易、易于培养、对外源蛋白修饰、可以分泌表达等遗传表达优点,但酿酒酵母分泌效率低、表达菌株不够稳定,相比之下毕赤酵母是工业生产重组蛋白应用更广泛的表达系统。工业上,生产过程中发酵产量是控制生产成本的关键因素,由于胰岛素市场需求量大,作为重要生产商的诺和诺德利用酵母表达生产时罐子规模达到几十吨,对厂房、设备要求很高,成本也高,所以提高人胰岛素及其类似物的发酵产量对工业生产有着重要意义。

[4]

遗传密码子是三联体密码,一个密码子由信使核糖核酸(mRNA)上相邻的三个碱基组成。遗传密码共有64种,但不同的生物,甚至同种生物不同的蛋白质编码基因,对不同密码子使用频率并不相同,具有一定的偏爱性。外源基因 的密码子主要在翻译水平上影响基因的表达,很多文献已经证明密码子的优化对于在毕赤酵母中提高外源蛋白的表达量卓有成效。毕赤酵母表达外源基因分为胞内表达和分泌表达两种,后者需要信号肽来引导外源基因表达产物的分泌,目前最普遍使用的信号肽为来源于酿酒酵母α-因子信号肽,其核苷酸序列也来源于酿酒酵母,目前还没有报道针对毕赤酵母优化的α-因子信号肽核苷酸序列。胰岛素前体密码子优化的相关文献很多,如Gurramkonda等人优化的人胰岛素前体基因序列并在毕赤酵母的表达研究(Gurramkonda et al.Application of simple fed-batch technique to high-level secretory production of insulin precursor using Pichia pastoris with subsequent purification and conversion to human insulin.Microbial Cell Factories,2010,9:31),专利WO1998028429公开了表达人胰岛素类似物前体的基因序列,该基因编码的胰岛素前体氨基酸序列是EEGEPK-B(1-29)-AAK-A(1-21),其中EEGEPK为胰岛素前体N端延伸,称为间隔肽或前导肽,可以保护胰岛素前体的N端免于酵母蛋白酶的水解作用,并且能提高胰岛素前体的表达效率;B(1-29)是缺失B30位苏氨酸的人胰岛素B链;A(1-21)是人胰岛素A链氨基酸序列;AAK为连接B链和A链的连接肽,也称为C肽。

[5]

为了进一步提升人胰岛素及其类似物前体的产量,本发明结合毕赤酵母密码子偏好性,优化了胰岛素类似物前体基因和α-因子信号肽基因,在毕赤酵母中进行分泌表达,并与现有技术中的人胰岛素类似物前体基因作为对照,结果表明,本发明中经过密码子优化后的基因表达人胰岛素类似物前体量提高了近2倍,能够大大降低后期人胰岛素及其类似物工业生产的成本。

[6]

发明内容

[7]

本发明的一些实施方案中提供了核酸分子,其包含如下结构:

[8]

5′—(PS)a—(SP)b—(LS)c—GE—(P′S)d—3′,其中,

[9]

PS是编码加工位点的核酸分子,a是0或1;

[10]

SP是编码信号肽的核酸分子,b是0或1;

[11]

LS是编码间隔肽的核酸分子,c是0或1;

[12]

GE是编码目标多肽的核酸分子;

[13]

P′S是编码加工位点的核酸分子,d是0或1。

[14]

一些实施方案中提供了核酸分子,其包含如下结构:

[15]

5′—(PS)a—(SP)b—(LS)c—GE—(P′S)d—3′,其中,

[16]

PS是编码加工位点的核酸分子,a是0或1;

[17]

SP是编码信号肽的核酸分子,b是1;

[18]

LS是编码间隔肽的核酸分子,c是1;

[19]

GE是编码目标多肽的核酸分子;

[20]

P′S是编码加工位点的核酸分子,d是0或1。

[21]

在一些实施方案中,编码信号肽的核酸分子包含如SEQ ID NO:1所示序列。

[22]

在一些实施方案中,目标多肽是人胰岛素类似物前体多肽;编码人胰岛素类似物前体多肽的核酸分子包含如SEQ ID NO:3所示序列。

[23]

在一些实施方案中,编码信号肽的核酸分子(SP)的核酸序列如SEQ ID NO:1所示,氨基酸序列如SEQ ID NO:2所示:

[24]

[25]

在一些实施方案中,编码目标多肽的核酸分子(GE)可以是编码人胰岛素类似物前体的核酸分子,其可以是B30位苏氨酸缺失的人胰岛素。人胰岛素类似物前体的核酸分子序列如SEQ ID NO:3所示,氨基酸序列如SEQ ID NO:4所示:

[26]

[27]

在一些实施方案中,编码人胰岛素类似物前体的核酸分子的88-96位(即GCTGCTAAG)为编码连接肽(也称C肽)的核酸分子,其可以被替代,包括但不限于如下的序列:GCCGCTAAG,GCTGCCAAG,GCTGCTAAA,GCCGCCAAG。

[28]

在一些实施方案中,编码间隔肽的核酸分子(LS)的序列如SEQ ID NO:5所示:

[29]

[30]

[31]

在一些实施方案中,PS和/或P′S是编码酶切位点的核酸分子;

[32]

优选的,PS是编码EcoR I酶切位点的核酸分子,和/或P′S是编码Not I酶切位点的核酸分子。

[33]

在一些实施方案中,提供能够表达人胰岛素类似物前体的核酸分子,其包含编码间隔肽的核酸分子和编码人胰岛素类似物前体的核酸分子,能够与包含信号肽的载体重组后表达人胰岛素类似物前体。

[34]

在一些实施方案中,人胰岛素类似物前体核酸分子编码的人胰岛素类似物前体氨基酸序列如下:

[35]

EEGEPK-B(1-29)-AAK-A(1-21)

[36]

其中,“EEGEPK(SEQ ID NO:16)”可以是胰岛素前体N端延伸,称为间隔肽或前导肽;“B(1-29)”可以是缺失B30位苏氨酸的人胰岛素B链;“A(1-21)”可以是人胰岛素A链氨基酸序列,“AAK”为连接B链和A链的连接肽,也称为C肽。

[37]

在一些实施方案中,人胰岛素类似物前体核酸分子的序列可以如SEQ ID NO:6所示,氨基酸序列如SEQ ID NO:7所示:

[38]

[39]

在一些实施方案中,提供另一种能够表达人胰岛素类似物前体的核酸分子,该序列中包含信号肽序列、间隔肽序列和编码人胰岛素类似物前体的序列,其能够与不包含信号肽的载体重组后表达人胰岛素类似物前体。

[40]

在一些实施方案中,表达人胰岛素类似物前体的核酸分子的核酸序列如SEQ ID NO:8所示,编码的氨基酸序列如SEQ ID NO:9所示:

[41]

[42]

[43]

在一些实施方案中,表达人胰岛素类似物前体的核酸分子还可以连接酶切位点序列,所述酶切位点优选EcoR I酶切位点和Not I酶切位点。

[44]

在一些实施方案中,还提供了一种能够在真核或原核细胞中表达的载体,其能够在原核或真核细胞中分泌表达人胰岛素类似物前体。

[45]

在一些实施方案中,还提供了一种宿主细胞,所述的宿主细胞优选为酵母菌,更优选为毕赤酵母,其能够分泌表达人胰岛素类似物前体。

[46]

在一些实施方案中,还提供一种制备人胰岛素类似物的方法,包括使用如前所述的核酸分子,载体,和/或宿主细胞。

[47]

所述的方法还可以包含如下步骤:

[48]

1)通过编码人胰岛素类似物前体的核酸分子在真核细胞中表达人胰岛素类似物前体;

[49]

2)通过酶切处理人胰岛素类似物前体得到人胰岛素类似物,所述的编码人胰岛素类似物前体的核酸分子可以如SEQ ID NO:6所示,所述的酶切处理胰岛素前体采用本领域技术人员公知的方法。

[50]

在一些实施方案中,步骤1)中包含用表达载体表达人胰岛素类似物前体,所述的表达载体包含信号肽序列,所述的信号肽序列可以如SEQ ID NO:1所示。

[51]

在一些实施方案中,所述的人胰岛素类似物为B30缺失的人胰岛素,所述的人胰岛素类似物进一步经过酰化基团的取代。

[52]

在一些实施方案中,所述的B30缺失的人胰岛素在B29位的赖氨酸处被酰化基团取代。

[53]

优选的,上述取代的取代产物为赖氨酸B29(Nε-(Nα-十六烷脂肪二酸-L-赖氨酸-Nε-氧代丁酰基))des(B30)人胰岛素。

[54]

缩写和术语

[55]

“密码子优化”是指利用宿主细胞偏爱密码子规则,使用偏爱密码子并避 免使用利用率低或稀有密码子来合成基因。

[56]

“对照1”是“EEGEPK”的编码核酸分子(双下划线所示的GAAGAAGGTGAACCAAAG)与专利WO1998028429中的胰岛素前体基因的编码核酸分子相连,如下SEQ ID NO:10所示:

[57]

[58]

“对照2”是“EEGEPK”的编码核酸分子(双下划线所示)与Gurramkonda等人的文献(Microbial Cell Factories,2010,9:31)中经优化的胰岛素前体基因的编码核酸分子相连,如下SEQ ID NO:11所示:

[59]

[60]

“IP-S”是经密码子优化的胰岛素前体基因对应的核酸分子。

[61]

“α-因子”是Invitrogen公司提供的pPIC9K表达载体带有的α-因子信号肽基因对应的核酸分子,来源于酿酒酵母。

[62]

“α-因子-S”是经密码子优化的α-因子信号肽基因对应的核酸分子。

[63]

“载体”包括核酸分子,其能够运输它连接的另一核酸,包括但不局限于质粒和病毒载体。某些载体能够在其被引入的宿主细胞中自主复制,而其它载体可在引入宿主细胞时整合到宿主细胞的基因组中,并因此与所述宿主基因组一起复制。此外,某些载体能够指导有效连接到它们的基因的表达,此类载体此处称作“重组表达载体”(或简单地“表达载体”),并且典型载体为本领域熟知。

[64]

“目标多肽”是能够在酵母中表达的多肽,包括但不限于酶、抗体、干扰素、胰岛素、白介素等及其变体、前体、中间体,例如可以是胰岛素前体。

[65]

“细胞”、“宿主细胞”可互换使用。

[66]

“多核苷酸分子”、“核酸分子”可互换使用,其序列可以是DNA序列。

具体实施方式

[67]

以下结合实施例用于进一步描述本发明,但并非限制本发明的范围。

[68]

本发明实施例中所用的载体、宿主菌和培养基均购自Invitrogen公司,其中毕赤酵母表达载体pPIC9K含有醇氧化酶AOX1启动子,可受甲醇诱导,该载体还含有α-因子信号肽序列,能够分泌表达外源蛋白;毕赤酵母表达载体pPIC3.5K含有醇氧化酶AOX1启动子,可受甲醇诱导,该载体不含有α-因子信号肽序列;宿主菌为毕赤酵母GS115菌株;培养基为毕赤酵母手册提供的培养基配方。

[69]

实施例1构建胰岛素前体重组表达载体

[70]

将对照1(SEQ ID NO:10)、对照2(SEQ ID NO:11)、IP-S(SEQ ID NO:6)的5′端和3′端都分别加入EcoR I和Not I酶切位点,由南京金斯瑞生物科技公司进行合成,并将合成的核酸分子序列连接到T载体。

[71]

[72]

用内切酶EcoR I和Not I将上述带有胰岛素前体核酸分子的T载体和表达载体pPIC9K进行双酶切,之后采用胶回收试剂盒分别回收目标片段和载体片段,用T4连接酶将酶切纯化后的目标片段分别与酶切纯化后的载体pPIC9K进行连接。

[73]

将上述连接液分别转化到大肠杆菌TOP10感受态细胞,涂布含氨苄青霉素的抗性平板,培养后,挑取克隆菌提取质粒,双酶切验证,通过验证最终得到三种重组表达载体,分别含有对照1、对照2、IP-S的序列。

[74]

实施例2毕赤酵母重组菌表达胰岛素前体

[75]

将实施例1中构建的三种重组表达载体分别转化到毕赤酵母GS115中,表达对照1和对照2的重组菌为对照菌株,表达IP-S的重组菌为实验菌株。

[76]

将三种重组菌的菌落接种至5mL的YPD培养基中,30℃恒温摇床250rpm振荡培养至OD600=10左右(16-18小时)。收集并重悬细胞于50mL BMGY培养基中,30℃恒温摇床250rpm振荡培养过夜,至OD600为30左右。1500rpm离心5分钟收集细胞,用25mL BMMY培养基重悬。在培养基中加入1/200体积的甲醇(终浓度为0.5%),30℃恒温摇床250rpm振荡培养96小时,其中每24小时补加1/200体积的甲醇。表达结束后,10,000rpm离心取上清,通过HPLC检测上清液中胰岛素前体的产量,换算为相对于对照菌株胰岛素前体表达量的百分比,胰岛素前体的表达量百分比如表1所示。

[77]

表1

[78]

对照菌pPIC9Kα-因子对照1100
对照菌pPIC9Kα-因子对照2125
实验菌pPIC9Kα-因子IP-S225

[79]

表1的数据显示,经过优化的胰岛素前体基因表达的胰岛素前体量与两个对照组相比提高到1.8到2.25倍,可见经过优化的胰岛素前体基因有更好的表达效果,其表达的胰岛素前体的产量显著提高。

[80]

实施例3构建融合了不同α-因子的胰岛素前体基因的重组表达载体

[81]

在IP-S前分别加入α-因子(SEQ ID NO:12)和α-因子-S(SEQ ID NO:1),融合后的核酸分子序列分别如SEQ ID NO:13和SEQ ID NO:8所示,进行合成,合成后的核酸分子的5′端和3′端分别带有EcoR I和Not I酶切位点,并将合成的核酸分子连接到T载体。

[82]

[83]

[84]

将对照1前分别加入α-因子(SEQ ID NO:12)和α-因子-S(SEQ ID NO:1),融合后的核酸分子序列分别如SEQ ID NO:14和SEQ ID NO:15所示,进行合成,合成后的核酸分子5′端和3′端分别带有EcoR I和Not I酶切位点,并将合成的核酸分子连接到T载体。

[85]

[86]

[87]

用内切酶EcoR I和Not I将上述T载体和表达载体pPIC3.5K进行双酶切,之后采用胶回收试剂盒分别回收目标片段和载体片段,用T4连接酶将酶切纯化后的目标片段分别与酶切纯化后的载体pPIC3.5K进行连接。

[88]

将上述连接液分别转化到大肠杆菌TOP10感受态细胞,涂布含氨苄青霉素的抗性平板,培养后,挑取克隆菌提取质粒,双酶切验证,通过验证最终得到四种重组表达载体,分别融合了α-因子信号肽和α-因子-S信号肽,表达不同核苷酸序列的胰岛素前体基因。

[89]

实施例4毕赤酵母重组菌表达优化前后的胰岛素前体

[90]

将实施例3中构建的重组表达载体分别转化到毕赤酵母GS115中。

[91]

将重组菌菌落接种至5mL的YPD培养基中,30℃恒温摇床250rpm振荡培养至OD600=10左右(16-18小时)。收集并重悬细胞于50mL BMGY培养基中,30℃恒温摇床250rpm振荡培养过夜,至OD600为30左右。1500rpm离心5分钟收集细胞,用25mL BMMY培养基重悬。在培养基中加入1/200体积的甲醇(终浓度为0.5%),30℃恒温摇床250rpm振荡培养96小时,其中每24小时补加1/200体积的甲醇。表达结束后,10,000rpm离心取上清,通过HPLC检测上清液中胰岛素前体的产量。

[92]

将表达融合α-因子的对照1基因的重组菌作为对照菌,将其他菌株的胰岛素前体产量换算为相对于对照菌株产量的百分比,如表2所示。

[93]

表2

[94]

对照菌pPIC3.5Kα-因子对照1100
实验菌pPIC3.5Kα-因子-S对照1150
实验菌pPIC3.5Kα-因子IP-S225
实验菌pPIC3.5Kα-因子-SIP-S275

[95]

表2的数据显示,仅信号肽优化的核酸分子序列表达胰岛素前体的量提高到1.5倍,仅胰岛素前体基因优化的核酸分子序列表达胰岛素前体的量提高到2.25倍,而经信号肽和胰岛素前体基因同时优化的核酸分子序列表达胰岛素前体量提高到2.75倍。综合以上,密码子优化使得胰岛素前体的表达量增加到1.5-2.75倍。



[1]

Provided is a nucleic acid molecule of a codon optimized precursor gene and signal peptide gene of a human insulin analogue. The nucleic acid molecule comprises a nucleic acid molecule encoding the precursor of the fusion insulin analogue and a nucleic acid molecule encoding the yeast secreting signal peptide α-factor. The nucleic acid molecule improves the expression of the precursor of the insulin analogue in Pichia pastoris, and reduces the production cost of the human insulin analogue.



核酸分子,其包含具有以下通式的分子或结构:

5′—(PS)a—(SP)b—(LS)c—GE—(P′S)d—3′,

其中,

PS是编码加工位点的核酸分子,a是0或1;

SP是编码信号肽的核酸分子,b是1;

LS是编码间隔肽的核酸分子,c是0或1;

GE是编码目标多肽的核酸分子;

P′S是编码加工位点的核酸分子,d是0或1;

所述编码信号肽的核酸分子包含如SEQ ID NO:1所示序列。

核酸分子,其包含具有以下通式的分子或结构:

5′—(PS)a—(SP)b—(LS)c—GE—(P′S)d—3′,

其中,

PS是编码加工位点的核酸分子,a是0或1;

SP是编码信号肽的核酸分子,b是0或1;

LS是编码间隔肽的核酸分子,c是0或1;

GE是编码人胰岛素类似物前体多肽的核酸分子;

P′S是编码加工位点的核酸分子,d是0或1;

所述编码人胰岛素类似物前体多肽的核酸分子包含如SEQ ID NO:3所示序列。

根据权利要求1所述的核酸分子,其中所述目标多肽是人胰岛素类似物前体,编码所述人胰岛素类似物前体的核酸分子包含编码SEQ ID NO:4所示氨基酸序列的核酸分子,优选的,包含如SEQ ID NO:3所示核酸序列。

根据权利要求2所述的核酸分子,其中编码所述信号肽的核酸分子包含编码SEQ ID NO:2所示氨基酸序列的核酸分子,优选的,包含如SEQ ID NO:1或SEQ ID NO:12所示核酸序列。

根据前述权利要求2-4中任一项所述的核酸分子,所述编码人胰岛素类似物前体的核酸分子在相当于SEQ ID NO:3的第88-96位被替换,优选的,被GCCGCTAAG、GCTGCCAAG、GCTGCTAAA或GCCGCCAAG替换。

根据前述权利要求中任一项所述的核酸分子,所述间隔肽的氨基酸序列 包含EEGEPK(Glu-Glu-Gly-Glu-Pro-Lys),优选的,编码间隔肽的核酸分子包含如SEQ ID NO:5所示序列。

根据前述权利要求中任一项所述的核酸分子,其包含如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:13、SEQ ID NO:15所示序列中的任意一个;或为SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:13、SEQ ID NO:15所示序列中的任意一个。

根据前述权利要求中任一项所述的核酸分子,所述加工位点是连接酶切位点,优选的,PS是编码EcoR I酶切位点的核酸分子和/或P′S是编码Not I酶切位点的核酸分子。

载体,其包含如前任一项权利要求所述的核酸分子,优选的,其是真核细胞表达载体或原核细胞表达载体。

宿主细胞,其含有权利要求1-8任一项所述的核酸分子和/或权利要求9所述的载体,优选的,其为酵母菌;更优选的,其为毕赤酵母。

制备人胰岛素类似物的方法,包括使用权利要求1-8任一项所述的核酸分子,权利要求9所述的载体,和/或权利要求10所述的宿主细胞。

根据权利要求11所述的方法,其还包括如下步骤:

1)表达人胰岛素类似物前体;

2)酶切步骤1)获得的人胰岛素类似物前体,得到人胰岛素类似物。

根据权利要求11或12所述的方法,所述的人胰岛素类似物为B30缺失的人胰岛素,和/或进一步经过酰化基团的取代,

优选的,所述取代是B29位的赖氨酸被取代;

更优选的,所述取代的产物为赖氨酸B29(Nε-(Nα-十六烷脂肪二酸-L-赖氨酸-Nε-氧代丁酰基))des(B30)人胰岛素。