摘要:表遗传学(Epigenetics)是研究没有DNA序列变化的、可遗传的表达改变。表遗传学的发展弥补了传统遗传学的不足,促进了遗传学的发展。表遗传学与传统遗传学之间的关系有如阴阳,它们既相区别,又彼此协同参与发育和进化等重要生物学过程的调控,构成了遗传学密不可分的两个组成部分。文章讨论了表遗传学的定义、研究内涵和中文译名等问题。
关键词:表遗传学;传统遗传学;发育;进化;
作者简介:薛开先,硕士,研究员,研究方向:肿瘤遗传学,表遗传学。
本世纪以来,表遗传学(Epigenetics)快速发展,已成为生物学、医学和农学等研究领域的前沿[1~4];同时,引起公众的关注,著名杂志“时代(Time)”发表评述:“DNA不是主宰”[5,6]。近两年来,一些重要学术期刊发表编者按或著文指出,随着表基因组(Epigenome)时代的到来,表遗传学是核心思想和下一件大事[7~9]。从公众到学术界,表遗传学研究得到如此关注和重视,使我们认为有必要进一步审视表遗传学发展的启示、重要进展,及其对遗传学的意义等基本问题。
1表遗传学的产生和发展
遗传学是生物学的核心学科之一,与生物的发育、进化等学科密切相关。在19世纪,主流生物学认为遗传和发育是同一个问题[10]。至19世纪下半叶,遗传学研究取得重要进展。1865年孟德尔发现“分离规律”和“自由组合规律”,提出了遗传因子说来解释这些遗传现象;1879年,Flemming发现染色体,随后Wilson和Boveri等通过实验证明,发育的编程存在于染色体中;1911年摩尔根在果蝇的伴性遗传中证明,遗传因子存在于染色体上,并发现位于同一条染色体上基因遗传的连锁和互换规律[11,12]。此后,当遗传学迅速发展的同时,也积累了不少传统遗传学不能解释的遗传现象。例如,Muller等的工作表明,基因的易位或染色体重排能影响基因性状的表达,看来基因并不是一个独立的实体,它的功能还受到在基因组中的位置的影响;在基因组印记基因中,表现的性状取决于亲本的来源,表明双亲的等位基因对性状的遗传贡献并不相等[10,11]。
20世纪初的几十年里,遗传学和发育生物学的研究很少考虑对方的成果和方法,各自发展。至40年代,一些生物学家认识到这种研究方法的局限性,其中通晓发育生物学和遗传学的WaddingtonCH(1905–1975)于1939年首先提出“发育是表遗传的(Epigenetic)”;1942年他又提出表遗传学(Epigenetics)和表遗传景观(Epigeneticlandscape)等概念,主张将两个学科联系起来研究。他认为表遗传学是研究基因型产生表型的过程[1,2]。其实,具有发育生物学背景的摩尔根也有类似认识,早在1925年《基因论》一书中就认为:“明了基因如何对发育中个体发生影响,毫无疑义地将使我们对遗传的观点进一步扩大,对于目前还不了解的许多现象也多半会有所阐明”[4]。此后遗传学发展遇到一些难题,也印证了开展这类研究的重要性[4]。
在个体发育中所有细胞都具有相同的基因组,是何种机制调控基因表达的特异性编程,分化成不同类型的组织细胞,一旦建立就能在谱系细胞间遗传;又如,人类同卵双生子具有完全相同的基因组,根据传统理论应发育成完全相似的两个个体,然而约有1/3的同卵双生子20岁后出现了个性和疾病易感性等方面的差异;另外,成体组织细胞核移植实验发现,虽然所形成的克隆胚胎具有完整的基因组,但实际上在胚胎发育过程中常出现各种异常,多数在出生前夭亡,少数生存的个体也有多方面的异常,并且寿命较正常胎生的个体短[4,11]。
表遗传学概念提出后,由于对其机制还不清楚,长期以来发展缓慢。直至1975年Holliday等在研究中发现,DNA甲基化在基因表达中具有重要作用,并认为是发育中基因活性调节的开关;另外,他还推测存在一种维持型甲基化酶,能识别复制的半甲基化DNA,从而解决甲基化模式的遗传问题[4,12]。此后的10多年间,没有发现这种甲基化酶,表遗传学又是一段沉默。
20世纪90年代,表遗传学研究取得一系列重大突破。首先证实了维持型DNA甲基化酶的存在,如小鼠剔除DNA甲基化酶基因,则发育异常;在人类肿瘤中发现,肿瘤抑制基因p16因高甲基化而灭活,如用去甲基化抑制剂处理,能使p16基因复活。上述研究提示,DNA甲基化在正常发育和肿瘤发生中起重要作用[2,4]。其次,在染色质结合组蛋白的研究中发现,组蛋白各种修饰如乙酰化、甲基化和磷酸化等,可影响各种调节蛋白和功能复合物与DNA接触通路;各种修饰组合构成的“组蛋白密码”,提供了效应蛋白的结合点,在基因表达调控中发挥作用[2,4];另外,还发现染色质和基因组转录的非编码RNA在基因表达调控中也起到重要作用。至此,表遗传学机制的框架已初步确立,并在各种类型的生物得到证实。2001年Science专辑发表一组评述,系统介绍了表遗传学研究领域和进展。2003年,Nature就双生子等表遗传学研究发表述评。21世纪表遗传学迅猛发展,上述遗传学存在的难题已有不同程度的阐明,并开发出新的研究领域,显示表遗传学已成为主流生物学和医学的一部分[2~4,13]。
人类基因组计划完成及其后续计划的研究,提升了对人类自身的认识,但也获得了许多意想不到的结果,对传统基因中心论形成了冲击。例如:(1)人类基因组约有10万个基因,而实际只测出不足25000个,约是果蝇的2倍。有学者质疑,只有不足2%的DNA序列就含有充分的遗传信息,调控人类的生长发育和生命的全过程,而98%的DNA为“垃圾DNA”[4,14];(2)不是机体愈复杂基因数愈多。如在脊椎动物中编码蛋白质基因的数量、编码序列的长度并没有显著改变,而它们的发育复杂性存在巨大的差异;深入研究发现,90%以上的基因组被转录,生物学复杂性通常与基因组非蛋白质编码部分相关,而编码蛋白质基因维持相对的静态;各种类型的非编码RNA几乎调节各个水平的基因表达,构成一个巨大、高效的调控网络,促进正常的发育和生理过程,其功能异常可引发疾病,而这些正是表遗传学的研究领域[14,15];(3)人类基因组约有1千多万个单核苷酸多态,曾有学者期望于通过单核苷酸多态性的研究,确定一些常见病的个体易感性,但迄今为止,包括应用全基因组关联研究(Genomewideasso-ciationstudy,GWAS)虽取得不少成果,但在总体上两者间的关联性不如预期的那样好[4,16]。
只有从史学角度分析一个事物的发生与发展,才能更好地了解其存在意义。对上述表遗传学发展的过程和背景的分析表明,表遗传学是科学发展到一定阶段产生的,能够克服和补充传统遗传学之不足,随着表遗传学研究的深入,必将促进新一轮的遗传学的发展[17]。
2表遗传学与遗传学的关系
2.1表遗传现象与非孟德尔遗传方式
表遗传学是研究不能用DNA序列变化解释的、能通过有丝分裂或减数分裂遗传的基因功能的改是变[11]。表遗传学遗传或表遗传(Epigeneticinheritance)涉及非DNA序列编码的信息或基因表达状态,在细胞和个体世代间的传递[19]。这种能影响后代性状的表遗传信息,没有DNA原始结构的改变或来自环境的诱因。目前,多把涉及个体世代间的表遗传称之为跨代表遗传(Transgenerationalepigeneticinheritance),尽管在单细胞生物,细胞分裂与世代交替是一致的,而在多细胞生物就可能有不同的机制和进化意义[20]。
百年来积累了许多不能用孟德尔规律解释的遗传现象,例如基因组印记、位置效应花斑、副突变、表突变、X-染色体失活和转基因沉默等。近年来研究发现,这些现象都有其表遗传学基础。
基因组印记是一种表遗传现象,其特征是某些基因以亲本来源特异性、等位基因差异性表达,这类印记基因约占基因组基因数的1%,是哺乳动物和有花植物的独特现象。经典的孟德尔遗传,遗传性状的形成需要来自父、母双方等位基因的表达;而印记基因的表达是由染色体亲本来源所决定、单等位基因表达;受影响的基因在男、女性后代中显示与亲本特异性相同的表达[15~17]。现已研究表明,基因组印记是由于特定亲本等位基因差异甲基化区(DMR)高甲基化的结果[4,14]。
位置效应是指当基因在染色体上的位置发生改变时,影响该基因的表达,位置效应花斑(Position-effectvariegation,PEV)是其中的一种,是由Muller等于1930年首先在果蝇研究中发现的。在位置效应花斑情况下,由于基因周边基因组环境的改变引发了基因可逆性灭活,通常是由于处于有转录活性常染色质区的基因,通过染色质重排,移至邻近无转录活性异染色质区,因异染色质能随机扩展,引发部分基因的失活,这样在相同遗传背景的细胞群体中产生镶嵌表型的花斑[4,14]。
副突变(Paramutation)也是一种表遗传现象。根据孟德尔的分离规律,来自双亲、决定性状遗传的一对等位基因彼此独立,互不影响;在生殖细胞形成时,各自分离,分别进入配子。副突变是一对等位基因间相互作用的结果,此时沉默的等位基因通过反式沉默另一等位基因,并可通过减数分裂遗传。沉默等位基因是副突变源性的(Paramutagenic),具有副突变能力的等位基因是副易变的(Paramutable);沉默的副易变等位基因在下一代则获得了副突变源的能力,因此这一可遗传的表达状态能在群体中迅速传播。最近的结果表明,副突变关系到RNA介导的、可遗传的染色质改变,以及许多与RNAi途径相关基因的变化[4,14]。
其他一些传统遗传学之谜随着表遗传学进展也在逐步解开。例如:同卵双生子间个性和易感性等的差异,是基因组甲基化模式差异的结果;在发育过程中,分化细胞所形成特殊的基因表达模式,通过细胞记忆在细胞世代间稳定传递,维持细胞的同一性,即体细胞表遗传现象。在肿瘤发生中,启动子区的高甲基化和基因突变一样,引发肿瘤抑制基因的灭活;生殖系hMLH1启动子区的高甲基化引起的表突变,同样可引发遗传性肿瘤,等等[4,14]。
2.2传统遗传学信息与表遗传学信息
近10多年来的遗传学和表遗传学研究进展使人们认识到人类基因组含有两类遗传信息,传统遗传信息(Classicgeneticinformation)提供了合成生命所必需蛋白质的模板,表遗传信息(Epigeneticin-formation)提供了何时、何地和以何种方式应用遗传信息的指令。它们的遗传物质基础、编码和遗传方式不同。编码蛋白质的遗传信息贮存在DNA序列之中,通过半保留复制准确地传递给后代,因此除非偶发突变事件,通常遗传性状不受所处环境和亲本行为等的影响,在世代间稳定地传递[4,14,21]。
表遗传信息提供了在细胞内选择性地激活或灭活基因功能,这是更高层次和特化的遗传信息[22]。大量的研究显示,染色质修饰是基因转录活性调控的基本机制,其中关键机制是DNA甲基化和组蛋白修饰,由于这类修饰的组合本质,大大地延伸了遗传密码的信息潜能。它们再与染色质重塑复合物、核内系统结构和ncRNA协同,决定了受控基因区段的染色质结构和其转录活性[23,24]。在细胞分裂中,表遗传学信息的复制机制除DNA甲基化外其余的尚不很清晰,其保真度不如DNA复制可靠;它们易受到环境压力、营养和亲本行为等因素的影响,其中一部分修饰的表基因型可传递给后代,引起表遗传性状的改变[4]。
从上述可见,生物至少存在有3个不同层次的遗传信息:一是编码蛋白质的基因和DNA调控序列,蛋白质是生命体系中结构和功能的物质基础,是最基本的遗传信息;二是由编码RNA基因组成,这类基因主要存在于非蛋白质编码的DNA序列中,转录形成的多种类型的ncRNA构成巨大的基因表达调控网络;三是表遗传信息,贮藏在DNA及与其结合蛋白的各类共价修饰和染色质构型之中,是表遗传学调控的基本机制。它们之间的功能协同,才能完成生物的遗传过程;同时完成了从基因的一维遗传信息向三维的表遗传信息的转换[25,26]。
2.3基因组与表基因组
基因组是机体遗传信息的总和,其中包括编码蛋白质的DNA序列(基因)、非编码DNA序列(非编码RNA基因,non–codingRNAgene)、基因表达调控序列和功能尚未被阐明的DNA序列。早期曾把单倍体(全套)染色体组称之为基因组。
表基因组是遗传信息载体—染色质生化修饰的总和。表基因组是编程的基因组,表基因组信息主要由DNA甲基化、组蛋白修饰、核小体定位和染色质高阶结构组成。在个体发育中胚胎细胞具有相同的基因组,但在表遗传学机制调控下,通过分化产生不同结构、不同功能的组织细胞,从而具有各别的表基因组,故表基因组是调控基因表达的模式,也是一类细胞的总体表遗传学状态[4,28,29]。
与基因组比较,表基因组更为动态,这反映了细胞处于不同时空下的功能状态。同时,表基因组处于基因组与环境的界面,它能将动态的环境与遗传上静态的基因组连接起来,除通过上述的染色质修饰机制外,还与另外一些非共价修饰的表遗传机制如miRNA和染色质重塑复合物等相关。因此,表基因组在发育中不仅通过一个高度有序、协同的生物学过程,依据遗传和环境信息,产生一定的基因表达程序,结果形成特定的表型;而且在整个生命过程中,还能对环境应激作出反应,可能引发表遗传异常疾病。因此,表基因组将环境和基因型与表型和疾病连接起来[28~30]。
2.4传统遗传学和表遗传学是遗传学的一体两面
遗传和变异是生命的基本现象,对遗传现象的研究不仅要研究遗传性状在生物世代间的传递规律,研究基因复制和变异等的机制,而且要研究遗传性状在个体发育中的形成与变异,研究调控和实施遗传学信息的分子机制。可见,传统遗传学和表遗传学应是遗传学不可分离的两个组成部分。如同世间万物一样,遗传也有阴阳两个方面[17,18],基因编码蛋白质,有实质功能,表遗传修饰在其上,为阴;表遗传修饰在DNA外,调控基因的表达,为阳。两者既相区别、彼此制约,又相辅相成构成同一性,完成生物的遗传、变异和发育、进化过程。
近年来积累的实验事实也表明,传统遗传学和表遗传学相反相成、密不可分而成为现代遗传学的两个方面。例如:(1)表遗传现象是遗传现象的重要组成部分,其中如基因组印记、X-染色体失活和表突变等,在人体的正常发育和疾病发生中起重要作用;(2)传统遗传信息与表遗传信息载体有不同的稳定性和可变性,其中基因组DNA能精确地复制,保证了遗传学信息的稳定性和连续性,使物种维持相对稳定;同时又通过具有不同程度稳定性的表遗传学机制,如组蛋白修饰所产生的基因灭活,多为短期的改变,用于转录因子基因等的抑制;而DNA甲基化所引起的基因灭活,多为长期的改变,提供了特定序列如转座子、印记基因和干细胞多能性相关基因等的沉默,使基因组能根据机体自身的信息、程序以及内外环境信号适当地表达,在个体发育中能与环境达到实时的平衡或适应。有时环境引发种系表遗传学状态的改变,能产生可遗传的发育表型,作为自然群体中的表型变异,提供了自然选择的原料[4,14,31];(3)传统遗传信息和表遗传信息相互为根,彼此依存。表遗传信息是动态的,需要编写表遗传信息的各种DNA和组蛋白修饰酶(Writer),如DNA甲基转移酶和组蛋白乙酰化酶等;并在有必要时,能及时消除这些修饰的酶((Erasers),如DNA去甲基化酶和组蛋白去乙酰化酶等;以及含有识别表遗传修饰结构域(Domain)的效应分子(Readers),如含有JumonjiC结构域的组蛋白去甲基化酶。表遗传学调节还必需有表遗传学接头(Epigeneticadaptors)或介导分子,如甲基化DNA结合蛋白以及染色质重塑酶、非编码RNA等,所有这些以及组蛋白本身都是由DNA所编码,因此没有遗传信息就没有表遗传信息;同样,在遗传信息实施过程中,只有在表遗传信息适当调控下,才能合成所需蛋白,进而形成由各种组织器官构成的、功能协调的整体;而被表遗传机制沉默的基因没有任何生物学功能,仅是一段化学物质DNA而已。可见,只有当遗传信息与表遗传信息按遗传发育编程分工协同,才能在与环境相互作用中完成遗传性状的传承。传统遗传学和表遗传学应是现代遗传学密不可分的两个方面[14,32,33]。
3表遗传学与个体发育及系统发育
表遗传学的发展与发育生物学及进化研究密切关联,并从彼此的研究中获益[11]。
3.1表遗传学与发育
性状的遗传在发育过程中得以实现,然而传统遗传学长期不能说明有关的两个核心问题:一是如何从单一细胞的受精卵分化形成由多种细胞类型组成的、复杂的多细胞生物,而这些细胞具有相同的基因组;二是什么样的分子机制参与表型遗传[35]。近年来,随着基因测序等的研究进展,明确显示遗传因素本身不足以说明发育过程和表型形成,因为遗传性状的形成还依赖与环境因素的相互作用,而在这一过程中表遗传学机制发挥了决定性的作用[36,37]。表遗传学机制调控从受孕至死亡的所有生物学过程,包括在早期胚胎发育的基因组重编程、细胞分化、定型、谱系细胞的维持和配子发生等,因此发育是表遗传的[24,31],正如1939年Waddington所说的那样。
从受精卵开始的个体发育需要遗传和表遗传程序的密切协同,由于DNA序列不变,是表遗传机制编排了各种细胞类型特有的基因表达程序,从而使分化形成的各类细胞获得了不同的结构与功能。这种表遗传编程(Epigeneticprogramming)是正常发育中的一种生理过程,表遗传学机制如DNA甲基化和组蛋白修饰等,通过建立有丝分裂可遗传的、活性或抑制的染色质状态,调控发育潜能和细胞同一性;同时这些编程通过细胞记忆,可在各谱系内细胞世代间维持[4,38,39]。
成体哺乳动物每一类型的细胞都有自己的表遗传状态,它反映基因型、发育过程和环境的影响,最终产生一定的表型。这些表遗传学状态在大多数分化细胞已被固定下来,然而在正常发育的某些阶段或疾病的情况下,细胞就会发生表遗传重编程(Epigeneticreprogramming),首先需要消除原有的表遗传学标志,随后建立不同的表遗传学标志和基因表达编程。已知在两个发育的关键期发生表遗传学重编程,一是在配子发生期,重编程发生在原生殖细胞,使配子全能性恢复;二是发生在发育早期的植入前阶段,同样使胚胎细胞获得全能性[4,40]。
健康和疾病的发育起源(Developmentaloriginsofhealthanddisease,DODaH)理论近年来日益受到关注,并有人主张应将这一成果转化为干预和政策。该理论认为,在生命早期阶段特别是发育中的胚胎,对环境因素的作用最为敏感,因为此期DNA合成速度最快,并在精确构建对正常发育所必需的甲基化模式和染色质构型,不良的环境因素如母体营养状况、环境毒物的暴露和心理压力等,可通过表遗传学机制改变细胞的表基因型,并通过细胞记忆得以维持,进而影响成年后一些慢性病如2型糖尿病、高血压和冠心病等的发病及其病情。因此,很多研究者认为许多慢性病起源于生命发育的早期阶段,与表基因型异常改变相关;这一疾病发育起源说不仅揭示了复杂、非孟德尔疾病的病因和病理机制,而且为这类疾病的预防和开发高效、低毒的表遗传学药物提供了设计的依据[41,42]。
3.2表遗传学与系统发育
遗传是生物系统发育或进化的基础,表遗传学发展历史不长,与进化关系的研究尚在起步阶段,需要深入探讨。
3.2.1表遗传机制是生物进化到一定阶段发生的现象
在进化过程中表遗传调控机制是作为宿主抗病毒和抗寄生序列的防御机制而进化,例如在植物和真菌中,DNA甲基化主要局限于转座子和DNA重复序列;在酵母、线虫和果蝇中几乎不存在DNA甲基化,果蝇因转座子等的作用使自发突变率高达50%~80%;哺乳动物DNA甲基化的程度较高,并且是表遗传学调节的主要机制,由于重复序列和转座子被高甲基化,自发突变率显著下降。可见,DNA甲基化调节基因的表达,是生物界进化到一定阶段发生的现象[5]。
3.2.2表突变和表遗传变异
表突变是特定染色体位点的、可遗传的表遗传信息或状态的改变,并产生可检出的表型改变,而不是DNA序列改变的结果[10,45]。一些表遗传变异的后代在配子形成时,亲本的甲基化改变可被消除,因此以往有人认为,这些表遗传学变异是短暂的,不可能是稳定地遗传,因而忽视其在人工和自然选择中的作用。近年来增多的证据表明,表遗传学改变特别是DNA甲基化改变,能与突变一样通过减数分裂遗传,可传递数代[44,45]。已在人类证明,有一些家族性大肠癌就是由错配修复基因MLH1和MSH2的表突变所引起[48]。
3.2.3表遗传变异与进化
非DNA序列变化的表遗传学状态的改变,可在细胞和个体世代间传递,拓宽了遗传的概念,挑战目前广泛被接受的、基因中心论的新达尔文主义;获得性状遗传问题又重新提出,并认为在多个生物学、医学领域是重要的[17,47,48]。有研究者认为获得性状遗传可用表遗传学理论来解释,即食物数量和质量的改变,可能激活某些途径,引起表遗传状态的改变,并传给后代,这在营养对小鼠毛色、饥荒对人类后代疾病易感性影响的研究中得到部分验证[3,5,6,49]。进一步研究认为,表遗传机制可促进基因突变,是进化的动力。环境持续诱发的、基因表达模式的改变能引起表型的改变,接受自然选择,因此有人认为,表遗传学过程在进化中起中心作用[50]。
4表遗传学定义和中文译名问题
4.1表遗传学定义
表遗传学这一术语首先由英国发育生物学家Waddington提出,他主张把发育与遗传结合起来研究。当时积累的事实已使他认识到,在遗传学之上(‘overandabove’genetics)必然存在某种因素,能使具有相同基因型的细胞在发育中分化成各种不同类型的细胞。1942年,他把前缀epi-加genetics结合,创建表遗传学一词,并认为它是生物学的一个分支,是研究基因与其形成表型产物间的因果作用。在这一定义的原意中,是指修饰基因型表达、产生特定表型的所有分子途径[4,51]。
此后50多年间,随着分子生物学对表遗传学机制认识的深化,表遗传学的定义也在演进中。20世纪80年代中期Holliday就认识到,存在不依赖DNA序列改变的、新的遗传方式,他根据自己的工作,认为DNA甲基化改变与基因活性调控和一些非孟德尔遗传现象相关。20世纪90年代,阐明,先后有学者提出了至今仍较常用的两个定义:(1)表遗传学是研究不能用DNA序列变化解释的、能通过有丝分裂或减数分裂遗传的基因功能变;(2)表遗传学是研究没有DNA序列变化的、可遗传的基因表达改变[4,10,34]。
进入新世纪,又不断有研究者提出新的定义,我们初步收集到的就有40多种,归纳起来表遗传学的研究内涵主要有:(1)研究主体是基因表达、功能或表型的改变;(2)其内在机制是发生在基因组结构表面的、染色质修饰状态的改变,它们能通过有丝分裂和减数分裂在细胞和个体世代间遗传;(3)没有内在DNA序列的改变,或不能用DNA序列改变来解释的;(4)这些改变是潜在可逆的。目前,学术界应用较多的还是上述两个较为简明的定义,如要全面考虑到表遗传学的研究内涵,可将表遗传学定义为:研究没有DNA序列变化的、可遗传并潜在可逆的基因表达或表型的改变,作为内在机制的染色质状态改变,能通过有丝分裂和减数分裂遗传。
国内的多数研究者亦采用上述两种常用的定义,但在2006年国家名词委审定颁布的遗传学名词(第二版)中,将表遗传学定义为:“研究生物体或细胞表观遗传变异的遗传学分支学科”[52]。显然内容空泛,没有考虑到数十年来表遗传学研究成果和学科特点。进一步修改,势在必行。
4.2Epigenetics的中文译名问题
1996年,在《人类遗传学概论》一书中作者首次将Epigenetic译成“表遗传“[53]。进入21世纪,国内在Epigenetics方面评介和研究逐渐增多,出现包括表观遗传学在内的10多种中文译名,但无论在杂志和网站上都以表遗传学译名应用较多[54]。2006年国家名词委公布的《遗传学名词》将Epigenetics译成“表观遗传学”,但编委会也认为“名词审定工作难度很大……希望遗传学界同仁提出宝贵意见,使之日臻完善”[52]。确实如此,表遗传学在我国的发展尚属初期,对本学科的研究和理解尚待提高;另一方面,学科译名更应审慎和周延,好的译名应有助于对学科内涵的理解。鉴于此,本文对此进行了系列的讨论[4,17,54]。
近来在系统查阅、整理表遗传景观(Epigeneticlandscape)文献时发现,将Epigenetics中文译成表观遗传学可能是一种误读,并且对某些新术语的翻译带来困难。其他研究者也发现第二版“遗传学名词”存在许多可商榷之处[55,56]。因此,有必要根据一些新的资料和体悟,以及国内认同的中文翻译理论,再次审视这一译名的确切性。
4.2.1中文翻译原则
在多年的反复讨论中认识到,首先必需确立中文翻译应遵循的原则,否则讨论就没有标准。目前国内翻译界大多推崇“信、达、雅”的翻译原则,并认为这是最简明、实用的翻译理论。根据自己多年来的学习和翻译实践,可以将“信”理解为准确、忠实地反映原文、原义;“达”要求译文能反映原文的内涵,晓畅通达;“雅”为译文的遣词造句得体,追求含蓄、典雅。
要准确翻译Epigenetics一词,首先要正确理解前缀“epi-”的含义,在陆谷逊主编的《英汉大词典》(第二版,上海译文出版社,2010)中有8种含义,其中医学生物学相关的含义主要有:(1)表示“在…上面”,如epiderm表皮;(2)表示“在…之外”,如epiblast外胚层;(3)表示“在…之后”,如epigenesis后成论,等等。在该词典的各种前缀“epi-”的含义中,无一有“表观”之含义,其他中英文词典亦如此。
其次是要准确地反映epigenetics的研究内涵,如前述,该学科是研究没有DNA序列变化的、可遗传的基因表达或表型改变;其表遗传机制和信息的贮存、改变和复制,以及作用平台都在基因组的表面;作为总体的、染色质修饰特异性组合的表遗传景观(表观),具有重要生物学和医学意义。这样在中文表述的表遗传学研究内涵中,含有的表达、表型、表面和表观4个关键词,“表”为这些词的共素,根据汉语共素缩合构词法,再结合“epi-”前缀的含义,如将epigenetics译成“表遗传学”,不仅忠实于中、英文原意,也符合中文构词法,而且可自然联想到它的定义、作用机制和理论实践意义,从而基本了解该学科的研究内涵。因此与表遗传学译名比较,表观遗传学的译名看来不够准确,也未能很好地反映epigenetics的研究内涵[54]。
4.2.2表观遗传学译名可能是误读
前缀“epi-”没有“表观”的含义,一般中文词典中也查不出“表观”一词,而表观遗传学译名出自有良好学养的作者,提示应有其依据。“表观”看来是一个缩合词,很自然联想到可能是表遗传景观一词的缩写。最近在整理表遗传景观文献时发现,在维基百科解释epigenetics词条时有这样一段话:“Epigenetics(asin“epigeneticlandscape”)gtonin1942”。括号中原意可理解为“如在表遗传景观”(该网有此词条),考虑到最早译成“表观遗传学”的《现代遗传学》一书出版于2001年,写作时间会更早些,当时国内对表遗传学研究内涵尚缺乏深入理解,或为区别于已有的“表遗传”[53]中文译名,而采用表观遗传学的译名。虽然我们不能断定,该作者就是因此段文字产生了这一中文译名,但还是很明显提示,表观遗传学中的“表观”很可能是“表遗传景观”的缩写。
“表观遗传学”中文译名是种“幸运”的误读,因为这一译名反映了该学科部分特征和研究内涵,因此在一定的行政和学术背景下,能为多数人接受;但毕竟是一种误读,又不能反映表遗传学的全部研究内涵;同时还应指出,表观遗传学的译名很难对epigeneticlandscapes(可试译成“表观遗传学景观”)给予通顺和符合英文原意和中文习惯的翻译,而该词在近年来的表遗传学文献中出现频率越来越大。因此,根据中外文翻译原则,表观遗传学译名的合理性值得商榷;同时应引起学术界和国家名词委的关注。