NASA
Special thanks to William Shatner for lending his voice to this project.
NASA
中国电子科技集团公司第二十一研究所
原慧芳 于慧敏
随着近期围棋人机大战的赛况播出,好多编程爱好者对于传统的计算机算法开始进一步的研究探索。要说的回溯算法是算法设计基本原理中最通用的技术之一,也是人工智能中问题求解的基本方法,如果要搜索一系列解,或者解决满足一定约束条件的最优解问题,可以应用回溯算法。在很多现实的问题中,合法的解可能要通过在一个大量的但有限的多种可能性中做穷尽的搜索才能获得,这样的问题称为组合问题。并且,有些组合问题,除了穷尽搜索外尚未找到其他的办法。所以,开发一种系统的、能减少搜索空间的搜索技术是有必要的,回溯的搜索技巧用在穷尽的搜索过程中,能避免搜索所有的可能情形。回溯算法普遍地适用于解决需要检测有限但却是大量的可能解的组合问题。对解决组合问题的回溯算法稍加修改,还可以用来解决组合优化问题:在所有的可能解中计算最优解。
回溯法是一种选优搜索法,按选优条件向前搜索,以达到目标,当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技术称为回溯法。
解空间的树结构称为状态空间树。树中的每一个节点定义一种问题状态。从根节点到其他节点的所有路径定义整个问题的状态空间,解状态是一些解状态 s,从根到 s 的路径定义解空间中的一个元组。答案状态是指那些解状态 s,从根节点到 s 的路径定义一个元组,且这个元组为问题的解集合(满足隐式约束)中的一个元素。
使用状态空间树,就可以系统地生成问题状态,决定其中的哪些状态是解状态,最终决定哪些解状态是答案状态的方式来解决问题。这种方式是从根节点开始,然后再生成其他的节点。节点已经生成,但是其子节点还未生成,这种节点称为活节点。对于一个活节点,当前它的子节点正在生成,称为可拓展节点,一个已经生成、不再扩展的节点,或者子节点都已经生成的节点称为死节点。界限函数用于删除活节点,无需生成它的所有子节点。界限函数必须设计的非常严密,使得在整个过程完成时,至少生成一个答案节点,如果问题本身需要寻找所有答案,就可以得到所有节点。带有限界函数的深度优先节点生成法也就是回溯法。
设 \( \left ( x_{1},x_{2},…x_{i} \right ) \) 为根节点到状态空间树中任一节点的路径。设 \( T \left ( x_{1},x_{2},…x_{i} \right ) \) 为xi+1的所有可能的值的集合,且满足 \( \left ( x_{1},x_{2},…x_{i+1} \right ) \) 也是到一个问题状态的路径。则\(T \left ( x_{1},x_{2},…x_{i+1} \right ) = \Phi \) ,假定限界函数 \(B_{i+1}\) (用谓词表示)存在,且满足从根节点到问题状态的路径的 \( \left ( x_{1},x_{2},…x_{i+1} \right ) \) 值为假,那么这个路径就无法拓展得到答案节点。因此,解向量 \( \left ( x_{1},x_{2},…x_{n} \right ) \) 的第 \( i+1 \) 个位置的后选值就是那些由生成且满足限界函数 \(B_{i+1}\) 的值。
解向量 \( \left ( x_{1},x_{2},…x_{n} \right ) \) 可以作为一个全局数组 \(x[1∶n]\)。逐个生成满足 \(B_{k}\) 的元组中的第 k 个位置处所有可能的元素,然后把它连接到当前向量 \( \left ( x_{1},x_{2},…x_{k-1} \right ) \) 中,每当连接一个 \(x_{k}\) 时,检查是否得到了解,然后对这个算法进行递归调用。当外层 for 循环退出 \(x_{k}\) 就不复存在,当前的 Backtrack 结束。在通过调用 Backtrack(1) 开始。
使用深度优先搜索逐个产生解向量的每一个位置的值,变量k不断增加,解向量也不断完善直到找到一个解或者 \(x_{k}\) 的取值都已尝试过,当 k 减小时,将继续生成还未尝试的第 k 个位置的可能元素。直到最后回溯退回 k 的值减为 0 退出循环。
经典的 N 皇后问题是指如何在一个 N*N 的棋盘上放置 N 个皇后使得任意两个皇后之间不能互相攻击,即他们不能处在同一行、同一列、同一对角线上。假设第 i 个皇后就是位于第 i 行上,可以用\( \left ( x_{1},x_{2},…x_{n} \right ) \) 表示一个解, \(x_{i}\) 表示第 i 个皇后所在的列号。则一个互不攻击的格局应该满足以下两个约束条件。N 皇后问题就转化为如何尽快求得所有合理布局的解。
\(x_{i} \neq x_{j} ; i \neq j \) (1)
\(x_{i}-x_{j} \neq \pm \left ( i-j \right ) ; i \neq j \) (2)
利用回溯算法求解 N 皇后问题,可以将该问题的解空间组织为树结构,然后以深度优先的方法搜索。以 4 皇后为例,假设初始的根节点为唯一的活节点,此节点为可拓展节点,路径为()。接着生成一个子节点,假设子节点按升序生成。因此生成图1中的编号为2的节点,路径为(1),也就是将第一个皇后放置于第一列上。节点2成为可拓展节点,生成节点3,发现冲突又删除,下一个生成的节点为节点8,路径为(1,3)。节点8又成为可拓展节点,通过检查发现它的所有的子节点组成棋盘布局不是一个合法的布局,因此也被删除。因此回溯到节点2,生成另外一个子节点13,路径为(1,4)。如此继续,图1给出了回溯算法解决 4 皇后的部分生成树。N皇后也类似。节点下面标的D表示在搜索的过程中删掉的节点,也就是不可能生成可能的解的节点。
回溯算法是一个既带有系统性又带有跳跃性的搜索算法,它在包含问题的所有解空间树中,按照树的先根遍历的搜索策略,从根节点出发搜索解空间树,搜索到解空间树的任一节点时,首先判断该节点是不是能够满足部分解的界限函数,如果不能满足,则跳过该节点为根的子树的搜索。逐层向其祖先节点回溯,否则进入其子节点继续搜索。在回溯法求解N皇后问题中,要回溯到根节点,且所有的子树都已经搜索完成才结束。因此搜索了全部的解空间,在搜索的过程中应用界限函数,也就是不能满足合理布局的约束条件,避免了无效解的搜索。
用非递归回溯算法实现N皇后问题,通过设计一个栈来保存的部分解,发现N皇后问题的空间复杂度(在 N<27 的情况下)是多项式的空间复杂度而不是指数的空间复杂度。
最坏情况下总的时间复杂度为 \(O\left ( n^{n+1}) \right )\) 。
对于任一合理布局的经过有限次顺时针旋转、逆时针旋转、水平旋转、垂直翻转及其复合所得的结果仍是一个合理的布局。
基于这条公理,对回溯算法进行改进以提高效率,对棋盘的翻转可以有垂直翻转、顺时针翻转、逆时针翻转、对直线 y=x 和 y=-x 做轴对称翻转,主要考虑顺时针旋转 90 度, 180 度和 270 度。
设 \(x=\left ( x_{1},x_{2},…x_{n} \right )\) 是一个合法解,则顺时针旋转 90 度得到 \(y=\left ( y_{1},y_{2},…y_{n} \right )\) 也是一个合法解。记为 \(y=TURN90 \left( x \right)\) ; x 经顺时针旋转 180 度得到 y 也是一个合法解,记为 \(y=TURN180 \left( x \right)\) ;经顺时针旋转 270 度得到也是合法解,记为 \(y=TURN270 \left( x \right)\) 。对于任何一个合法解的合理棋盘布局,顺时针旋转 360 度将仍是该解本身,因此对于任一合法解 x 满足以下关系。
\(x=TURN^{4}90\left ( x \right )=\) \(TURN^{2}180\left ( x \right )TURN90(TURN270\left ( x \right ))\)(3)
\(TURN90\left ( x \right )=TURN^{3}270\left ( x \right )=\) \(TURN180\left ( TURN270\left ( x \right ) \right )=\) \(TURN270\left ( TURN180\left ( x \right ) \right )\)(4)
\(TURN270\left ( x \right )=TURN^{3}90\left ( x \right )=(5)
由以上公式可以看出,旋转变换具有以上等效关系,因此,在考虑对任一个合理布局应用 3 个旋转变换函数时,每种变换只应用一次。只需要确定顺时针旋转 90 度、180 度、270 度之后的格局不是原来的格局,就可以对该合理格局进行旋转以产生新的格局。
对于可以进行顺时针旋转 90 度的格局,也就是该格局顺时针旋转 90 度后的格局不是其本身。如果一个合法格局的解用一维数组 \( A[1:n] \) 表示,即 \(x=A[1:n],xi=A[i]\) 。那么如果一个格局存在 \(x=TURN90(x)\) 关系的布局,满足关系为:
如果 \(A[1]=num\) ,则有\(A[N-num+1]=1\) (6)
对于可以进行顺时针旋转 180 度的格局,也就是该格局顺时针旋转 180 度后的格局不是其本身。如果一个合法格局的解用一维数组\(A[1:n]\)表示,即 \(x=A[1:n]\) , \(xi=A[i]\) 。那么如果一个格局存在 \(x=TURN180(x)\) 关系的布局,满足关系为:
如果 \(A[1]=num\) ,则有\(A[N]=N-num+1\) (7)
对于可以进行顺时针旋转 270 度的格局,也就是该格局顺时针旋转 270 度后的格局不是其本身。如果一个合法格局的解用一维数组 \(A[1:n]\) 表示,即 \(x=A[1:n],xi=A[i]\)。那么如果一个格局存在 \(x=TURN180(x)\) 关系的布局,满足关系为:
如果 \(A[1]=num\) ,则\(A[num]=N\) (8)
以5皇后为例,一个合理布局 x=(2,5,3,1,4),满足条件(6),其旋转 90 度之后仍是该布局,所以产生该布局后不可以对其做 90 度顺时针旋转,该布局也满足条件(7),旋转 180 度后仍是该布局,不做 180 度旋转,该布局同时也满足条件(8),不做 270 度顺时针旋转。
通过上述方法实现对回溯算法的修改,可以快速地生成 N 皇后的所有解。如果一个解满足条件(6),可以做 90 度顺时针旋转,返回两个解,如果同时满足条件(6)、(7),那么可以做 90 度顺时针旋转和 180 度顺时针旋转,返回 3 个解,如果同时满足条件(6)、(7)、(8)那么可以做 90 度顺时针、180 度顺时针、270 度顺时针旋转,得到 4 个解。
对改进的的 N 皇后求解,可以通过固定前3行皇后的位置,把问题分割成多个任务,将改进的回溯算法推广成并行算法,分配到不同的计算机与 CPU 上,可以实现并行求解 N 皇后的问题。通过实现程序的标准化,可以成为检验计算机集群性能的基准。N 皇后问题的解的个数随着 N 的增加呈指数增加,从 1 到 10 皇后的解的个数为:1,0,0,2,10,4,40,92,352,724。当 N=23 时,其可行解将超过 24 万亿。因此将 N 皇后问题实现并行化可以成为检验计算机集群性能的基准。
回溯算法作一种通用的问题求解的算法对求解很多问题是有效的,例如经典的三着色问题,即对一个无向图 \(G\leqslant V\) ,需对每一个顶点着 1,2,3 3 种颜色之一,使得任意两个相邻顶点颜色不同。对 n 个顶点的图,如果用穷尽法搜索,将要搜索各种可能,如果用回溯算法,则可以在最坏情况下缩减为 \(3+3^{2}+…3^{n}=3\left ( 3^{n}-1 \right )/2\) 种可能。对回溯算法修改也可以用来求解组合优化问题,即在所有的可行解中计算最优解。所以回溯算法适用于检测有限但是却大量的肯能解的组合问题。
中国科学院广州生物医药与健康研究院华南干细胞与再生医学研究所
李卓 吴景淳 裴端卿
自 DNA 双螺旋结构于 20 世纪 50 年代被克里克和沃森发现,相继研究导致“中心法则”的诞生, 生命科学就开始了空前的高速发展。每隔三五年便有重大发现问世,由此重塑了人们对生命的认知。在不足七十年的时间,这些发现和发明为人们探索生命奥秘点亮了无数里程碑式的灯塔,也极大丰富了人类的智慧。基因编辑就是这些无数灯塔之一, 或许是最耀眼的。人们试图用最原始的办法,例如育种来改变作物的形状,以提供更好的食物。但基于 CRISPR 的方法改变了游戏规则,使这一过程极简单又精准。就目前的进展来看,基于 CRISPR 的基因编辑高效精准、简单易用、成本低廉,产生了许多以前认为不可能的新应用,也让外科手术式的基因改造进入了可以普适性运用的年代。
在 CRISPR 发明之前,已经有 ZFN 技术可以用来做类似精准的基因编辑,但使用起来极其繁琐、昂贵。随后,TALEN 技术的发明改变了这一点, 使基因编辑变得简单和便利一些。但是,技术的快速发展与迭代使得 CRISPR 已成为生物学中自重组
DNA 诞生以来最具突破性的工具之一,因此引发了广泛的讨论,这些讨论已经并不局限于学术界, 更进入到了公众视野。人们对它产生了浓厚的兴趣, 开始议论它,并对它之于人类可能产生的影响进行了无限的畅想。这其中有对人类已经掌握了可以对自身及世界更深入理解的工具的欢喜与兴奋,也包含了这些技术可能被用于突破伦理道德底线的行为的恐惧。尤其是使用CRISPR/Cas9 操作人类胚胎的第一份报道发表后,更加深了各种情绪的碰撞, 引发了世界范围的关于该技术在编辑人类基因组中潜在的应用的争论。这些情绪最终化为了行动,促成了由中、美、英三国 4 家最高级学术团体组织,并于 2015 年 12 月举行的人类基因编辑国际峰会。峰会成功举行后,由 22 位专家组成的研究小组深入研究了解人类基因组编辑的科学、伦理和监管。由此产生的报告建议继续支持基础研究,通过基因组编辑的新颖应用来探索生物学的新视野,以产生先前无法实现的知识,例如早期人类胚胎发育。报告强调了体细胞基因组编辑作为一种治疗工具预先存在监管框架的重要性,同时承认在治疗 ( 维持或恢复特定的功能 ) 和改善 ( 超出个人最初预期的功能 ) 之间划清界限的困难。然而,超越了此前的类似的论述,报告为处理可遗传的基因组编辑提供了一种宽容而非常谨慎的态度。该报告得出结论认为,在有限的一系列令人信服的情况下,进行可遗传的编辑在道德上是可以理解的,并且是允许的。总体而言,这些准则是一套明确的原则,任何希望从事研究和临床应用的国家都应该采用这一原则。除此之外,报告还强烈建议社会各界参与相关政策的讨论,以及就什么是符合伦理道德但超出了一个国家公共政策的限制范围的问题达成具有共识性的一致。自报告公布以来,已经在科学和大众媒体上进行了广泛的讨论和引用。本文将简要讨论基因编辑的科学性、临床应用、伦理与监管。
基于其高度精准的特征,CRISPR 的运用从理论上讲,可以修正任何遗传疾病的病因 ——突变, 从而达到疾病治疗的效果。 其具体运用可以分为体细胞基因编辑和胚胎基因编辑,前者是不可遗传的, 后者如果能成功将会遗传给后代。Ma 等报道了在植入前人类胚胎中纠正了 MYBPC3 基因 ( 一种与显性肥厚型心肌病相关的基因之一 ) 中的四碱基 GAGT 缺失。与以前的报道不同,这项新研究不仅使用了二倍体人类胚胎,而且还宣称提高了效率、准确性和减少了嵌合,从而为这种方法的临床应用开辟了新的基础。通过胞质内注射将 Cas9 蛋白和精子引入 M 期卵母细胞中,他们宣称嵌合体大幅减少并获得更有效的同源定向修复。然而,作者提醒说,需要进行更多的研究来证明其对于其他类型突变 ( 例如碱基替换和更大片段的 DNA 删除、复制和回复 ) 的可重复性和普遍性。尽管他们的研究取得了成果,但这种方法仅适用于对杂合突变的校正,因为修复显然依赖于同源的野生型拷贝,即母体等位基因,而不是合成的 DNA 模板。另一方面, 根据动物研究和人类胚胎的初步报道,CRISPR/Cas9 直接注射到受精卵中时,很难避免嵌合现象。不是胚胎的每一个细胞都必然携带所需的遗传改变,而且可能会在目标位点引入其他种类的突变。显然,这一研究还处于非常早期的探索阶段,也备受领域同行质疑。
胚胎水平的基因编辑临床应用,最大的受益方便是潜在的遗传性罕见病患者。一个触目惊心的现实是罕见病并不罕见,我国是出生缺陷高发国家。据估计,我国每年有 90~100 万缺陷患儿出生,约占出生总人口的 5.6%,已严重影响我国出生人口素质和儿童健康水平。胚胎基因编辑是治疗严重遗传性疾病最有效、最直接、最根本的治疗策略。使用基因编辑技术对人类胚胎进行基因组精确操作, 不仅可以让带有严重遗传性疾病的高危个体顺利出生,使其自身终生摆脱该种遗传疾病,还可以将纠正后的正确基因序列传递给后代,让后代也尽可能地避免患上此种遗传病。与优生学目的不同,目前此类研究主要集中在诸如地中海贫血症、亨廷顿舞蹈症、镰刀型红细胞贫血症、血友病等对人类健康有重大威胁,并且尚无有效治疗方案的疾病。现在大的趋势是乐观的,在涉足基因治疗领域的制药公司、生物医药初创企业的研发投入上,除肿瘤癌症类外,遗传病获得了最多的研究资源和经费。
虽然人类基因组编辑报告中规定了严格的许可前置条件,但从技术上讲,目前显然还没有准备好对人类疾病进行可遗传基因编辑。当然为了达到有效和无风险的目标,必须通过严格的科学研究和技术开发来填补知识的空白。自该报告发布以来,脱靶效应和嵌合现象再次引起关注。鉴于人们对该系统的理解以及世界各地科学家的应用都取得了显著进展,前者应该在短期内可以得到解决。
另一方面,尽管人类胚胎的突变校正可能会继续占据媒体的头条,但人类胚胎的基因编辑也为理解早期人类发育提供了有价值的工具,正如报告中所预期的那样。英国和瑞典已经开展了这方面的工作 ( 如 NPR 和卫报的报道 )。生物学中最令人着迷的问题之一是受精卵如何形成构成人类的不同细胞类型。在小鼠和其他物种中进行的工作为胚胎发育和多能性起源提供了概念性框架。然而,小鼠和人类胚胎发育的分子细节上存在着显著的差异,这些差异也可能在它们衍生的干细胞中出现。更好地了解早期人类胚胎的遗传回路将有助于寻找真正的“naïve”人类多能干细胞。此外,人类胚胎的基因编辑可以帮助探索早期妊娠丢失和植入缺陷的遗传基础,特别是如果结合最近改进的人类囊胚培养方法。根据英国、美国和中国等国家的正式规则或非正式规范,科学家只允许培养人类胚胎至 14 d。即使在这样的条件下,基因编辑也可以提供对植入后发育早期阶段 ( 包括最早阶段 ) 事件的深入了解。然而,将该规则延伸至 14 d 以上将开辟人原肠胚形成、胚层形成和体外生殖细胞发育等方面的研究, 否则人类发育的各阶段是无法获得全面研究的。
2018 年 7 月,英国 Sanger 研究所的 Kosicki 等发表了他们使用第三代测序技术获得的最新研究结果,显示 sgRNA 作用的靶点附近会产生基因组大段的缺失。由于第三代测序技术读长更长,因此可以捕获到基因组的大段缺失以及染色体易位,而这类基因组事件的检测是第二代测序技术不能胜任的。他们的结果极大地增强了人们对于已有研究由于没有采取恰当的检测技术而得出了不恰当结论的怀疑。
正如人类基因编辑报告所预期的,无论目前已有研究的结论是否恰当,这些研究可能会在未来几年内在世界范围内引发进一步的深入探究,并激发研究人员针对具体的问题寻求恰当的检测方法。与通常的科学进展一致,目前已有一些建议提出对近几年中关键性的某些研究进行额外的实验,以证实或澄清观察结果及其背后的机制,并最终进一步促进对报告中列出的原则进行改进。
此外,CRISPR 系统来源于细菌,包括人在内的哺乳动物体内并没有 CRISPR 系统及相似蛋白的存在,但人体内却存在针对 Cas9 蛋白的免疫应答机制。因此,在确保向人体或人类胚胎中引入外源 CRISPR 系统有效的同时,又不引起机体的强烈免疫应答,这些都是需要解决的问题。而且,外源 CRISPR 是否会对细胞或组织器官造成基因组之外的影响仍然缺少研究,特别是 2018 年 CRISPR/Cas9 与 p53 基因互有促进及抑制的报道,也引发了广泛的讨论。
目前来看,并没有任何一种技术可以将所有sgRNA 靶点区域出现的事件清晰地描绘出来,而对于更高维度的细胞、组织,甚至个体本身的影响依然缺乏有效的评估。因此,基于现有技术的“鸡尾酒式”的检测,以及针对性的新技术开发,从而确立基因编辑安全性与有效性的“金标准”,在未来研究的日程表上显得尤其突出。
另一种提高安全性的策略是针对特定问题提出替代解决方案。单碱基编辑技术便属于此种情形。众所周知,大部分的致病性 DNA 异样为单碱基突变,而采用切割 DNA 双链纠正单碱基的策略,不但会导致纠正的效率不可控,而且位于被切割区域的染色体易位、碱基的丢失与插入、大片段 DNA 的丢失与插入等诸多意想不到事件的发生也是不可控的。而单碱基编辑策略的精妙之处在于,仅使用 Cas9 或 Cpf1 蛋白的定位功能 ( 或伴随使用 DNA 单链切割功能 ),将融合表达的碱基作用结构域引导到基因组特定的位点,并对该区域内的特定碱基进行突变。目前已经可以编辑的碱基包括 C>T 和A>G ,而采用将碱基作用结构域与具有更广泛识别 PAM 的 xCas9 或 SpCas9-NG 结合的策略, 更可以将可执行纠正操作的致病型单碱基突变扩大至数千个。单碱基编辑的策略极大地扩展了对致病型突变的干预能力,而且因其不会主动切断双链DNA 而具备较高的安全性,因此,这项技术在基因治疗领域引起了极大的乐观情绪。
目前在使用人类胚胎作为研究对象的国际规则和法规上存在着分歧,尽管在人类胚胎中进行体外基因组编辑可以帮助研究人员发现有关人类发育的宝贵知识。人类基因组编辑报告认为,可遗传的编辑是合乎道德的,但前提是必须符合严格的前置条件。这些前置条件包括在现有条件下没有合理的替代方案来预防严重的发育、生理缺陷,且存在强有力的监管力量以监督实施方案设计、执行以及长期的后续行动。
在衡量一项可遗传编辑的应用时,应当采纳适当的原则在风险与收益方面进行合适的评估。因此, 即使某项可遗传的人类基因编辑在特定管辖区域内获得了许可并合法开展,也希望该区域的监管部门在批准之前采用这些准则。现在的问题是,监管机构是否准备好接受这样的申请、审查及批准。因为, 即使在某些情况下可遗传的编辑是合乎伦理的,但这是否是一项基本权利似乎是不明确的。
就像所有的新科学一样,公众对人类基因组编辑前景的期望和焦虑程度都很高。人们对优生学的恐惧和对“扮演上帝”的担忧加剧了这些反应,这在所有社会中都具有深刻的宗教、文化和历史根源。应该听取和考虑这些合理的关切,并且必须进行公开讨论。
与此同时,正在进行的国际讨论应该审视各司法管辖区不断发展的监管框架,以期在科学发展的过程中保持一些共同的原则。合作开发合适的公共讨论的参与方式,以帮助在可接受的基因编辑的伦理界限上作出决策,以此为主要目标,使社会、文化和政治价值观的跨国多样性成为一种推动力,而不是成为达成进一步共识的障碍。此外,国际协议应该在这一重要领域促进开放科学,并解决与国籍、知识产权和商业利益有关的任何障碍。
国际峰会组织者呼吁建立一个持续的国际论坛,继续讨论基因编辑的人类临床应用。跨国合作也是美国国家科学院报告建议的七项原则之一。需要高层次和持久的合作,以解决报告中确认的关键问题。例如,在可遗传基因编辑被考虑进行临床试验之前,国际合作可以通过使用人类和非人灵长类动物模型帮助解决安全性和有效性的问题。不同的国家有不同的机会获取人类或非人灵长类胚胎,这取决于当地的监管和成本问题。因此,一项精心设计和拟订的合作协议将使工作能够在法律允许的情况下进行,在财务上可行,在后勤上可管理,并且能够汇集最终的知识,以评估安全性和有效性,以及形成满足各个国家监管机构要求的证据。
人类基础生物学的跨国合作可能是最紧迫的问题。正如报告中指出的,人类胚胎的编辑代表了一个更好地了解早期人类发育的独特机会。虽然现在已经有几个实验室已经开始或计划开始研究人类胚胎编辑的方法,但仍需要协调一致的努力。首先, 个别研究者能否获得足够的资金来完成所需的所有工作尚不清楚。其次,鉴于人类胚胎作为研究材料的政策分歧,特别是专门为研究而创造的胚胎,许多合格的科学家可能不被允许从事这方面的研究。第三,人类卵母细胞和胚胎是稀缺的,许多研究人员可能无法获得。最后,几个实验室可能正在研究相同或非常相似的问题,这可能导致不必要的重复, 浪费宝贵的资源,造成不健康的竞争。一个国际合作机构,例如一个大学联合体或科研联盟,可允许共同处理一些有趣的问题,并且可以生成、分析和共享数据。关键的是,一个联合体将能够制定详细的指导方针,使科学界能够在各自的国家中遵循和实施。一个高效合作的联盟将能够专注于 4 个目标: 利用特定调控网络标注的细胞谱系生成一个完整的早期人类胚胎发育地图 ;从受精卵到原肠胚生成一个详细的单细胞人类细胞图谱 ( 基因表达、染色质结构等 ) ;建立与特定发育或临床异常相关的人类基因组变异的相关数据库 ;并为子孙后代创造一个强大的工具和资源平台,以从遗传学和表观遗传学角度来理解人类发展。在这些资源可用的国家,这些研究应该与非人灵长类胚胎的研究相辅相成,扩充灵长类细胞生物学和发育的知识基础。
人类基因组编辑工作进展迅速,在第一届峰会成功召开之后,有大量学术研究论文发表,人类基因编辑在各方面所呈现出的问题均需要与时俱进的讨论,因此,第二届人类基因编辑国际峰会顺势而生。第二届国际峰会定于 2018 年 11 月于香港召开, 本次峰会将继续讨论医学应用的相关问题,以及针对基因编辑技术本身的学术讨论,并将就第一届峰会后发表的最新研究进展进行详尽的探讨。
基因编辑技术为人类健康带来了全新的图景, 但与此同时,也必须认识到这项技术能为生物学的基本理解带来巨大机遇,特别是早期人类胚胎的发育。我们由衷地期望通过利用峰会发布的原则和建议,设计并建立一个包括全球主要利益相关者的国际合作环境与机制,从而使基因组编辑可以在医学和生物学上透明、高效,以及具有人文关怀地实现最大效能,以此服务人类社会。
哈尔滨医科大学组织学与胚胎学教研室
王巍巍 邓德剑 李秋明 张喜梅
自噬是发生在所有真核细胞内的一种溶酶体依赖性降解途径。在此过程中,进行配合的蛋白质复合物被有序地引入到吞噬组装位点,导致自噬体的双膜囊泡伸长和闭合,最终使得细胞质成分被运送至溶酶体内进行降解。游离脂肪酸、核苷酸、氨基酸和一些在自噬溶酶体内降解所产生的小分子物质可被再利用,从而维持真核细胞内环境的稳定性。肥胖是一种慢性代谢性疾病,主要表现为体内脂肪过多而且分布不均。脂肪组织是机体能量代谢的核心,当体内能量代谢处于正平衡时,将导致脂肪组织过度积累,造成脂肪组织的功能和分布异常,引发许多与肥胖有关的代谢疾病。伴随着肥胖发生,在趋化因子、炎性细胞因子和脂肪因子的驱动下,免疫细胞渗入脂肪组织,导致脂肪组织中慢性炎症的发生和发展。而细胞自噬也是一个高度被调节的过程,受游离脂肪酸、营养、激素、炎性因子等多种因素调节。因此,细胞自噬功能失调将会在各种疾病的病理生理过程中扮演重要的角色。本文将概述细胞自噬的发生过程及其分子机制,并详细介绍自噬与肥胖时脂肪组织炎症之间的调节关系。
“ 自噬” 的概念由比利时科学家Christia deDuve 于1963 年提出,是指将一些受损失能的细胞器、错误折叠的大分子胞质物质经双层囊泡包裹,运送至溶酶体进行降解、循环利用的过程。根据包裹物及运输方式的不同,可将细胞自噬大致分为巨自噬(macroautophagy)、小自噬(microautophagy) 和分子伴侣介导参与的自噬(chaperone-mediated autophagy,CMA)。巨自噬是指通过形成双层膜自噬体来隔离需要降解的胞质物质,并将其转运至溶酶体中进行降解。巨自噬是研究最透彻、最经典的一种自噬方式,本文涉及的“自噬”均指巨自噬。自噬是一系列连续变化过程,包括自噬泡膜集结、自噬泡膜延伸、自噬体形成,以及自噬溶酶体形成和降解等阶段。
Yoshinori Ohsumi 教授发现了自噬的分子机制,并于2016 年获得诺贝尔生理学或医学奖。自噬途径高度保守,受自噬相关基因(autophagy-relatedgene, Atg) 的调控;自噬同时受到营养物和生长因子敏感信号转导通路的调节,包括雷帕霉素靶蛋白(mammalian target of rapamycin, mTOR) 和5′- 磷酸腺苷激活的蛋白激酶(5’-adenosine monophosphate(AMP) – activated protein kinase, AMPK) 信号转导通路。在细胞营养不足或饥饿的状态下,mTOR的活性受到抑制,进而诱导自噬的发生。AMPK 是一种保守的、多功能的丝/ 苏氨酸蛋白激酶,可在能量发生变化、缺血缺氧、氧化应激以及营养物质匮乏等情况下被激活,进而抑制mTOR,然后激活UNC51 样激酶1/2 (Unc51-like kinase1/2, ULK1/2)复合物,启动自噬。哺乳动物中磷脂酰肌醇-3-激酶(vacuolar protein sorting 34, VPS34)、Ⅲ类磷脂酰肌醇-3- 激酶(a class Ⅲ phosphatidylinositol-3-kinase,PI3KC Ⅲ ) 可与Beclin1(Atg6) 相互作用,从而参与自噬囊泡形成,并通过Beclin1 复合物生成磷脂酰肌醇-3- 磷酸(phosphatidylinositol-3-phosphate, PI3P)来调节自噬体形成。最近的研究已经阐明了ULK1/2 与Beclin1 复合物之间的功能联系。饥饿或mTOR 被抑制可激活ULK1,从而磷酸化Beclin1的Ser14 位点,增强PI3KC Ⅲ的活性,最终引发自噬。自噬体的进一步延伸受到两种泛素样共轭系统的控制:Atg5-Atg12 共轭系统和Atg8 共轭系统。在哺乳动物中,微管相关蛋白-1 轻链3 (microtubuleassociatedprotein-1 light chain 3, LC3) 是酵母自噬相关基因Atg8 的同源体,LC3/Atg8 的C 端被Atg4蛋白酶酶切后生成LC3 Ⅰ,LC3 Ⅰ与磷脂酰乙醇胺以泛素样反应的方式连接后转化为LC3 Ⅱ,LC3 Ⅱ可插入到延伸的自噬前体膜中。
自噬在调节细胞功能方面发挥着多种不同的作用,包括炎症调节以及先天和适应性免疫调节,如淋巴细胞增生、抗原呈递、抗体产生和细菌清除等。越来越多的证据表明,自噬可以影响人类疾病包括癌症、神经变性疾病、肺病、肝病、肾病以及心血管系统疾病等的发病。目前的研究正集中于探索自噬在代谢性疾病( 如糖尿病、胰岛素抵抗和肥胖) 的发病机制中所起到的作用。
脂肪组织已被认为是内分泌器官和能量储库,可调节代谢稳态。脂肪组织的发育和功能维持依赖于脂肪细胞的分化,其中自噬起着重要的作用。已有研究表明,自噬缺陷能够抑制脂肪细胞分化,损害脂肪组织的发育,使脂肪因子分泌失调,甚至在幼小动物中引起猝死。
肥胖的主要特点是脂肪组织的扩展,主要体现在脂肪细胞数量和( 或) 大小的增加。当机体能量的摄入量超过消耗量时,过剩的能量便以甘油三酯的形式储存于脂肪细胞中。在肥胖状态下,脂肪细胞的自噬活动将不可避免地发生改变。2011 年,Kovsan 等 发现,BMI 为32 kg/m2 的肥胖成年人脂肪细胞中,LC3 Ⅱ的蛋白表达水平显著高于BMI为22 kg/m2 的健康成人,且LC3 Ⅱ的蛋白表达水平与BMI 指数呈正相关;同时,肥胖者内脏脂肪细胞中LC3 Ⅱ、Atg5 和P62 的蛋白表达水平均高于皮下脂肪细胞。提示肥胖者脂肪细胞中的自噬活动处于活跃状态,并且在自噬的活化程度上存在脂肪库差异性。由于P62 可以被自噬专一性降解,因此可用来反映自噬流的情况。使用自噬抑制剂巴弗洛霉素A1 和亮抑酶肽处理脂肪组织后,P62 蛋白在脂肪组织中的表达增加。肥胖者内脏脂肪组织中Atg5、LC3 Ⅰ和LC3 Ⅱ mRNA 的表达水平高于偏瘦体重组,而且Atg5 mRNA 水平和BMI 呈正相关。2015 年,Kosacka 等 的研究也得到了相似的结果:通过透射电子显微镜检测发现,在肥胖者皮下和内脏脂肪组织中的脂肪细胞内有大量的自噬体,而偏瘦体重个体中未检测到;同时,通过免疫荧光检测发现,肥胖者皮下和内脏脂肪库中自噬标记物LC3 信号高于偏瘦体重组,并且自噬相关蛋白Atg5/12 复合体的表达水平分别高于偏瘦体重组2 倍和4 倍。2018 年,Kosacka 等 通过蛋白质印迹分析发现,肥胖的WOKW 大鼠的内脏和皮下脂肪细胞中自噬标记物Atg5/12 和LC3 Ⅱ蛋白表达水平增加,同时内脏脂肪细胞mTOR 蛋白表达明显下降。以上结果表明:肥胖者脂肪细胞中的自噬活动明显增强,且在内脏脂肪细胞中显著高于皮下脂肪细胞。
然而,2012 年,Yoshizaki 等 报道,在正常饮食小鼠的脂肪组织中检测到GFP-LC3 为散点状分布,而高脂饮食小鼠的脂肪组织中未检测到GFP-LC3 信号。由于自噬抑制剂氯喹可抑制自噬体与溶酶体融合,从而导致自噬体内外膜上的LC3 降解被抑制,因此,当给小鼠注射氯喹后,正常饮食小鼠的脂肪组织中GFP-LC3 信号增加;然而,高脂饮食小鼠脂肪细胞的胞质中仅检测到GFP-LC3信号微弱表达,表明肥胖时自噬被抑制。与此同时,Yoshizaki 等 在离体培养肥大的3T3-L1 脂肪细胞时发现,溶酶体相关膜蛋白(lysosomal-associatedmembrane proteins, LAMPs) 中LAMP1、LAMP2 以及Atg5 等自噬相关基因表达减少,提示在肥胖状态下脂肪细胞自噬活动受到抑制。
形成以上不同实验结果的主要原因可能是与实验研究对象的种属来源不同有关;其次,有可能是评价肥胖的标准不一致,肥胖程度的不同对胞内自噬的影响可能也不同。就目前已有的研究来看,更多的结果倾向于在肥胖脂肪组织中自噬活动是增强的。
肥胖的特征之一是低度的慢性炎症。正常状态下,脂肪细胞中的甘油三酯能够被分解成脂肪酸和甘油。而在肥胖状态下,脂肪分解活动增强,过量的脂肪酸聚集在胰岛素敏感组织中,并破坏胰岛素的功能,导致胰岛素抵抗;在改变脂肪组织分泌特征的同时,脂肪细胞合成和分泌大量细胞因子和趋化因子,如瘦素、脂联素和内脂素 ;同时,脂肪组织中浸润的炎性细胞释放肿瘤坏死因子-α(tumor necrosis factor-alpha, TNF-α)、白细胞介素-6(interleukin-6, IL-6)、单核细胞趋化蛋白1 (monocytechemoattractant protein 1, MCP-1) 和IL-1 等细胞因子。所有的这些分子作用于局部和全身性的免疫细胞,促进了炎症的发生。白色脂肪组织是肥胖相关炎症发生的主要部位。另有文献报道,前脂肪细胞在衰老过程中功能的变化将会破坏脂肪组织的正常生理活动,包括成脂能力降低、脂毒性敏感性增加、促炎细胞因子和趋化因子分泌增加等,最终发展为脂肪组织慢性炎症。另外,脂肪组织衰老时内质网应激反应增强能够加剧炎症反应,并且脂肪组织中自噬功能受损亦可导致内质网应激增强和炎症反应的发生。
最近的研究表明,肥胖者脂肪组织中炎性因子的产生是由自噬介导和调节的。目前所报道的关于肥胖状态下脂肪细胞中自噬活性变化的研究结果并不一致。有文献报道,自噬活动增强可以抑制炎性因子分泌。自噬活性在肥胖者的脂肪组织中上调,肥胖个体皮下脂肪组织中自噬标记物LC3 的蛋白表达水平高于偏瘦体重组,并且与胰岛素抵抗程度和脂肪组织炎症水平呈正相关。用自噬抑制剂3- 甲基腺嘌呤(3-methyladenine, 3-MA) 处理离体培养的人和小鼠脂肪组织,可以观察到IL-1β、IL-6 和IL-8 mRNA 表达水平和蛋白质分泌水平显著增高。在肥胖个体中,抑制自噬可导致IL-1β、IL-6 和角质细胞趋化因子(keratinocyte-derivedchemoattractant, KC) 的表达水平显著增高。在过度生长综合征患者的脂肪细胞中,应用siRNA 靶向干扰Atg7 从而抑制自噬,可以观察到以上相似的结果。在肥胖者的脂肪组织中,可通过激活钙蛋白酶或mTOR 抑制AMPK 的活性,从而抑制自噬通量,引起IL-1β 和IL-18 蛋白表达水平增高,最终导致炎症。以上结果表明,肥胖个体的脂肪组织中自噬活动增强,而自噬可起到抑制炎症基因表达的作用,从而控制脂肪组织炎症。目前对于自噬能抑制脂肪组织炎症基因表达的相关机制还不明确,其中有一种可能的机制为:脂肪细胞内自噬活动增强,IL-1 前体降解增多,从而导致IL-1 蛋白分泌水平下降。然而另有研究表明,自噬活动增强可以促进炎性因子分泌。Kosacka 等 研究发现,在肥胖者的脂肪组织中,自噬活动增强,引起促炎细胞因子表达增多。与偏瘦体重组相比,肥胖者的皮下脂肪组织和内脏脂肪组织中TNF-α 和IL-6蛋白表达水平增加,IL-10 蛋白表达水平降低,且内脏脂肪组织中的炎性蛋白表达变化更明显。该结果表明,肥胖时自噬活性与脂肪组织中炎性基因的表达呈正相关。Kosacka 等 还发现,自噬活动在肥胖的WOKW 大鼠内脏脂肪细胞中明显增强,且MCP-1 和TNF-α 蛋白表达水平增加,而脂联素蛋白表达水平降低。通过使用LY294002 抑制PI3K信号转导通路来抑制自噬活性后,肥胖的WOKW大鼠内脏脂肪细胞中MCP-1 和TNF-α 蛋白表达水平显著降低,而脂联素蛋白表达水平增加。由此可见,自噬既可以介导抗炎信号激活,又可以介导促炎信号激活。
自噬对炎症发挥调节作用的同时,炎症反过来也会调节自噬的活性。肥胖时NLRP3 (NOD-, LRRandpyrin domain-containing 3) 炎性体的表达水平升高,构成了肥胖相关炎症的主要决定因素之一。虽然自噬可以调控NLRP3 的表达水平,但有证据表明,NLRP3 可作为mTOR 的结合伴侣,两者相互作用可以抑制自噬活动,且有文献报道称NLR家族成员可能与Beclin1 联合负性调节自噬。NLRP4 与VPS 复合物之间的相互作用可阻断自噬体与溶酶体融合形成自噬溶酶体,从而抑制自噬。由此可见,自噬与炎症是双向调节的。
细胞自噬作为保守的亚细胞过程,可促进能源物质循环利用,保护细胞免受损害,在组织稳态调节过程中起着复杂而重要的作用。自噬通过调节脂肪细胞的数量和( 或) 大小来调节肥胖以及脂肪组织的炎症。而对脂肪组织而言,肥胖的过程也是脂肪细胞自噬发生改变的过程。目前肥胖状态下有关脂肪细胞自噬的研究结论不一致,而本课题组的研究正集中于脂肪细胞中氧化应激产物对自噬活性的影响,以及其与炎性因子表达之间的关系。研究发现,自噬、肥胖与炎症三者之间相互影响,通过特定信号通路相互调控,在一定范围内保持平衡状态;一旦平衡被打乱,就可能导致各种各样疾病的发生,如代谢紊乱综合征、高脂血症、糖尿病和心血管疾病等。因此,自噬调控可能会成为肥胖相关疾病中新的治疗策略,但相关作用机制仍需进一步研究。