我应该爱生物学

2020-11-21 12:09:24

我本应该热爱生物学,但是我发现它是对名字的无生命的背诵:高尔基体和克雷布斯循环;有丝分裂,减数分裂DNA,RNA,mRNA,tRNA。

在教科书中,令人惊讶的事实没有引起惊讶。可能有人告诉我,我体内的每个细胞都具有相同的DNA。但是没有人摇我的肩膀,说那是多么疯狂。我需要在《水母和蜗牛》中写道的刘易斯·托马斯:

对于真正的惊奇,如果您希望感到惊奇,就是这个过程。您从一个由精子和卵子结合产生的细胞开始。它分为两个,然后四个,然后八个,依此类推,在某个阶段出现了一个单细胞,该单细胞的全部后代都是人脑。这样一个细胞的存在应该是地球的一大惊奇。人们应该整天走来走去,整个清醒时光都在无休止地彼此呼唤,除了那个牢房外,什么也没说。

我希望我的高中生物学老师问班上一个胚胎如何分化-然后停下来让我们真正考虑一下。整个主题都在该问题的答案中。胚胎液中的化学梯度足以发出信号,从而稍微改变某些细胞(而非其他细胞)的基因表达程序。现在胚胎从“向下”知道“向上”;一端的细胞开始产生不同于另一端的细胞的蛋白质,这些蛋白质又释放出更精细的化学信号。 ...;很快,您将拥有脑细胞和足细胞。

我们怎么迷恋于进化枝和王国,却没有谈论这些?直到上大学,当我读道格拉斯·霍夫施塔特(Douglas Hofstadter)的埃德尔·巴赫(Gerdel)时,我才将单元格理解为递归自我修改程序。仅此一种语言就令人回味。这表明胚胎-产生RNA的DNA,产生RNA的蛋白质,调节DNA转录为RNA的蛋白质-就像一个小的Lisp程序,其中的宏生成宏,获取宏,源代码中包含了生命所需的所有指令。在地球上。还能想象出更多有趣的事情吗?

想象一下,一艘浮华的飞船降落在您的后院。门将打开,并且邀请您调查所有内容,以了解可以学习的知识。这项技术显然超出了我们的制造能力数百万年。

在生物学课上,生物学并不是作为对生命秘密的追求。教科书把要求搞错了。我们对真正的生物学家,他们所遇到的真正问题,他们为回答他们所做的实际实验都不熟悉。我们只是得到他们的结论。

例如,我从没听说过一个名叫Oswald Avery的人在1940年代对两种链球菌细菌的文化感到困惑。在盘中生长时,质地粗糙。另一个很光滑,闪闪发光。艾利(Avery)注意到,当他将平滑应变与粗糙应变混合时,之后的每一代也都是平滑的。一道菜的遗传。是什么使它起作用?实际上,这是有史以来最激动人心的谜团之一。

大多数专家认为蛋白质在某种程度上是负责任的,性状是通过不同浓度的化学物质被严格编码的。艾利怀疑核酸的作用。因此,他做了一个实验,我们可以在学校的长凳上进行复制。他只用离心机,水,去污剂和酸,就从光滑的链球菌培养物中纯化了核酸。用酒精沉淀,变得纤维状。他在粗糙的文化中加入了一点点,然后,这种文化在随后的几代人中变得很光滑。因此,这种纤维状的东西就是“改变原理”-遗传的长期追求者。艾利(Avery)的实验掀起了疯狂的工作,十年后,直到发现双螺旋结构才结束。

保罗·洛克哈特(Paul Lockhart)在他的《数学家的哀叹》中描述了学校如何通过抢劫我们的问题来降低数学的价格。我们不仅被问到,嘿,三角形占据了多少个盒子?

这是我们可能会喜欢的一个难题。(如果从三角形的顶部放下垂直线,则最终将两个矩形切成两半;您会发现三角形内部的面积等于外部的面积。)相反,我们被告知,如果您发现自己想要一个三角形的区域,请执行以下步骤:

生物学就是这样,但更糟糕的是,因为它是一门杂乱的话题。事实似乎更加武断。我们被告知要先将“脂质双层”与“内质网”区分开来,但首先不了解为什么我们要关心这两个方面。

最好以薄而深的切片接近巨大的物体。我是在第一次学习编程时发现的。这些教科书从未奏效。当我开始为自己做一些小项目时,这一切才开始被点击。该项目不仅是动机,而且是组织原则,是我整理过程中捡起的随机铁屑的磁铁。我很想了解一些抽象概念,例如“记忆化”,因为我需要它来解决问题。根据我的示例,这些概念将失去其抽象性。

生物学没有什么不同。学习始于问题。胚胎如何分化?为什么我的眼睛发蓝?仓鼠如何将奶酪变成肌肉?为什么冠状病毒使某些人比其他人病重?

几个月前,我开始发行杂志,回答有关SARS-CoV-2和免疫系统的一些问题。我遇到了这样的段落:

在低MOI感染(MOI,0.2)中,ACE2的外源表达使SARS-CoV-2能够复制并占总读数的〜54%,从而在〜30-kb的基因组上覆盖了300倍的覆盖率(图1A和1B) 。 Western印迹分析证实了这些RNA-seq数据。值得注意的是,尽管病毒载量急剧增加,但我们并未观察到TBK1的活化,负责IFN-I和IFN-III表达的激酶,也未观察到STAT1和MX1的诱导, IFN-I刺激的基因(图S1A; Sharma等,2003)…

无需咨询维基百科就很难通过句子。特别是在免疫学中,命名法是广泛的。一句话可能是指“白细胞”,其次是单核细胞,其次是淋巴细胞。有很多正方形和矩形的情况:所有白介素都是细胞因子,但不是所有的细胞因子都是白介素?

我从未遇到过如此复杂的分形问题。它让我想起了这种计算方式。一天的编程可能涉及构建精心设计的正则表达式,调查文件描述符泄漏,调试您刚编写的应用程序中的竞争条件,以及通过模块接口进行思考。您所看到的任何地方(编译器,外壳,CPU,DOM)都是隐藏工作寿命的抽象。生物学就是这样,而且要糟糕得多,因为生命系统不是故意设计的。这都是全球可变国家的一大笔钱。通过上调该物件的速度,同时降低该物件的阻遏物的启动子来实现控制。您认为您知道某事是如何工作的,例如当我以为我掌握了中性粒细胞(先天免疫系统中的重要一线参与者)时,才知道它具有多种味道,并且还在发现中,他们中的一些人似乎做的与您以为自己知道的相反。生物学中的一切都是这样。这是规则的所有例外。

但是生物学就像计算一样,有一个底,而底不是抽象的。它是物理的。形状相互碰撞。实际上,二十世纪分子生物学的巨大启示是结构与功能的结合。形成成对的螺旋的非周期性晶体是遗传的天然存储,因为它具有卷曲,展开和与补体自身结合的能力。血红蛋白是在晶体学上进行详细研究的第一个蛋白质,它被证明是一种有效的能量储存方式,因为氧原子像乐高积木一样迅速地进入体内,每个氧合都使剩余的缝隙变宽,因此实际上使它充满了一大口。大多数蛋白质都是这样的。那些驱动运动的驱动器像小电动机一样扭曲。收缩肌肉的人会互相攀爬和压缩。细胞也不断地进行对话,它们所讲的语言是有形的。它的钥匙进入了锁定状态:一种蛋白质可能横跨在细胞膜上,而当一种细胞因子(一种信号分子)与它对接时,它就会改变其形状,从而使其在膜内侧的其他分子上的抓紧力放松,就像在摸索橄榄球一样-橄榄球本身可能是向核运动的信号。

我认为我对生物学的理解在高中时就太小了。我知道DNA→RNA→蛋白,这就是所谓的“基因表达”,但是我对基本知识感到困惑,例如基因实际上是如何“打开”的?一旦启动,它们就永久存在了吗?身体思考时会更清楚。哺乳动物的DNA并不是一个长双螺旋。它紧紧地盘绕着,就像这样,围绕着称为组蛋白的小环状蛋白质:

所得纤维的结构对基因表达有影响。这是因为将DNA转录为RNA的小分子机器实际上必须沿着螺旋运动,并且只能沿着螺旋的某些部分运动,即那些不会卷曲的部分。 “表达”基因只是意味着在给定的时刻,机器正在访问DNA的特定部分,从而产生大量的RNA转录物,从而产生了该基因编码的大量蛋白质。稍微扭动一下纤维,您就可以改变机器的外观,从而改变其产生的蛋白质的分布。您已经“重新编程”了单元格。 (控制基因表达的方法有很多,也许最常见的是“阻遏物”停在DNA的某处,物理上阻止了转录机制。)

现代生物学中的一种主力技术,称为RNA测序,或简称为RNA-seq,用于获取冷冻细胞并计算其中的RNA转录本。实际上,您可以获得当时所有表达的蛋白质的快照。结果实际上是一张大表,将基因映射到转录本计数。您会看到,一种细胞与另一种细胞相比,或者处于一种细胞的情绪与另一种细胞相比,例如在健康与疾病中,只是在这张桌子上分布不同而已。 RNA-seq结果通常表示为高维空间中的向量,表中的计数构成坐标;细胞在自我调节并适应其环境时会穿过该表达空间。

您如何发展对生物学的物理理解?我喜欢图片。我最喜欢的一本书是David Goodsell写的《生命的机械》。到处都是漂亮的手绘插图。这里显示了细菌的鞭毛运动,然后放大了插图,第三张图片突出了其功能要素:

这本书之所以起作用,是因为它基本上是对分子生物学的重新介绍,其前提是:细胞是一个非常快速且拥挤的地方,到处都是小机器,其中大多数是蛋白质,您可以通过仔细观察来了解。它通过像上面这样的插图以不同的比例关联事物来完成特别出色的工作。 “想像一下您的房间里装满了米粒。这将使您了解组成指尖的数十亿个细胞。”

写作非常好。它以某种方式使您想象这些机器的运动。在考虑蜂窝世界时,将我们的自身微型化是很诱人的;但在细胞尺度上,行为却很奇怪。运动本质上是通过随机扩散。 “生物分子的运动和相互作用完全被周围的水分子所支配……在细胞内部,[a]蛋白被水分子从四面八方殴打。它总是以很高的速度来回弹跳,但要到达任何地方都需要很长时间。”

事实证明,随机扩散是长距离旅行的一种令人难以置信的缓慢方式,但是却是短距离探索的一种令人难以置信的快速方式。在细胞内成为蛋白质就像在一个拥挤的家庭聚会上,穿越房间可能要花一个小时,但是到了那时候,您已经撞到了每个人60万次。

威廉·科恩(William W. Cohen)撰写的另一本我的最喜欢的书《计算机科学家的细胞生物学指南》很好地阐明了这一点:

靠近细胞器的分子往往会保持一段时间,然后多次撞击它。图20给出了一些直觉,说明了为什么如此。

这样的结果是,如果蛋白p的受体甚至覆盖了细胞器表面的一小部分,则细胞器在识别p方面将出奇地有效。例如,如果典型真核细胞表面仅0.02%具有p受体,则该细胞的效率大约是整个表面都被p受体覆盖的一半。

这种事实立即阐明了生物学如何可能起作用。科恩写道:“因此,像细胞大小的物体具有'高带宽'。” “即使它们被膜所包围,它们也可以识别或吸收数百种不同的化学信号。”

科恩的书被推销为试图提炼他在获得生物学的“阅读知识”时所学的知识,足以跟上《细胞》中的一篇论文。他非常善于解释方法:生物学家如何知道他们所知道的?对于计算机科学家来说,生物学家的方法似乎很疯狂。麻烦来自于这样一个事实,即单元太小,太多,太复杂而无法像逐步调试器那样分析程序员的方式。生物学家最常做的事情是:

使用凝胶和磁铁将大小不同的东西分开。 (“凝胶电泳”。)

取其中一种凝胶,并用专用纸将其吸干以张开部件。然后用与特定蛋白质结合的抗体洗涤纸。最后,用与第一个结合的另一种抗体清洗纸,并在发荧光时发荧光。看到元抗体在哪里发光,这就是您要寻找的蛋白质。 (我认为我是在描述“西方印迹”。)

使用荧光抗体技巧来标记表达一种或多种目标蛋白质的细胞。然后通过一根很小的管子挤压细胞,一次只能容纳一个。当每个细胞通过时,用激光照射它以读取其荧光标签,并使用电荷将其重定向到特定的容器。现在,您可以对符合条件的单元格进行排序和计数。 (“流式细胞仪”。)

基因改变微生物以使分子机器符合规范;有系统地一次关闭一个细胞系中的一个基因,看看有什么变化;编辑整个动物的基因组,并观察其生命。

科恩发现,而且我也知道,在尝试获得生物学的阅读知识时,研究这些方法比任何单个事实几乎有用。这是因为这些方法在整个研究过程中都是高度保守的。每个人都做蛋​​白质印迹。每个人都进行流式细胞仪和RNA测序。您会在每篇论文中看到这些东西。 (或相同主题的变体:分离,排序,选择,基因操作。)

这就是基础。或几乎是:我最后留下了我最喜欢的所有资源,一本令人难以置信的书,名叫霍勒斯·弗里兰德·贾德森(Horace Freeland Judson),名为《第八天的创造:生物学革命的创造者》。本书的某些部分于1970年代在《纽约客》上连载。它是生物学的力量经纪人,是一项超凡脱俗的杰作。这不仅是全面的,贾德森还与弗朗西斯·克里克(Francis Crick),雅克·莫诺德(Jacques Monod)和弗朗索瓦·雅各布(FrançoisJacob)及其朋友,配偶和同事进行了数百次对话。他读了每篇论文,读了他们所有的来信,但科学地做到了。贾德森总是只描述真实的事物。

他强调错误的转弯。例如,在发现tRNA(将三联体RNA碱基与它们编码的氨基酸相连的衔接子分子)之前,存在很多混乱。人们普遍认为,必须有某种标点符号,因为别人又怎么会知道从哪里开始抄写,或者如何从一个密码子中划出一个密码子呢?某些心智模型根深蒂固:一种流行的理论是,RNA为不同的氨基酸形成了特殊形状的口袋。这个想法是,如果放大每个三重奏或四重奏或其他任何东西(该方案当时是未知的),它将始终形成只有一种氨基酸可以容纳的相同独特形状。氨基酸链将与RNA链一起在那儿形成,几乎将其用作霉菌。人们认为这发生在原子核中。蛋白质合成是通过衔接子发生的,因此核酸的作用不像霉菌,而是数字代码,而纯粹是信息,这是一个很大的惊喜。

克里克坐在伍兹霍尔的草地上,谈论的是基因和蛋白质,尤其是关于他假定它们是共线的假设,以及本泽和布伦纳的计划展示的尽可能多的东西,当以弗鲁西问他如何知道氨基酸不是氨基酸时让他大吃一惊。通过细胞质中的某物进入其主要序列。 。 。 。 “我不认为鲍里斯一定会相信,但这是他认为并非不可能的想法。”

克里克也对沃森和里奇建立RNA模型的尝试持怀疑态度。 “当然,您意识到我们对此的想法是完全错误的。我们以为RNA具有二十个空腔的某种结构,就在那个时期。嗯不幸的是人们忘记了我们当时不知道的东西。”

换句话说,这本书给我们发现之前的科学观点。这是从业者对主题的看法。它与教科书相反。

试图研究免疫系统使我陷入了布雷特·维克多的情绪,想知道可以做些什么或建立些什么来使对这一主题的理解更容易。我想到了几件事:

YouTube上有一些令人难以置信的解释器。 《 Ninja Nerd Science》中有关免疫系统的视频是一个奇迹-所有这些都是由一个研究生在校的孩子讲的。他是个天才。他做得很好的就是Goodsell在那本《生命机器》一书中做得很好,那些著名的“细胞的内在生命” 3D动画做得很好:他可以帮助您“看到看不见的东西”。