人类基因组是不可思议的事情。 60亿个DNA字母-每个细胞中的DNA长度超过两米-包含使单个细胞成长为完整,功能齐全的人的所有基因。
因此,当人类基因组序列的第一稿于2001年发布时,全世界的研究人员都渴望发现确切的基因组中必须包含多少个基因。
许多人认为,造就一个人至少需要十万个基因-对最接近最终数字的人提供了抽奖活动-但人类基因组却只包含20,000个左右的基因(与果蝇或线虫蠕虫的基因数量大致相同)。
这使得生物体的复杂性与人类一样令人眼花low乱。更令人困惑的是,我们所拥有的基因不足所有DNA的2%。那剩下的是什么?
那时遗传学家Susumu Ohno在不起眼的科学杂志《布鲁克海文生物学研讨会》上发表了一篇题为“我们基因组中有太多'垃圾'DNA”的论文,他在其中沉迷于一个数学问题。
到那时,科学家们已经测量了细菌中存在多少DNA,并且发现这些小虫子必须包含数千个基因。他们还知道,单个人类细胞所含DNA至少是其750倍。
Ohno进行了快速的计算,如果任何基因组中的基因数量与DNA的数量成正比,那么人类应该拥有大约300万个基因。
但是,正如他在论文中指出的那样,“低等的肺鱼和sal”细胞中的DNA可能是我们细胞中DNA的36倍,这表明它们应该具有……。亿个基因。
他不相信。所有这些基因都需要一个黏糊糊的sal?因此,大野总结说,人类基因组的绝大部分必须是垃圾。而且,相应地,其他生物的基因组比例也必须不同。而且一旦人类基因组计划揭示出我们的绝大多数基因组似乎都不包含实际基因,就好像他是对的。
剩下的98%的人类基因组(有时称为“垃圾DNA”,但更准确地称为非编码DNA)的功能在遗传学界引起了热烈讨论,是在期刊和学术期刊的庄严篇章中展开的科学会议气氛更加活跃。
2012年发表的一项绝对庞大的研究被称为ENCODE,表明人类基因组中约80%具有功能-即,它对我们的细胞和身体的正常运转起了重要作用。人们认为只有不到10%的控制开关负责在正确的时间和正确的位置打开和关闭基因,而其余的则可以做各种事情,从产生控制基因活性的小片段RNA到组织基因调控。细胞内部DNA的三维结构。
其他人则不服气。例如,进化遗传学家克里斯·庞廷(Chris Ponting)认为,根据进化时间以来已被强烈保存的基因组,人类基因组中只有不到10%具有功能,因此必须非常重要。
在这种背景下,我们引入了洋葱测试,该测试由T. Ryan Gregory设计,并于2007年4月发布在他的博客上。后来正式化为他在2014年与Alexander Palazzo一起发表的科学论文。
蔬菜抽屉中的洋葱的DNA是人类的五倍。因此,如果您是一名研究人员,认为非编码DNA在基因组中具有特定功能,那么您能否解释一下为什么做相同的事情洋葱比人类需要的洋葱多五倍?
Gregory进一步消除了这个想法,指出某些种类的洋葱的DNA含量是普通洋葱的两倍左右,而其他种类的不到一半。但是它们几乎相同并且具有相同数量的基因,那么为什么它们需要两倍或一半的非编码DNA?
这种论点适用于各种物种,从大野的低火蜥蜴的巨型基因组包含与其他脊椎动物(包括人类)大致相同的基因集,到迄今为止发现的最大基因组,属于日本冠层花巴黎粳稻,基因组中的DNA比人类多150倍。
然后是有毒的河豚河豚鱼-在日本经常作为美味佳肴食用(非常小心!)。它们的基因组非常紧凑,大约是我们自身基因组的八分之一,却包含几乎完全相同的基因库,而且几乎没有垃圾。
也许我们对寻找基因组中所有垃圾的功能的痴迷是因为人们希望人类在生物界是一种特殊的事物-当然比洋葱更独特。
但是用脾气暴躁的遗传学家丹·格劳尔(Dan Graur)的话来说,我在我的书《海丁威·海明威的猫》中采访了我,在那本书中,我挖掘了基因库中的垃圾,“要么您必须假设人类是创造的顶峰,要么一切都是功能性的而那些比我们拥有更多DNA的生物体拥有垃圾DNA,但我们却没有。或者,您必须假设人类像其他任何事物一样都是具有垃圾DNA的常规生物。”