蛋白质结构可以提供宝贵的信息,既可以用于推理生物过程,也可以用于实现基于结构的药物开发或靶向诱变等干预措施。经过数十年的努力,人类蛋白质序列中 17% 的总残基被实验确定的结构 1 覆盖。在这里,我们通过大规模应用最先进的机器学习方法 AlphaFold 2 显着扩大了结构覆盖范围到几乎整个人类蛋白质组(人类蛋白质的 98.5%)。生成的数据集覆盖了 58% 的残基,具有置信度预测,其中一个子集(所有残基的 36%)具有非常高的置信度。我们引入了通过构建 AlphaFold 模型开发的几个指标,并使用它们来解释数据集,识别强多域预测以及可能无序的区域。最后,我们提供了一些案例研究,说明如何使用高质量的预测来生成生物学假设。重要的是,我们正在通过公共数据库(由欧洲生物信息学研究所在 https://alphafold.ebi.ac.uk/ 托管)向社区免费提供我们的预测。我们预计常规的大规模高精度结构预测将成为重要工具,允许从结构角度解决新问题。作者提交评论即表示您同意遵守我们的条款和社区准则。如果您发现有辱骂性或不符合我们的条款或准则的内容,请将其标记为不当。