幻觉与创新：AlphaFold3为何失败？

AlphaFold3 是一个技术杰作：

换句话说：

什么是扩散模型？
扩散模型（也称为扩散概率模型）：使用变分推理训练的马尔可夫链。

扩散模型的目标是通过对数据点在潜在空间中扩散的方式进行建模来学习数据集的潜在结构。

扩散模型于 2015 年提出，其灵感来源于非平衡热力学。

扩散模型可应用于多种任务，包括图像去噪、修复、超分辨率和图像生成。例如，图像生成模型将从随机噪声图像开始，然后在对自然图像进行逆扩散过程训练后，该模型将能够生成新的自然图像。

OpenAI 于 2022 年 4 月 13 日发布的文本到图像模型DALL-E 2就是一个最近的例子。它对模型的先验（给定文本标题生成图像嵌入）和生成最终图像的解码器都使用扩散模型。

生成模型与幻觉
一般来说，生成模型（包括但不限于生成扩散模型）容易产生幻觉。幻觉是指生成的输出看似合理，但不准确或没有基于给定的输入数据。以下是生成模型容易产生幻觉的一些主要原因：

生成模型中出现幻觉的原因

训练数据限制：
- 质量：如果训练数据包含噪音、错误或偏差，模型可能会学习重现这些缺陷，从而导致幻觉输出。
- 数量：训练数据不足会导致模型无法学习数据的真实分布，从而导致其产生不合理的结果。

模型复杂度：

概率性质：

调理和指导：

模型架构和目标：

类型

如何避免幻觉？
在设计生成模型时，通常需要根据应用情况平衡创造力和准确性：

AlphaFold3创新来源于幻觉？
由于使用生成扩散方法容易产生幻觉，所以这是一件有趣的事情。

AlphaFold3 整合了已开发的用于预测特定相互作用的模型中的元素（因此您可以将其视为一种概括或预测不同类型相互作用的单一模型）。此外，该模型的分辨率要高得多。

总而言之，AlphaFold3 的表现优于研究人员在寻找新药时使用的各种软件和模型。这一切都归功于一个模型。

AlphaFold3 是否会产生与之前版本相同的颠覆性影响？
AlphaFold2 发布时，所有研究人员都可以使用整个代码。但 AlphaFold3 带有“伪代码”（幻觉），无论它有多详细，都无法轻松重现模型。

传统上，最负盛名的研究期刊对代码发布一直以来都存在模糊性，但在出现AlphaFold3伪代码情况下，就开始明确表示不能发布伪代码。

此举激起了科学界的愤怒，并最终引发了一封公开批评信：

我们对 AlphaFold3 在《自然》杂志上发表时缺少代码甚至可执行文件感到失望。尽管 AlphaFold3 扩展了 AlphaFold2 的功能，包括小分子、核酸和化学修饰，但它是在没有以高通量方式测试和使用该软件的手段的情况下发布的。——来源

出乎意料的是，《自然》杂志发表社论回应了批评，解释了其同意发布 AlphaFold3 但未提供代码或模型的原因。

在生物医学领域，只有被社区采用（复制、使用、修改和调整）的东西才算真正成功。

LLM大语言模型
近几个月来，一些面向健康领域的开源模型已经问世。研究人员对这些模型进行了微调，以获得能够生成新序列的LLM 。还代表原始解决方案的模型，例如蛋白质语言模型（结合大型语言模型和蛋白质模型的模型）。

这些模型向我们展示了未来的一些趋势。研究人员正在将开源模型用于医学和生物学应用。

AlphaFold3 将作为对学术界的“警示”
提醒他们依赖 DeepMind 等科技公司开发和分发 AlphaFold 等工具的风险。

AlphaFold2 已证明能够根据序列预测结构。它并不是研究的终点，因为它有几个局限性。AlphaFold3 弥补了其中一些缺陷，但是：

这场革命分为三个阶段：

在第一阶段，研究人员按原样使用 LLM。仅用于推理，并且大多数情况下通过专用服务器。这种用途主要是为了产生新的科学假设。
在第二阶段，模型被修改或调整以适应特殊情况。研究人员使用专有数据对模型进行微调，或提取表示以用于其他应用程序。随着更多模型可用，社区开始将它们组合成越来越复杂的管道。
在第三阶段，几个团队开始从头开始创建模型。对于许多应用来说，从头开始训练模型比修改为其他内容训练的模型更便宜。