详解zkML:迈向可验证人工智能的未来

本文中的零知识机器学习(ZKML)是指在不暴露模型输入或模型参数的情况下,使用 zkSNARK(一种零知识证明)来证明机器学习推理的正确性。

背景

在过去的几个月里,人工智能行业出现了多项突破。 GPT4 和 Stable Diffusion 等模型正在改变人们生成软件和互联网以及与之交互的方式。

尽管这些新的 AI 模型具有令人印象深刻的功能,但一些人仍然担心 AI 的不可预测性和一致性问题。例如,在线服务领域缺乏透明度,其中大部分后端工作由 AI 模型运行。验证这些模型是否以预期的方式运行是一项挑战。此外,用户隐私也是一个问题,因为我们提供给模型 API 的所有数据都可用于改进 AI 或被黑客利用。

ZKML 可能是解决这些问题的新方法。通过将可验证和无需信任的属性注入机器学习模型,区块链和 ZK 技术可以形成 AI 对齐的框架。

什么是 ZKML

本文中的零知识机器学习(ZKML)是指在不暴露模型输入或模型参数的情况下,使用 zkSNARK(一种零知识证明)来证明机器学习推理的正确性。根据隐私信息的不同,ZKML 的用例可以分为以下类型:

公共模型 + 私有数据:

  • 隐私保护机器学习:ZKML 可用于在敏感数据上训练和评估机器学习模型,而无需向任何其他人透露数据。这对于医疗诊断和金融欺诈检测等应用可能很重要。我们也看到一些玩家在生物特征数据认证上使用 ZKML 来构建人性证明服务。
  • 证明:在大多数在线内容由 AI 生成的世界中,密码学可以提供真相的来源。人们正在尝试使用 ZKML 来解决 deepfake 问题。

私有模型 + 公共数据:

  • 模型真实性:ZKML 可用于确保机器学习模型的一致性。这对于用户确保模型提供者不会懒惰地使用较便宜的模型或被黑客攻击可能很重要。
详解zkML:迈向可验证人工智能的未来
  • 去中心化的 Kaggle:ZKML 允许数据科学竞赛的参与者证明模型在公共测试数据上的准确性,而无需透露训练中的模型权重

公开模型 + 公开数据:

  • 去中心化推理:这种方法主要是利用 ZKML 的简洁特性,将复杂的 AI 计算压缩到类似于 ZK rollup 的链上证明。这种方法可以将模型服务的成本分配给多个节点。

由于 zkSNARK 将成为加密世界的一项非常重要的技术,ZKML 也有可能改变加密领域。通过在智能合约中加入 AI 能力,ZKML 可以解锁更复杂的链上应用。这种集成在 ZKML 社区中被描述为「赋予区块链眼睛」。

技术瓶颈

然而,ZK-ML 带来了一些当前必须解决的技术挑战。

量化:ZKP 在场上工作,但神经网络在浮点数中训练。这意味着为了使神经网络模型 zk/blockchain 友好,它需要转换为具有完整计算跟踪的固定点算术表示。这可能会牺牲模型性能,因为参数的精度较低。

跨语言翻译:神经网络 AI 模型是用 python 和 cpp 编写的,而 ZKP 电路需要 r​​ust。所以我们需要一个翻译层来将模型转换为基于 ZKP 的运行时。通常这种类型的翻译层是模型特定的,很难设计一个通用的。

ZKP 的计算成本:ZKP 的成本基本上会比原来的 ML 计算高很多。根据 Modulus labs 的实验,对于一个 20M 参数的模型,根据不同的 ZK 证明系统,生成证明需要 1-5 分钟以上的时间,内存消耗在 20-60GB 左右。

详解zkML:迈向可验证人工智能的未来

智能的成本 — Modulus Labs

现状

即使面临这些挑战,我们也看到 ZKML 引起了加密社区的极大兴趣,并且有一些优秀的团队正在探索这一领域。

基础设施

模型编译器

由于 ZKML 的主要瓶颈是将 AI 模型转换为 ZK 电路,一些团队正在研究 ZK 模型编译器等基础层。从 1 年前的逻辑回归模型或简单的 CNN 模型开始,该领域已经快速进入更复杂的模型。

EZKL 项目现在支持高达 100mm 参数的模型。它使用 ONNX 格式和 halo2 ZKP 系统。该库还支持仅提交模型的一部分。

ZKML 库已经支持 GPT2、Bert 和 diffusion 模型的 ZKP!

ZKVM

ZKML 编译器也属于一些更通用的零知识虚拟机领域。

Risc Zero 是一个使用开源 RiscV 指令集的 zkVM,因此可以支持 c++ 和 rust 的 ZKP。这个 zkDTP 项目展示了如何将决策树 ML 模型转换为 Rust 并在 Risc Zero 上运行。

我们还看到一些团队正在尝试通过 Startnet(吉萨)和 Aleo(零重力)将 AI 模型带到链上。

应用

除了基础设施,其他团队也开始探索 ZKML 的应用

Defi:

DeFi 用例的一个示例是 AI 驱动的金库,其中机制由 AI 模型而不是固定策略定义。这些策略可以利用链上和链下数据来预测市场趋势并执行交易。 ZKML 保证链上模型一致。这可以使整个过程自动化且无需信任。 Mondulus Labs 正在构建 RockyBot。该团队训练了一个链上 AI 模型来预测 ETH 价格,并构建了一个智能合约来自动与该模型进行交易。

其他潜在的 DeFi 用例包括 AI 支持的 DEX 和借贷协议。预言机还可以利用 ZKML 提供从链下数据生成的新型数据源。

Gaming:

Modulus labs 推出了一款基于 ZKML 的国际象棋游戏 Leela,所有用户都可以与一个由 ZK 验证的 AI 模型提供支持的机器人一起玩。人工智能能力可以为现有的完全链上游戏带来更多的交互功能。

NFT/ 创作者经济:

EIP-7007:该 EIP 提供了一个接口来使用 ZKML 来验证 AI 为 NFT 生成的内容是否确实来自具有特定输入(提示)的特定模型。该标准可以启用 AI 生成的 NFT 集合,甚至可以为新型创作者经济提供动力。

详解zkML:迈向可验证人工智能的未来
EIP-7007 项目工作流程

Identity:

Wordcoin 项目正在提供基于用户生物识别信息的人性证明解决方案。该团队正在探索使用 ZKML 让用户以无需许可的方式生成 Iris 代码。当生成 Iris 代码的算法升级后,用户可以自行下载模型并生成证明,而无需去 Orb 站。

采用的关键

考虑到人工智能模型零知识证明的高成本。我们认为 ZKML 的采用可以从一些信任成本高的加密本机用例开始。

我们应该考虑的另一个市场是数据隐私非常重要的行业,例如医疗保健行业。为此,还有其他解决方案,如联邦学习和安全 MPC,但 ZKML 可以利用区块链的可扩展激励网络。

更广泛地大规模采用 ZKML 可能取决于人们失去对现有大型 AI 提供商的信任。会不会出现一些事件,提高整个行业的意识,促使用户考虑可验证的 AI 技术?

总结

ZKML 仍处于早期阶段,有许多挑战需要克服。但随着 ZK 技术的改进,我们认为人们很快就会发现几个具有很强产品市场契合度的 ZKML 用例。这些用例一开始可能看起来很适合。但随着中心化人工智能的力量越来越大,渗透到每一个行业乃至人类生活中,人们可能会在 ZKML 中发现更大的价值。

(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)

(0)
上一篇 2023年5月30日 下午4:16
下一篇 2023年5月30日 下午4:24

相关推荐

  • Neon EVM开启公募,兼容层能否拯救日渐没落的Solana?

    2021 年 11 月,Solana TVL 达到历史最高峰,突破 100 亿美元。随着 FTX 的崩溃,Solana 也一蹶不振,资金纷纷撤离。自 FTX 崩溃之后,TVL 经过长期的不断下跌。目前,TVL 已经跌至约 2.66 亿美元,仅为 ATH 的 2% 左右。

    2023年5月25日
    1.5K
  • MEV是不是一个好的投资机会?

    现在以太坊过渡到 POS 后,任何用户质押 32ETH 就能成为 validator。在每个出块的时间里面,会随机选择一个验证者作为区块 proposer,来将交易打包执行成一个新状态,随后这个 proposer 将此区块打包给其他 validator 进行验证。从上述描述中,似乎应该是 validator 想办法排列区块的交易排序以此才能有利可图。

    2023年1月18日
    659
  • 华尔街押注比特币:牛市墙头草还是加密真信徒?

    对于摩根大通 CEO Jamie Dimon 来说,加密货币不过是些「宠物石头」——(译者注:宠物石(Pet Rock)是一种流行于美国上世纪七十年代的玩具,实际上是一块普通的石头,被当作一种有趣的宠物来养护),毫无价值。对于股神 Warren Buffett 的老搭档 Charlie Munger 而言,加密货币则是 「愚蠢至极」 的玩意儿。

    2024年3月6日
    195

发表回复

登录后才能评论
微信

联系我们
邮箱:whylweb3@163.com
微信:gaoshuang613