Top 8 加密货币大模型用例
人工智能和区块链是两种不同的技术,具有完全不同的特征。 LLM 是真正强大的AI技术,本文介绍LLM可以帮助区块链领域的 8 个潜在用例。
一键发币: SOL | BNB | ETH | BASE | Blast | ARB | OP | POLYGON | AVAX | FTM | OK
由于LLM的热潮,最近我们看到越来越多的AI+区块链项目。 除了LLM与区块链的结合之外,我们还看到AI回归区块链。 ZKML 是流行的组合之一。
人工智能和区块链是两种不同的技术,具有完全不同的特征。 人工智能需要集中式数据中心提供的强大计算能力。 区块链提供了去中心化的计算和隐私,但不擅长大计算和大存储。 我们还在探索人工智能与区块链结合的正确方式。 以下是人工智能+区块链项目的概述。
在这篇研究文章中,我们将主要关注LLM在加密领域的应用。 LLM 是真正强大的技术,因为它能够理解自然语言,开发人员正在以下两个方向使用 LLM:
- 针对大量上下文数据提供准确且最新的答案
- 使用不同的代理/工具完成特定任务
这是构建 LLM 应用程序来回答用户问题的工程流程图。 首先,相关数据源被生成嵌入并存储在向量数据库中。 LLM 适配器使用用户查询和相似性搜索从向量数据库中查找相关上下文。 相关上下文被放入提示中并发送给LLM。 LLM 将执行提示并使用其拥有的工具来生成响应。 有时,LLM会根据特定数据集进行调整,以提高准确性并降低成本。
LLM应用流程一般可分为三个主要阶段:
- 数据的准备和嵌入:此阶段涉及保存机密信息(例如项目备忘录)以供将来访问。 通常,文件被分段,通过嵌入模型进行处理,然后保存在称为矢量数据库的特定类型的数据库中。
- 提示的制定和提取:当用户提交搜索请求(在本例中为搜索项目信息)时,软件会创建一系列提示以输入到语言模型中。 最终提示通常融合了由软件开发人员硬编码的提示模板、被称为少样本示例的有效输出示例、从外部 API 获得的任何所需数据以及从矢量数据库中提取的相关文件的选择。
- 提示的执行和推理:提示最终确定后,将它们交给预先存在的语言模型 (LLM) 进行推理,其中可能包括专有模型 API 和开源或单独微调的模型。 一些开发人员此时可能还会合并日志记录、缓存和验证等操作系统。
我们提出了LLM可以帮助区块链领域的 8 个潜在方向:
- 将内置的 Al/LLM 功能集成到区块链中
- 使用LLM分析交易记录
- 使用 LLM 识别潜在的机器人
- 使用LLM写代码
- 使用LLM阅读代码
- 使用LLM来帮助社区
- 使用LLM追踪市场
- 使用LLM来分析项目
1、将内置 AI/LLM 功能集成到区块链中
区块链将内置人工智能功能和模型。 开发人员可以访问 AI 功能来执行标志性 ML 任务,例如分类、回归、文本完成和链上 AIGC。 开发者可以通过智能合约调用这些AI功能。
借助这些内置功能,开发人员可以为他们的智能合约赋予智能和自主性。 分类、回归和 AIGC 是典型的人工智能任务。 让我们看看如何在区块链领域使用它们以及一些示例项目。
1.1 分类
分类可用于确定该地址是机器人还是真人。 这可以改变当前的 NFT 销售状况。 分类还可以增加 DeFi 生态系统的安全性。 DeFi智能合约可以过滤恶意交易,防止资金损失。
1.2 回归
回归活动可用于预测。 可用于基金、财富管理。
Numer.ai 已经使用人工智能来帮助他们管理资金。 Numer 提供高质量的股市数据。 数据科学家利用这些数据并应用机器学习来预测股市。
1.3 AIGC
许多 NFT 项目都在尝试构建一个 IP 宇宙。 然而,它们有限的内容无法支撑一个宇宙。 如果我们能够在链上使用AIGC,AIGC模型可以以相对较低的成本输出无数的内容。 这些生成的内容具有相似的标志性品牌风格。 该模型可以输出文本、插图、音乐、声音甚至音乐。 这极大地扩展了知识产权领域。 社区参与者可以集体微调模型以满足他们的期望。 微调过程也给社区带来了参与感。
Botto 已经使用 AIGC 模型来生成艺术内容。 社区投票选出他们最喜欢的图像,共同微调 AIGC 模型。
如果我们将区块链视为数据库,我们还会发现 Databend 将 AI 内置功能集成到其数据库中。 它们提供如下功能:
ai_embedding_vector
:生成文本文档的嵌入。ai_text_completion
:根据给定提示生成文本完成。cosine_distance
:计算两个嵌入之间的余弦距离。ai_to_sql
:将自然语言指令转换为 SQL 查询。
开发人员可以将此功能应用到他们的 SQL 查询中。 例如,支持以下查询:
USE <your-database>;
SELECT * FROM ai_to_sql('<natural-language-instruction>');
2、为区块链提供AI能力
我们看到有几个项目为区块链提供人工智能功能。
Giza正在 ZKML 方面开展工作。 它在链外生成推理证明并在链上进行验证。 它现在支持 EVM 兼容链和 StarkNet。 吉萨最近宣布与 Yearn.finance 建立合作伙伴关系。 Yearn 将使用 Giza AI 功能来改进其风险评估。
Modulus Labs 也在朝着类似的方向努力。 他们投入更多精力改进验证系统,为人工智能生产高性能电路。 他们发布了象棋 AI 和 ETH 价格预测 AI 等演示。 他们的新演示 zkMon 是世界上第一个经过零知识验证的生成对抗网络 NFT 系列。
3、使用LLM分析交易记录
分析交易记录通常是由特定的应用程序完成的,例如Debank。 人类很难手动分析交易记录。 手动分析涉及数据收集、数据清理和数据分析。 用户需要具备编码能力。 有了LLM,我们现在有了一种新的方法。 LLM具有分析可视化数据的能力。 因此,通过LLM,我们可以通过定制来分析链上数据。 我们可以分析胜率、绩效比或任何我们想知道的内容。
RSS3 开发了 ChatGPT 插件 Web3 User Activity 来追求这个方向。 用户可以输入钱包地址、ENS或Lens来查找链上活动。 该插件将以人类可读的方式输出交易。 然而,它无法执行复杂的查询,例如有多少 Azuki 持有者以及最热门的智能合约是什么。 用户还应注意所提供插件的地址和标签的准确性。
DeFiLlama 还发布了 ChatGPT 插件。 用户可以使用自然语言询问 DeFiLlama 上可用的任何数据。 它还可以执行简单的过滤和排序。
Dune 还将 GPT 集成到其产品中。 Dune 计划了以下功能:
- 查询解释:使用LLM来解释查询
- 查询翻译:使用LLM将其他SQL语言翻译为DuneSQL
- 自然语言查询:用户可以使用自然语言编写查询
- 搜索:使用 LLM 改善搜索结果
- 向导知识库:供用户与文档聊天的聊天机器人
除了分析链上数据之外,Dune 还将 LLM 集成到了其他功能中,我们将在后面讨论。
与 Dune 类似,Space and Time 也致力于将自然语言翻译为由 OpenAI 支持的 SQL。
区块链数据是高度结构化的数据。 使用自然语言直接查询数据库可能无法输出准确的结果。 更好的方法是将自然语言转换为 SQL,然后执行相应的 SQL 查询。
4、使用 LLM 增强安全性
由于LLM具有逻辑和推理能力,因此可以用来过滤一些恶意交易。 它充当智能合约的防火墙。 这是阻止机器人活动的具体示例。
输入地址后,LLM可以通过第三方插件获取所有交易数据。 然后LLM分析这些交易记录并输出该地址是机器人的可能性。 此功能可以插入到不欢迎机器人的 Dapp 中,例如 NFT 销售。
这是一个通过 ChatGPT 的简单示例。 ChatGPT通过RSS3开发的Web3 User Activity插件检索账户交易记录。 然后 ChatGPT 分析这些交易记录并输出该帐户是机器人的可能性。
如果我们输入更多的交易记录并在机器人相关数据集上微调 LLM,我们可以获得更准确的结果。 以下是此类应用程序的示例工作流程。 我们还可以添加缓存和数据库层来提高响应速度并降低成本。
5、使用LLM编写代码
LLM主要用于开发中,帮助开发人员更快更好地编写代码。 根据开发人员的指示,LLM可以为他们生成代码。 目前,开发者还需要对LLM给出详细的指导。 LLM很难为开发者自动生成整个项目。
一些流行的 LLM 代码模型包括 StarCoder、StarCoder+、Code T5、LTM、DIDACT、WizardCoder、FalCoder-7B、MPT30B。
它们都可以用来编写智能合约,但它们可能没有经过智能合约数据的专门训练。 他们还有进步的空间。
目前,HuggingFace 上只有一个与智能合约相关的数据集。 这是经过审计的智能合约。 它包含 113k 智能合约。 它可用于文本分类、文本生成和漏洞检测。
与Copilot相比,自动代码生成会更有前途。 自动代码生成适用于智能合约,因为智能合约相对较短且简单。 LLM可以通过多种方式帮助开发人员在区块链空间中自动编写代码。
5.1 测试
首先,LLM可以为编写良好的智能合约生成测试。 已经有像 Codium 这样的项目可以自动为书面项目生成测试。 Codium 目前支持 JS 和 TS。 Codium 首先了解代码库并分析每个函数、文档字符串和注释。 Codium 会将代码分析作为注释写入文件并输出测试计划。 用户可以选择他们喜欢的测试,Coidum 将生成选定的测试。
其他copilot软件也支持为选定的功能生成测试。
我们可以按照类似的步骤在 GPT-4 上重现类似的功能。
我们首先要求进行代码分析,因为我们希望法学硕士能够在这项任务上花费更多的时间。 LLM不知道哪些任务是困难的。 它为每个代币提供相同数量的计算能力。 这可能会导致复杂任务的结果不准确。 根据这些特点,我们要求进行代码分析。 这样,LLM将花费更多的代币/时间思考这些任务并输出更高质量的结果。 这种方法也称为思想链。
为了使其适用于更长的智能合约,我们需要具有更大背景的LLM或一些工程设计来保留内存。
5.2 生成辅助脚本
其次,我们可以使用LLM自动生成一些辅助脚本,比如部署。
部署脚本可以减少手动部署过程中潜在的错误。 这个想法与自动生成测试非常相似。
5.3 自动分叉
在牛市中,分叉项目非常多。 这些分叉项目团队对原始代码库进行了一些代码更改。 这将是LLM的一个很好的用例。 LLM可以帮助开发人员根据团队的需求自动修改代码。 通常只需要更改代码的特定部分。 对于 LLM 来说,这相对容易做到。
5.4 自动生成代码
如果我们更进一步呢? LLM能否根据开发者的需求自动生成智能合约? 与 JS、Rust 和 Python 编写的其他复杂软件相比,智能合约相对简短。 智能合约没有大量的外部库。 LLM 相对容易弄清楚如何编写智能合约。
我们已经看到自动代码生成方面的一些进展。 GPT 工程师是先驱者之一。 用户需要满足他们的要求并解决LLM的任何困惑。 然后就开始敲代码了。 该代码还包括一个可以运行整个项目的脚本。 GPT-engineer可以为开发者自动启动项目。
用户输入他们的需求。 GPT工程师将分析需求并要求澄清。 在收集完所有必要的信息后,GPT-engineer首先输出程序的设计。 这包括此任务所需的核心类、函数和方法。 然后 GPT 工程师将为每个文件生成代码。
有了这样的提示,我们就可以生成一个计数器智能合约了。
智能合约可以通过编译并按预期运行。
由于 GPT-engineer 最初是为 Python 设计的,因此在生成与 Hardhats 相关的代码时存在一些问题。 GPT 工程师不知道最新版本的 Hardhat,有时会生成过时的测试和部署脚本。
如果我们的代码有错误怎么办? 我们可以将代码库和控制台错误日志提供给 LLM。 LLM可以不断修改代码,直到代码可以成功运行。 我们看到像 flo 这样的项目正在朝这个方向努力。 目前,Flo仅支持JS。
如果我们想提高智能合约生成的准确性。 我们可以通过一些新的提示来改进 GPT-engineer。 我们可以采用测试驱动开发,并要求LLM确保程序通过某些测试,这样我们就可以更好地约束生成的程序。
5.5 使用LLM阅读代码
由于LLM可以很好地理解代码,因此我们可以使用LLM来编写开发人员文档。 LLM还可以跟踪代码更改以更新文档。 我们在上一篇研究“探索 ZKRU 上的开发人员体验:深入分析”的末尾讨论了这种方法。
阅读文档是遗留行为。 使用代码聊天是一种新方法。 用户可以提出有关代码的任何问题,LLM将回答用户的问题。 LLM可以为开发者解读代码,帮助他们快速理解链上智能合约。 LLM还可以帮助没有代码经验的人理解智能合约。
我们已经在 Web2 世界中看到了这种趋势。 很多copilot工具都有这个功能代码解释。
Etherscan 还展示了其新功能,用户可以利用 LLM 的力量与代码聊天。
有了理解代码的能力,那么审计呢? 在论文的实验中,你还需要手动智能合约审计吗,LLM 在识别漏洞方面达到了 40% 的命中率,优于随机基线。 然而,它们的误报率也很高。 作者认为,适当的提示是关键。
除了提示之外,限制还会有以下原因:
- 目前的LLM没有专门为此目的进行训练。 训练数据可能不涉及智能合约代码库和相应的审计报告。
- 通常,最严重的漏洞是由不同功能组成的逻辑问题。 LLM目前受到token数量的限制。 LLM无法解决非常长的上下文问题并提高逻辑能力。
这些问题并不难解决。 大型审计公司拥有数千份审计报告,可用于微调LLM。 具有较大token限制的LLM即将问世。 Claude 有 100k token限制。 新发布的LTM-1拥有疯狂的5M token限制。 结合解决这两个问题的努力,我们可能会看到LLM可以更好地识别错误。 LLM可以协助审计师并加快审计过程。 这可能会一步步发生。 可能的发展轨迹是:
- 帮助审核员组织语言并格式化报告。 这确保了同一审计公司下语言的一致性。通常不同的群体可能有不同的首选词。
- 帮助审核员识别并验证潜在的错误。
- 自动生成审核草稿报告。
6、使用LLM来帮助社区
治理是社区的重要组成部分。 社区成员有权投票选出自己喜欢的提案。 这些建议将塑造产品的未来。
对于重要的提案,有很多背景信息和围绕这些提案的社区辩论。 所有社区成员在投票前很难理解这一背景。 LLM可以帮助社区成员快速了解他们的选择的影响并帮助他们投票。
另一个潜在的应用是问答机器人。 我们已经看到基于项目文档的问答机器人。 我们可以更进一步,建立一个更大的知识数据库。 我们可以插入不同的媒体和来源,例如演示文稿、播客、Github、Discord 聊天和 Twitter Space。 问答机器人不仅存在于文档搜索栏中,还可以出现在 Discord 上以立即支持社区成员,或出现在 Twitter 上以传播项目愿景并回答任何问题。
AwesomeQA 目前正在朝这个方向努力。 它实现了三个功能:
- 使用 ChatGPT 集成来回答社区成员的问题
- 根据社区的消息获取有关社区的数据驱动的见解,例如常见问题解答分析
- 发现哪些消息很重要,例如未解决的问题
问答机器人目前面临的障碍是如何准确地从向量数据库中获取相关上下文并将上下文提供给LLM。 例如,如果用户使用过滤器要求多个元素的多个特征,则机器人可能无法从矢量数据库中检索相关上下文。
更新矢量数据库是另一个问题。 目前的解决方案是重建矢量数据库或按命名空间更新矢量数据库。 将命名空间附加到嵌入类似于将标签附加到数据。 它可以帮助开发人员轻松找到并更新相应的嵌入。
7、使用LLM跟踪市场
每天都有很多事情发生。 市场变化很大。 KOL 在推特上发布新想法、新想法。 时事通讯和产品电子邮件流入你的邮箱。 LLM 可以为你选择最重要的想法和新闻。 它还可以总结内容,缩短你的阅读时间,帮助你赶上市场。
minmax.ai 正在研究新闻。 它们提供了有关特定主题的最新新闻摘要以及有关该主题的观点。
无聊的报道消除了新闻中的耸人听闻,专注于基本细节,帮助读者做出正确的决定。
机器人咨询是最热门的领域之一。 LLM可以促进机器人咨询的使用。 LLM 可以提供交易建议,并帮助用户在股票信息作为上下文的情况下管理他们的投资组合。
Numer.ai 等项目使用人工智能来预测市场并运营基金。 还有由LLM管理的投资组合。 用户可以在 Robinhood 上关注这些投资组合。
Composer 将交易算法与人工智能结合在一起。 人工智能根据用户的洞察构建特定的交易策略。 然后AI会自动回测这些交易策略。 如果用户对策略满意,composer可以自动为用户执行该策略。
8、使用LLM来分析项目
分析项目需要阅读大量材料和撰写长篇研究论文。 LLM 可以读写短段落。 如果我们可以将其能力扩展到更长的段落,这是否意味着LLM可以以某种方式输出一些项目研究? 可能是。 我们可以输入LLM的白皮书、文档或活动演示来分析项目和创始人。 限于token,我们可以先写一下论文的提纲。 然后根据获得的来源更新每个部分。
像 BabyAGI 这样的项目已经在朝这个方向努力。 以下是 BlockAGI 的示例输出,它是 BabyAGI 的变体。
LLM还可以根据Twitter和公开言论来分析创始人的性格。 例如,推文分析器获取最近的推文并使用 LLM 来分析人员。
9、结束语
这是LLM在不久的将来可以帮助区块链社区的8个具体方向。
- 将内置 AI/LLM 功能集成到区块链中
- 利用LLM分析交易记录
- 利用 LLM 增强安全性
- 利用LLM编写代码
- 使用LLM阅读代码
- 让LLM协助社区
- 实施LLM来跟踪市场
- 应用LLM来分析项目
LLM 可以使加密货币领域的所有成员受益,包括项目所有者、分析师和工程师。 创始人可以使用LLM来自动化文档和问答等任务。 工程师可以使用LLM更快、更安全地编写代码。 分析师可以更轻松地研究项目。
从长远来看,我们还发现了在 GameFi 中应用 LLM 的潜在机会。 LLM可以生成更多有趣的任务并在游戏中扮演不同的角色。 游戏中的世界会感觉更加真实和有趣。 NPC 会对玩家的动作做出动态反应。 根据用户解决问题的方式,任务将会有更多的结局。
LLM 可以整合到现有项目中,但它也为新人提供了机会。 例如,链上数据分析领域已经出现了顶级参与者。 Dune 可以集成 LLM 以改善其用户体验。 然而,LLM也为新人创造了机会。 这些新人可以将LLM置于其产品设计的中心位置。 这些以人工智能为先、以人工智能为中心的创意产品可能会给链上数据分析领域带来新的竞争。
Web2 和 Web3 世界确实在 LLM 应用程序中共享一些用例,但它们可能以不同的方式实现产品。 因为我们在Web3世界中使用的数据与Web2世界中的数据不同。 Web2 和 Web3 中 LLM 的知识库也可能不同。 Web3 数据围绕区块链、代币价格、推文、项目和研究成果。 因此,它要求Web2和Web3有不同的LLM来为最终用户提供服务。
由于LLM的蓬勃发展,我们看到AIxBlockchain越来越受欢迎。 然而,大量的AIxBlockhain在短时间内并不实用。 区块链和ZK无法提供强大的计算能力来训练和对一些复杂模型进行推理。 小模型不足以解决复杂的任务。 更实用的方法是LLM在区块链领域的应用。 LLM最近比其他AI主题取得了更多进展。
LLM 社区正在努力改善代币限制并提高响应准确性。 区块链社区剩下的就是数据源和数据管道。 清理后的数据可用于微调LLM,以提高区块链环境下的准确性。 数据管道可以将更多区块链相关应用程序集成到LLM中,并开发更多特定于加密货币的代理。
原文链接:The Promise and Potential of LLM in Crypto
DefiPlot翻译整理,转载请标明出处