如果说前面三类更侧重于AI如何赋能于Crypto,那么AI作为目标强调了Crypto对AI的帮助,即如何利用Crypto创造出更好的AI模型和产品,这或许包括多个评判标准:更高效、更精确、更去中心化等等。
AI包括三个核心:数据、算力和算法,在每一个维度,Crypto都在致力于为AI提供更有效的助力:
数据:数据是进行模型训练的基础,去中心化数据协议将激励个人或企业提供更多私域数据,同时利用密码学保障数据隐私,避免个人敏感数据的泄露。
算力:去中心化算力赛道是目前最火热的AI赛道,协议通过提供供需双方的匹配市场,促进长尾算力与AI企业的匹配,用于模型的训练和推理。
算法:Crypto对算法的赋能是实现去中心化AI最核心的环节,也是V神文章中AI作为目标叙述的主要内容,创建去中心化的、可信任的黑匣子AI,那么前文所说的对抗式机器学习的问题则将得到解决,但将面临极高的密码学开销等一系列阻碍。此外,使用加密激励来鼓励制作更好的AI也可以在不完全陷入密码学完全加密的兔子洞的情况下实现。
大型科技公司对数据和算力的垄断共同造成了对模型训练过程的垄断,闭源模型成为大型企业获利的关键。从基础设施的角度,Crypto通过经济手段激励数据和算力的去中心化供应,同时通过密码学的方法保证过程中的数据隐私,并以此为基础助力于去中心化的模型训练,以实现更透明、更去中心化的AI。
去中心化数据协议主要以数据众包的形式开展,激励用户提供数据集或数据服务(如数据标注)用于企业进行模型训练,并开设DataMarketplace促进供需双方的匹配,一些协议也正在探索通过DePIN激励协议,获取用户的浏览数据,或利用用户的设备/带宽完成网络数据爬取。
OceanProtocol:对数据确权并代币化,用户可以通过无代码方式在OceanProtocol完成对数据/算法的NFT创建,同事创建相应的datatoken来控制对数据NFT的访问。OceanProtocol通过ComputeToData(C2D)来确保数据的隐私性,使用者只能获得根据数据/算法的输出结果,而无法完整下载。OceanProtocol于2017年成立,作为数据市场,在本轮热潮中很自然地搭上了AI的快车。
SynesisOne:该项目是Solana上的Train2Earn平台,用户通过提供自然语言的数据和数据标注来获取$SNS奖励,用户通过提供数据支持挖矿,数据在验证后会进行存储和上链,并由AI公司用来训练和推理。具体来说,挖矿者分为三类:Architect/Builder/Validator,Architect负责创建新的数据任务,Builder在相应的数据任务中提供语料,Validator则对Builder提供的数据集进行验证。完成的数据集会被存入IPFS中,并在链上保存数据来源和IPFS地址们同事会被存储在链下的数据库中供AI公司(目前为MindAI)使用。
Grass:被称为AI的去中心化数据层,本质上是一个去中心化网络抓取市场,并以此获得数据来用于AI模型训练。互联网网站是一个重要的AI训练数据来源,包括推特、谷歌、Reddit在内的许多网站的数据都具有重要价值,但这些网站正在不断对数据爬取加以限制。Grass利用个人网络中未使用的带宽,通过使用不同的IP地址来减少数据封锁带来的影响,来抓取公共网站中的数据,完成数据初步清理,成为AI模型训练企业和项目的数据源。目前Grass正处于Beta测试阶段,用户可提供带宽获取积分以领取潜在空投。
AITProtocol:AITProtocol是去中心化数据标注协议,旨在为开发者提供高质量数据集用于模型训练。Web3使得全球劳动力能够快速接入网络,并通过数据标注获得激励,AIT的数据科学家将对数据进行预标注,随后由用户进行进一步处理,经过数据科学家检查后,通过质量检测的数据将提供给开发者。
除了上述数据提供和数据标注协议,曾经的去中心化存储类基础设施,如Filecoin、Arweave等也将为更分散化的数据供给助力。
AI时代,算力的重要性不言而喻,不仅英伟达的股价日攀高峰,在Crypto世界,去中心化算力可以说是AI赛道炒作最热烈的细分方向在市值前200的11个AI项目中,做去中心化算力的项目就有5个(Render/Akash/AIOZNetwork/Golem/Nosana),并在过去几个月中收获了高倍涨幅。在小市值的项目中也看到许多去中心化算力的平台出现,虽然刚刚起步,但伴随着英伟达大会的浪潮,只要是与GPU沾边,都快速收获了一波大涨。
从赛道特点来看,这一方向项目的基本逻辑高度同质化通过代币激励使得拥有闲置算力资源的人或企业提供资源,并由此大幅降低使用费用,建立起算力的供需市场,目前,主要的算力供应来自于数据中心、矿工(尤其在以太坊转为PoS后)、消费级算力以及与其他项目的合作。虽然同质化,但这是一个头部项目拥有较高护城河的赛道,项目的主要竞争优势来源于:算力资源、算力租赁价格、算力使用率以及其他技术优势。这一赛道的龙头项目包括Akash、Render、io.net和Gensyn。
根据具体业务方向,项目可以被粗分为两类:AI模型推理和AI模型训练。由于AI模型训练对算力和带宽的要求远高于推理,比分布式推理的落地难度更大,且模型推理的市场快速扩展,可预测的收入将在未来大幅高于模型训练,因此目前绝大多数项目主攻推理方向(Akash、Render、io.net),主攻训练方向的龙头即为Gensyn。其中,Akash和Render诞生较早,并非是为AI计算而生,Akash最初用于通用计算,Render则主要应用于视频和图片渲染,io.net则为AI计算专门设计,但在AI将算力需求提升了一个Level后,这些项目都已倾向于AI方面的开发。
最为重要的两个竞争指标依然来自于供应端(算力资源)和需求端(算力使用率)。Akash拥有282个GPU和超过2万个CPU,已完成16万次租赁,GPU网络的利用率为50-70%,在这一赛道是一个不错的数字。io.net拥有40272个GPU和5958个CPU,同时拥有Render的4318个GPU和159个CPU、Filecoin的1024个GPU的使用许可,其中包括约200块H100和上千块A100,目前已完成推理151,879次,io.net正在用极高的空投预期吸引算力资源,GPU的数据正在快速增长,需要等代币上线后对其吸引资源的能力重新评估。Render和Gensyn则并未公布具体数据。此外,许多项目正在通过生态合作来提高自己在供应与需求端的竞争力,如io.net采用Render和Filecoin的算力来提高自己的资源储备,Render建立了计算客户端计划(RNP-004),允许用户通过计算客户端io.net、Nosana、FedMl、Beam,来间接接入Render的算力资源,从而快速从渲染领域过渡到人工智能计算。
此外,去中心化计算的验证依然是一个问题如何证明拥有算力资源的工作者正确地执行了计算任务。Gensyn正在尝试建立这样一个验证层,通过概率学习证明、基于图的精确定位协议以及激励来保证计算的正确性,其中的验证者和举报者共同对计算进行检查,因此Gensyn除了为去中心化训练提供了算力支持,其建立的验证机制也具有独特价值。位于Solana上的计算协议Fluence同样增加了对计算任务的验证,开发人员可以通过检查链上提供商发布的证明来验证其应用程序是否按预期运行以及计算是否正确执行。但现实的需求依然是可行大于可信,计算平台必须首先具有足够的算力才有竞争的可能,当然对于出色的验证协议来说,可以选择接入其他平台的算力,成为验证层和协议层来发挥独特作用。
距离Vitalik所描述的终极场景(下图所示)还非常遥远,我们目前还无法实现通过区块链和加密技术创建一个可信任的黑盒AI,来解决对抗性机器学习的问题,将数据训练到查询输出的整个AI运行过程进行加密处理是一笔非常大的开销。但目前正在有项目尝试通过激励机制创建更好的AI模型,首先打通了不同模型之间封闭的状态,创造了模型之间相互学习、协作和良性竞争的格局,Bittensor是其中最具代表性的项目。
Bittensor:Bittensor正在促进不同AI模型之间的组合,但值得注意的是,Bittensor本身不进行模型的训练,而是主要提供AI推理的服务。Bittensor的32个子网专注于不同的服务方向,如数据抓取、文本生成、Text2Image等,在完成一项任务时,分属不同方向的AI模型可以相互协作。激励机制促进了子网之间、以及子网内部的竞争,目前奖励以每块1个TAO的速度发放,每日总计发放约7200个TAO代币,SN0(根网络)中的64个验证器根据子网性能,决定了这些奖励在不同子网之间的分配比例,子网验证器则通过对矿工的工作评价,决定在不同矿工之间的分配比例,由此表现更好的服务、表现更好的模型获得更多激励,促进了系统整体推理质量的提高。
从SamAltman动向带来ARKM和WLD的价格疯涨,到英伟达大会带飞一系列参会项目,很多人正在对AI赛道的投资理念发生调整,AI赛道究竟是MEME炒作还是技术革命?
除了少数名人题材(比如ARKM和WLD),AI赛道整体更像是以技术叙事为主导的MEME。
一方面,CryptoAI赛道的整体炒作一定是与Web2AI的进展紧密挂钩的,OpenAI为首的外部炒作将成为CryptoAI赛道的导火索。另一方面,AI赛道的故事依然以技术叙事为主,当然,这里我们强调的是技术叙事而非技术,这就使得对AI赛道细分方向的选择和项目基本面的关注依然重要,我们需要找到有炒作价值的叙事方向,也需要找到有中长期竞争力和护城河的项目。
从V神提出的四类结合可能中,可以看到的是叙事魅力和落地可能性的相互权衡。在以AI应用为代表的第一类和第二类中,我们看到了许多GPTWrapper,产品落地快但业务同质化程度也较高,先发优势、生态系统、用户数量和产品收入则成为同质化竞争中可讲的故事。第三类和第四类代表着AI与Crypto结合的宏大叙事,如Agent链上协作网络、zkML、去中心化重塑AI,都处于早期阶段,具有技术创新的项目将会快速吸引资金,即使只是很早期的落地展示。
以上就是从Vitalik的文章出发,盘点Crypto×AI值得关注的细分赛道的全部内容,望能这篇从Vitalik的文章出发,盘点Crypto×AI值得关注的细分赛道可以帮助您解决问题,能够解决大家的实际问题是非常好学习网一直努力的方向和目标。