Redian新闻
>
理解数据可用性采样

理解数据可用性采样

科技

数据可用性采样是我最近正在学习的技术,也是目前区块链方向最重要的技术,这个理论和实践都比较难,我将翻译一些资料,同时把自己的心得和大家分享。

本文翻译整理自:

@nickwh8te

https://twitter.com/nickwh8te/status/1560426053830574080


数据可用性采样是区块链扩展的一项重大突破,但许多人难以理解它。
别担心,实际上非常简单,我们可以把它想象成抛硬币。
想想一下,我有两个硬币,A硬币两面都是字,B硬币一面是字,一面是图案。
问题:我给了你两枚硬币中的一枚,你如何知道我给了你哪一枚呢?
简单,你只需要多次的投掷硬币。
如果硬币是A,它总是字朝上。
如果硬币是B,每次抛的时候,只有50%的概率字朝上。
因此,每次你抛硬币的时候,如果字朝上,你就会多出50%的信心认为它是A。
重复这个过程20次,你将有99.9999%的概率相信是A
具体的计算如下:
1-0.5^20=0.9999990463
如果次数更多,概率将会更大。
这就是数据可用性采样的工作原理。或许你有疑问:拿到硬币看一下不就可以了?在实际场景中,看到整个硬币和拿到整个区块的数据是等同的。BTC等区块链也就是这样验证的。也正是这个原因,BTC等的处理能力受到影响。
所以,抽样是为了只获取小部分的数据就可以进行整体的验证。从而提升性能。
继续。
有两种类型的区块:数据可用的区块和数据不可用的区块(只有区块头,或者是有正反面的硬币B)
区块生产者给你一个区块,为了安全,我们需要知道它到底是什么!
如何做呢?通过多次对这个区块进行采样,就类似抛硬币。
对于每一个成功的样本,你对这个区块是可用的信心就增加50%。
重复这个采样的操作,直到我们拥有99.99%的信心认定这个区块是可用的。

为什么这是区块链可扩展性的重大突破?
更大的区块意味着更高的吞吐量,但这也意味着更多的数据需要下载。
如果没有数据可用性采样:
在这样的场景里,为了确保一个区块可用,需要下载整个区块的数据。
数据可用性采样允许你仅仅下载几个小样本来确保一个块是可用的。
如果你有一个4MB的区块,并且需要20个样本,每个样本1KB,那么你只需要下载大约0.5%的数据就可以99.9999%的确定它是可用的。
这是一个200倍的改进
随着区块变大,它只会变得更有效率。
这正是@CelestiaOrg 正在构建的核心技术之一,也是模块化区块链技术栈的基础。
更多的信息可以查看 celestia.org/learn。
这是一个形象的解释,这已经可以和足够多的人聊天了,但对于工程师来说,显然是不够的,并且一些细节,这个例子的讲述也不是那么贴切。我们后续继续研究。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
留学生可用!告别排队!加拿大国际机场推出过关神器!不用跟边境官交谈就能入境!国产CPU执行SPL实现数据库运算的性能实用性测试汇总了近50场面试,这70多页K8s/Docker/DevOps通用性极强 | 极客时间Soft Diffusion:谷歌新框架从通用扩散过程中正确调度、学习和采样求职干货 | 华为、DELL等2023秋招已开!海归求职:数据(数据分析、数据科学、工程)让数据可用不可见,隐私计算迎来风口?穿越爱琴海,探访希腊美丽的圣托里尼岛不能用性别用词,爸妈要改叫亲生家长??英国议会更新规范用语,网友炸了限时领!清华大学出品小学数学资料《DK图解数学》含184个数学知识点视频和253种科学思维!未来已来,一起了解数字资产吧!| 活动精粹文档智能多模态预训练模型LayoutLMv3:兼具通用性与优越性瞬时流量高峰场景下的高可用架构设计:Kubernetes集群如何调优?| Q推荐3个案例,详解数据分类分级方法论及落地应用智力游戏皇冠上的明珠——围棋断网的日子贾乃亮摊上事?前顶流男星无人可用?王力宏李靓蕾删文和解?踏实男星好事将近?颠覆三观!谷歌最新研究:用性能差的模型计算「相似度」反而更准?自慰12年:我用性瘾“治疗”被猥亵的自己不小心沾到病毒采样管里红红的液体,会有事吗?斯坦福/谷歌大脑:两次蒸馏,引导扩散模型采样提速256倍!2000亿“券茅”也扛不住!三季度业绩下滑14%,公司称没有提前泄露财务数据可能正确理解“新冠是自限性疾病”,用数据说话!四大也开卷的数据可视化人才:不分岗位,会Tableau的优先!!!招商基金张西林:用溯因法去理解市场,理解了“因”才能得到“果”一个项目帮你了解数据集蒸馏Dataset Distillation核酸检测的采样管里,粉色的液体是干嘛用的?没有自己的数据怎么发SCI?用好这些公共数据库和数据缺失处理方法,发表SCI并不难!解数:2022防晒行业调研报告(100页)NeurIPS 2022 | 马里兰、北大等机构提出量子算法用于采样对数凹分布和估计归一化常数日结核酸采样员:多挣点钱,赶紧走NeurIPS 2022 | 量子算法用于采样对数凹分布和估计归一化常数采样提速256倍,蒸馏扩散模型生成图像质量媲美教师模型,只需4步把水边的爱情搬回家西方的民选政客是独裁还是民主类数值方法PNDM:Stable Diffusion默认加速采样方案
logo
联系我们隐私协议©2025 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。