=数据压缩算法=速记算法=
递增素数之间,可以使用加法,得出相对小的数,可以用乘法,得出相对大的数,可以用乘方号,得出很大很大的数。
当使用特定长度把一个大数据分割成N个小片段时,就可以进行统计,比如全体相加,然后除以总数得到全局平均数。
然后使用1KB的平均数,1MB的平均数,1GB的平均数作为比大小基准。
然后还有特定数(比如出现了一次以上的多次数)(比如只出现了一次的一次数)(比如出现的最大值)(比如出现的最小值)。
现在的问题就是,统计能够获得数据的被过滤掉了很多信息的被压缩后的数据,如何使用统计获得的数据,来逆推原始数据(包括各种统计的先后顺序)(当然,因为数据的缺失,导致必须使用试错方式来实现)。
在处理大数据时,如何减少解压缩时试错次数,就是大数据压缩专用算法的重难点。
[示例]
如果有一个二进制数1010010010011100110001000100010,统计出其二进制的1总共有12个,二进制的0总共有19个;转换为八进制为……
(ò﹏ò)
抱歉,章节内容不支持该浏览器显示~
【为了使用完整的阅读功能】
请考虑使用〔Chrome 谷歌浏览器〕、〔Safari 苹果浏览器〕或者〔Edge 微软浏览器〕等原生浏览器阅读!
谢谢!!!
铅笔小说 23qb.com