#基数

HyperLogLog(en.wikipedia.org)
2020-12-31 21:11
跳转至导航跳转至搜索HyperLogLog是一种用于计数差异问题的算法,它近似于多集合中不同元素的数量。 [1]计算多集的确切基数需要与基数成比例的内存量,这对于非常大的数据集而言是不切实际的。概率基数估计器(例如HyperLogLog算法)使用的内存明显少于此,以仅获得基数近似值为代价。 HyperLogLog算法......
The radix 2^51 trick(www.chosenplaintext.ca)
2020-5-29 23:41
从“1”位置开始,我们加6+6=12,写下2,进位1。我们向左前进,一次一个位置,直到没有更多的数字要加。 在实现大整数(例如,2 64及以上)的加法时,通常会编写与此算法非常相似的代码。有趣的是,有一个简单的技巧可以在现代CPU上极大地加速这一过程。 但首先,我要问一个问题:为什么我们要从“1”开始长相加?为什么不......