写在前面
在大数据与云盘算发展的时期,我们常常会碰到这样的问题。我们是不是能高效的断定一个用户是不是拜访过某网站的主页(每天拜访量上亿)或须要统计网站的pv、uv。最直接的想法是将所有的拜访者存起来,然后每次用户拜访的时候与之前聚集进行比拟。不论是将拜访信息存在内存(或数据库)都会对服务器造成非常大的压力。那是不是存在一种方法,容忍必定的毛病率,高效(盘算庞杂度、空间庞杂度)的实现拜访量信息的跟踪、统计呢?接下来介绍的布隆过滤器(Bloom在大数据与云盘算发展的时期,我们常常会碰到这样的问题。我们是不是能高效的断定一个