Scalaz（52）－ scalaz-stream: 并行运算－parallel processing concurrently by merging

发表于:2021-03-06

如果scalaz-stream真的是一个实用的数据流编程工具库的话，那它应该能处理同时从多个数据源获取数据以及把数据同时送到多个终点（Sink），最重要的是它应该可以实现高度灵活的多线程运算。但是：我们说Process代表了一串可能是无穷的元素。这个一串的意思是多个按序排列的元素。也就是说如果我们有一个Process(a,b,c)，那么我们只能按顺序来进行运算：我们只能在完成了对a的运算后才能运算b。这样也说得过去：它让我们更容易理解scalaz-stream Process的运算过程。面对scalaz-stream这样的特性我们应该怎样去实现它的并行运算呢？实际上在很多应用场景中我们对运算结果的排列顺序并不关心，我们只对运算结果内容感兴趣。如：从数据库库存表中查询商品价格大于100的所有商品，这时我们对读出商品记录的顺序并不关心，我们只对每条记录的价格感兴趣。如果我们从很多源头（数据表）读取商品信息的话，可以同时对这些源头进行并行读取。scalaz-stream是通过merge来实现并行运算的。merge可以同时读取多个数据源然后产生一个合并的数据流。由于各个源头的滞后情况有所不同，所以merge产生结果的顺序是不可预测的（nondeterministic）。我们用个例子来示范有那些方法可以同时从三个文件中逐行读取文字然后再合并成一个多行文件：如果scalaz-stream真的是一个实用的数据流编程工具库的话，那它应该能处理同时从

分享到：

非常感谢你花费了来阅读本文,如果你在本站获取到了新知识,那就请点击分享按钮将本站分享出去吧。