阅读背景:

The Dataflow Model:Google Dataflow 编程模型

来源:互联网 

摘要

在日常商业运营中,无边界、乱序、大规模数据集越来越普遍了。(例如,网站日志,手机应用统计,传感器网络)。同时,对这些数据的消费需求也越来越复杂。比如说按事件发生时间序列处理数据,按数据本身的特征进行窗口计算等等。同时人们也越来越苛求立刻得到数据分析结果。然而,实践表明,我们永远无法同时优化数据处理的准确性、延迟程度和处理成本等各个维度。因此,数据工作者面临如何协调这些几乎相互冲突的数据处理技术指标的窘境,设计出来各种纷繁的数据处理系统和实践方法。在日常商业运营中,无边界、乱序、大规模数据集越来越普遍了。(例如,网站日志




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: