Q:计算组件区别?
A:
l MapReduce:是一种离线计算框架,将一个算法抽象成Map和Reduce两个阶段进行处理,是一种磁盘计算框架,非常适合数据密集型计算。
l Spark:Spark则是一种内存计算框架,它将数据尽可能放到内存中以提高迭代应用和交互式应用的计算效率,适合迭代计算和交互式计算
l Storm/Flink:Storm和Flink都是流计算框架。Storm擅长流计算,时延低,它的实时性要远远优于MapReduce计算框架。Flink是用于分布式流和批处理的开源平台。相比之下Flink对窗口及状态管理更加完善,且性能要优于Storm
l Tez:支持DAG作业的计算框架,是对MapReduce数据处理的归纳。把Map/Reduce过程拆分成若干个子过程,同时可以把多个Map/Reduce任务组合成一个较大的DAG任务,减少Map/Reduce之间的文件存储,并合理组合其子过程,减少任务的运行时间。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作