信茂工控网
首页 > 运动控制 > Storm精华问答 为什么要用Storm不用Spark

Storm精华问答 为什么要用Storm不用Spark

Storm精华问答 为什么要用Storm?不用Spark?

戳蓝字“CSDN云端计算”关注我们哦!

Apache Storm是一个分散式实时大资料处理系统。Storm设计用于在容错和水平可扩充套件方法中处理大量资料。它是一个流资料框架,具有最高的摄取率。今天,我们就挑一些Storm的安装配置问题来看看吧。

1

Q:Storm简介

A:1.Storm是一套分散式的、可靠的,可容错的用于处理流式资料的系统。

2.Storm也是基于C/S架构来进行工作的,C负责将资料处理的方式的jar(Topology)传送给S,S解析C传送过来的jar(Topology),并按一定规则jar变成多个Task((Spout/Bolt)),生成相关的程序和执行绪执行里面的Task。

2

Q:topology工作原理

A:1.Storm丛集中有两种节点,一种是控制节点(Nimbus节点),另一种是工作节点(Supervisor节点)。

2.所有Topology任务的 提交必须在Storm客户端节点上进行(需要配置 storm.yaml档案),由Nimbus节点分配给其他Supervisor节点进行处理。

3.Nimbus节点首先将提交的Topology进行分片(Spout/Bolt),分成一个个的Task,并将Task和Supervisor相关的资讯提交到 zookeeper丛集上。

4.Supervisor会去zookeeper丛集上认领自己的Task,通知自己的Worker程序进行Task的处理。

3

Q:Storm有哪些特性?

A: 1.适用场景广泛: storm可以实时处理讯息和更新DB,对一个数据量进行持续的查询并返回客户端(持续计算),对一个耗资源的查询作实时并行化的处理(分散式方法呼叫,即DRPC),storm的这些基础API可以满足大量的场景。

2. 可伸缩性高: Storm的可伸缩性可以让storm每秒可以处理的讯息量达到很高。扩充套件一个实时计算任务,你所需要做的就是加机器并且提高这个计算任务的并行度 。Storm使用ZooKeeper来协调丛集内的各种配置使得Storm的丛集可以很容易的扩充套件。

3. 保证无资料丢失: 实时系统必须保证所有的资料被成功的处理。 那些会丢失资料的系统的适用场景非常窄, 而storm保证每一条讯息都会被处理, 这一点和S4相比有巨大的反差。

4. 异常健壮: storm丛集非常容易管理,轮流重启节点不影响应用。

5. 容错性好:在讯息处理过程中出现异常, storm会进行重试

6. 语言无关性: Storm的topology和讯息处理元件(Bolt)可以用任何语言来定义, 这一点使得任何人都可以使用storm。

4

Q:Storm的丛集结构

A:

5

Q:为什么要用Storm?为什么不用Spark?

A:很多场景下,我们希望系统能够实时的处理一条资料、甚至是事务。也就是说,在处理资料、事务的过程中,到达系统,并能马上得到结果。其次,在成万上亿条资料大量涌入系统时,也要求“实时”的到事务处理的结果。此时,单个节点已经是杯水车薪了,而Storm的关键一项是因为它支援分散式平行计算!如果说,你遇到了以上相似的场景,那Storm可以当仁不让的扛起实时处理的大旗!

这个问题其实很难界定,因为Spark在RDD粒度上,可以满足实时计算的要求,当然,使用RDD还有其他优势;但总的来说,Storm 的实时性更强。其次,Storm的框架完全按照流式处理的思想构建,和专案场景结合性更强一些。(Spark 用的不是很多,欢迎吐槽。)

在看Storm之前,很多人都对Hadoop有一定了解,为了能更快入戏,我们以Hadoop为参照,以下是它使用yarn之前的架构,对照Storm Server框架理解。

小伙伴们冲鸭,后台留言区等着你!

关于Storm,今天你学到了什么?还有哪些不懂的?除此还对哪些话题感兴趣?快来留言区打卡啦!留言方式:开启第XX天,答:……

同时欢迎大家搜集更多问题,投稿给我们!风里雨里留言区里等你~

福利

扫描新增小编微信,备注“姓名+公司职位”,加入【云端计算学习交流群】,和志同道合的朋友们共同打卡学习!

推荐阅读:

同样是讯息伫列,Kafka凭什么速度那么快?

苹果宣布加入CNCF;华为要求美国运营商支付专利费;微软删除最大的公开人脸识别资料集

如何给老婆解释什么是微服务?(文末有福利)

任正非:华为 100% 没有后门

阿里巴巴杨群:高并发场景下Python的效能挑战

那些去德国的程序员后来怎么样了?

新技术“红”不过十年,半监督学习为什么是个例外?

独家对话V神! 质疑之下的以太坊路在何方?

真香,朕在看了!

标签:

上一篇 目录 下一章

猜你喜欢

工控运动控制 免费职业性格测...
免费职业性格测试系统:为你揭示最合适的工作之路吗? 在这个快节奏和多元化的社会中,人们越来越意识到找到一个与自己性格、兴趣和价值观相匹配的职业是至关重要的...
工控运动控制 软件测试的基本...
测试基础理论 软件测试作为软件开发过程中的一个重要环节,其核心任务是确保软件产品在满足用户需求的同时,能够稳定地运行,没有明显的缺陷。为了成为一名优秀的软...
工控运动控制 职场回顾个人成...
职场回顾:个人成长之旅的精彩瞬间 一、职场征途的起点 在这个充满挑战与机遇的世界里,我们每个人的职业生涯都是一个独特而宝贵的旅程。站在今天,我想回望从前的...
工控运动控制 芯片革命从逆袭...
芯片革命:从逆袭到领先的中国技术奇迹 一、逆袭之路 在信息时代,芯片是科技进步的核心驱动力。随着全球经济逐渐走向数字化和智能化,需求对于高性能、高集成度、...

强力推荐