大数据Hadoop的优点和缺点分别是什么

hadoop的优点
(1)hadoop具有按位存储和处理数据能力的高可靠性。
(2)hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。
(3)hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。
(4)hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错性。
hadoop的缺点
(1)hadoop不适用于低延迟数据访问。
(2)hadoop不能高效存储大量小文件。
(3)hadoop不支持多用户写入并任意修改文件。
hadoop的核心组件
hadoop自诞生以来,主要出现了hadoop1、hadoop2、hadoop3三个系列多个版本。
hdfs和mapreduce是hadoop1的核心组件,hadoop生态圈里的很多组件都是基于hdfs和mapreduce发展出来的。在继hadoop1之后出现了hadoop2,hadoop2在hadoop1的基础上做了改进。
相比hadoop1,hadoop2的三大核心组件分别是hdfs、mapreduce、yarn。目前市面上绝大部分企业使用的是hadoop2,本书使用的是hadoop2.7.3这一版本。
hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下。
(1)hadoopcommon:为其他hadoop模块提供基础设施。
(2)hdfs:具有高可靠性、高吞吐量的分布式文件系统。
(3)mapreduce:基于yarn系统,分布式离线并行计算框架。
(4)yarn:负责作业调度与集群资源管理的框架。

变压器数字化—变压器企业转型的必由之路
LoRa模块为什么会出现timeout,分析其原因
功率器件龙头华微电子未来可期
地平线旭日3成功部署运行参数规模高达14亿的大语言模型
商务百搭创基USB-C扩展坞转接无限可能
大数据Hadoop的优点和缺点分别是什么
新唐科技NCT3107S简介
诺基亚8、诺基亚9什么时候上市?诺基亚旗舰机曝光!背部采用与华为P10相同工艺,值得一买!
苹果罕见促销难挡股价跌势 全球市值第一的宝座被微软夺走
什么是边缘服务器?边缘服务器的优势分析
Trinamic的StealthChop™驱动器的高度静音
欧洲议会成员认为区块链可以让小企业从中获益
由合成数据支持的可解释人工智能
华为Mate9解决安卓卡顿问题 拉美市场销量已超1000万
利用人工智能的变革潜力来支持经济多元化
电感和磁珠有什么联系与区别?
未来携号转网会不会因电信与移动目前市场策略而造成什么影响
离子推进系统的推力水平提高 离子推进无人机静音飞行
浮动端面密封环压射套的应用
土壤有机质检测仪产品简介