hadoop是什么？新手自学hadoop教程_极悦注册

专注Java教育14年全国咨询/投诉热线：444-1124-454

全国校区

极悦注册机构

北京

深圳极悦注册

深圳

上海极悦注册

上海

广州极悦注册

广州

武汉极悦注册

武汉

极悦注册机构

成都

西安极悦注册机构

西安

郑州极悦注册机构

郑州

南京极悦注册机构

南京

长沙极悦注册机构

长沙

按需选班

爆
Java实验班



Java就业班



Java在职加薪班



Java架构师班



Java夜校班
首页
师资力量
极悦在线学习
图书馆
视频教程
毕业设计
报名须知

首页学习攻略 Java学习 hadoop是什么？新手自学hadoop教程

hadoop是什么？新手自学hadoop教程

更新时间：2019-08-20 11:26:49 来源：极悦浏览2258次

　　Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

　　Hadoop是一个专为离线和大规模数据分析而设计的，并不适合那种对几个记录随机读写的在线事务处理模式。

　　Hadoop=HDFS（文件系统，数据存储技术相关）+Mapreduce（数据处理），Hadoop的数据来源可以是任何形式，在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能，具有更灵活的处理能力，不管任何数据形式最终会转化为key/value，key/value是基本数据单元。

　　用函数式变成Mapreduce代替SQL，是查询语句，而Mapreduce则是使用脚本和代码，而对于适用于关系型数据库，习惯SQL的Hadoop有开源工具hive代替。

timg (4).jpg

　　hadoop使用Java编写，版本较为混乱，初学者可从1.2.1开始学习

　　1.成百上千台服务器组成集群，需要时刻检测服务器是否故障

　　2.用流读取数据更加高效快速

　　3.存储节点具有运算功能，省略了服务器之间来回传数据的网络带宽限制

　　4.一次写入，多次访问，不修改数据

　　5.多平台

　　namenode:master，负责总体调度，处理协调请求等

　　（一个集群只能有一个namenode，但是可以多个集群组成一个更大的集群，这时就有多个namenode，这时的namenode有两种状态，一种叫active并且一个大集群只能有一个namenode处于该状态，一种为standby）

　　namenode两大功能：接受客户端读写服务，存放元数据（DataNode存储的位置等基本信息，fsimage和edits文件）

　　fsimage是namenode格式化时产生的，edits是用户操作增删改查的时候生成的日志

　　datanode:slave，存储节点，会备份，一般本地2分，其他服务器一份

　　机架:多个DataNod节点组成，master通过机架感知技术得知所需数据的位置

　　数据块:存储单元，一般64M（hadoop2中是128M）

　　时刻保持心跳通讯，保证每个数据都备份于3个节点上

　　5的read为第一个数据块读完后，读下一个数据块，如果在读取过程中某一个数据块出问题，则会记录下来并且找其他的备份，并且以后不再读取错误数据块

　　map负责分批运算，如果要统计1TB数据中my的出线次数，则可以启用100个map，每个map统计0.01TB数据，最终由reduce汇总

　　作业（Job）：运行一个MapReduce所需要用到的所有jar组件

　　任务（Task）：mapTask和ReduceTask

　　Key相同的结果进行reduce统计合并

　　作业提交一般提交jar包和配置文件

　　调度一般来说默认采取FIFO调度，即先考虑优先级，然后先进先出

　　TaskTracker会不断想JobTracker传达任务信息，如果空闲会主动申请作业

　　一般的生产环境都是完全分布式模式。

　　需要资料的可以登录极悦IT培训官网咨询在线客服老师，打包好了一些Java的基础资料和一些进阶资料。

上一篇纯干货！Eclipse的安装与使用下一篇全网Java性能优化最好的12个细节

相关阅读

最新文章

提交申请后，顾问老师会电话与您沟通安排学习

课程大纲学习路线毕业设计开发工具

西安校区 2024-08-20 抢座中
南京校区 2024-08-20 抢座中
武汉校区 2024-08-20 抢座中
郑州校区 2024-08-20 抢座中
长沙校区 2024-08-20 抢座中
成都校区 2024-08-20 抢座中
广州校区 2024-08-20 抢座中
深圳校区 2024-08-20 抢座中
上海校区 2024-08-20 抢座中
北京校区 2024-08-20 抢座中

西安校区 2024-08-05 抢座中
南京校区 2024-08-05 抢座中
长沙校区 2024-08-05 抢座中
成都校区 2024-08-05 抢座中
广州校区 2024-08-05 抢座中
深圳校区 2024-08-05 抢座中
上海校区 2024-08-05 抢座中
北京校区 2024-08-05 抢座中
西安校区 2024-09-05 抢座中
南京校区 2024-09-05 抢座中

全国校区 2024-08-19 抢座中
全国校区 2024-09-20 抢座中
全国校区 2024-10-24 抢座中
全国校区 2024-11-21 抢座中
全国校区 2024-12-19 抢座中

免费课程推荐 >>

技术文档推荐 >>

大家在问 >>

极悦注册班
热点话题
城市分站
资源广场
热门专题

北京极悦注册广州极悦注册深圳极悦注册上海极悦注册武汉极悦注册成都极悦注册西安极悦注册郑州极悦注册南京极悦注册长沙极悦注册