北科培训“Hadoop系统原理、开发与运维”培训班
主办单位:北京市北科信息处理公司
培训地点:中国 北京
培训时间:2014年5月16日—18日
【课程简介】
通过此课程的培训,学员可以了解大数据技术的发展方向并深入理解Hadoop技术架构、运作机制和使用场景,对于MapReduce程序开发有清晰全面的认识,可以开发测试Hadoop程序,以及独立规划、部署以及调试生产环境的Hadoop集群,并进行版本管理。课程还涵盖了对新一代大数据操作系统--YARN的深入介绍,帮助学员在企业大数据战略方向上体现自身价值。课程主要涵盖以下内容:Hadoop基础知识、HDFS和MapReduce基本原理和架构、HDFS配置和部署、Mapreduce开发、Hadoop 2.0 – YARN、大数据生态系统。
【讲师简介】
堵老师,知名外企资深架构师,中国大陆地区唯一Apache Hadoop项目的Committer,负责Hadoop相关代码的审查和变更。有多年云计算与大数据开发和实施经验,熟悉大数据领域各项技术和商业模式,并活跃于国内外重要的大数据会议和论坛。
1. 各类 IT/软件企业和研发机构的技术总监、企业CIO;
2. 大数据系统工程师、软件架构师、软件设计师、高级软件工程师等;
3. 数据库开发人员、互联网产品后台开发人员;
4. 运维人员、数据分析师、软件测试人员。
【课程内容】
| 
			 课题  | 
			
			 课程内容  | 
		
| 
			 第一天:Hadoop基础知识、基本原理和部署  | 
		|
| 
			 模块一 大数据和Hadoop入门  | 
			
			 大数据Hadoop的前世今生 Hadoop经典应用案例  | 
		
| 
			 模块二 Hadoop基础知识  | 
			
			 Hadoop与分布式系统 Hadoop扩展性分析 Hadoop基本模块  | 
		
| 
			 模块三 HDFS与MAPREDUCE基本原理与架构  | 
			
			 HDFS架构与功能分析 HDFS读与写流程分析 HDFS守护进程分析 MapReduce基础知识 MapReduce基本功能分析 MapReduce架构分析与故障恢复  | 
		
| 
			 模块四 Hadoop集群管理与配置  | 
			
			 Hadoop常见使用命令 Hadoop运维故障及解决 Hadoop常用工具 Hadoop集群安装和开启LZO压缩 Hadoop配置集群具备机架感知 Hadoop集群开启公平/能力任务调度器  | 
		
| 
			 模块五 Hadoop集群维护与管理  | 
			
			 查看集群状态 HDFS数据管理 Mapreduce 任务管理 HDFS安全模式 Namenode,Jobtrack单点失效问题 添加删除节点 数据平衡 文件数据跨集群拷贝 集群升级  | 
		
| 
			 模块六 Hadoop集群规划、测试、监控与高可用  | 
			
			 集群规划(硬件,系统,网络) 集群性能测试 使用Ganglia 监控Hadoop集群 使用Cacti 监控操作系统 Hadoop 元数据NFS备份方案 Hadoop SecondaryNameNode备份方案  | 
		
| 
			 第二天:Hadoop MapReduce开发  | 
		|
| 
			 模块七 Hadoop MapReduce流程分析  | 
			
			 Hadoop JobTracker 详解回顾 Hadoop TaskTracker 详解回顾 Hadoop 任务提交流程详解  | 
		
| 
			 模块八 使用 Hadoop MapReduce Streaming 编程  | 
			
			 Hadoop Streaming 和 Java MapReduce API 差异。 学习使用 MapReduce 实现数据库功能,比如select group by join union all )  | 
		
| 
			 模块九 MapReduce分布式程序  | 
			
			 MapReduce流程 剖析一个MapReduce程序 基本MapReduceAPI 概念 驱动代码 Mapper Reducer API 使用Eclipse进行快速开发 上机实验 新MapReduce API  | 
		
| 
			 模块十 HDFS分布式文件系统编程  | 
			
			 Hadoop HDFS 回顾 Hadoop NameNode 回顾 Hadoop DataNode 回顾 Hadoop I/O 操作 使用Hadoop HDFS API对HDFS编程  | 
		
| 
			 模块十一 Hadoop MapReduce高级编程和优化  | 
			
			 ToolRunner介绍 使用MRUnit进行测试 利用Combiners来减少中间数据 使用Configure和Close方法来进行Map/Reduce设置和关闭 编写Partitioner来优化负载平衡 直接访问Hadoop分布式文件系统(HDFS) 使用分布式缓存(Distributed Cache) map优化 reduce优化 小文件优化  | 
		
| 
			 第三天:Hadoop 2.0 — YARN和大数据生态系统  | 
		|
| 
			 模块十二 YARN基础知识与架构分析  | 
			
			 下一代HADOOP – YARN介绍 YARN的主要模块分析 YARN的 RPC通信机制 YARN的 两级资源调度机制 YARN的 多应用支持  | 
		
| 
			 模块十三 YARN集群配置和MapReduce特性  | 
			
			 YARN基础配置 脚本化部署与卸载 YARN配置文件 YARN高级配置 高可用性配置 机架感知 基于CPU, Memory资源的公平、能力调度器 MapReduce的兼容性分析 插件化Shuffle和排序  | 
		
| 
			 模块十四 YARN集群维护与管理  | 
			
			 查看YARN集群状态 查看YARN高可用性状态 YARN任务管理与追踪 集群ResourceManager失效 添加删除节点 集群升级 任务历史服务器 集群安全认证  | 
		
| 
			 模块十五 Hadoop YARN二次开发  | 
			
			 YARN Resource Manager API YARN客户端和Application Master 剖析Distributed Shell 总结不同应用的Application Master定制方案  | 
		
| 
			 模块十六 大数据生态系统  | 
			
			 大数据与存储系统 大数据与线上系统 大数据与实时系统 大数据与数据仓库 大数据与内存计算 大数据与虚拟化 大数据与云计算  | 
		
【注】:北信保留对以上课程信息(包括课程设置,课程内容和其他细节等)进行调整的权利,具体课程信息以实际上课为准。
【培训费用】
培训费:3980元/人,包括培训费、版资料费。培训期间免费提供午餐。可协助安排住宿,食宿费用自理。
1. 4月20日(含)之前报名且付款的学员可享受九折优惠;
2. 4月21日之后,5月10日之前报名且付款的学员可享受九五折优惠;
3. 3+1团报,同期班同单位3人报名且付款的团体,免费赠送1个学员名额;
4. 参加过往届北信培训班(不包含公开课)的学员享受八八折优惠。
(1,2,3,4的优惠不能同时使用,最终解释权归北信所有)
1. 名额有限,报满为止。我们将在报名后3个工作日内发送确认函,报名是否成功以收到我们的确认邮件为准;
2. 请自带笔记本电脑方便上机操作;
3. 已经成功付款的学员,若临时有事不能参加培训,请提前联系我们报退,可退还100%的培训费用;也可以转邀其他人代为参加;或者提交延期申请,推迟至下一期的培训。
1. 或者填写报名回执表,将报名回执表以附件的形式发送到邮箱bktraining@163.com;
2. 报名咨询: 张老师 (咨询时间:周一至周五9:00-17:00)
3. 电话:010-57674188 手机:13466732145
4. 联系邮箱:bktraining@163.com
账户名称:北京市北科信息处理公司
开户银行:北京银行健翔支行
账号:0109 1122 8001 2010 2013 270
汇款信息:Hadoop系统原理、开发与运维培训班
| 
			 培训班报名回执  | 
		|||||||
| 
			 姓名  | 
			
			 
  | 
			
			 性别  | 
			
			 
  | 
			
			 职务  | 
			
			 
  | 
		||
| 
			 身份证号  | 
			
			 
  | 
			
			 报名日期  | 
			
			 
  | 
		||||
| 
			 工作单位  | 
			
			 
  | 
		||||||
| 
			 研究方向  | 
			
			 
  | 
		||||||
| 
			 固定电话  | 
			
			 
  | 
			
			 手机  | 
			
			 
  | 
			
			 | 
			
			 
  | 
		||
| 
			 是否住宿  | 
			
			 
  | 
			
			 是否用餐  | 
			
			 
  | 
		||||
| 
			 备注  | 
			
			 
  | 
		||||||