ClouderaApacheHadoop培訓(xùn)及認(rèn)證幫助您進(jìn)階大數(shù)據(jù)知識及技能。
Cloudera大學(xué)為期4天的Hadoop管理員培訓(xùn)將幫助學(xué)員綜合理解并全面掌握通過ClouderaManager對Hadoop集群的運維管理,包括:安裝,配置、負(fù)載平衡及性能調(diào)優(yōu)等。通過該培訓(xùn),Hadoop系統(tǒng)管理員將能準(zhǔn)備好應(yīng)對實際運維中遇到的挑戰(zhàn)。
一.培訓(xùn)內(nèi)容
● 通過講師在課堂上的講解,以及實操練習(xí),學(xué)員將學(xué)習(xí)以下內(nèi)容:
● ClouderaManager管理集群的特性,諸如日志匯總、配置管理、資源管理、報告、報警及服務(wù)管理等。
● YARN、MapReduce、Spark及HDFS的工作原理。
● 如何為你的集群選取合適的硬件和架構(gòu)。
● 如何將Hadoop集群和企業(yè)已有的系統(tǒng)進(jìn)行無縫集成。
● 如何使用Flume進(jìn)行實時數(shù)據(jù)采集以及如何使用Sqoop在RDBMS和Hadoop集群之間進(jìn)行數(shù)據(jù)導(dǎo)入導(dǎo)出。
● 如何配置公平調(diào)度器為Hadoop上的多用戶提供服務(wù)級別保障。
● 產(chǎn)品環(huán)境中Hadoop集群的運維實踐。
● Hadoop集群排錯、診斷問題和性能調(diào)優(yōu)。
二.培訓(xùn)對象及學(xué)員基礎(chǔ)
面向系統(tǒng)管理員和IT經(jīng)理,需具備Linux經(jīng)驗,無需ApacheHadoop基礎(chǔ)。
三.認(rèn)證
結(jié)束本課程培訓(xùn)后,我們建議學(xué)員準(zhǔn)備并注冊參加CCAHadoop管理員考試。通過并獲取該證書是向公司及客戶證明個人在Hadoop領(lǐng)域的技術(shù)和專長的有力依據(jù)。
四.課程大綱
1. ApacheHadoop介紹
● Hadoop的創(chuàng)建動機(jī)
● 基本概念
● Hadoop核心部件
2. Hadoop集群安裝
● 集群管理方案
● ClouderaManager特性
● Clouderamanager安裝
● Hadoop(CDH)安裝
3. Hadoop分布式文件系統(tǒng)(HDFS)
● HDFS特性
● 讀寫文件
● NameNode內(nèi)存考慮
● HDFS安全簡介
● HDFSWebUI
● 使用HDFSShell
4. YARN上的MapReduce和Spark
● 計算平臺在Hadoop里扮演的角色
● YARN:集群資源管理器
● MapReduce概念
● ApacheSpark概念
● Yarn上的計算平臺
● 通過WebUI及Shell觀察YARN應(yīng)用
● YARN應(yīng)用運行日志
5. Hadoop配置及服務(wù)運行日志
● ClouderaManager配置管理機(jī)制
● 定位配置參數(shù)及進(jìn)行配置變更
● 管理角色實例及添加服務(wù)
● 配置HDFS服務(wù)
● 配置Hadoop服務(wù)運行日志
● 配置YARN服務(wù)
6. HDFS數(shù)據(jù)導(dǎo)入
● 使用Flume從外部數(shù)據(jù)源實時
● 導(dǎo)入數(shù)據(jù)
● 使用Sqoop從關(guān)系數(shù)據(jù)庫導(dǎo)入數(shù)據(jù)
● REST接口
● 導(dǎo)入數(shù)據(jù)的實踐
7. Hadoop集群規(guī)劃
● 規(guī)劃考慮因素
● 硬件選擇
● 虛擬化選項*
● 網(wǎng)絡(luò)因素
● 節(jié)點配置
8. Hive,Impala及Pig安裝及配置
● Hive
● Impala
● Pig
9. Hadoop客戶端及Hue
● 什么是Hadoop客戶端
● 安裝及配置Hadoop客戶端
● 安裝及配置Hue
● 使用Hue進(jìn)行身份驗證及授權(quán)
10. 集群高級配置
● 高級配置參數(shù)
● Hadoop端口配置
● HDFS機(jī)柜感知配置
● HDFS高可靠性配置
11. Hadoop安全
●Hadoop安全的重要性
● Hadoop安全性概念
● Kerberos簡介
● 使用Kerberos保護(hù)Hadoop集群
● 其他安全概念
12. 資源管理
● 使用靜態(tài)服務(wù)池配置Linuxcgroup
● 公平調(diào)度器
● 配置動態(tài)資源池
● YARN內(nèi)存及CPU設(shè)置
● Impala查詢調(diào)度
13. 集群維護(hù)
● 檢查HDFS狀態(tài)
● 集群間復(fù)制數(shù)據(jù)
● 添加/移除集群節(jié)點
● 集群數(shù)據(jù)負(fù)載平衡
● 目錄快照
● 集群升級
14. 集群監(jiān)控及排錯
● ClouderaManager監(jiān)控特性
● 監(jiān)控Hadoop集群
● Hadoop集群排錯
● 常見配置不當(dāng)問題
15. 結(jié)論
Cloudera大數(shù)據(jù)課程體系