公開課 內(nèi)訓課 培訓師
首頁 公開課 內(nèi)訓課 特惠課程 培訓師 培訓專題 在線文檔 管理名言 會員專區(qū) 積分兌換 聯(lián)系我們 關(guān)于我們 誠聘英才     
首頁 >> 公開課 >> 綜合管理 >> Cloudera授權(quán)Apache Hadoop分析師認證培訓
Cloudera授權(quán)Apache Hadoop分析師認證培訓 下載課程WORD文檔
添加時間:2015-05-11      修改時間: 2015-05-11      課程編號:100279699
《Cloudera授權(quán)Apache Hadoop分析師認證培訓》課程詳情
點擊下載課大綱及報名表
課程綜述
Cloudera授權(quán)Apache Hadoop數(shù)據(jù)分析師培訓為期三天,課程聚焦于Apache Pig、Hive及Cloudera Impala。將向?qū)W員教授如何在大數(shù)據(jù)中運用觸痛的數(shù)據(jù)分析及商業(yè)智能技能。課程為大數(shù)據(jù)專家講解了能夠使用SQL和類似腳本語言來訪問、維護及分析復(fù)雜數(shù)據(jù)集的工具。
Hadoop的實驗操作:
通過將講師的分享、討論與動手實驗相結(jié)合,學員將探索Hadoop生態(tài)系統(tǒng)的所有領(lǐng)域,學習的課題如下:
-Apache Hadoop基礎(chǔ)及使用Hadoop工具進行數(shù)據(jù)ETL(抽取、轉(zhuǎn)換、裝載)、提取及處理
-使用Pig關(guān)聯(lián)多個數(shù)據(jù)集并分析不同的數(shù)據(jù)
-利用Hive實現(xiàn)在表中組織數(shù)據(jù)、完成轉(zhuǎn)換并簡化復(fù)雜查詢
-使用Impala實現(xiàn)對保存在HDFS或HBase中的大數(shù)據(jù)集進行基于SQL的實時交互式分析
-在Hadoop中針對特定的任務(wù)如何選取最佳的工具


內(nèi)容綱要
*簡介
-關(guān)于課程
-關(guān)于Cloudera
-課程邏輯
*Hadoop基礎(chǔ)
-Hadoop概述
-HDFS
-MapReduce
-Hadoop生態(tài)系統(tǒng)
-實驗場景
*Pig概述
-什么是Pig
-Pig的功能
-Pig使用案例
-與Pig交互
*HBase的概念
-HBase的基本概念
-使用HBase
*使用Pig做基本數(shù)據(jù)分析
-Pig的拉丁語法
-裝載數(shù)據(jù)
-簡單數(shù)據(jù)類型
-字段定義
-數(shù)據(jù)輸出
-查看Schema
-數(shù)據(jù)過濾及排序
-常用函數(shù)
*使用Pig處理復(fù)雜數(shù)據(jù)
-存儲格式
-復(fù)雜/嵌套數(shù)據(jù)類型
-分組
-關(guān)于復(fù)雜數(shù)據(jù)的內(nèi)置函數(shù)
-分組數(shù)據(jù)迭代
*使用Pig操作多數(shù)據(jù)集
-數(shù)據(jù)集組合技術(shù)
-在Pig中關(guān)聯(lián)數(shù)據(jù)集
-設(shè)置操作
-分割數(shù)據(jù)集
*擴展Pig
-通過參數(shù)提升靈活性
-宏與導(dǎo)入
-UDFs
-分布函數(shù)
-在Pig中利用其它語言處理數(shù)據(jù)
*Pig故障分析與優(yōu)化
-Pig故障分析
-日志
-使用Hadoop的web UI
-數(shù)據(jù)采樣與調(diào)試
-性能概述
-理解執(zhí)行計劃
-提升Pig作業(yè)性能的提示
*Hive簡介
-什么是Hive
-Hive Schema及數(shù)據(jù)存儲
-Hive與傳統(tǒng)關(guān)系型數(shù)據(jù)庫管理系統(tǒng)的對比
-Hive vs Pig
-Hive用戶案例
-Hive迭代
*使用Hive分析關(guān)系型數(shù)據(jù)
-Hive數(shù)據(jù)庫及表
-基本HiveQL語法
-數(shù)據(jù)類型
-關(guān)聯(lián)數(shù)據(jù)集
-常用內(nèi)置函數(shù)
*Hive數(shù)據(jù)管理
-Hive數(shù)據(jù)格式
-創(chuàng)建數(shù)據(jù)庫和Hive管理表
-將數(shù)據(jù)裝載到Hive
-變更數(shù)據(jù)庫和表
-自管理表
-使用視圖簡化查詢
-保存查詢結(jié)果
-控制數(shù)據(jù)訪問
*使用Hive處理文本
-文本處理概述
-重要的字符串函數(shù)
-在Hive中使用正則表達式
-情緒分析及N-Grams
*Hive優(yōu)化
-理解查詢性能
-控制作業(yè)執(zhí)行計劃
-分區(qū)
-Bucketing
-數(shù)據(jù)索引
*擴展Hive
-SerDes
-使用定制腳本傳輸數(shù)據(jù)
-用戶定義的函數(shù)
-參數(shù)化查詢
*Impala簡介
-什么是Impala
-Impala與Hive及Pig的區(qū)別
-Impala與關(guān)系型數(shù)據(jù)庫的區(qū)別
-限制與未來的方向
-使用Impala shell
*使用Impala分析數(shù)據(jù)
-基本語法
-數(shù)據(jù)類型
-過濾、排序和結(jié)果限定
-數(shù)據(jù)關(guān)聯(lián)與分組
-提升Impala性能
*針對作業(yè)選擇最佳工具
-對比MapReduce、Pig、Hive、Impala及關(guān)系型數(shù)據(jù)庫
-如何選擇?


目標學員
本課程適合于具有使用SQL和Unix或Linux基本命令經(jīng)歷的數(shù)據(jù)分析師、業(yè)務(wù)分析師、開發(fā)人員和系統(tǒng)管理員,并不要求已經(jīng)具有Java和Apache Hadoop的知識。


《Cloudera授權(quán)Apache Hadoop分析師認證培訓》所屬分類
綜合管理

《Cloudera授權(quán)Apache Hadoop分析師認證培訓》授課培訓師簡介
《Cloudera授權(quán)Apache Hadoop分析師認證培訓》報名服務(wù)流程
-----------------------------------------------------------------------------------

選擇課程

選擇上課時間

報名參加

確認報名

支付課款

參加課程

我們的優(yōu)勢
十六年誠信品牌值得信賴
一站式培訓顧問服務(wù)想你所需
海量課程及專業(yè)師資隨需應(yīng)變
多城市開課,讓您擁有更多選擇更多便利
會員折扣讓您更合理有效的使用您的費用預(yù)算
公開課需求        課程編號:100279699          咨詢熱線:020-29042042
課程名稱:  Cloudera授權(quán)Apache Hadoop分析師認證培訓
您的真實姓名:  * (請一定使用真實姓名)
性    別:  先生女士
公司名稱: 
E-mail地址:  *
電話/手機:  * (電話請帶上區(qū)號,謝謝)
QQ: 
上課時間:  (時間格式:2025-01-08)
上課地點: 
費用預(yù)算:  * 元人民幣。(請?zhí)顚憯?shù)字,不需要填寫單位。)
其它咨詢: 
驗證數(shù)字:   驗證碼,看不清楚?請點擊刷新驗證碼 *
準時開課
報名有禮!
1、報名參加本課程,可獲得雙倍積分!
  點擊這里查看積分的用途
2、老客戶介紹新客戶參加本課程,老客戶將可額外獎勵0.5倍積分!
  點擊這里查看積分的用途
3、報名參加指定課程可按會員享受8.5折優(yōu)惠!
4、報名參加本站特惠課程最高可享受300元/人的交通食宿補貼!
  點擊這里查看所有活動特惠課程
相關(guān)培訓
關(guān)于我們 | 聯(lián)系我們 | 友情連接 | 培訓分類導(dǎo)航
Copyright © 2009-2025 peixune.com . All rights reserved.
廣州必學企業(yè)管理咨詢有限公司 版權(quán)所有  頁面執(zhí)行時間: 18.3 毫秒

粵公網(wǎng)安備 44011302000582號


粵ICP備16013335號
培訓易在線客服 ×