推廣 熱搜: 2022  財務  微信  法律    網格化  管理  營銷  總裁班  安全 

        Hadoop大數據解決方案平臺技術培訓

        主講老師: 傅一航 傅一航

        主講師資:傅一航

        課時安排: 1天/6小時
        學習費用: 面議
        課程預約: 隋老師 (微信同號)
        課程簡介: 本課程主要介紹Hadoop的思想、原理,以及重要技術等相關知識。
        內訓課程分類: 綜合管理 | 人力資源 | 市場營銷 | 財務稅務 | 基層管理 | 中層管理 | 領導力 | 管理溝通 | 薪酬績效 | 企業文化 | 團隊管理 | 行政辦公 | 公司治理 | 股權激勵 | 生產管理 | 采購物流 | 項目管理 | 安全管理 | 質量管理 | 員工管理 | 班組管理 | 職業技能 | 互聯網+ | 新媒體 | TTT培訓 | 禮儀服務 | 商務談判 | 演講培訓 | 宏觀經濟 | 趨勢發展 | 金融資本 | 商業模式 | 戰略運營 | 法律風險 | 沙盤模擬 | 國企改革 | 鄉村振興 | 黨建培訓 | 保險培訓 | 銀行培訓 | 電信領域 | 房地產 | 國學智慧 | 心理學 | 情緒管理 | 時間管理 | 目標管理 | 客戶管理 | 店長培訓 | 新能源 | 數字化轉型 | 工業4.0 | 電力行業 |
        更新時間: 2023-09-01 11:18


        課程目標】

        Hadoop作為開源的云計算平臺,大數據處理提供了一整套解決方案,應用非常廣泛。Hadoop作為一個平臺框架,包括了如何存儲海量數據,如何處理海量數據,以及相應的數據庫、數據倉庫、數據流處理、數據分析和挖掘算法庫,等等。本課程主要介紹Hadoop思想、原理,以及重要技術相關知識。

        通過本課程的學習,達到如下目的:

        1、 全面了解大數據處理技術的相關知識。

        2、 學習Hadoop的核心技術以及應用

        3、 深入掌握Hadoop的相關工具在大數據中的使用。

        4、 掌握Hadoop的常用模塊的工作原理及開發應用技術。

        5、 掌握傳統數據中心向大數據中心轉換的關鍵技術。

        6、 掌握海量數據處理的性能優化及維護技巧

        【授課時間】

        2時間

        【授課對象】

        網絡部、大數據系統開發、大數據中心、網絡運維部等相關技術人員

        【授課方式】

        原理精+案例演練+開發實踐+系統優化

        課程大綱】

        第一部分: Hadoop基本框架

        1、 數據時代面臨的問題

        2、 當前解決大數據的技術方案

        3、 Hadoop架構和云計算

        4、 Hadoop簡史及安裝部署

        5、 Hadoop設計理念和生態系統

         

        第二部分: HDFS分布式文件系統--海量數據存儲的搖籃

        1、 HDFS的設計目標

        2、 HDFS的基本架構

        NameNode名稱節點

        SecondaryNameNode第二名稱節點

        DataNode數據節點

        3、 HDFS的存儲模型

        數據塊存儲

        元數據存儲(空間鏡像與編輯日志)

        多副本存儲

        4、 多副本放置策略

        5、 多數據節點管理機制與交互過程

        6、 文件系統操作與管理

        讀文件過程

        寫文件過程(數據流管道)

        7、 數據完整性機制

        數據校驗和

        數據完整性掃描線程

        元數據備份與合并

        8、 數據可靠性設計

        安全模式(數據塊與節點映射關系管理)

        心跳檢測機制(節點失效管理)

        租約機制(多線程并發控制)

        9、 其它

        HDFS的安全機制

        負載均衡

        文件壓縮

        10、 操作接口與編程接口

        HDFS Shell

        HDFS Commands

        WebHDFS REST API

        HDFS Java API

        演練:HDFS文件操作命令

        演練:HDFS編程示例

         

        第三部分: MapReduce分布式計算系統--海量數據處理的利器

        1、 MapReduce的三層設計理念

        分布治之的設計思想(Map與Reduce)

        數據處理引擎(編程模型)

        運行時環境(任務調度與執行)

        2、 MapReduce的基本架構

        JobTracker作業跟蹤器

        TaskTracker任務跟蹤器

        MapReduce與HDFS的部署關系

        3、 MapReduce編程模型概述

        編程接口介紹

        Hadoop工作流實現原理

        4、 MapReduce作業調度機制

        MapReduce作業生命周期

        作業調度策略

        靜態資源管理方案

        5、 數據并行處理機制(五步驟)

        Input階段實現

        Map階段實現

        Shuffle階段實現

        Reduce階段實現

        Output階段

        6、 MapReduce容錯機制

        任務失敗與重新嘗試

        節點失效與重調度

        單點故障

        7、 MapReduce性能優化

        優化方向與思路

        磁盤IO性能優化

        分片優化

        線程數量優化

        內存優化

        壓縮優化

        8、 MapReduce操作接口

        Job Shell

        Web UI

        案例演練:MapReduce編程示例

        9、 YARN:下一代通用資源管理系統

        MRv1的局限性

        YARN基本框架

        NN HA:解決單點故障

        HDFS Federation:解決擴展性問題

         

        第四部分: Hbase非關系型數據庫--海量數據的黎明

        1、 Hbase的使用場景

        2、 Hbase的基本架構

        Zookeeper分布式協調服務器

        Master主控服務器

        Region Server區域服務器

        3、 Hbase的數據模型

        Hbase的表結構

        行鍵、列鍵、時間戳

        4、 Hbase的存儲模型

        基本單位Region

        存儲格式HFile

        5、 數據分裂機制Split

        6、 數據合并機制Compaction

        minor compaction

        major compaction

        7、 HLog寫前日志

        8、 數據庫讀寫操作

        數據庫寫入

        數據庫讀取

        三次尋址

        9、 Hbase操作接口

        Native Java API

        Hbase Shell

        批量加載工具

        HiveQL操作

        10、 Hbase性能優化

        寫速度優化

        讀速度優化

        11、 Hbase集群監控與管理

        案例演練:HBase命令操作實例

         

        第五部分: Hive分布式數據倉庫--高級的編程語言

        1、 Hive是什么

        2、 Hive與關系數據庫的區別

        3、 Hive系統架構

        用戶接口層

        元數據存儲層

        驅動層

        4、 Hive常用服務

        5、 Hive元數據的三種部署模式

        6、 Hive的命名空間

        7、 Hive數據類型與存儲格式

        數據類型

        TextFile/SequenceFile/RCFile

        8、 Hive的數據模型

        管理表

        外部表

        分區表

        桶表

        9、 HQL語言命令實例

        DDL數據定義語言

        DML數據操作語言

        QUERY數據查詢語言

        10、 Hive自定義函數

        基本函數(UDF)

        聚合函數(UDAF)

        表生成函數(UDTF)

        11、 Hive性能優化

        動態分區

        壓縮

        索引

        JVM重用

        案例演練:Hive命令操作實例

         

        第六部分: Sqoop數據交互工具--與傳統數據庫的橋梁

        1、 Sqoop是什么

        2、 Sqoop的架構和功能

        Sqoop1架構

        Sqoop2架構

        3、 數據雙向交換

        數據導入過程

        數據導出過程

        4、 數據導入工具與命令介紹

        案例演練:Sqoop數據導入/導出實際操作

         

        第七部分: Pig數據流處理引擎--數據腳本語言

        1、 Pig介紹

        2、 命令行交互工具Grunt

        3、 Pig數據類型

        4、 Pig Latin腳本語言介紹

        基礎知識

        輸入和輸出

        關系操作

        調用靜態Java函數

        5、 Pig Latin高級應用

        6、 開發與測試Pig Latin腳本

        開發工具

        任務狀態監控

        調試技巧

        7、 腳本性能優化

        8、 用戶自定義函數UDF

        案例演練:Pig Latin腳本編寫、測試與運行操作

         

        結束:課程總結問題答疑

         
        反對 0舉報 0 收藏 0
        更多>與Hadoop大數據解決方案平臺技術培訓相關內訓課
        企業家經營哲學與企業經營之道 高   效   執   行   力 教練式經銷商管理 商業模式創新 創新思維管理應用訓練?—創造性解決問題 創新思維和有效執行 微課的設計與制作 高效能主管風暴訓練營
        傅一航老師介紹>傅一航老師其它課程
        大數據產業現狀及應用創新 大數據挖掘工具:SPSS Modeler入門與提高 大數據挖掘工具: SPSS Statistics入門與提高 大數據建模與模型優化實戰培訓 金融行業風險預測模型實戰 數說營銷——大數據營銷實戰培訓 大數據分析與挖掘綜合能力提升實戰 助力市場營銷與服務的數據分析實戰
        網站首頁  |  關于我們  |  聯系方式  |  誠聘英才  |  網站聲明  |  隱私保障及免責聲明  |  網站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網站留言  |  RSS訂閱  |  違規舉報  |  京ICP備11016574號-25
         
        主站蜘蛛池模板: 无码精品不卡一区二区三区| 97一区二区三区四区久久| 国产一区二区三区播放心情潘金莲| 亚洲大尺度无码无码专线一区 | 国模精品一区二区三区| 狠狠色婷婷久久一区二区三区| 色国产在线视频一区| 国产第一区二区三区在线观看| 日韩在线视频一区| 亚洲熟女一区二区三区| 国产一区二区成人| 狠狠色婷婷久久一区二区三区| 亚洲国产精品一区二区成人片国内| 亚洲国产一区在线| 久久精品国产一区二区三区| 亚洲AV福利天堂一区二区三| 日韩AV片无码一区二区不卡 | 国产伦精品一区二区三区视频金莲| 国产成人无码精品一区二区三区 | 搜日本一区二区三区免费高清视频 | 好爽毛片一区二区三区四无码三飞| 亚洲中文字幕一区精品自拍| 国产成人综合亚洲一区| 精品一区二区三区免费毛片爱| 国产成人av一区二区三区在线 | 国产在线视频一区二区三区98| 国产精品合集一区二区三区| 成人精品一区二区三区不卡免费看 | 手机看片福利一区二区三区| 亚洲av成人一区二区三区观看在线| 国产亚洲欧洲Aⅴ综合一区| 人妻夜夜爽天天爽一区| 91在线视频一区| 日韩精品无码一区二区三区免费| 一级毛片完整版免费播放一区 | 蜜桃传媒视频麻豆第一区| 欧洲精品免费一区二区三区| 亚洲av成人一区二区三区在线播放| 国产激情з∠视频一区二区| 国产在线一区二区在线视频| 国产精品一区二区三区99|