大數(shù)據(jù)分析挖掘與可視化最佳實(shí)踐培訓(xùn)班

認(rèn)證機(jī)構(gòu)

本課程由北京中培IT技能培訓(xùn)提供,有275瀏覽量

課程分類:  IT培訓(xùn)

適合對(duì)象:  想要學(xué)習(xí)大數(shù)據(jù)分析的人

咨詢電話:  400-968-9396

上課地點(diǎn):  [網(wǎng)校]

開班日期:  滾動(dòng)開班

學(xué)       費(fèi):  咨 詢

班       級(jí):  
  • 網(wǎng)校
  • 北京校區(qū)
 
人       數(shù):
 
報(bào)名試聽 我要咨詢

課程簡(jiǎn)介

大數(shù)據(jù)分析是在研究大量數(shù)據(jù)的過(guò)程中尋找模式,相關(guān)性和其他有用的信息,幫助企業(yè)更好地適應(yīng)變化,并做出更明智的決策。

大數(shù)據(jù)分析挖掘與可視化最佳實(shí)踐培訓(xùn)重點(diǎn)

1.  數(shù)據(jù)分析實(shí)戰(zhàn)

2.  數(shù)據(jù)挖掘理論及核心技術(shù)

3.  大數(shù)據(jù)算法原理及案例實(shí)現(xiàn)

4.  Python應(yīng)用實(shí)戰(zhàn)

大數(shù)據(jù)分析挖掘與可視化最佳實(shí)踐培訓(xùn)特色

1.理論與實(shí)踐相結(jié)合、案例分析與行業(yè)應(yīng)用穿插進(jìn)行;

2.專家精彩內(nèi)容解析、學(xué)員專題討論、分組研究;

3.通過(guò)全面知識(shí)理解、專題技能和實(shí)踐結(jié)合的授課方式。

大數(shù)據(jù)分析挖掘與可視化最佳實(shí)踐日程安排

時(shí)間

知識(shí)模塊

授課內(nèi)容

第一天

上午

數(shù)據(jù)分析實(shí)戰(zhàn)

第一講 零基礎(chǔ)學(xué)Python

講解Python背景、國(guó)內(nèi)發(fā)展?fàn)顩r、基礎(chǔ)語(yǔ)法、數(shù)據(jù)結(jié)構(gòu)及繪圖操作等內(nèi)容。特別針對(duì)向量計(jì)算這塊,著重介紹Python在這方面的優(yōu)勢(shì)及用法。

第二講 數(shù)據(jù)分析方法論

講解統(tǒng)計(jì)分析基礎(chǔ),包括統(tǒng)計(jì)學(xué)基本概念,假設(shè)檢驗(yàn),置信區(qū)間等基礎(chǔ),并結(jié)合數(shù)據(jù)案例說(shuō)明其使用場(chǎng)景和運(yùn)用方法。介紹數(shù)據(jù)分析流程和常見分析思路,并結(jié)合案例進(jìn)行講解。

第三講 數(shù)據(jù)處理技法

從數(shù)據(jù)接入、數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)轉(zhuǎn)換等幾個(gè)方面進(jìn)行講解。數(shù)據(jù)接入包含接入MySQL、Oracle、Hadoop等常見數(shù)據(jù)庫(kù)操作;數(shù)據(jù)統(tǒng)計(jì)包含Pandas包的具體用法和講解;數(shù)據(jù)轉(zhuǎn)換包含對(duì)數(shù)據(jù)集的關(guān)聯(lián)、合并、重塑等操作。此外,針對(duì)海量數(shù)據(jù)的情況下,介紹在Spark平臺(tái)上的數(shù)據(jù)處理技術(shù),并結(jié)合真實(shí)環(huán)境進(jìn)行操作講解。

第一天

下午

數(shù)據(jù)挖掘理論及核心技術(shù)

第四講 認(rèn)識(shí)數(shù)據(jù)挖掘

講解數(shù)據(jù)挖掘基本概念,細(xì)致講解業(yè)務(wù)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建立模型、模型評(píng)估、模型部署各環(huán)節(jié)的工作內(nèi)容及相關(guān)技術(shù);結(jié)合業(yè)界經(jīng)典場(chǎng)景,講解數(shù)據(jù)挖掘的實(shí)施流程和方法體系。

第五講 數(shù)據(jù)挖掘核心技術(shù)

細(xì)致講解抽樣、分區(qū)、樣本平衡、特征選擇、訓(xùn)練模型、評(píng)估模型等數(shù)據(jù)挖掘核心技術(shù)原理,并結(jié)合案例講解其具體實(shí)現(xiàn)和用法。尤其針對(duì)樣本平衡,重點(diǎn)講解人工合成、代價(jià)敏感等算法;針對(duì)特征選擇,重點(diǎn)講解特征選擇的核心思路,并結(jié)合Python進(jìn)行案例演示。

第二天

上午

大數(shù)據(jù)算法原理及案例實(shí)現(xiàn)(1

第六講 特征降維算法及Python實(shí)現(xiàn)

降維是大數(shù)據(jù)分析非常重要的算法,它可以在降低極少信息量的情況下,極大地縮小數(shù)據(jù)規(guī)模。主要講解主成分、LDA以及t-SNE原理,并結(jié)合案例進(jìn)行Python實(shí)現(xiàn)。特別地,針對(duì)海量數(shù)據(jù)情況下的應(yīng)用場(chǎng)景,講解實(shí)現(xiàn)思路和Python案例。

第七講 決策樹算法及Python實(shí)現(xiàn)

決策樹是非常經(jīng)典的算法,一般常見于小數(shù)據(jù)的挖掘。由于決策樹具有極強(qiáng)的可解釋性,針對(duì)海量數(shù)據(jù)仍然是非常重要的實(shí)用價(jià)值。主要講解ID3、C4.5C5.0以及CART決策樹算法的實(shí)現(xiàn)原理,并結(jié)合案例進(jìn)行Python實(shí)現(xiàn)。

第八講 好萊塢百萬(wàn)級(jí)影評(píng)數(shù)據(jù)分析與電影推薦實(shí)現(xiàn)

實(shí)戰(zhàn)部分:基于好萊塢百萬(wàn)級(jí)的影評(píng)數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行建模、清洗、透視表操作。然后根據(jù)用戶畫像分析不同的用戶喜好通過(guò)機(jī)器學(xué)習(xí)算法對(duì)不同性別、年齡階段的用戶進(jìn)行定制化的電影推薦,最后把推薦的電影進(jìn)行可視化的展示操作

第二天

下午

大數(shù)據(jù)算法原理及案例實(shí)現(xiàn)(2

第九講 因果推理算法及Python實(shí)現(xiàn)

大數(shù)據(jù)分析技術(shù)可以幫助我們?nèi)グl(fā)現(xiàn)、解決一些業(yè)務(wù)問(wèn)題,然而如何去判斷我們的改進(jìn)是否生效,是否在業(yè)務(wù)指標(biāo)上呈現(xiàn)過(guò)一定的因果邏輯,則是一個(gè)重要問(wèn)題和分析方向。本節(jié)主要介紹因果推理算法,包括貝葉斯推理、狀態(tài)空間模型以及CausalImpact工具等內(nèi)容,并結(jié)合案例進(jìn)行Python實(shí)現(xiàn)。

第十講 深度學(xué)習(xí)算法及Python實(shí)現(xiàn)

對(duì)于大數(shù)據(jù)的建模任務(wù),我們可以基于深度學(xué)習(xí)來(lái)實(shí)現(xiàn),不僅能夠針對(duì)海量數(shù)據(jù)進(jìn)行建模,其效果也非常不錯(cuò)。本節(jié)主要講解深度學(xué)習(xí)的發(fā)展歷程,DBN、DNN等經(jīng)典深度學(xué)習(xí)算法,深度學(xué)習(xí)優(yōu)化算法以及一些技巧。同時(shí),介紹Keras、OpenCV庫(kù)的使用方法,并結(jié)合案例進(jìn)行Python實(shí)現(xiàn)。

第十一講 采用OpenCV實(shí)現(xiàn)計(jì)算機(jī)視覺技術(shù)

實(shí)戰(zhàn)部分:基于OpenCV面部模型,完成對(duì)圖片和視頻的人臉識(shí)別,實(shí)戰(zhàn)中會(huì)講解OpenCV的重要類和函數(shù)。主要內(nèi)容包括OpenCV庫(kù)的安裝和部署、圖像增強(qiáng)、像素操作、圖形分析等各種技術(shù),并且詳細(xì)介紹了如何處理來(lái)自文件或攝像機(jī)的視頻,以及如何檢測(cè)和跟蹤移動(dòng)對(duì)象。

第三天

上午

Python應(yīng)用實(shí)戰(zhàn)(一)

第十二講 Python自然語(yǔ)言處理原理及案例

目前文檔數(shù)據(jù)已經(jīng)成為很多企業(yè)重要的資產(chǎn),通過(guò)對(duì)文檔數(shù)據(jù)進(jìn)行解析、建模、分析、挖掘、可視化,我們能夠發(fā)現(xiàn)不一樣的洞察。本節(jié)主要講解自然語(yǔ)言處理基本概念和技法,包含分詞、關(guān)鍵字提取、文摘提取、文本分類、主題模型、word2vec等內(nèi)容。介紹在深度學(xué)習(xí)的加持下,與傳統(tǒng)做法的區(qū)別,并使用Python進(jìn)行案例講解。

第十三講 數(shù)據(jù)分析圖表及Python案例

數(shù)據(jù)可視化是大數(shù)據(jù)分析的重要手段,通過(guò)合理地使用圖表,不僅可以簡(jiǎn)潔地表達(dá)數(shù)據(jù)的含義,高效地發(fā)現(xiàn)問(wèn)題,還可以為報(bào)告的編寫以及數(shù)據(jù)分析web應(yīng)用增色不少。本節(jié)主要講解常用的數(shù)據(jù)分析圖表及其使用場(chǎng)景,介紹數(shù)據(jù)可視化的方法論,避免生搬硬套的使用圖表,針對(duì)不同的業(yè)務(wù)場(chǎng)景和需求,合理選擇可視化方法。介紹的工具不限于matplotlibpycha、pyechartsggplot、Bokeh、HoloViewsmpld3、plotlypygal等常用可視化庫(kù)。

第三天

下午

Python應(yīng)用實(shí)戰(zhàn)(二)

第十四講 使用Notebook編寫數(shù)據(jù)分析報(bào)告

數(shù)據(jù)分析報(bào)告在大數(shù)據(jù)分析過(guò)程中具有重要價(jià)值,它體現(xiàn)了大數(shù)據(jù)分析的目的、過(guò)程和結(jié)果,以及對(duì)發(fā)現(xiàn)問(wèn)題的解讀、改進(jìn)方案等等,本節(jié)主要講解使用Notebook編寫數(shù)據(jù)分析報(bào)告的具體方法,以及編寫數(shù)據(jù)分析報(bào)告的方法論,并結(jié)合案例講解其用法。

第十五講 Seaborn可視化開發(fā)實(shí)戰(zhàn)

Seaborn是一款不錯(cuò)的可視化框架,它和 Pandas一樣是建立在 Matplotlib 之上的??梢曰?span lang="EN-US">Seaborn快速開發(fā)一個(gè)輕量級(jí)的數(shù)據(jù)分析web應(yīng)用。在網(wǎng)頁(yè)中嵌入圖表、數(shù)據(jù)以及分析的算法,非常適合打造企業(yè)內(nèi)部的敏捷數(shù)據(jù)分析工具集。本節(jié)主要介紹Pie、Scatter、Radar等等各種可視化解決方案,同時(shí)講解一個(gè)用Seaborn實(shí)現(xiàn)數(shù)據(jù)分析功能(兼圖表)的實(shí)際案例,搭建服務(wù)器,在企業(yè)內(nèi)部實(shí)現(xiàn)輕量級(jí)數(shù)據(jù)分析應(yīng)用。

大數(shù)據(jù)分析挖掘與可視化最佳實(shí)踐培訓(xùn)費(fèi)用

線下面授培訓(xùn)費(fèi)7800/人(含培訓(xùn)費(fèi)、場(chǎng)地費(fèi)、資料費(fèi)、學(xué)習(xí)期間午餐以及錄播視頻回放一年)食宿可統(tǒng)一安排,費(fèi)用自理。

網(wǎng)絡(luò)直播培訓(xùn)費(fèi):6800/人(含培訓(xùn)費(fèi)、平臺(tái)費(fèi)、資料費(fèi)以及直播視頻回放一年)。

本課程由中國(guó)信息化培訓(xùn)中心頒發(fā)《大數(shù)據(jù)分析高級(jí)工程師》證書,證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級(jí)和晉升職務(wù)的重要依據(jù)。

 

開設(shè)班級(jí)

班級(jí) 開班時(shí)間 上課地點(diǎn) 學(xué)費(fèi) 試聽/報(bào)名
網(wǎng)校/ 網(wǎng)授 人滿開班 咨詢 報(bào)名
北京校區(qū)/ 面授 人滿開班 北京豐臺(tái)育芳園東里3號(hào)樓 咨詢 報(bào)名
 

教學(xué)環(huán)境

查看全部照片  >

課程咨詢

我要咨詢
 

發(fā)表咨詢

 
有回復(fù)時(shí)短信通知我 發(fā)表咨詢
課程推薦

國(guó)際注冊(cè)信息系統(tǒng)審計(jì)師CISA認(rèn)證培訓(xùn)班

傳統(tǒng)審計(jì)人員、負(fù)責(zé)信息安全審計(jì)的從業(yè)人員、負(fù)責(zé)信息安全管理的從業(yè)人員 2 IT經(jīng)理、信息安全經(jīng)理 3 審計(jì)經(jīng)理、其他從事IT審計(jì)人員 4 對(duì)CISA認(rèn)證感興趣的人員
更新時(shí)間:2022-06-23