綠色排版工具|熱門專題|網站地圖|移動官網|微信編輯器
您的當前位置:主頁 > 電子書 > 計算機類 > 正文

尋路大數據-海量數據與大規模分析 [美]Michael Manoochehri完整版PDF

來源: 編輯:腳本之家 時間:2019-08-27 01:09:53 閱讀:

    《尋路大數據:海量數據與大規模分析》是一本系統化解讀大數據工程處理基礎技術的書籍。技術熱潮已然催生了形形色色的大數據處理技術及工具,但重要的并非魚與熊掌的孰優孰劣,而是如何選擇或組合這些技術并應用于實現不同的商業目標。

    《尋路大數據:海量數據與大規模分析》正是從這個角度評估了針對不同使用場景的大數據處理技術,從而幫助技術負責人及架構師做出不同的選型決策。我很高興看到了這《尋路大數據:海量數據與大規模分析》的出版,它必將有益于大數據技術的各種具體實踐。

    目錄

    第1部分大數據時代指引1

    第1章數據成功四原則3

    1.1當數據成為一件“大”事3

    1.2數據和單臺服務器4

    1.3大數據的權衡5

    1.3.1構建可(限)擴展的解決方案6

    1.3.2構建可(在互聯網上)共享數據的系統7

    1.3.3構建解決方案,而非基礎設施8

    1.3.4關注從數據中解放價值8

    1.4大數據流水線剖析9

    1.5終極數據庫10

    1.6總結10

    第2部分收集和共享海量數據13

    第2章托管和共享TB級原始數據15

    2.1文件之殤16

    2.1.1共享大量文件的挑戰16

    2.2存儲:基礎設施即服務17

    2.2.1網絡很慢18

    2.3選擇合適的數據格式18

    2.3.1XML:數據,描述你自己20

    2.3.2JSON:程序員的選擇21

    2.4字符編碼22

    2.4.1文件轉換24

    2.5移動中的數據:數據序列化格式25

    2.5.1ApacheThrift和ProtocolBuffers26

    2.6總結27

    第3章構建基于NoSQL的Web應用采集眾包數據29

    3.1關系型數據庫:命令及控制30

    3.1.1關系數據庫的ACID測試32

    3.2當關系型數據庫遇上互聯網33

    3.2.1CAP原理與BASE34

    3.3非關系型數據庫的模式36

    3.3.1鍵-值數據庫36

    3.3.2文檔存儲38

    3.4為寫入性能優化:Redis40

    3.5在多個Redis實例上分片43

    3.5.1使用Twemproxy自動分區44

    3.5.2Redis的替代選項46

    3.6NewSQL:Codd歸來46

    3.7總結47

    第4章解決數據孤島問題的策略49

    4.1堆滿術語的倉庫49

    4.1.1實踐中的問題51

    4.1.2數據合規與安全規劃52

    4.1.3走進數據倉庫53

    4.1.4數據倉庫的口訣:抽取、轉換和加載54

    4.2Hadoop:數據倉庫中的大象55

    4.3數據孤島也可能是個優點55

    4.3.1專注于數據問題,而不是技術56

    4.3.2鼓勵員工提出他們自己的問題57

    4.3.3投資溝通數據孤島的技術57

    4.4融合:數據孤島的終結58

    4.4.1Luhn的商業智能系統是否能成為現實59

相關文章推薦:

圖文精選:

Copyright?2012-2030小螞蟻信息網版權所有 站長QQ:1614558876


鄭重聲明:本網站資源、信息來源于網絡,完全免費共享,僅供學習和研究使用,版權和著作權歸原作者所有,如有不愿意被轉載的情況,請通知我們QQ1614558876刪除已轉載的信息。

Top 双色球10000期走势图表