色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

Netflix數據管道的演進歷程

大?。?/span>0.3 MB 人氣:0 2017-10-11 需要積分:1
去年12月我們的Keystone數據管道正式投入使用,本文我們就來講講這些年Netflix數據管道的變化歷程。
  數據是Netflix的中心,很多的商業決策和產品設計都是依據數據分析而做出的決定。在Netflix,數據管道的目的是對數據進行收集歸納和處理,幾乎我們所有的應用都會用到數據管道。下面我們先來看看有關Netflix數據管道的一些統計數據:
  每天約5000億個事件,1.3PB的數據高峰時段約每秒800萬個事件,24GB數據
  我們用另外的Atlas系統來管理運營相關的數據所以它并沒有出現在上面的列表中。
  由于需求的變化和技術的進步,過去幾年我們的數據管道發生了很大的改變。下面我們就來介紹一下。
  V1.0 Chukwa數據管道
  最初數據管道唯一的目的就是把事件信息上傳到Hadoop/Hive。如下圖中所示,整個架構是比較簡單的。Chukwa收集事件信息并將sequencefile寫入亞馬遜S3,之后大數據平臺部門會進一步處理并寫入Hive。從事件發生到以Parquet格式寫入Hive整個過程不超過十分鐘,對于每小時甚至每天才運行一次的batch job來說已經足夠了。
  Netflix數據管道的演進歷程
  V1.5 能夠進行實時處理的Chukwa數據管道
  隨著Kafka和Elasticsearch等技術的發展,公司內部對于實時分析的需求愈加強烈,我們必須保證處理所需時間在一分鐘之內。
  Netflix數據管道的演進歷程
  除了將數據寫入S3,Chukwa還可以將數據發送到Kafka,新的實時分支(虛線框住的部分)處理的事件大約占到總事件的30%。處于實時處理分支中心位置的是事件路由模塊,它負責將數據從Kafka傳遞到Elasticsearch和下一級Kafka(進行數據的篩選)。終端用戶可以自由選擇趁手的工具進行分析,比如Mantis、Spark或其他定制工具。
  Elasticsearch在Netflix的應用過去兩年經歷了爆炸式的發展,現在共有約150個集群和約3500個節點,總數據量約1.3PB,而這其中大部分數據都是通過我們的數據管道采集處理的。
  數據路由的部分是由我所在的小組管理的,下面是一些我們碰到過的問題:
  Kafka high level consumer會喪失消息分區的所有權并停止讀取一些分區,唯一的解決辦法是重啟。有時部署代碼之后high level consumer在rebalance時會出錯。我們有幾十個集群用于事件路由,運營上的開銷正持續增長,所以對于路由job的管理還要想個更好的辦法。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

用戶評論

      ?
      主站蜘蛛池模板: 欧美激情精品久久久久 | 校花在公车上被内射好舒 | 精品AV综合导航 | 国产精品18久久久久久白浆. | 国产午夜永久福利视频在线观看 | 亚洲成年人在线观看 | 一二三四中文字幕在线看 | 一个人免费观看完整视频日本 | 国产亚洲精品久久久久小 | 狠狠色狠狠色综合日日91app | xxx日本免费 | 中字幕久久久人妻熟女天美传媒 | xx69欧美| 果冻传媒在线播放 免费观看 | 2019伊人查蕉在线观看 | 久9视频这里只有精品123 | 色即是空之甜性涩爱 | 一边亲着一面膜下的免费过程 | 久久成人伊人欧洲精品AV | 免费99精品国产自在现线 | 人人射人人插 | 暖暖 视频 免费 高清 在线观看 | JAPANRCEP老熟妇乱子伦视频 | 久久精品人人做人人爽97 | 成人毛片18岁女人毛片免费看 | ewp绞死vk失禁编 | 美妇教师双飞后菊 | 国产在线观看不卡 | 欧美日韩一二区旡码高清在线 | 日本特殊精油按摩 | 一抽一出BGM免费3分钟 | 久久精品视频在线看15 | 久久视频这里只精品99re8久 | 啦啦啦影院视频在线看高清... | 久久视频在线视频观品15 | 国产乱码卡二卡三卡4W | jiizzyou欧美喷液 | 菠萝视频高清版在线观看 | 亚洲高清视频在线观看 | 欧美人与善交大片 | 777米奇色狠狠俺去啦 |