色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

雅虎機器學(xué)習(xí)平臺CaffeOnSpark解讀

大小:0.3 MB 人氣:0 2017-10-10 需要積分:1
Andy Feng是Apache Storm的Committer,同時也是雅虎公司負責大數(shù)據(jù)與機器學(xué)習(xí)平臺的副總裁。他帶領(lǐng)雅虎機器學(xué)習(xí)團隊基于開源的Spark和Caffe開發(fā)了深度學(xué)習(xí)框架CaffeOnSpark,以支持雅虎的業(yè)務(wù)團隊在Hadoop和Spark集群上無縫地完成大數(shù)據(jù)處理、傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)任務(wù),并在CaffeOnSpark較為成熟之后將其開源(https://github.com/yahoo/CaffeOnSpark)。Andy Feng接受《程序員》記者專訪,從研發(fā)初衷、設(shè)計思想、技術(shù)架構(gòu)、實現(xiàn)和應(yīng)用情況等角度對CaffeOnSpark進行了解讀。
  CaffeOnSpark概況
  CaffeOnSpark研發(fā)的背景,是雅虎內(nèi)部具有大規(guī)模支持YARN的Hadoop和Spark集群用于大數(shù)據(jù)存儲和處理,包括特征工程與傳統(tǒng)機器學(xué)習(xí)(如雅虎自己開發(fā)的詞嵌入、邏輯回歸等算法),同時雅虎的很多團隊也在使用Caffe支持大規(guī)模深度學(xué)習(xí)工作。目前的深度學(xué)習(xí)框架基本都只專注于深度學(xué)習(xí),但深度學(xué)習(xí)需要大量的數(shù)據(jù),所以雅虎希望深度學(xué)習(xí)框架能夠和大數(shù)據(jù)平臺結(jié)合在一起,以減少大數(shù)據(jù)/深度學(xué)習(xí)平臺的系統(tǒng)和流程的復(fù)雜性,也減少多個集群之間不必要的數(shù)據(jù)傳輸帶來的性能瓶頸和低效(如圖1)。
  雅虎機器學(xué)習(xí)平臺CaffeOnSpark解讀
  圖1 深度學(xué)習(xí)集群與大數(shù)據(jù)集群分離的低效
  CaffeOnSpark就是雅虎的嘗試。對雅虎而言,Caffe與Spark的集成,讓各種機器學(xué)習(xí)管道集中在同一個集群中,深度學(xué)習(xí)訓(xùn)練和測試能被嵌入到Spark應(yīng)用程序,還可以通過YARN來優(yōu)化深度學(xué)習(xí)資源的調(diào)度。
  雅虎機器學(xué)習(xí)平臺CaffeOnSpark解讀
  圖2 CaffeOnSpark系統(tǒng)架構(gòu)
  CaffeOnSpark架構(gòu)如圖2所示,Spark on YARN加載了一些執(zhí)行器(用戶可以指定Spark執(zhí)行器的個數(shù)(–num-executors 《# of EXECUTORS》),以及為每個執(zhí)行器分配的GPU的個數(shù)(-devices 《# of GPUs PER EXECUTOR》))(Executor)。每個執(zhí)行器分配到一個基于HDFS的訓(xùn)練數(shù)據(jù)分區(qū),然后開啟多個基于Caffe的訓(xùn)練線程。每個訓(xùn)練線程由一個特定的GPU處理。使用反向傳播算法處理完一批訓(xùn)練樣本后,這些訓(xùn)練線程之間交換模型參數(shù)的梯度值,在多臺服務(wù)器的GPU之間以MPI Allreduce形式進行交換,支持TCP/以太網(wǎng)或者RDMA/Infiniband。相比Caffe,經(jīng)過增強的CaffeOnSpark可以支持在一臺服務(wù)器上使用多個GPU,深度學(xué)習(xí)模型同步受益于RDMA。
  考慮到大數(shù)據(jù)深度學(xué)習(xí)往往需要漫長的訓(xùn)練時間,CaffeOnSpark還支持定期快照訓(xùn)練狀態(tài),以便訓(xùn)練任務(wù)在系統(tǒng)出現(xiàn)故障后能夠恢復(fù)到之前的狀態(tài),不必從頭開始重新訓(xùn)練。從第一次發(fā)布系統(tǒng)架構(gòu)到宣布開源,時間間隔大約為半年,主要就是為了解決一些企業(yè)級的需求。
  CaffeOnSpark解決了三大問題
  《程序員》:在眾多的深度學(xué)習(xí)框架中,為什么選擇了Caffe?
  Andy Feng:Caffe是雅虎所使用的主要深度學(xué)習(xí)平臺之一。早在幾個季度之前,開發(fā)人員就已將Caffe部署到產(chǎn)品上(見Pierre Garrigues在RE.WORK的演講),最近,我們看到雅虎越來越多的團隊使用Caffe進行深度學(xué)習(xí)研究。作為平臺組,我們希望公司的其它小組能夠更方便地使用Caffe。
  在社區(qū)里,Caffe以圖像深度學(xué)習(xí)方面的高級特性而聞名。但在雅虎,我們也發(fā)現(xiàn)很容易將Caffe擴展到非圖像的應(yīng)用場景中,如自然語言處理等。
  作為一款開源軟件,Caffe擁有活躍的社區(qū)。雅虎也積極與伯克利Caffe團隊和開發(fā)者、用戶社區(qū)合作(包括學(xué)術(shù)和產(chǎn)業(yè))。
  《程序員》:除了貢獻到社區(qū)的特性,雅虎使用的Caffe相對于伯克利版本還有什么重要的不同?
  Andy Feng:CaffeOnSpark是伯克利Caffe的分布式版本。我們對Caffe核心只做了細微改動,重點主要放在分布式學(xué)習(xí)上。在Caffe的核心層面,我們改進Caffe來支持多GPU、多線程執(zhí)行,并引入了新的數(shù)據(jù)層來處理大規(guī)模數(shù)據(jù)。這些核心改進已經(jīng)加入了伯克利Caffe的代碼庫,整個Caffe社區(qū)都能因此而受益。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      ?
      主站蜘蛛池模板: 第四色播日韩AV第一页 | 年轻的女教师2017韩国在线看 | 国产成人精品电影在线观看 | 入禽太深免费观看 | 亚洲 日本 中文字幕 制服 | 亚洲AV无码久久流水呻蜜桃久色 | 六度影院最新 | 一本色道久久88加勒比—综合 | 国产成人欧美日韩在线电影 | GOGOGO高清在线播放韩国 | 亚洲午夜电影 | 欧美xxx性 | 精品视频一区二区三三区四区 | Chineseman瘦老头77 | 久久综合香蕉久久久久久久 | 午夜神器老司机高清无码 | 美女激清床上戏大全 | 亚在线观看免费视频入口 | 尤物99久久久合集一区区 | 国产a级黄色毛片 | 极品美女久久久久久久久久久 | 色狐直播免费观看 | 中文字幕不卡在线高清 | 午夜福利体检 | 久久国产视频网站 | 国产原创剧情麻豆在线 | jizzjizz丝袜 | 无人区日本电影在线观看高清 | 国产中文字幕乱码免费 | 国产亚洲精品黑人粗大精选 | 国产永久免费观看视频软件 | 久久99r66热这里只有精品 | 伊人热人久久中文字幕 | 国产69精品9999XXXX| 在线 国产 欧美 亚洲 天堂 | 午夜办公室在线观看高清电影 | 亚洲一区乱码电影在线 | 色播播电影 | 我不卡影院手机在线观看 | 男助理憋尿PLAY灌尿BL出去 | 老师湿乎乎两半嫩 |