色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

如何使用Apache Spark 2.0

大小:0.5 MB 人氣:0 2017-09-28 需要積分:1

  Spark 2.0中使用DataFrames和SQL的第一步

  Spark 2.0開(kāi)發(fā)的一個(gè)動(dòng)機(jī)是讓它可以觸及更廣泛的受眾,特別是缺乏編程技能但可能非常熟悉SQL的數(shù)據(jù)分析師或業(yè)務(wù)分析師。因此,Spark 2.0現(xiàn)在比以往更易使用。在這部分,我將介紹如何使用Apache Spark 2.0。并將重點(diǎn)關(guān)注DataFrames作為新Dataset API的無(wú)類型版本。

  到Spark 1.3,彈性分布式數(shù)據(jù)集(Resilient Distributed Dataset,RDD)一直是Spark中的主要抽象。RDD API是在Scala集合框架之后建模的,因此間接提供了Hadoop Map / Reduce熟悉的編程原語(yǔ)以及函數(shù)式編程(Map、Filter、Reduce)的常用編程原語(yǔ)。雖然RDD API比Map / Reduce范例更具表達(dá)性,但表達(dá)復(fù)雜查詢?nèi)匀缓芊爆崳貏e是對(duì)于來(lái)自典型數(shù)據(jù)分析背景的用戶,他們可能熟悉SQL,或來(lái)自R/Python編程語(yǔ)言的數(shù)據(jù)框架。

  Spark 1.3引入了DataFrames作為RDD頂部的一個(gè)新抽象。DataFrame是具有命名列的行集合,在R和Python相應(yīng)包之后建模。

  Spark 1.6看到了Dataset類作為DataFrame的類型化版本而引入。在Spark 2.0中,DataFrames實(shí)際上是Datasets的特殊版本,我們有type DataFrame = Dataset [Row],因此DataFrame和Dataset API是統(tǒng)一的。

  表面上,DataFrame就像SQL表。Spark 2.0將這種關(guān)系提升到一個(gè)新水平:我們可以使用SQL來(lái)修改和查詢DataSets和DataFrames。通過(guò)限制表達(dá)數(shù)量,有助于更好地優(yōu)化。數(shù)據(jù)集也與Catalyst優(yōu)化器良好集成,大大提高了Spark代碼的執(zhí)行速度。因此,新的開(kāi)發(fā)應(yīng)該利用DataFrames。

  在本文中,我將重點(diǎn)介紹Spark 2.0中DataFrames的基本用法。我將嘗試強(qiáng)調(diào)Dataset API和SQL間的相似性,以及如何使用SQL和Dataset API互換地查詢數(shù)據(jù)。借由整個(gè)代碼生成和Catalyst優(yōu)化器,兩個(gè)版本將編譯相同高效的代碼。

  代碼示例以Scala編程語(yǔ)言給出。我認(rèn)為這樣的代碼最清晰,因?yàn)镾park本身就是用Scala編寫(xiě)的。

  ?SparkSession

  SparkSession類替換了Apache Spark 2.0中的SparkContext和SQLContext,并為Spark集群提供了唯一的入口點(diǎn)。

  如何使用Apache Spark 2.0

  為了向后兼容,SparkSession對(duì)象包含SparkContext和SQLContext對(duì)象,見(jiàn)下文。當(dāng)我們使用交互式Spark shell時(shí),為我們創(chuàng)建一個(gè)名為spark的SparkSession對(duì)象。

  ?創(chuàng)建DataFrames

  DataFrame是具有命名列的表。最簡(jiǎn)單的DataFrame是使用SparkSession的range方法來(lái)創(chuàng)建:

  使用show給我們一個(gè)DataFrame的表格表示,可以使用describe來(lái)獲得數(shù)值屬性概述。describe返回一個(gè)DataFrame:

  如何使用Apache Spark 2.0

?

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

如何使用Apache Spark 2.0下載

海量PCB软件教程下载 华强PCB技术中心,海量PCB软件教程下载!

相關(guān)電子資料下載

用戶評(píng)論

      ?
      主站蜘蛛池模板: 草莓在线观看 | 国产亚洲欧美ai在线看片 | 国产麻豆剧果冻传媒免费网站 | 小处雏一区二区三区 | 婷婷五月久久精品国产亚洲 | 奶头从情趣内衣下露了出来AV | 久久久黄色片 | 俄罗斯女肥臀大屁BBW | 爱情岛论坛网亚洲品质 | 国语对白老女人8av 国语对白刺激真实精品 | 色婷婷综合久久久中文字幕 | 无码国产精品高潮久久9 | 久久亚洲精品永久网站 | 欧美日韩亚洲一区二区三区在线观看 | 亚洲三级视频在线观看 | 亚洲黄色免费在线观看 | 国精产品一区一区三区有 | jizzzz亚洲丰满xxxx | 国产精品点击进入在线影院高清 | 小草高清视频免费直播 | 人妻体体内射精一区二区 | 国产呦精品一区二区三区网站 | 狼群资源网中文字幕 | 亚洲国产韩国欧美在线不卡 | 抽插内射高潮呻吟V杜V | 97在线精品视频免费 | 国产揄拍国产精品 | 美女被免费喷白浆视频 | 用震蛋调教女性下面视频 | 男人插曲女人身体视频 | 在线自拍亚洲视频欧美 | 亚洲 欧美 国产 综合久久 | 美女在线永久免费网站 | 起碰免费公开97在线视频 | 2019一級特黃色毛片免費看 | 国产在线观看的 | 久草在线一免费新视频 | 视频区 国产 欧美 日韩 | 野草观看免费高清视频 | 伊伊人成亚洲综合人网 | 纯h超级大尺度小黄文 |