色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

基于MapReduce的并行關聯規則挖掘算法

大小:2.04 MB 人氣:1 2018-01-10 需要積分:2

  數據挖掘( data mining)又稱做知識發現(knowledge disco-ver in database,KDD),其目的在于發現大量數據集中有價值的隱含信息。常見的數據挖掘任務有關聯規則挖掘、分類、聚集、離群點檢測等。關聯規則挖掘是最重要的數據挖掘任務之一,由Agrawal等人提出,其目的是發現事務(項)之間存在的隱含關聯。關聯規則挖掘一般分為兩個階段,即發現頻繁項集和根據頻繁項集產生關聯規則。由于根據頻繁項集產生關聯規則相對容易實現,所以關聯規則挖掘研究主要關注的是如何在數據集中找到頻繁出現的項集,這個過程也稱為頻繁項集挖掘( frequent itemsets mining)或頻繁模式挖掘(frequent patterns mining)。傳統的關聯規則挖掘算法主要可以分為三類:a)產生測試方法,通過迭代產生候選頻繁項集并進行分別計數,統計得到頻繁項集,典型的算法是Agrawal等人心1提出的算法及其一系列的改進算法,如DHP、DIC等;b)模式增長方法,它不用產生候選項集,而是將所有頻繁項壓縮成一種特殊的數據結構(一般為樹結構),通過在數據結構上進行遍歷直接產生頻蘩項集,典型的算法有FP-Growth、LP-tree、FIUT、IFP、FPUTPLElol等;c)垂直格式方法,是將水平格式的數據集轉換成垂直格式,通過交運算來得到頻繁項集,典型的算法有Eclat等。

  隨著信息技術的快速發展,需要存儲和分析的數據量呈爆炸性增長,人類已經進入了大數據時代,傳統的關聯規則挖掘算法已經不能適應大數據挖掘的要求,主要困難是:單一計算機無法存儲所需要挖掘的所有數據及挖掘過程中產生的中間結果;挖掘過程所需要的內存遠遠超過單一機器的存儲量;計算時間太長無法忍受等。需要開發分布式、并行關聯規則挖掘算法解決上述問題。

  MapReduce是一種由Google于2004年提出的一種易用且功能強大的并行編程模型,具有使用簡單、自動容錯、負載均衡、伸縮性好等優點,其開源實現Hadoop已經廣泛應用于很多大數據分析領域,已經有了很多將傳統關聯規則挖掘算法向MapReduce模型進行遷移的研究,很大程度上解決了大數據關聯規則挖掘的問題。這些算法的主要思想都是利用Ha-doop中的分布式文件系統(HDFS)來解決海量數據存儲和分片的問題,利用MapReduce未實現挖掘算法的并行執行。

基于MapReduce的并行關聯規則挖掘算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

用戶評論

      ?
      主站蜘蛛池模板: 亚洲爆乳少妇精品无码专区 | 视频一区国产精戏刘婷30 | 最近日本MV字幕免费观看在线 | 亚洲国语在线视频手机在线 | 国产成人免费高清在线观看 | 国产成人亚洲精品无广告 | 快穿之诱受双性被灌满h | 日本无码人妻精品一区二区视频 | 欧美 亚洲 中文字幕 高清 | 一色屋精品亚洲香蕉网站 | 蜜芽tv在线观看免费网站 | 亚洲av欧美在我 | jyzzjyzzz视频国产在线观看 | 性满足久久久久久久久 | 在线视频一区二区三区在线播放 | 伊人久久大香线蕉综合亚洲 | 国产精品一区二区人妻无码 | 成人麻豆日韩在无码视频 | 亚洲精品在看在线观看 | 国产综合视频在线观看一区 | 老师你下面好紧夹死了 | 99久久久无码国产精品免费人妻 | 谁有成人网站地址 | 在线二区 中文 无码 | 999精品国产人妻无码系列 | 看电影来5566一区.二区 | 2018国产天天弄谢 | 韩国女主播内部vip自带氏巾 | 法国剧丝袜情版h级在线电影 | 国产人成高清在线视频99 | 人妻免费久久久久久久了 | 无人区免费一二三四乱码 | 一二三四中文字幕在线看 | 欧洲美女高清一级毛片 | 99精品中文字幕在线观看 | 国产免费看片 | 一本色道久久88综合日韩精品 | 黄 色 网 站 免 费 涩涩屋 | 美美哒免费影视8 | 青柠在线观看视频在线高清 | 国产成人高清在线观看播放 |