色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種新聞關鍵信息的提取算法

大小:0.87 MB 人氣:5 2017-12-13 需要積分:0

  針對網(wǎng)頁正文提取算法缺乏通用性,以及對新聞網(wǎng)頁的提取缺乏標題、時間、來源信息的問題,提出一種新聞關鍵信息的提取算法newsExtractor。該算法首先通過預處理將網(wǎng)頁轉換成行號和文本的集合,然后根據(jù)字數(shù)最長的一句話出現(xiàn)在新聞正文的概率極高的特點,從正文中間開始向兩端尋找正文的起點和終點提取新聞正文,根據(jù)最長公共子串算法提取標題,構造正則表達式并以行號輔助判斷提取時間,根據(jù)來源的格式特點并輔以行號提取來源;最后構造了數(shù)據(jù)集與國外開源軟件newsPaper進行提取準確率的對比實驗。實驗結果表明,newsExtractor在正文、標題、時間、來源的平均提取準確率上均優(yōu)于newsPaper,具有通用性和魯棒性。

一種新聞關鍵信息的提取算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

用戶評論

      ?
      主站蜘蛛池模板: 欧美夜夜噜2017最新 | 东北成人社区 | 日韩一区二区三区免费体验 | 国产36d在线观看 | 精品久久伊人 | x8国产精品视频 | 粉嫩极品国产在线观看 | 性做久久久久久久久浪潮 | bl高h文合集 | 91福利潘春春在线观看 | 精品视频免费在线 | 脔到她哭H粗话HWWW男男动漫 | 老司机午夜影院味味 | 国产亚洲精品久久无码98 | 久久精品国产视频澳门 | 狠狠撩色姣姣综合久久 | 国产又粗又猛又爽又黄的免费视频 | 狼人无码伊人AV啪啪 | 国产精品嫩草影院在线观看免费 | 肉动漫无修在线播放 | 成人在线视频观看 | 岛国片在线免费观看 | 欧美黑人巨大性极品hd欧 | 色橹橹欧美在线观看视频高 | 日韩男明星 | 嫩草AV久久伊人妇女 | 亚洲精品一二三 | 在线视频网站www色 在线视频免费国产成人 | 俄罗斯极品hd | 亚洲乱码爆乳精品成人毛片 | 亚洲欧美国产旡码专区 | 9988电影网| 岛国精品在线观看 | 岛国大片在线播放高清 | 国产午夜在线观看视频播放 | 久久频这里精品99香蕉久网址 | 幸福草电视剧演员表介绍 | 日本吃孕妇奶水免费观看 | 我的年轻漂亮继坶三级 | 日韩精品卡1卡2三卡四卡乱码 | 伊人AV一区二区三区夜色撩人 |