期刊导航
期刊开放获取
VIP36
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于微博数据采集的Web信息集成系统研究
被引量:
3
1
作者
马凯
《现代电子技术》
北大核心
2016年第11期125-128,共4页
使用模块化构建了一种特定领域的Web信息集成系统,设计实现一种基于领域关键词的新闻、微博数据采集处理系统,通过用户提供的关键词,结合人工筛选进行关键词扩展,对全网相关新闻、微博数据进行采集与抽取。设计实现了一种基于关键词和...
使用模块化构建了一种特定领域的Web信息集成系统,设计实现一种基于领域关键词的新闻、微博数据采集处理系统,通过用户提供的关键词,结合人工筛选进行关键词扩展,对全网相关新闻、微博数据进行采集与抽取。设计实现了一种基于关键词和转发数的新闻排序方法,对特定领域采集的新闻数据进行处理排序,遴选重要信息进行定向推送。以气候变化领域为例,设计了Web信息集成系统。
展开更多
关键词
WEB信息集成
微博数据采集
气候变化
信息推送
在线阅读
下载PDF
职称材料
一种基于Scrapy-Redis的分布式微博数据采集方案
被引量:
11
2
作者
邓万宇
刘光达
董莹莹
《信息技术》
2018年第11期59-62,共4页
作为向网民展示世界和汇聚民意的重要渠道,微博正日益成为网络舆情的传播高地。如何对微博数据进行灵活高效地采集并存储,对后续的数据挖掘与分析工作起到重要作用。文中在分析新浪微博站点特征结构的基础上设计了一种局部最佳搜索策略...
作为向网民展示世界和汇聚民意的重要渠道,微博正日益成为网络舆情的传播高地。如何对微博数据进行灵活高效地采集并存储,对后续的数据挖掘与分析工作起到重要作用。文中在分析新浪微博站点特征结构的基础上设计了一种局部最佳搜索策略,采用Python开源框架Scrapy搭配Redis数据库,设计实现了一套抓取速度快、定制性强、扩展性高的分布式爬虫系统,获取的数据具有良好的实时性和准确性,为后续工作提供了有力的数据支撑。
展开更多
关键词
Scrapy-Redis
局部最佳搜索
分布式
微博数据采集
在线阅读
下载PDF
职称材料
基于用户兴趣挖掘技术的微博信息推送应用研究
被引量:
1
3
作者
邵忻
《电脑编程技巧与维护》
2021年第6期152-153,共2页
以模拟器的方式对微博大量数据进行爬取计算,对微博数据进行自动清洗,并结合关键词抽取等语言处理技术对微博用户数据进行分析和挖掘,准确分析用户兴趣对微博数据挖掘研究具有重要的意义。对平台设计的需求进行了分析,结合用户兴趣挖掘...
以模拟器的方式对微博大量数据进行爬取计算,对微博数据进行自动清洗,并结合关键词抽取等语言处理技术对微博用户数据进行分析和挖掘,准确分析用户兴趣对微博数据挖掘研究具有重要的意义。对平台设计的需求进行了分析,结合用户兴趣挖掘技术,对平台总体架构的设计进行了研究,并从用户微博信息推动应用方面,对平台的功能模块进行了设计。
展开更多
关键词
用户兴趣挖掘技术
微博数据采集
信息推动应用
IDF词典
在线阅读
下载PDF
职称材料
题名
基于微博数据采集的Web信息集成系统研究
被引量:
3
1
作者
马凯
机构
河北大学图书馆
出处
《现代电子技术》
北大核心
2016年第11期125-128,共4页
文摘
使用模块化构建了一种特定领域的Web信息集成系统,设计实现一种基于领域关键词的新闻、微博数据采集处理系统,通过用户提供的关键词,结合人工筛选进行关键词扩展,对全网相关新闻、微博数据进行采集与抽取。设计实现了一种基于关键词和转发数的新闻排序方法,对特定领域采集的新闻数据进行处理排序,遴选重要信息进行定向推送。以气候变化领域为例,设计了Web信息集成系统。
关键词
WEB信息集成
微博数据采集
气候变化
信息推送
Keywords
Web information integration
microblog data acquisition
climate change
information push
分类号
TN919-34 [电子电信—通信与信息系统]
TM417 [电气工程—电器]
在线阅读
下载PDF
职称材料
题名
一种基于Scrapy-Redis的分布式微博数据采集方案
被引量:
11
2
作者
邓万宇
刘光达
董莹莹
机构
西安邮电大学计算机学院
出处
《信息技术》
2018年第11期59-62,共4页
基金
国家自然科学基金项目(61572399)
西安邮电大学研究生创新基金(CXJJ2017042)
文摘
作为向网民展示世界和汇聚民意的重要渠道,微博正日益成为网络舆情的传播高地。如何对微博数据进行灵活高效地采集并存储,对后续的数据挖掘与分析工作起到重要作用。文中在分析新浪微博站点特征结构的基础上设计了一种局部最佳搜索策略,采用Python开源框架Scrapy搭配Redis数据库,设计实现了一套抓取速度快、定制性强、扩展性高的分布式爬虫系统,获取的数据具有良好的实时性和准确性,为后续工作提供了有力的数据支撑。
关键词
Scrapy-Redis
局部最佳搜索
分布式
微博数据采集
Keywords
Scrapy-Redis
local optimal search
distributed
microblog data crawling
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于用户兴趣挖掘技术的微博信息推送应用研究
被引量:
1
3
作者
邵忻
机构
天津外国语大学通识教育学院
出处
《电脑编程技巧与维护》
2021年第6期152-153,共2页
文摘
以模拟器的方式对微博大量数据进行爬取计算,对微博数据进行自动清洗,并结合关键词抽取等语言处理技术对微博用户数据进行分析和挖掘,准确分析用户兴趣对微博数据挖掘研究具有重要的意义。对平台设计的需求进行了分析,结合用户兴趣挖掘技术,对平台总体架构的设计进行了研究,并从用户微博信息推动应用方面,对平台的功能模块进行了设计。
关键词
用户兴趣挖掘技术
微博数据采集
信息推动应用
IDF词典
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于微博数据采集的Web信息集成系统研究
马凯
《现代电子技术》
北大核心
2016
3
在线阅读
下载PDF
职称材料
2
一种基于Scrapy-Redis的分布式微博数据采集方案
邓万宇
刘光达
董莹莹
《信息技术》
2018
11
在线阅读
下载PDF
职称材料
3
基于用户兴趣挖掘技术的微博信息推送应用研究
邵忻
《电脑编程技巧与维护》
2021
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部