期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于微博数据采集的Web信息集成系统研究 被引量:3
1
作者 马凯 《现代电子技术》 北大核心 2016年第11期125-128,共4页
使用模块化构建了一种特定领域的Web信息集成系统,设计实现一种基于领域关键词的新闻、微博数据采集处理系统,通过用户提供的关键词,结合人工筛选进行关键词扩展,对全网相关新闻、微博数据进行采集与抽取。设计实现了一种基于关键词和... 使用模块化构建了一种特定领域的Web信息集成系统,设计实现一种基于领域关键词的新闻、微博数据采集处理系统,通过用户提供的关键词,结合人工筛选进行关键词扩展,对全网相关新闻、微博数据进行采集与抽取。设计实现了一种基于关键词和转发数的新闻排序方法,对特定领域采集的新闻数据进行处理排序,遴选重要信息进行定向推送。以气候变化领域为例,设计了Web信息集成系统。 展开更多
关键词 WEB信息集成 微博数据采集 气候变化 信息推送
在线阅读 下载PDF
一种基于Scrapy-Redis的分布式微博数据采集方案 被引量:11
2
作者 邓万宇 刘光达 董莹莹 《信息技术》 2018年第11期59-62,共4页
作为向网民展示世界和汇聚民意的重要渠道,微博正日益成为网络舆情的传播高地。如何对微博数据进行灵活高效地采集并存储,对后续的数据挖掘与分析工作起到重要作用。文中在分析新浪微博站点特征结构的基础上设计了一种局部最佳搜索策略... 作为向网民展示世界和汇聚民意的重要渠道,微博正日益成为网络舆情的传播高地。如何对微博数据进行灵活高效地采集并存储,对后续的数据挖掘与分析工作起到重要作用。文中在分析新浪微博站点特征结构的基础上设计了一种局部最佳搜索策略,采用Python开源框架Scrapy搭配Redis数据库,设计实现了一套抓取速度快、定制性强、扩展性高的分布式爬虫系统,获取的数据具有良好的实时性和准确性,为后续工作提供了有力的数据支撑。 展开更多
关键词 Scrapy-Redis 局部最佳搜索 分布式 微博数据采集
在线阅读 下载PDF
基于用户兴趣挖掘技术的微博信息推送应用研究 被引量:1
3
作者 邵忻 《电脑编程技巧与维护》 2021年第6期152-153,共2页
以模拟器的方式对微博大量数据进行爬取计算,对微博数据进行自动清洗,并结合关键词抽取等语言处理技术对微博用户数据进行分析和挖掘,准确分析用户兴趣对微博数据挖掘研究具有重要的意义。对平台设计的需求进行了分析,结合用户兴趣挖掘... 以模拟器的方式对微博大量数据进行爬取计算,对微博数据进行自动清洗,并结合关键词抽取等语言处理技术对微博用户数据进行分析和挖掘,准确分析用户兴趣对微博数据挖掘研究具有重要的意义。对平台设计的需求进行了分析,结合用户兴趣挖掘技术,对平台总体架构的设计进行了研究,并从用户微博信息推动应用方面,对平台的功能模块进行了设计。 展开更多
关键词 用户兴趣挖掘技术 微博数据采集 信息推动应用 IDF词典
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部