摘要
本文阐述了互联网文本数据采集能力是目前各种数据集成、应用系统关注的一项核心支撑能力,在各种系统开发中有着重要的作用。各种网站、Web应用系统的文本数据的获取方式存在一定规律性和相似性,网站文本数据的利用,诸如NLP相关研究的价值较高。因此,研究面向互联网文本数据采集的框架具有重要的现实意义,并且能够提供分布式、组件化和配置化的框架能力。
出处
《电子技术与软件工程》
2021年第12期187-189,共3页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
基金
江苏高校哲学社会科学研究项目(2020SJA0354)
江苏省高等学校教育技术研究会高校教育信息化研究课题(2019JSETKT060)
南京审计大学2020年度高教所课题(2020JG051)。