摘要
随着信息技术的快速发展和网络的普及,以网页形式表示的信息越来越多,基于网页的知识元挖掘就是从浩瀚的网页信息中发现潜在的有价值知识。网页知识元挖掘要处理大量的非结构化的文档信息和复杂的语义关系,采用全新的数据挖掘方法直接对非结构化数据进行挖掘,其基本流程包括:文件格式转换、分词与词性标注、文本知识元挖掘、知识元聚类以及推理与知识发现。
出处
《图书情报工作》
CSSCI
北大核心
2010年第S1期278-281,311,共5页
Library and Information Service