期刊文献+

基于网页的知识元挖掘

原文传递
导出
摘要 随着信息技术的快速发展和网络的普及,以网页形式表示的信息越来越多,基于网页的知识元挖掘就是从浩瀚的网页信息中发现潜在的有价值知识。网页知识元挖掘要处理大量的非结构化的文档信息和复杂的语义关系,采用全新的数据挖掘方法直接对非结构化数据进行挖掘,其基本流程包括:文件格式转换、分词与词性标注、文本知识元挖掘、知识元聚类以及推理与知识发现。
作者 任成义
出处 《图书情报工作》 CSSCI 北大核心 2010年第S1期278-281,311,共5页 Library and Information Service
  • 相关文献

参考文献7

二级参考文献46

  • 1曾民族.向知识标引进军——阅读《知识元挖掘》的体会[J].情报学报,2006,25(2):254-256. 被引量:12
  • 2Fayyad U M,Piatetsky-Shapiro G,Smyth P.Adavance in Knowledge Discovery and Data Mining.Cambridge MA: AAAI/MIT Press,1996
  • 3John George H.Enhancements to the data mining process: [Ph.D.Thesis].Stanford University, 1997
  • 4Rao A S.AgentSpeak(L):BDI Agents Speak Out in a Logical Computable Language.In:Proc.Eur.Workshop Model.Auto.Agents Multi-Agent World (MAAMAW-96, 7th), 1996.42~55
  • 5梁南元 郑延斌.一个汉语自动分词模型CWSM及自动分词系统PC—CWSS[J].Communications of COLIPS,1991,1(1):51-55.
  • 6Wang XiaoLong,et al.The Problem of Separating Characters into Fewest Words and Its Algorithms.Chinese Science Bulletin,1989,34 (22): 1924~1928
  • 7Salton G,Wong A,Yang C S.A Vector Space Model for Automatic Indexing.Communication of the ACM 1995,18:613~620
  • 8Mladenic D.Machine Learning on non-homogeneous, distributed text data.Doctoral Dissertation, University of Ljubljana,1998
  • 9McCallum A,Nigam K.A Comparison of Event Models for Naive Bayes Text Classification.Just Research 4616 Henry Street Pittsburgh,PA 15213
  • 10McCallum A,Nigam K.Text Classification by Bootstrapping with Keywords, EM and Shrinkage.Just Research 4616 Henry Street Pittsburgh, PA 15213

共引文献206

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部