基于网页的知识元挖掘

导出

摘要随着信息技术的快速发展和网络的普及,以网页形式表示的信息越来越多,基于网页的知识元挖掘就是从浩瀚的网页信息中发现潜在的有价值知识。网页知识元挖掘要处理大量的非结构化的文档信息和复杂的语义关系,采用全新的数据挖掘方法直接对非结构化数据进行挖掘,其基本流程包括:文件格式转换、分词与词性标注、文本知识元挖掘、知识元聚类以及推理与知识发现。

作者任成义

机构地区西安电子科技大学经济管理学院

出处《图书情报工作》 CSSCI 北大核心 2010年第S1期278-281,311,共5页 Library and Information Service

关键词知识元挖掘文件格式转换词性标注知识元聚类知识发现

分类号 G350 [文化科学—情报学]

引文网络
相关文献

参考文献7

1朱庆华.《知识元挖掘》评介——兼议情报学的理论研究[J].情报科学,2006,24(12):1899-1902. 被引量：22
2薛为民,陆玉昌.文本挖掘技术研究[J].北京联合大学学报,2005,19(4):59-63. 被引量：63
3周在龙.计算机文件格式解析[J].科技情报开发与经济,2005,15(3):272-273. 被引量：3
4范宇中,张玉峰.网络信息资源的知识组织方法[J].情报理论与实践,2003,26(4):350-352. 被引量：15
5王丽坤,王宏,陆玉昌.文本挖掘及其关键技术与方法[J].计算机科学,2002,29(12):12-19. 被引量：43
6冯书晓,徐新,杨春梅.国内中文分词技术研究新进展[J].情报杂志,2002,21(11):29-30. 被引量：25
7邹涛,黄源,张福炎.基于WWW的文本信息挖掘[J].情报学报,1999,18(4):291-295. 被引量：47

二级参考文献46

1曾民族.向知识标引进军——阅读《知识元挖掘》的体会[J].情报学报,2006,25(2):254-256. 被引量：12
2Fayyad U M,Piatetsky-Shapiro G,Smyth P.Adavance in Knowledge Discovery and Data Mining.Cambridge MA: AAAI/MIT Press,1996
3John George H.Enhancements to the data mining process: [Ph.D.Thesis].Stanford University, 1997
4Rao A S.AgentSpeak(L):BDI Agents Speak Out in a Logical Computable Language.In:Proc.Eur.Workshop Model.Auto.Agents Multi-Agent World (MAAMAW-96, 7th), 1996.42～55
5梁南元郑延斌.一个汉语自动分词模型CWSM及自动分词系统PC—CWSS[J].Communications of COLIPS,1991,1(1):51-55.
6Wang XiaoLong,et al.The Problem of Separating Characters into Fewest Words and Its Algorithms.Chinese Science Bulletin,1989,34 (22): 1924～1928
7Salton G,Wong A,Yang C S.A Vector Space Model for Automatic Indexing.Communication of the ACM 1995,18:613～620
8Mladenic D.Machine Learning on non-homogeneous, distributed text data.Doctoral Dissertation, University of Ljubljana,1998
9McCallum A,Nigam K.A Comparison of Event Models for Naive Bayes Text Classification.Just Research 4616 Henry Street Pittsburgh,PA 15213
10McCallum A,Nigam K.Text Classification by Bootstrapping with Keywords, EM and Shrinkage.Just Research 4616 Henry Street Pittsburgh, PA 15213

共引文献206

1宋瑞祺.Web文本数据挖掘关键技术及其在网络检索中的应用[J].山西财经大学学报（高等教育版）,2007(S1). 被引量：1
2徐妙君,顾沈明.面向Web的文本挖掘技术研究[J].控制工程,2003,10(z1):44-46. 被引量：4
3贺国旗,张强.基于用户模型的文献检索研究[J].雁北师范学院学报,2002,18(5):29-32. 被引量：1
4张艳英,吕子军.基于网络环境的信息挖掘及信息服务[J].图书馆学研究,2002(11):68-70. 被引量：1
5李湘云.ISODATA动态聚类算法在文本挖掘中的应用[J].长春工程学院学报（自然科学版）,2007(2):56-58.
6杨璐光,雷宁光,朱晨光.互联网信息挖掘技术及其实现[J].哈尔滨铁道科技,2006(1):17-19. 被引量：1
7马绍龙,刘海砚.基于文档集的文本挖掘模型研究[J].测绘与空间地理信息,2013,36(5):48-50. 被引量：1
8陈淑珍.Web文本挖掘中的特征表示与特征提取技术[J].三明高等专科学校学报,2004,21(2):53-57. 被引量：2
9邵晓良,刘红.Web信息采集中军事主题信息的识别[J].情报杂志,2004,23(7):14-16. 被引量：2
10王卫平,郭长旺.基于文本挖掘的企业竞争情报系统[J].现代情报,2004,24(9):188-189. 被引量：7

1李力钢.建立“电子文件归档系统”探析[J].兰台世界（上旬）,2007(03S):25-25. 被引量：5
2李洁,范兴国,黄贵智.现代物流知识元挖掘初探[J].物流技术,2006,25(7):151-152. 被引量：1
3李爱齐.数据挖掘在科技论文分析工作中的应用[J].宁波大学学报（理工版）,2005,18(3):378-380.
4周松.数据挖掘在期刊客户关系管理中的应用[J].科技与出版,2014(3):29-31. 被引量：1
5比率和比例的区别[J].海南医学,2010,21(14):81-81.
6“比率”和“比例”的区别[J].温州医科大学学报,2016,46(5):378-378.
7李新乐.我馆读者工作中的拒借情况考察(续)[J].国家图书馆学刊,1983,1(1):14-19.
8丁梅.如何提取转存电子读物资料[J].中华医学写作杂志,2003,10(13):1250-1252.
9高国伟,王亚杰,李永先.我国知识元研究综述[J].情报科学,2016,34(2):161-165. 被引量：21
10魏艳君,彭熙.学术期刊应重视作者校对[J].编辑学报,2015,27(4):371-373. 被引量：6

图书情报工作

2010年第S1期

浏览历史

内容加载中请稍等...

基于网页的知识元挖掘

参考文献7

二级参考文献46

共引文献206

相关作者

相关机构

相关主题

浏览历史