Web文本分类技术研究
摘要
Web文本分类是Web数据挖掘的一个重要研究方向,本文在研究了Web文本分类的特征项权重计算方法的基础上,提出一种改进的TF-IDF特征项权重公式,并通过实验加以验证。
出处
《福建电脑》
2008年第9期107-107,109,共2页
Journal of Fujian Computer
二级参考文献28
-
1罗远胜,王明文,曾雪强.基于核方法的潜在语义文本分类模型[J].清华大学学报(自然科学版),2005,45(S1):1853-1856. 被引量:4
-
2廖海波,万中英,王明文.基于投影寻踪回归文本自动分类的模型[J].清华大学学报(自然科学版),2005,45(S1):1823-1827. 被引量:5
-
3叶浩,王明文,曾雪强.基于潜在语义的多类文本分类模型研究[J].清华大学学报(自然科学版),2005,45(S1):1818-1822. 被引量:18
-
4付雪峰,王明文.基于模糊-粗糙集的文本分类方法[J].华南理工大学学报(自然科学版),2004,32(z1):73-76. 被引量:8
-
5曾雪强,王明文,陈素芬.一种基于潜在语义结构的文本分类模型[J].华南理工大学学报(自然科学版),2004,32(z1):99-102. 被引量:27
-
6万中英,王明文,廖海波.基于投影寻踪的中文网页分类算法[J].中文信息学报,2005,19(4):60-67. 被引量:11
-
7Aas K, Eikvil A. Text Categorisation: A Survey[R].Norwegian Computing Center, http://citeseer.nj.nec.com/aas99text.html, 1999.
-
8Mladeni′c D, Brank J, Grobelnik M, et al. Feature Selection Using Linear Classifier Weights: Interaction with Classification Models[J]. In The 27nd Ann Int ACM SIGIR Conference on Research and Development in Information Retrieval, 2004, 234-241.
-
9Salton G, Buckley C. Term Weighting Approaches in Automatic Text Retrieval[J]. Information Processing and Management, 1988, 24(5): 513-523.
-
10Yang Y, Pedersen J O. A Comparative Study on Feature Selection in Text Categorization[J]. The Fourteenth International Conference on Machine Learning, Morgan Kaufmann, 1997, 412-420.
共引文献2290
-
1白岗岗,侯精明,史玉品,韩浩,郭凯华,李丙尧,付德宇.基于支持向量机的葫芦河流域径流变化的多因素贡献率分析[J].水土保持研究,2020,27(2):112-117. 被引量:2
-
2曾赟.第四种法学知识新形态——数据法学的研究定位[J].法制与社会发展,2023,29(1):41-59. 被引量:13
-
3乔丹,刘刚,杨执钧,钟韬,白雪.基于迁移学习的船舶目标识别[J].计算机应用研究,2020,37(S01):324-325. 被引量:1
-
4孟琮棠,赵银娣,向阳.基于卷积神经网络的遥感图像变化检测[J].现代测绘,2019,0(5):1-5. 被引量:3
-
5田海军,门洪,郎世伟.基于LS-SVM的电厂过热汽温仿真研究[J].微计算机信息,2007,23(10):270-272. 被引量:2
-
6张磊,夏士雄,牛强.基于SVM二叉决策树方法的矿井提升机故障诊断[J].微计算机信息,2008,24(10):198-199. 被引量:4
-
7瞿伟廉,谭冬梅.基于小波分析和支持向量机的结构损伤识别[J].武汉理工大学学报,2008,30(2):80-82. 被引量:3
-
8郑树剑,刘冀伟,何积铨,韩旭.基于支持向量机的混凝土结构中钢筋腐蚀的判别[J].电子器件,2007,30(5):1935-1938.
-
9殷彬,方思行.脾虚证诊断的数学模型[J].暨南大学学报(自然科学与医学版),2006,27(3):363-367. 被引量:4
-
10王宇,丁萍,吴峻.基于SVM的光纤陀螺标度因数建模研究[J].舰船电子工程,2008,28(5):78-80. 被引量:1
-
1张虹.基于自动文本分类的关键词抽取算法[J].计算机工程,2009,35(12):145-147. 被引量:18
-
2徐冬冬,吴韶波.一种基于类别描述的TF-IDF特征选择方法的改进[J].现代图书情报技术,2015(3):39-48. 被引量:13
-
3范灵.信噪比优化算法文档分类及特征权重公式改进研究[J].微计算机信息,2006,22(07X):294-296. 被引量:3
-
4王永亮,郭巧,曹奇敏.一种基于同义词的中文关键词提取方法[J].江南大学学报(自然科学版),2013,12(5):620-625. 被引量:2
-
5陈之宁,周存宝,李敏.基于犹豫度专家残缺权重补充及其群决策方法[J].舰船电子工程,2012,32(7):21-22. 被引量:1
-
6周兵,韩媛媛,徐明亮,李炜,裴银祥,吕培,周力为.快速非局部均值图像去噪算法[J].计算机辅助设计与图形学学报,2016,28(8):1260-1268. 被引量:14
-
7刘杰,迟利华,蒋杰,徐涵,晏益慧,胡庆丰.大规模并行计算机系统性能测评体系[J].计算机工程与科学,2013,35(3):25-30. 被引量:2
-
8汪峰,毛军军,黄超.基于熵和协相关度的直觉模糊多属性决策方法[J].计算机应用,2015,35(12):3456-3460. 被引量:6
-
9毛坚桓,赵晓莲.基于MWF改进的航迹标牌避让算法[J].信息化研究,2016,42(1):23-27.
-
10于泓博,李会,韩德丽.基于PSODE的网格任务调度算法[J].计算机工程与设计,2012,33(4):1447-1451. 被引量:1