期刊文献+

基于信息熵和决策分类技术的邮件识别研究 被引量:1

Study on Email Classifying Based on Information Entropy and Determination Tree Technique
在线阅读 下载PDF
导出
摘要 本文通过对电子邮件头信息和正文内容进行离散和特征化处理,将一封电子邮件用向量组的方式加以表达;进而使用基于信息熵的决策树分类技术构建一种垃圾邮件分类识别模型;最后通过实验对该模型做了相关的检验和测试。实验证明,该模型经过一定数量的垃圾邮件和正常邮件的对比学习后,能够进行垃圾邮件的识别,具有较好的效果。 By disperseing and charactering an email, this paper uses a group of vectors to express an email. And bring forward a determination tree classifying model base on information entropy. And then followed with some experiments and tests. The results proved that the model can find out how to identify the new spams by learning and training from the spams and normals. So it shows that our model and method work well.
作者 李洋 赵骅
出处 《计算机科学》 CSCD 北大核心 2008年第2期87-89,共3页 Computer Science
关键词 决策树 信息增益 数据挖掘 垃圾邮件 Data mining, Information entropy, Determination tree, Spam
  • 相关文献

参考文献5

  • 1赵晓明,郑少仁.电子邮件过滤器的分析与设计[J].东南大学学报(自然科学版),2001,31(5):19-23. 被引量:10
  • 2丁岳伟.基于SM TP协议电子邮件的还原[J].小型微型计算机系统,2002,23(3):290-293. 被引量:12
  • 3陈文伟,邓苏,张维明.数据挖掘与知识发现综述[N].计算机世界报,1997—06—30.
  • 4Postel J B. RFC821 simple mail transfer protocol. USA.. IETF, 1982.4-18.
  • 5Freed N, Borenstein N. RFC2045 Multipurpose Internet Mail Extensions(MIME) part one: format of Internet message bodies. USA:IETF, 1996.6-27.

二级参考文献7

  • 1[美]AndrewS Tanenbaum著 熊桂喜 王小虎 等译.计算机网络(第三版)[M].北京:清华大学出版社,1998..
  • 2[1]Postel J B. RFC821 simple mail transfer protocol. USA: IETF, 1982.4~18
  • 3[2]Freed N, Borenstein N. RFC2045 multipurpose Internet mail extensions (MIME) part one: format of Internet message bodies. USA:IETF, 1996.6~27
  • 4[3]Chapman D, Zwicky D. Building Internet firewalls. USA: O'Reilly & Associates Inc, 1995. 160~165
  • 5[4]Nachenberg C. Building AV into the Internet. In: Virus bulletin conference 2000. Oxfordshire: Virus Bulletin Ltd, 2000. 79~105
  • 6RFC#822.Srandard for the Format of Arpa Internet Text Messages[S].August 13,1982
  • 7Douglas E.Comer.Computer networks and internets[M]. Prentice Hall,Inc.1998([美]Douglas E.Comer.计算机网络与互连网[M].北京:电子工业出版社.1998.4)

共引文献20

同被引文献9

  • 1中国互联网协会反垃圾邮件中心.2009年第四季度中国反垃圾邮件状况调查报告[EB/OL].(2010-04-23)[2010-05-27].http://www.12321.cn/viewnews.php?id=12679.
  • 2SALTON G, LESK M E. Computer evaluation of indexing and text processing[J].Journal of the ACM,1968,15(1):8-36.
  • 3LANGLEY P, LBA W, THOMPSON K. An analysis of Bayesian classifiers[C]//Proc of the 10th National Conference on Artificial Intelligence. Menlo Park: AAAI Press and MIT Press, 1992: 223-228.
  • 4刘洋,杜孝平,周二胜,等. 垃圾邮件的智能分析、过滤及Rough 集讨论[C]//第十二届中国计算机学会网络与数据通信学术会议论文集.2002: 515-521.
  • 5赵利,廖闻剑,彭艳兵. 基于中文主题的垃圾邮件过滤方法研究[C]//中国通信学会第六届学术年会论文集(上).2009:16-19.
  • 6KOSMOPOULOS A, PALIOURAS G, ANDROUTSOPOULOS I. Adaptive spam filtering using only Nave Bayes text classifiers[C]//Proc of the 5th Conference on E-mail and Anti-Spam.2008.
  • 7梁刚,刘晓洁,李涛,蒋亚平,杨进,龚勋.NSC:一种新型的垃圾邮件过滤器[J].小型微型计算机系统,2008,29(1):158-161. 被引量:5
  • 8王军,史科,王辉.垃圾邮件过滤中特征选择方法研究[J].合肥工业大学学报(自然科学版),2009,32(12):1863-1866. 被引量:2
  • 9齐浩亮,程晓龙,杨沐昀,何晓宁,李生,雷国华.高性能中文垃圾邮件过滤器[J].中文信息学报,2010,24(2):76-83. 被引量:7

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部