期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于HTML结构特征的网页信息提取 被引量:5
1
作者 胡瑜 王立志 《辽宁石油化工大学学报》 CAS 2009年第3期65-69,共5页
Web上的信息很多存储在HTML页面上,传统的网页数据抽取方法是使用包装器(Wrapper)来抽取网页中感兴趣的数据。包装器所需的信息模式识别知识的获取是一个费时费力且需要较高智能的工作。避开了使用Wrapper,针对新闻类网页的结构特点,从... Web上的信息很多存储在HTML页面上,传统的网页数据抽取方法是使用包装器(Wrapper)来抽取网页中感兴趣的数据。包装器所需的信息模式识别知识的获取是一个费时费力且需要较高智能的工作。避开了使用Wrapper,针对新闻类网页的结构特点,从视觉角度对网页页面空间的构成进行了噪声与信息实体的划分与判断。讨论了一种根据新闻类网页层次结构和各层节点统计信息进行新闻主体提取的方法。改进了传统的DOM模型,增加了层次与样式等属性作为噪声判断的依据,并对其节点添加了统计信息,利用新闻的标题、时间等外显特性,提出并实现了一种结合正向直接抽取与反向降噪抽取新闻类网页得到结构化数据的方法。实验结果表明,用这种方法进行新闻类网页主体信息提取的有效性。 展开更多
关键词 信息提取 DOM LA-DOM html解析 噪声标记
在线阅读 下载PDF
HTML文件解析器设计:原理、算法与应用 被引量:8
2
作者 许骏 柳泉波 《小型微型计算机系统》 CSCD 北大核心 2001年第11期1378-1381,共4页
网页设计制作已成为当前计算机基础教育的重要内容 ,但与此相关的自动阅卷系统研究尚未见报导 .本文介绍了作者在这方面所做的工作 ,内容包括 HTML文件解析器的设计原理、主要算法和典型应用等 .HTML文件解析器作为网上远程考试与评价... 网页设计制作已成为当前计算机基础教育的重要内容 ,但与此相关的自动阅卷系统研究尚未见报导 .本文介绍了作者在这方面所做的工作 ,内容包括 HTML文件解析器的设计原理、主要算法和典型应用等 .HTML文件解析器作为网上远程考试与评价系统的组成部分之一 。 展开更多
关键词 html 文件解析器 算法 网页设计 远程教育
在线阅读 下载PDF
通过优化HTML代码来提高ASP程序运行速度
3
作者 李芳 《黄石理工学院学报》 2005年第4期46-48,共3页
为了提高页面在浏览器中显示的速度,采用了优化HTML代码这个方法,并列举了一些例子。
关键词 html 优化 区段标记符
在线阅读 下载PDF
基于XML的HTML自动阅卷算法设计与实现 被引量:4
4
作者 丁俊辉 龚沛曾 《计算机技术与发展》 2012年第1期1-4,8,共5页
自动阅卷技术在当今计算机基础教育中起着重要作用。当前主流的基于文档对象模型的HTML网页自动阅卷方法存在准确性低及在大数据量时阅卷效率差的问题。文中介绍了一种基于XML的HTML网页自动阅卷算法,它根据XML与HTML格式上的相似性将H... 自动阅卷技术在当今计算机基础教育中起着重要作用。当前主流的基于文档对象模型的HTML网页自动阅卷方法存在准确性低及在大数据量时阅卷效率差的问题。文中介绍了一种基于XML的HTML网页自动阅卷算法,它根据XML与HTML格式上的相似性将HTML文件转换成XML文件,然后利用各种程序语言对XML良好的支持来进行HTML网页自动阅卷过程中的信息处理。该算法不仅可以避免传统人工阅卷的低效率及结果的主观性,而且在准确率及稳定性方面比文档对象模型方法有很大提高,为HTML网页制作考核提供了一种有效可行的方法。 展开更多
关键词 可扩展标记语言 超文本标记语言 自动阅卷
在线阅读 下载PDF
浅谈用HTML和JavaScript修饰Web页 被引量:2
5
作者 王黎 《沈阳大学学报》 CAS 2001年第4期16-18,共3页
使用HTML和JavaScript,可以使Web页产生良好的效果。本文从介绍HT ML和JavaScript着手 ,就使用HTML和JavaScript其中的几种方法及举例 ,来谈如何修饰Web页。
关键词 html标记 JsavaScript代码 WEB页面 网页制作 音频插入 视频插入
在线阅读 下载PDF
基于HTML/XML方式的自动评卷系统 被引量:2
6
作者 刘家宁 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第6期64-66,共3页
研究了现有的计算机考试中主观题考试的自动评卷问题,提出将考试题目转换成HTML/XML格式的文本文件,再进行评判的技术思路,不仅扩展评判范围,而且便于制作特征值的系统解决方案,同时给出系统的体系结构、设计与实现方法。
关键词 自动评卷 主观题 html/XML格式 匹配
在线阅读 下载PDF
古籍资料库的自动超文本标注 被引量:3
7
作者 李新福 郭宝兰 《情报学报》 CSSCI 北大核心 1999年第3期250-254,共5页
依据古籍文献正文、校勘、参考文献等部分之间的非线性结构特性和计算机超文本技术,以720万字的《续资治通鉴长编》文本资料库超文本标注为例,着重讨论了超文本自动标注及其实现方法,并简要介绍了超文本和超文本标注语言(HTM... 依据古籍文献正文、校勘、参考文献等部分之间的非线性结构特性和计算机超文本技术,以720万字的《续资治通鉴长编》文本资料库超文本标注为例,着重讨论了超文本自动标注及其实现方法,并简要介绍了超文本和超文本标注语言(HTML)。 展开更多
关键词 古籍 超文本 超文本标注语言 标注 古籍资料库
在线阅读 下载PDF
使用javadoc自动生成标准API文档
8
作者 谢艳芳 《天津职业院校联合学报》 2013年第7期103-106,共4页
本文主要讲述了使用javadoc自动生成标准API文档的方法,其中包括为java源程序添加特定注释信息、标记的方法以及运行javadoc命令的常用方法,最后介绍了为HTML文档添加图像信息的方法。
关键词 javadoc 注释 API 标记 html
在线阅读 下载PDF
一种抽取新闻网页结构化数据的方法 被引量:1
9
作者 陈爽 李先国 +1 位作者 陈福 李素 《燕山大学学报》 CAS 2007年第6期485-488,共4页
根据统计结果,从阅读角度对网页页面空间的构成进行了噪声与信息实体的划分与判断,改进了传统的DOM模型,增加了层次与样式等属性作为噪声判断的依据,逐级降噪,并利用新闻的标题、时间等外显特性,提出并实现了一种结合正向直接抽取与反... 根据统计结果,从阅读角度对网页页面空间的构成进行了噪声与信息实体的划分与判断,改进了传统的DOM模型,增加了层次与样式等属性作为噪声判断的依据,逐级降噪,并利用新闻的标题、时间等外显特性,提出并实现了一种结合正向直接抽取与反向过滤降噪抽取新闻网页得到结构化数据的方法,并使用这种方法进行了大范围的效果验证。验证结果表明:这种方法信息抽取准确率高,对中英文新闻网页都有良好的适用性。 展开更多
关键词 信息抽取 html解析 DOM 标签补偿 噪声标记
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部