图像矫正作为OCR(Optical Character Recognition,光学字符识别)系统中的一项关键预处理技术,其重要性不容忽视。在对高考招生计划书等表格类型的图片进行OCR的流程中,输入的表格类型图片常常因为拍摄角度、光线变化或者纸张的不平整而...图像矫正作为OCR(Optical Character Recognition,光学字符识别)系统中的一项关键预处理技术,其重要性不容忽视。在对高考招生计划书等表格类型的图片进行OCR的流程中,输入的表格类型图片常常因为拍摄角度、光线变化或者纸张的不平整而产生扭曲或偏斜,严重影响识别的准确率。为提升表格类型图片内容识别的准确性,提出一种基于投影图的OCR表格图像矫正算法,基于投影图对表格图片的4个顶点进行定位,为后续的图像倾斜矫正提供参考,结合图像处理技术,矫正这些扭曲和偏斜,为字符识别提供更加准确的图像基础,从而提高整个OCR系统的识别准确性和效率。展开更多
引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的...引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的要求下,研究OCR识别在民生档案数字化管理中的应用,设计基于OCR识别的档案数字化管理方案,有助于解决纸质档案在扫描、识别、分类等环节容易出错且耗费大量人力的问题,提升民生服务效率,推动信息化建设再上新台阶。展开更多
随着城市矿产资源循环利用技术的不断发展,废旧手机回收已成为当前研究热点。受限于计算资源和数据资源的相对缺乏,目前基于线下智能回收装备的废旧手机识别精度难以达到实际应用。针对上述问题,提出一种基于多元特征异构集成深度学习...随着城市矿产资源循环利用技术的不断发展,废旧手机回收已成为当前研究热点。受限于计算资源和数据资源的相对缺乏,目前基于线下智能回收装备的废旧手机识别精度难以达到实际应用。针对上述问题,提出一种基于多元特征异构集成深度学习的图像识别模型。首先,利用字符级文本检测算法(character region awareness for text detection,CRAFT)提取手机背部字符区域,再利用ImageNet预训练的VGG19模型作为图像特征嵌入模型,利用迁移学习理念提取待回收手机的局部字符特征和全局图像特征;然后,利用局部特征构建神经网络模式光学字符识别(optical character recognition,OCR)模型,利用全局和局部特征构建非神经网络模式深度森林分类(deep forest classification,DFC)模型;最后,将异构OCR和DFC识别模型输出的结果与向量组合后输入Softmax进行集成,基于权重向量得分最大准则获取最终识别结果。基于废旧手机回收装备的真实图像验证了所提方法的有效性。展开更多
目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberr...目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberry Pi 4B作为边缘节点,使用视频采集卡、摄像头、平板计算机等搭建硬件环境。其次,基于卷积循环神经网络(convolutional recurrent neural network,CRNN)优化OCR模型,通过软硬件协同方式实现医疗终端视频流处理与数据提取。最后,采用FineBI工具实现交互界面设计与数据库链接。结果:经实验验证,该平台的硬件环境可靠、稳定,优化后的OCR模型文本识别准确率提升,且采用该平台能够实现对医疗设备数据的快速、自动化采集。结论:采用该平台能够为医护人员提供全面、准确的医疗救治装备数据支撑,有利于提升医疗救治效率。展开更多
文摘图像矫正作为OCR(Optical Character Recognition,光学字符识别)系统中的一项关键预处理技术,其重要性不容忽视。在对高考招生计划书等表格类型的图片进行OCR的流程中,输入的表格类型图片常常因为拍摄角度、光线变化或者纸张的不平整而产生扭曲或偏斜,严重影响识别的准确率。为提升表格类型图片内容识别的准确性,提出一种基于投影图的OCR表格图像矫正算法,基于投影图对表格图片的4个顶点进行定位,为后续的图像倾斜矫正提供参考,结合图像处理技术,矫正这些扭曲和偏斜,为字符识别提供更加准确的图像基础,从而提高整个OCR系统的识别准确性和效率。
文摘引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的要求下,研究OCR识别在民生档案数字化管理中的应用,设计基于OCR识别的档案数字化管理方案,有助于解决纸质档案在扫描、识别、分类等环节容易出错且耗费大量人力的问题,提升民生服务效率,推动信息化建设再上新台阶。
文摘随着城市矿产资源循环利用技术的不断发展,废旧手机回收已成为当前研究热点。受限于计算资源和数据资源的相对缺乏,目前基于线下智能回收装备的废旧手机识别精度难以达到实际应用。针对上述问题,提出一种基于多元特征异构集成深度学习的图像识别模型。首先,利用字符级文本检测算法(character region awareness for text detection,CRAFT)提取手机背部字符区域,再利用ImageNet预训练的VGG19模型作为图像特征嵌入模型,利用迁移学习理念提取待回收手机的局部字符特征和全局图像特征;然后,利用局部特征构建神经网络模式光学字符识别(optical character recognition,OCR)模型,利用全局和局部特征构建非神经网络模式深度森林分类(deep forest classification,DFC)模型;最后,将异构OCR和DFC识别模型输出的结果与向量组合后输入Softmax进行集成,基于权重向量得分最大准则获取最终识别结果。基于废旧手机回收装备的真实图像验证了所提方法的有效性。
文摘目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberry Pi 4B作为边缘节点,使用视频采集卡、摄像头、平板计算机等搭建硬件环境。其次,基于卷积循环神经网络(convolutional recurrent neural network,CRNN)优化OCR模型,通过软硬件协同方式实现医疗终端视频流处理与数据提取。最后,采用FineBI工具实现交互界面设计与数据库链接。结果:经实验验证,该平台的硬件环境可靠、稳定,优化后的OCR模型文本识别准确率提升,且采用该平台能够实现对医疗设备数据的快速、自动化采集。结论:采用该平台能够为医护人员提供全面、准确的医疗救治装备数据支撑,有利于提升医疗救治效率。