模糊技术在脱机手写体字符识别上的应用与研究

VIP免费
3.0 赵德峰 2024-11-19 4 4 655.72KB 59 页 15积分
侵权投诉
摘 要
手写字符识别是模式识别理论的一个重要应用领域,也是实现在各种背景下
字符录入自动化的重要手段。特征提取和分类器设计是手写字符识别中的两个关
键技术。虽然手写字符识别研究已经取得了很大进展,但在这两个方面仍存在尚
待深入研究的课题。本文对脱机手写字符识别系统的每个重要环节,如图像处理、
特征提取和字符识别等都进行了认真分析与研究。论文以“信函自动分拣模拟系
统软件”为具体应用,提出了基于模糊集理论的解决方案,并予以实现。
论文深入研究了图像灰度化和二值化、图像平滑与去噪、图像分割技术、
字符切分与图像归一化等,并提出了以连通域的自底向上分析法为主,投影的
自顶向下的方法为辅去除邮政编码边框的方法。根据边界特征提取和梯度特征
提取方法,提出用边界特征和轮廓特征的混合特征提取方式提取邮政编码的特
征指标。
通过模糊模式识别技术的研究,并着重讨论了隶属函数构造等一系列与手
写字符识别相关的关键问题。针对信函手写字符自动分拣的模型特征,提出一
种利用孔洞特征进行预识别,再采用边界特征和轮廓特征相结合的识别方法,
在一定程度上也提高了识别率。在对手写字符模式识别理论深入研究的基础之
上,通过设计一个信函自动分拣模拟系统软件来实际验证相关的理论。并在该
软件上对识别结果进行了分析和讨论,结果表明系统的设计方案是可行的。
关键词:手写字符识别 图像处理 特征提取 模糊集理论
ABSTRACT
Hand written character recognition is an important application area of pattern
recognition, and is also a significant way of implementing automatic inputting
characters in a variety of applications. Feature extraction and classifier designing are
two crucial techniques in handwriten character recognition. In spite of many
progresses have been made in handwritten character recognition research, there are
still deserved deeply studied topics about the two techniques.The research identifies
system to the off-line handwritten character recognition of each important link,for
example: image processing, feature selection and character recognition,all carried on
to analyze and study hard. The thesis was to the concrete application of "the letter
dividing emulation system software automatically" put forward gathering a theoretical
solution according to fuzzy set theory , and give a realization.
The research goes deep in to study decreasing image yawp, enhancing image,
separating image,etc. And put forward in chapter 6 with connect a heading uping
analysis method from the bottom of area is lord, cast shadow of from crest get down
of method for assist to clean the postal service codes a frame of method. Put forward
the characteristic index sign which adopts the hybrid characteristic of boundary
characteristic and outline chanracteristic to withdraw a way to postal service
coding,after discussing in detail two kinds of methods including boundary
characteristic withdraw and steps degree characteristic .
An efective algorithm of object selection is proposed which is based on
multi-feature extraction and fuzzy set. Firstly,it takes the advantages of fuzzy
membership to describe the importance of each feature.Then the value of each feature
is computed according its evaluation function.At last, I performance the letter
dividing emulation system software automatically which is based on hand written
character recognition and analyse the recognition rusult . The result exhibits that the
system proposal is feasible.
Key WordHandwritten Character RecognitionImage Processing
Feature ExtractionFuzzy Set Theory
目 录
摘 要
ABSTRACT
目 录
第一章 .................................................................................................................................. 1
§1.1 手写体字符识别的现状与发展趋势 ............................................................................1
§1.2 本课题的研究意义 ........................................................................................................ 2
§1.3 论文研究内容编排 ........................................................................................................ 2
第二章 手写字符的图像预处理 .................................................................................................... 4
§2.1 手写字符图像的灰度化和二值化 ................................................................................4
§2.1.1 手写字符图像的灰度化 ....................................................................................4
§2.1.2 手写字符灰度图像二值化处理 ........................................................................6
§2.2 手写字符的图像平滑与去噪 ........................................................................................8
§2.3 图像分割技术 .............................................................................................................. 11
§2.3.1 微分算子边缘检测 .......................................................................................... 11
§2.3.2 哈夫变换 .......................................................................................................... 12
§2.3.3 图像轮廓跟踪 ..................................................................................................14
§2.4 手写字符切分与图像归一化 ......................................................................................15
§2.4.1 手写字符切分 ..................................................................................................15
§2.4.2 手写字符图像归一化 ......................................................................................17
第三章 手写字符的特征提取 ...................................................................................................... 22
§3.1 字符特征提取方法概述 ..............................................................................................22
§3.2 常用的字符特征提取方法 ..........................................................................................24
§3.2.1 穿线法 .............................................................................................................. 24
§3.2.2 轮廓特征提取方法 ..........................................................................................24
§3.2.3 边界特征提取方法 ...........................................................................................25
§3.3 梯度特征的提取 .......................................................................................................... 27
§3.3.1 普通梯度特征的提取 ......................................................................................27
§3.3.2 模糊梯度特征的提取 ......................................................................................28
§3.3.3 基于梯度归一化的两种特征提取方式 ...........................................................30
第四章 模糊模式识别 .................................................................................................................. 34
§4.1 模式识别方法概述 ...................................................................................................... 34
§4.1.1 有关模式识别概念 ..........................................................................................34
§4.1.2 模式识别研究方法 ..........................................................................................34
§4.2 模糊集概念 .................................................................................................................. 36
§4.2.1 模糊数学与概率论的关系 ..............................................................................36
§4.2.2 模糊集 .............................................................................................................. 36
§4.2.3 隶属度函数 ...................................................................................................... 37
§4.2.4 模糊运算 .......................................................................................................... 37
§4.3 模糊模式识别 .............................................................................................................. 38
§4.3.1 模糊模式识别的原理 ......................................................................................39
§4.3.2 模糊识别技术的一些关键问题 ......................................................................41
第五章 信函自动分拣模拟系统软件的实..............................................................................47
§5.1 系统实现 ...................................................................................................................... 47
§5.1.1 系统简介 .......................................................................................................... 47
§5.1.2 系统的实现环..............................................................................................47
§5.1.3 系统框图 .......................................................................................................... 47
§5.2 实验结果与分析 .......................................................................................................... 51
§5.2.1 实验结果 ........................................................................................................ 51
§5.2.2 结果分析 ........................................................................................................ 51
第六章 总结与展望 ...................................................................................................................... 53
参考文献 .......................................................................................................................................... 54
在读期间公开发表的论文和承担科研项目及取得成果 ..............................................................56
致谢 .................................................................................................................................................. 57
第一章 绪论
1
第一章 绪 论
§1.1 手写体字符识别的现状与发展趋势
随着计算机技术的不断发展,计算机技术在各个领域中发挥着越来越重要的
作用。由于计算机速度的不断提高,处理信息数量的不断增大,信息输入的瓶颈
问题也变得越来越突出。这是因为目前的主要输入方式还是采用键盘输入,尤其
在需要输入大量的文字的情况下这种手工输入方式根本无法满足对速度的要求,
而且键盘输入方式对计算机的使用者也有一定的要求,这也限制了计算机的应用。
OCR技术作为一种重要的快速文字录入方式,将在很大程度上解决这方面的问题。
OCR即光学字符识别技术(Optical Character Recognition,简称OCR),是通过
扫描仪把印刷体或手写体文稿扫描成图像,然后识别成相应的计算机可直接处理
的字符。字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用
各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体
和联机手写方面技术已趋向成熟,并推出了很多应用系统:另一类是数据信息,
主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、
统计报表、财务报表、银行票据等等。
在整个OCR领域中,最为困难的就是脱机手写字符的识别。若未作出特殊说
明,本文中主要涉及的字符识别主要是指数字和英文字母的识别。数字或字母类
别比较少,笔画又简单,其识别问题似乎不是很困难。但事实上,一些测试结果
表明,脱机手写字符的正确识别率并不如印刷体汉字识别正确率高,甚至也不如
联机手写体汉字识别率高,而只仅仅优于脱机手写体汉字识别。尽管人们对手写
字符的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止,机
器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题(open
problem)
手写字符识别系统的性能主要取决于特征提取[1] [2]和分类器[3] [4] [5]设计这两个
环节。目前手写字符识别的分类器可以分为统计分类器、人工神经网络分类器、
支持向量机分类器、基于结构特征的分类器、统计方法和结构方法相结合的分类
器和多分类器的融合。
目前无论是传统方法还是一些新方法都不可避免地存在无法解决的识别“死
角”而采用单一的识别方法来提高识别率是十分困难的。因此,今后字符识别的
研究趋势应该采用多种分类器组合的多级匹配识别方法,即在特征抽取时以多种
方法有效结合来获取优化特征,互相补充,从而减少误识率,提高OCR系统的性
模糊技术在脱机手写体字符识别上的应用研究
2
能。
§1.2 本课题的研究意义
脱机手写数字识别是模式识别中的一个重要问题,主要研究如何利用计算机
自动识别手写在纸张上的阿拉伯数字。在现实生活中我们会遇到这样的数字信息,
如:邮政编码、统计报表、财务报表、银行票据、学生成绩、车牌号码……,这
些数据的录入往往需要花费很多时间。如果能通过脱机手写数字识别技术实现这
些信息的自动录入,无疑会节省很多的人力和财力,因此手写数字的识别研究有
着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。
手写字符识别的研究,对于进一步提高低质量、变形大、复杂环境干扰条件下的
文字识别的准确率,解决视频图像的文字检测和识别,文字的字体、签字和字迹
的鉴别,以及各种图像识别技术和应用问题等,甚至对于相对更成熟的联机手写
识别技术来说,都具有重要的借鉴和启发作用。
在模式识别中,用传统算法实现的自动检测往往容易出现误识的情形,而若
人来识别这种图像目标时,却能正确识别,究其原因,人的经验是模糊性的,是
难以为统计数学所容纳并加以描述的。模糊性的存在在图像信息处理中也是一个
不能回避的事实。利用模糊理论对手写体字符进行识别不仅可以解决重复劳动问
题,还能提高字符识别率。因此,基于模糊理论的脱机手写体字符识别技术成为
了一个非常有前景的课题。
§1.3 论文研究内容编排
本课题主要研究图像处理技术、字符特征提取算法、模糊理论及其在脱机手
写字符识别上的应用。脱机手写字符识别系统的性能主要取决于特征提取和分类
器设计这两个环节,因此字符特征提取算法和分类器设计是本课题的重点。
第一章是绪论,主要介绍脱机手写体字符识别的研究意义、现状和发展趋势。
第二章是手写字符的图像预处理,针对手写字符分析研究字符图像的预处理
技术,包括图像灰度化和二值化、手写字符图像平滑与去噪、图像分割技术、手
写字符切分与图像归一化等处理方法。
第三章是手写字符的特征提取,讨论常用的字符特征提取方法,如穿线法、
边界特征提取方法、梯度特征提取方法等。其中,边界特征提取方法和梯度特征
提取方法适用于手写字符特征的提取。结合脱机手写字符的特点讨论基于梯度归
一化的两种特征提取算法。
摘要:

摘要手写字符识别是模式识别理论的一个重要应用领域,也是实现在各种背景下字符录入自动化的重要手段。特征提取和分类器设计是手写字符识别中的两个关键技术。虽然手写字符识别研究已经取得了很大进展,但在这两个方面仍存在尚待深入研究的课题。本文对脱机手写字符识别系统的每个重要环节,如图像处理、特征提取和字符识别等都进行了认真分析与研究。论文以“信函自动分拣模拟系统软件”为具体应用,提出了基于模糊集理论的解决方案,并予以实现。论文深入研究了图像灰度化和二值化、图像平滑与去噪、图像分割技术、字符切分与图像归一化等,并提出了以连通域的自底向上分析法为主,投影的自顶向下的方法为辅去除邮政编码边框的方法。根据边界特...

展开>> 收起<<
模糊技术在脱机手写体字符识别上的应用与研究.pdf

共59页,预览6页

还剩页未读, 继续阅读

作者:赵德峰 分类:高等教育资料 价格:15积分 属性:59 页 大小:655.72KB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 59
客服
关注