基于数学形态学的手写印刷体汉字特征提取1.doc
《基于数学形态学的手写印刷体汉字特征提取1.doc》由会员分享,可在线阅读,更多相关《基于数学形态学的手写印刷体汉字特征提取1.doc(5页珍藏版)》请在三一文库上搜索。
1、基于数学形态学的手写印刷体汉字特征提取1赵伟,李丽娟湖南大学计算机与通信学院, 湖南长沙(410082)摘要:利用数学形态学的基本运算,改进了一种手写汉字特征提取方法。根据实际需要, 采用不同的结构元素,对汉字图像进行腐蚀、膨胀、开、闭运算,使手写体汉字通过形态学处理后,得到较清晰的横、竖、撇、捺四方向的笔段特征,以便后续的统计特征和结构特征 识别,实验证明了该方法的有效性。关键词:数学形态学;结构元素;腐蚀;膨胀;开闭运算;笔段特征1. 引言汉字识别是模式识别的一个重要分支,也是文字识别领域最为困难的问题,它涉及到模 式识别,图象处理,数字信号处理等学科,是一门综合性技术。脱机手写体汉字识别
2、因其自 身的复杂性,使得系统的实现具有很大的困难,目前还没有十分成熟的产品,是一门待发展 的技术,因此它成为了国内外研究的热点。12特征提取是汉字识别过程中最重要的环节,快速地提取稳定、可靠并能充分描述汉字模 式的特征,是手写体汉字识别的关键。数学形态学是分析几何形状和结构的数学方法,是建 立在集合代数基础上,用集合论方法定量描述集合结构的科学。它具有完备的数学理论基础, 在运算速度方面比其他特征提取算法有更大的优势。345本文提出一种以数学形态学为基础的汉字特征提取新方法。它改进及利用形态学的基本 运算,无需对原图像进行预处理等操作,直接对手写印刷体汉字原始图像进行处理,从中提 取出稳定有效
3、的笔划方向特征进行识别。它具有完备的数学理论基础,无需对原始字符图象 进行预处理,细化等操作,大大节约了系统开销,在运算速度方面比其他特征提取算法有更 大的优势。2. 数学形态学基本知识形态学应用于图像处理的基本思想是利用结构元素收集图像的信息,采用不同的结构元 素对同一幅图像进行同一种形态学运算,其结果是不一样的。当不同形状、大小的结构元素 在图像中不断移动时,便可提取图像的各种结构特征。腐蚀是数学形态学最基本的运算, 它的作用是消除物体边界点。数学形态学的第二个 基本运算是膨胀。膨胀是腐蚀的对偶运算,它是将与物体接触的所有背景点合并到该物体中, 使边界向外部扩张的过程。其数学定义为:腐蚀
4、AB=n A-b:bB;膨胀 A0B=uA+b:bB ;其中 B 为结构元素,A 为输入图像。运算效果如图 1 所示:原字符腐蚀后膨胀后图 1 对字符图像腐蚀膨胀后的效果图1本课题得到基于点方向的指纹特征提取研究(国家自然科学基金)的资助。-5-在腐蚀和膨胀的基础上,可以构造出形态学的其他各种组合运算,其中最重要的就是开运算和闭运算,分别定义如下:开运算 X . S = (X S ) S;闭运算XS = (X S ) S。开运 算即对目标图像先腐蚀再膨胀,具有消除图像上细小物体,并在物体影像纤细处(目标狭窄 区)分离物体和平滑物体边界的作用;闭运算则相反,对目标图像先膨胀再腐蚀,具有填充 物体
5、影像内细小空洞,连接临近物体和平滑边界的作用。33. 手写汉字特征提取手写体汉字的基本单元是笔划而不是位点,主要是由于手写体汉字笔划不规范,位点对 手写体汉字来说不稳定,它可能处在不同人写的相同字的不同笔划上,所以笔划是手写体汉 字的基本单元。尽管笔划在书写时会产生各种变形,笔划的绝对位置变化较大,但横、竖、 撇、捺四个方向基本可以分清。手写体汉字基本笔划是由横、竖、撇、捺构成。因此,在识 别手写体汉字的过程中,如何提取手写体汉字的笔划成为关键。84. 一种基于数学形态学的手写汉字笔划提取方法利用数学形态学算子可以有效地滤除噪声,同时能保留图像中原有有用的信息,突出图 像的几何特征,便于进一步
6、分析图像。因此,可以将数学形态学的基本运算应用到手写体汉 字字符图象处理中,利用不同结构的算子提取出汉字字符的笔段特征,以下是一种利用算子 模板和形态学基本运算的手写体汉字笔划提取方法,步骤如下:(1)二值化:实际中汉字图像一般为灰度图像,为了减少计算量,降低背景噪声对汉字 图像的干扰,通常将一幅多值汉字图像转边成只有黑(汉字部分)、白(背景部分) 分布的二值图象。单个汉字图像中笔划与背景有较明显的区分,所以一般采用整体 阀值法,即当图像上象素点的灰度值大于某一固定阀值时该点设为黑色笔划点,否 则即为背景点。阀值根据实际情况取定。如图2所示:256 色位图二值化后图像 图 2 二值化前后字符图
7、像对比(2)计算汉字图像笔划的平均宽度,分别用四种结构元素对汉字图像进行腐蚀运算,图3 给出了用于腐蚀四方向笔划的55大小的结构元素的示意图。但在处理实际图像时,结构元素 的大小要由笔画的平均宽度决定。这是因为,如果结构元素太小,会对笔画方向不敏感;如果结 构元素过大,又会腐蚀掉太多的字符信息,所以结构元素一般要比笔画宽度大4个像素。横方向结构元素竖方向结构元素撇方向结构元素捺方向结构元素图 3 用来腐蚀四方向笔划的 55 结构元素示意图若笔划宽度较大,可以根据实际需要采用更大的结构元素。如图4还给出提取撇、捺方向笔划的77的结构元素。00000010000010000010000010000
8、01000001000001000000撇方向 77 结构元素捺方向 77 结构元素 图 4 用来腐蚀撇捺方向的 77 的结构元素示意图(3)由于人们在书写过程中容易产生笔划的毛刺和与笔划无关的孤立点,须对四幅子图 像依次作开运算,滤除毛刺和噪声点,从而得到四方向的大致笔划。(4)由于手写体汉字并不能达到印刷体汉字横平竖直的效果,且撇、捺笔段由于个人书写 习惯的不同,斜率有较大变化,造成上述步骤处理后的子图像笔划部分存在断点。为解决该 问题,需对子图像按各自的笔划方向作膨胀运算,为确保提取笔划的准确性,需使膨胀后的 笔划宽度大于原图像笔划宽度。(5) 采用上述数学形态学步骤后,能基本得到四方向
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数学 形态学 手写 印刷体 汉字 特征 提取
链接地址:https://www.31doc.com/p-3624036.html