图像和视频中文本检测和提取技术研究.doc

资料分类:计算机信息 上传会员:小蚊子 更新时间:2019-03-17
需要金币2000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:14130
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:近年来,随着宽带网络技术、新型多媒体技术和信息通信技术的飞快发展,我们步入了一个崭新的互联网时代。我们知道,视频资源中包含丰富的语义信息和视频关键内容,为此,对图像和视频中文本检测和提取成为本文研究主题。

本文在现有研究的基础上主要对视频帧图像中文字的检测、定位、识别方法和实现手段展开研究。课题研究的重点主要为视频帧的截取、图像预处理、图像文本定位、图像字符分割、字符模板库的创建和字符匹配及识别六个方面。在视频帧的提取上,采用MATLAB中相关函数对视频文件进行分帧处理,获得视频相应的帧图像序列。在图像预处理方面,一是对彩色图像进行灰度化处理和二值化处理。二是对图像进行形态学运算,包括膨胀和腐蚀。在文本定位方法的选取上,本文采用了扫描法;图像字符分割采用阈值分割算法。字符模板库的创建和字符匹配运用的是模板匹配法,该方法是图像处理中最为常用的一种。最后,本文分析了当前视频图像中字符切割算法的缺点和所存在的问题以及应用领域。

 

关键词:数学形态学;文本定位;自适应阈值分割;字符识别;模板匹配

 

目录

摘要

Abstract

1 绪论-1

1.1 研究背景及意义-1

1.2 发展历史-2

1.2.1前言-2

1.2.2发展历史-2

1.3 国内外研究现状-3

1.4 论文的主要内容-4

2 视频和图像处理-5

2.1 视频图像中文本分类和特点-5

2.1.1 视频图像中文本分类-5

2.1.2 视频图像中文本特点-6

2.2 视频载入-8

2.3 视频帧提取-9

2.4 视频图像预处理-9

2.4.1图像灰度化-9

2.4.2图像二值化-10

2.5 图像数学形态学-11

2.5.1腐蚀操作-12

2.5.2膨胀操作-12

2.5.3开运算-13

2.5.4闭运算-13

2.6 本章小结-13

3 视频图像文本定位和识别-14

3.1文本定位的基本方法-14

3.1.1 基于区域的文本定位-14

3.1.2 基于边缘的文本定位-14

3.1.3 基于纹理的文本定位-15

3.1.4 基于学习的文本定位-15

3.2 文本识别-16

3.2.1 字符切分-16

3.2.2 字符归一化-16

3.2.3 文本识别-17

3.3 本章小结-17

4 系统设计及实现-18

4.1 视频载入-18

4.1.1视频文件读取-18

4.1.2视频信息获取-19

4.1.3获取视频图像序列-20

4.2 视频帧获取-21

4.3 图像预处理-22

4.3.1图像灰度化-22

4.3.2图像二值化-22

4.3.3腐蚀运算-23

4.3.4膨胀运算-23

4.4 文本定位-24

4.4.1文本边缘区域选定-24

4.4.2字符分割-25

4.5 文本识别-26

4.6 本章小结-27

结    论-28

参 考 文 献-29

致    谢-30

相关论文资料:
最新评论
上传会员 小蚊子 对本文的描述:论文对图像和视频中文本提取和识别的算法做了研究和分析,主要工作有如下几个方面:(1)介绍和分析了国内外有关内容的研究现状和发展历史;(2)对视频的载入、播放和暂停等处理以......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: