基于DSP的实时图像处理技术在大型孔板准直系统中的应用

VIP免费
3.0 陈辉 2024-11-19 5 4 1.54MB 48 页 15积分
侵权投诉
第一章 绪 论
1
第一章 绪 论
§1.1 图像实时处理的意义
图像处理是信号与信息处理学科的一个部分,也是诸多计算机领域中最为活
跃的一个领域。随着计算机、集成电路等技术的飞速发展,图像处理无论在算法、
系统结构上,还是在应用以及普及程度上都有了长足的进展。而在实时图像处理
方面,随着数字信号处理器(DSP)和大规模/超大规模集成电路以及大规模可编
程逻辑器件的发展,也得到了迅速的发展。
国际上实时图像处理研究始于 60 年代[1]当时要对黑白电视图像数据进行实
时处理,黑白电视图像数据的带宽为 6Mbit。因此,若要在一时间内对每一像素
作 50-5000 次操作,则需 3-300 亿次操作/秒,要求运算速度相当快。
为达到实时的要求,人们不断更新图像处理的算法以及计算机的系统结构技
术。对于传统的计算机,采取的是冯.诺依曼结构,它属于标准串行机,大部分
工作是在存储器和 ALU 之间交换数据,而数据的流动速率限制了计算机的速度,
这也就是通常所说的瓶颈效应,它很难完成实时高速的图像处理工作。随着 PCI[3]
总线的出现,这个问题得到了一定的解决,但是现在随着处理的复杂性加大,算法
也越来越复杂,这种处理是准实时的。因此,多处理器系统、并行处理结构计算机
成为发展的必然趋势[4]
另一方面,自从 20 世纪 80 年代初期第一片数字信号处理器芯片问世以来,
DSP 就以数字器件特有的稳定性、可重复性、可大规模集成,特别是可编程性和
易于实现自适应处理特点,给图像实时处理的发展带来了巨大机遇。最早的 DSP
是 1978 年 GOULD-AMI 推出的 S2811。DSP 自问世以来,几乎每隔 2~3 年就有新一
代产品出现,近二十年历史,就已经历了四代产品更新。DSP 在 20 世纪 80 年代
末和 90 年代初进入了快速发展的时期。以 TI 公司为典型,DSP 包括了定点、浮
点、多处理器三个类型产品[5][6]由于 DSP 运算速度的提高,能够实时处理的信号
带宽也大大增加,数字信号处理的研究重点也由最初的非实时应用转向了高速实
时适应。但是,图像处理算法复杂,运算量相当大,若所有任务都由 DSP 来完成,
对 DSP 压力相当大,可能不能满足系统的实时性,近年来,发展的可编程逻辑技
术使这个问题得到了一定的解决。用 FPGA/CPLD 可编程逻辑器件实现图像预处理
算法如:灰度图像二值化、中值滤波、平滑滤波、FFT 等,用硬件执行算法既快
又灵活,可大大减轻 DSP 的压力,使 DSP 专心处理算法程序。
正是由于上述技术的发展,使实时图像处理技术应用的领域极其广泛。从民
用领域,如机器人视觉、地形/资源探测、工业现场检测、天气预报和医学图像处
理分析等,到军用领域,如导弹的精确制导、战场的动态分析等,都利用了实时
图像处理技术[1][2]
§1.2 图像实时处理相关技术的发展动态
如前所述,在图像实时处理方面,人们一方面在计算机中软件采取并行处理、
硬件采取并行处理器。另一方面用数字信号处理器(DSP)和大规模可编程逻辑器
件(FPGA/CPLD),来实现图像的实时处理。
并行处理[7]是利用计算过程中的并发性事件进行有效的信息处理。并发性
有并行性、同时性和流水线三种含义。并行时间可在同一时间间隔内在多重资源
基于 DSP 的实时图像处理技术在大型孔板准直系统中的应用
2
中发生,同时性事件是在同一瞬间发生,而流水线事件可在重叠的时间段发生。
这些并发性事件可以在计算机系统的各个处理级获得。最高级并行处理是通过多
道、分时和多处理来实施多作业或多程序,该级需要研究并行处理的算法,通过
并行算法把有限的软硬件资源有效地配置给求解大的计算问题的多个程序;次高
级并行处理是实施同一程序内部的过程和任务,这涉及把一个程序分解为多个任
务;第三级是利用多条指令的并发性,通过指令的并发性达到快速的并发作业。
在硬件方面,由基本的串行结构发展成为并行处理结构,由单处理器发展成
多处理器系统,或带阵列处理器的高速处理系统。并行处理器阵列成为满足实时
图像处理超高强度运算能力要求的一个有效途径[4]
DSP 芯片是一种专用微处理器,它位于高性能系统的核心。它将高速控制
的灵活性与阵列处理器的数据处理能力结合起来,能产生每秒几十甚至上千
MIPS。DSP 作为一个器件,一个处理器或者一个事物是相对较新的概念。
在 20 世纪 60 年代,DSP 硬件使用分立元器件,因为价格高和体积大,它
应用仅仅是为非常特殊的要求做验证(或者庞大的预算研究程序)。在 70 年代,
出现了一些 DSP 子系统的单片集成电路,主要用于数字乘法器和地址发生器,并
且使用位片微处理器可以实现 DSP 系统。DSP 技术开发的突破出现在 1979 年,
时 Intel 发明了 2920,这是一片 40 针 DIP 封装完整的信号处理器件,带有片
EPROM、数据 RAM、A/D 和 D/A 转换器,并且它的结构和指令集非常强大,足以应
用于一个全双工的 1200bps 的调制解调器。紧接着,1982 年德州仪器公司在市场
上投放了 TMS32010[11]从 Intel2920 开始,共出现了五代通用信号处理器,第六
代已被发布。最新一代数字信号理器的处理能力是早期 2920 器件处理能力
100000 倍,所有这一切只用了 20 年的时间。
早期的 DSP 都是基于传统的 DSP 结构,它们每个时钟周期执行一条指令,使
用复杂的、多操作类型的指令。它们往往包括一个乘法器或 MAC,一个 ALU 和若
干其他的执行单元。
DSP 处理器的结构设计师要在不提高钟频和显著改变硬件的情况下改善其
能,就必须找到途径,使其在每个时钟周期内作更多的工作。一种方法是在传统
的 DSP 结构上增加并行的执行单元,如增加第二个乘法器和加法器等。这些硬件
的强化,还伴随着扩展的指令集,以便充分利用增加的硬件单元,在单个周期内
并行地作更多的操作。强化的传统结构 DSP 处理器,通过在每个指令内作多个操
作来改善其性能。但它们使用了专门的硬件和复杂的组合指令,其面临的问题也
就与传统结构的 DSP 相同:用汇编语言编程困难,编译器生成的目标代码效率不
高等。为了达到性能既高,又能有效地使用编译器,有些新的 DSP 处理器使用了
“并行”的结构。与传统的 DSP 处理器和强化的传统结构 DSP 处理器不同的是,
并行性处理器使用非常简单的指令,即同时执行一组并行的指令,而不是一次执
行 一 条 指 令 。 TI 是 第 一 个 使 用 这 种 结 构 的 DSP 厂 商 , 在 1996 年 推 出 了
TMS320C62XX,比当时所有的其他 DSP 处理器快得多。其他的厂商很快跟进,现在,
几个主要的 DSP 厂商(TI、AD、MOTOROLA、LUCENT)都在其最新的高性能 DSP 处
理器中使用了并行结构。
并行执行多指令的处理器的结构又分为两类,即超长指令字(VLIW)和超标
(superscaler)结构。这两种结构其实是很类似的,其区别主要在于并行执行
的指令如何分组。当前的决大多数并行性 DSP 处理器都使用 VLIW 结构。VLIW 和
超标量结构都提供许多执行单元,每个执行单元都执行各自的指令。
第一章 绪 论
3
VLIW 处理器在每个周期内可以执行 4-8 条指令,它们都是一个很长的指令的
一部分。超标量处理器每个周期可执行 2-4 条指令。
进 DSP 芯了 SIMDSingle Instruction
Multiple Data)技术,来改善处理器的性能,例如,SIMD 乘法指令,可以在单
周期内用不同的输入数据执行两次或多次乘法。这种技术可以极大地提高多媒体
和各理中广应用运算度。有 SIMD 能的 DSP
处理器中,支持 SIMD 操作的硬件可以是各种各样的,如 AD 公司改善了其传统的
点 ADSP-2106X 的
ADSP-2116X。每组执行单元都包括 MAC、ALU、移位器,以及属于该执行单元组的
操作数寄存器组。经过扩展的结构,可以在并行的执行单元组里,用不同的数据
来执行同样的指令。在某些算法里,可以将性能提高一倍[12]
有些厂家还将几个 DSP 芯核和 MPU 芯核(如精简指令集的 ARM 处理器)以及
专用的处理单元,如 Vierbi、Reed-Solomon 解码器,再加外围电路单元、存储单
元均集成在一个芯片上,成为系统集成电路(SOC),速度可达 1600MIPS 以上。
TI 的 TMS320C2700,Philips 的 Trimedia,Siemens 的 Tricore。在通信方面,VLSI
的 OneC GSM 处理器,则是将 ARM 处理器和 Oak DSP 芯核集成在一起[8]
另一方面,自从 1984 年 Xilnix 公司发明了现场可编程门阵列 FPGA (Field
Programmable Gate Array),加上其它可编程逻辑器件(如 GAL、EPLD、CPLD 等),
给电子系统设计带来了革命性的设计。一个 FPGA 包含丰富的具有快速系统速度的
逻辑门、寄存器和 I/0 口,其功能单元可实现多数 TTL74LS 系列器件功能,一些
系列的产品还提供一定规模的存储块(如 Altera 公司的 ACEX 系列),包括单口
或 多 口 RAM,ROM,FIFO 缓 冲器 。 由 于 逻 辑 器 件 的 可 重 复 编 程性 ( In-System
reprogrammability),硬件的配置变得象软件一样,灵活方便。而其速度、集成
度也随着 VLSI 工艺的发展而迅速提高,许多运算功能在性能上甚至超过 DSP,
于这个特点,ALTERA 下一代 FPGA 将带有 DSP 核[9][10]
国内开展图像实时处理研究是近几年的事情。89 年,浙江大学用中小规模集
成电路实现了模块化的实时处理系统 ZPIR-Ⅰ,93 年用 LOGIC 公司的 VLSI 芯片又
研制了改型系统 ZPIR-Ⅱ。津大学 90 年研的四 TMS320C25 构成的 MIMD
实时图像处理系统以用于焊接机器人,92 年又研制出了以单片 TMS320C30 为核心
的实时图像处理系统。总体来看,国内实时图像处理技术相对落后[1]
§1.3 课题的来源及本文的工作
利用视频图像来提高工业现场生产加工的效率已成为近年来研究的热点,如
对产品质量进行实时检测等。本文针对 DSP 处理大型孔板准直系统中图像实时处
理部分的硬件系统和软件框架进行了深入的分析,给出了系统图像部分的具体实
现方案。各章节内容安排如下:
第一章 绪论
第二章 系统方案设计
第三章 图像处理算法的研究
第四章 实时图像处理系统的硬件实现
第五章 实时图像处理系统的软件实现
第六章 实验结果
第七章 结论和展望
基于 DSP 的实时图像处理技术在大型孔板准直系统中的应用
4
第二章 系统方案设计
§2.1 整个课题的实现方案及工作原理
大型平板拉孔是上海理工大学附属工厂为核电厂所生产的一个产品。该产品
最后一道工序要求用拉刀对直径约 3 米的圆板上的孔进行加工成型。在加工中,
要求拉刀装置连线与孔中心的位置度误差小于
0.03mm。
我们提出的测量控制系统原理如下图 2-1 所示。
图 2-1 测量系统控制原理图
整个系统的工作原理如下:
工作人员在安装刀具前,先通过操作面板进行准直测量和控制。光源经过扩束
后变为平行光,投射到辅助测量芯棒上。辅助测量芯棒上的小孔影像通过透镜成
像在 CCD 感光面上,CCD 感光面将所成的影像传输到实时图像处理系统,经过图
像数字化、图像处理计算后将小孔影像以及当前计算得到的小孔影像的位置实时
显示在 LCD 显示器上,同时根据所计算得到的位置坐标控制 X 方向和 Y 方向两个
大功率电机运动,直到对准为止。对准后,系统通过声光提示操作人员安装拉刀
后加工,加工一个孔后,工作人员拆下拉刀进入下一个孔的加工。
实时图像处理系统
辅助测量芯棒
大功率电机
驱动系统
X方向交流
侍服电机
Y方向交流
侍服电机
实时图像数据
显示系统
操作面板
第二章 系统方案设计
5
§2.2 本课题的组成系统
作为拉孔自动准直系统的一部分,本课题的任务就是设计一个实时图像处理系
统,作为实现实时校准中最关键的部分:实时图像处理系统,系统的框图如图 2-2
所示。它的主要任务是:通过图像传感器采集的图像经过数字化后,用 CPLD 进行
图像预处理。经过预处理后的视频数据一方面输入到视频转换模块,经视频转换
后输入到图像卡,图像卡经过转换处理,形成 R、G、B 模拟信号经 CRT 显示出来,
另一方面存储在 SRAM,当目前的一帧数据存储完毕后,DSP 就从 SRAM 读入数据进
行圆心计算,当 DSP 计算完毕后再把求得的圆心坐标上传给上位机,并实时显示
出来。
图 2-2 实时图像处理系统框图
SAA7111A
DSP 控制模块
AL
250
AL
128
上 位
图 像
AL
422B
CMOS 传感器
Buffer 2
Buffer 1
摘要:

第一章绪论1第一章绪论§1.1图像实时处理的意义图像处理是信号与信息处理学科的一个部分,也是诸多计算机领域中最为活跃的一个领域。随着计算机、集成电路等技术的飞速发展,图像处理无论在算法、系统结构上,还是在应用以及普及程度上都有了长足的进展。而在实时图像处理方面,随着数字信号处理器(DSP)和大规模/超大规模集成电路以及大规模可编程逻辑器件的发展,也得到了迅速的发展。国际上实时图像处理研究始于60年代[1]。当时要对黑白电视图像数据进行实时处理,黑白电视图像数据的带宽为6Mbit。因此,若要在一时间内对每一像素作50-5000次操作,则需3-300亿次操作/秒,要求运算速度相当快。为达到实时的要...

展开>> 收起<<
基于DSP的实时图像处理技术在大型孔板准直系统中的应用.pdf

共48页,预览5页

还剩页未读, 继续阅读

作者:陈辉 分类:高等教育资料 价格:15积分 属性:48 页 大小:1.54MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 48
客服
关注