《图像检测与分割方法及其应用.pdf》由会员分享,可在线阅读,更多相关《图像检测与分割方法及其应用.pdf(78页珍藏版)》请在三一文库上搜索。
1、 图像检测与分割方法 及其应用 任会之 孙申申 著 机 械 工 业 出 版 社 本书主要介绍关于图像检测与分割方法及其应用的一些最新研究。 即 在对图像检测与分割方法的基本概念、 研究进展进行总结分析的基础上, 以人体特别是肺部的医学影像后处理为应用案例, 结合现有模式识别、 人 工智能方面的前沿理论, 提出了图像检测与分割的新算法。 本书共分 5 章。 第 1 章为基于 Hessian 矩阵的球形区域检测方法及其 应用; 第 2 章为基于组合优化和 SVM 的图像球形区域检测方法; 第 3 章 为基于多尺度和 Mean-Shift 的分割方法研究; 第 4 章为基于 EM 和 Mean- S
2、hift 的分割方法研究; 第 5 章为基于改进主动形状模型的分割方法研究。 本书内容既有理论算法, 又有典型应用, 理论联系实际, 具有广泛的 参考价值。 本书可供计算机应用、 医学影像、 生物医学工程等领域从事图像分割 和检测理论研究、 技术、 应用的专业人员和师生参考。 图书在版编目 (CIP) 数据 图像检测与分割方法及其应用/ 任会之, 孙申申著. 北京 : 机械工业出 版社, 2018. 7 ISBN 978-7-111-59701-8 . 图 . 任 孙 . 数字图像处理 . TN911. 73 中国版本图书馆 CIP 数据核字 (2018) 第 072688 号 机械工业出版社
3、(北京市百万庄大街 22 号 邮政编码 100037) 策划编辑: 沈 红 责任编辑: 沈 红 责任校对: 王明欣 封面设计: 路恩中 责任印制: 张 博 河北鑫兆源印刷有限公司印刷 2018 年 6 月第 1 版第 1 次印刷 169mm 239mm4. 75 印张2 插页74 千字 标准书号: ISBN 978-7-111-59701-8 定价: 69. 00 元 凡购本书, 如有缺页、 倒页、 脱页, 由本社发行部调换 电话服务 服务咨询热线: 010-88361066 读者购书热线: 010-68326294 010-88379203 封面无防伪标均为盗版 网络服务 机 工 官 网:
4、www. cmpbook. com 机 工 官 博: weibo. com/ cmp1952 金书网: www. golden-book. com 教育服务网: www. cmpedu. com 前 言 本书从实际应用的角度, 研究并改进了现有的图像检测与分割方法。 重点讲述了基于圆点滤波器的增强算法、 组合优化 (如改进遗传算法或分 散搜索) 和支持向量机相结合的 “去假阳” 算法框架、 基于主动形状模 型的分割方法、 基于多尺度的均值漂移的带宽选取方法、 结合均值漂移和 期望最大的分割方法等。 本书以肺部的孤立型肺结节图像检测和分割为实际案例, 在应用中对 这些算法进行了改进研究, 且提出
5、了结合均值漂移和期望最大的图像分割 方法; 通过在肺部图像的粘连血管型肺结节分割中的应用, 证明了其具有 较好的应用效果。 还提出改进主动形状模型方法, 并应用在肺部图像的病 态肺实质分割中, 取得了较好的结果。 本书详细介绍了这些算法的理论推导、 算法步骤和实验结果, 力求向 读者展示出图像检测与分割的最新研究动态及其应用成果, 希望能为从事 图像处理的广大读者提供参考, 推动该领域的学术进步。 本书理论联系实 际, 应用实例清晰可靠。 本书第 1、 2 章由任会之编写, 第 3、 4、 5 章由孙申申编写, 全书由 任会之统稿。 本书的主要内容为著者多年来的研究成果。 本书的研究课题得到了
6、国 家自然科学基金青年基金 (71201105)、 辽宁省高校科学研究项目 (L2014480) 的资助。 由于图像检测与分割技术正在迅速发展之中, 加之作者水平有限, 本 书的内容会有不足之处, 恳请广大读者批评指正。 著 者 目 录 前 言 第 1 章 基于 Hessian 矩阵的球形区域检测方法及其应用1 1. 1 基于二维 Hessian 矩阵的圆点滤波器1 1. 2 基于三维 Hessian 矩阵的圆点滤波器1 1. 3 圆点滤波器理论在图像处理中的应用实例3 1. 4 实验结果及分析6 1. 4. 1 实验数据6 1. 4. 2 实验环境7 1. 4. 3 实验方案7 1. 4.
7、4 实验结果7 第 2 章 基于组合优化和 SVM 的图像球形区域检测方法10 2. 1 求解组合优化问题的智能计算方法10 2. 1. 1 遗传算法10 2. 1. 2 分散搜索算法11 2. 2 基于组合优化的特征选择模型11 2. 3 基于改进 GA 和 SVM 的求解模型13 2. 4 基于 SS 和 SVM 求解模型14 2. 5 基于改进 GA 和 SVM 模型及其应用15 2. 5. 1 肺分割16 2. 5. 2 自适应感兴趣区域获取17 2. 5. 3 特征提取18 2. 6 实验结果及分析20 2. 6. 1 实验数据20 2. 6. 2 参数的选取20 2. 6. 3 实
8、验结果及讨论21 第 3 章 基于多尺度和 Mean-Shift 的分割方法研究29 3. 1 多尺度层次聚类方法29 3. 2 均值漂移算法31 3. 3 均值漂移算法带宽参数选取现状33 3. 4 基于多尺度的带宽参数选取方法35 3. 5 基于多尺度和 Mean-Shift 分割在图像处理中的应用36 3. 5. 1 初始区域的获取36 3. 5. 2 初始带宽参数的选取37 3. 5. 3 最佳带宽参数的选取38 3. 5. 4 Mean-Shift 二维分割结节过程39 3. 6 实验结果及分析40 3. 6. 1 实验方案40 3. 6. 2 人造实验数据及结果40 3. 6. 3
9、 肺 CT 影像实验数据42 3. 6. 4 实验结果与讨论42 第 4 章 基于 EM 和 Mean-Shift 的分割方法研究45 4. 1 期望最大算法45 4. 1. 1 算法原理45 4. 1. 2 算法步骤46 4. 2 基于 EM 和 Mean-Shift 在图像分割中的应用46 4. 2. 1 基于 EM 的带宽选取方法流程46 4. 2. 2 预处理48 4. 2. 3 基于关系矩阵的流向特征提取49 4. 2. 4 基于 EM 估计粘连血管型结节模型参数51 4. 2. 5 最佳带宽参数选取51 4. 3 Mean-Shift 三维分割结节过程52 4. 4 结果及分析53
10、 4. 4. 1 实验方案53 4. 4. 2 人造实验数据及结果53 4. 4. 3 肺 CT 影像实验数据55 4. 4. 4 实验结果与讨论56 第 5 章 基于改进主动形状模型的分割方法研究58 5. 1 主动形状模型58 5. 2 改进 ASM 在肺区分割上的应用59 5. 2. 1 肺区分割研究现状59 5. 2. 2 提取标记点61 目 录 5. 2. 3 建立形状模型61 5. 2. 4 异常标记点选择62 5. 2. 5 搜索肺区边缘63 5. 3 数据集及分割结果64 5. 3. 1 数据集64 5. 3. 2 分割结果64 5. 3. 3 分割结果评价与讨论65 参考文献
11、67 图像检测与分割方法及其应用 第 1 章 基于 Hessian 矩阵的球形 区域检测方法及其应用 所谓图像检测, 就是对图像感兴趣的特征区域 (检测目标) 有针对性 地进行提取及其过程。 其中图像是承载检测目标的载体, 检测目标需要事 先进行特征提取、 归纳, 最终通过相应算法分离出来。 本章试图应用基于 Hessian 矩阵的圆点滤波器, 对具有球形特征的目标图像进行检测。 1. 1 基于二维 Hessian 矩阵的圆点滤波器 在二维上, 服从高斯分布的圆形用式 (1-1) 表示, 服从高斯分布的 线结构用式 (1-2) 表示1。 d(x,y) = exp - (x2+ y2) 22 (
12、1-1) l(x,y) = exp - (x2) 22 (1-2) 二维 Hessian 矩阵形式如下: H = uxx uxy uyx uyy (1-3) 特征值为 1、 2, 当 1= 2 n 0. 025则停止, 并记录当前的灰度值 ThresholdValue。 5第 1 章 基于 Hessian 矩阵的球形区域检测方法及其应用 自适应阈值 被设为 ThresholdValue, 用阈值 把血管从原图像中剔除掉, 如图 1-5b 所示。 如果直接对图 1-5b 做圆点滤波器的处理, 运算量会非常大, 且耗时 多, 不实用。 则需要对图 1-5b 取高亮区域, 在高亮区域中进行圆点滤波
13、器的操作。 用自适应阈值的方法提取高亮区域, 即设图 1-5a 直方图的最 大灰度级数为 maxValue1, 最小灰度级数为 minValue1, 肺实质区域的像素 个数为 n1, 从 maxValue1 到 minValue1 累加灰度级对应的像素个数和 sumThreshold1, 当 sumThreshold1 n10. 1 则停止, 并记录当前的灰度级 数 ThreshodValue1。 自适应阈值 1被设为 ThresholdValue1。 二值化后高亮 区域如图 1-6a 所示; 对图 1-6a 进行圆点滤波器操作结果如图 1-6b 所示, 图中圈定的为候选毛玻璃型结节。 图 1
14、-6 提取毛玻璃型候选结节的结果 a) 高亮区域 b) 圆点滤波器提取得 GGO 型 “候选点” 1. 4 实验结果及分析 1. 4. 1 实验数据 表 1-1 描述了本章中使用的影像数据来源和数据属性。 数据来源于 LIDC 数据库和广州医学院第一附属医院, 每套数据的结节都有医生手工 标识的 “金标准”, 即结节的位置。 LIDC 数据库中的数据是扫描部分的肺 影像, 而广州医学院第一附属医院的数据是扫描全肺影像。 广州医学院第 一附属医院的数据库中的影像, 是通过东芝 16 排 CT 产生的, 球管的电压 为 120kV, 电流为 130mA。 数据被重建成 512 512 大小的影像。
15、 6图像检测与分割方法及其应用 表 1-1 本章测试算法性能的数据库 项 目LIDC 数据库广州医学院第一附属医院 CT 影像套数/ 套2364 像素单位体积0. 6mm 0. 6mm 0. 6mm0. 6mm 0. 6mm 2mm 3mm 平均层数/ 层30 50100 200 “金标准” 中结节总数/ 个23226 孤立型结节总数/ 个1182 粘连血管型结节总数/ 个654 粘连肺壁型结节总数/ 个258 GGO 结节数/ 个432 1. 4. 2 实验环境 所有实验都是在主频 AMD2GHz、 内存 1. 5GB 计算机上完成的; 操作 系统是 Windows XP, 编程语言为 VC
16、 +6. 0。 算法代码的开发都是在东软 医学影像处理与分析平台下完成的, 该平台是基于 NIL 库实现的, 并负责 把 3D 影像数据读入到内存中, 且能把处理后的结果显示到界面上。 1. 4. 3 实验方案 本章实验共设计 2 套实验方案, 具体方案如下。 1. 实验一 目的是分析提取毛玻璃型候选肺结节的必要性。 让医生检测 LIDC 数 据库中的所有影像, 并画出检测结果。 同时和 LIDC 发布的 “金标准” 进 行比较, 并分别统计各种类型结节的漏检情况。 2. 实验二 目的是分析所提出的提取毛玻璃型候选肺结节方法的有效性和实用 性。 首先, 找出 “金标准” 含有毛玻璃型结节的影像
17、; 然后, 分别对每套 影像分割肺实质区域; 再次, 按照 1. 3 中所述方法, 得到 GGO 结节的 “候选点”; 最后, 统计平均运行时间、 “候选点” 个数/ 套、 漏检的个数。 与此同时, 在相同的数据集上对文献 6, 8 所述算法进行了评估, 并把 它们的结果与所提出的方法的结果相比较。 1. 4. 4 实验结果 实验一的实验结果是: LIDC 数据库中共 23 个结节, 医生总共漏检了 6 个, 其中孤立型结节漏检2 个, 粘连血管型结节和粘连肺壁型结节无漏检, 而 毛玻璃型结节漏检了4 个 (漏检率 100%)。 因此, 证明了毛玻璃型结节是医 7第 1 章 基于 Hessia
18、n 矩阵的球形区域检测方法及其应用 生最易漏检的结节类型, 从而说明提取候选毛玻璃型结节的必要性。 实验二中把 1. 3 所述方法中的自适应滤波器的参数 设为 3, 模板的 高斯系数 delta 也设定为 3。 检测结果是: 对于广州医学院第一附属医院数 据库中的 32 个毛玻璃型结节, 漏检了 5 个; 而对于 LIDC 数据库中的 4 个 毛玻璃型结节, 没有漏检现象发生。 表 1-2 分别列出了 3 种方法的漏检 率、 平均每层 “候选点” 个数, 平均每套影像提取 “候选点” 所需时间。 表 1-2 本章方法与现有的 2 种方法的性能对比 实 验 方 法漏 检 率候选点个数/ 层速度/
19、 (min/ 套) 文献 6 方法42. 5%32. 03. 5 文献 8 方法30. 4%7. 44. 5 本章方法15. 6%5. 51. 2 图 1-7 为 4 幅包含 GGO 结节的影像, 箭头标示的为 GGO 结节。 本章 方法提取候选毛玻璃型结节的实际效果如图 1-8 所示, 图 1-8 为本章算法 提取 GGO 结节 “候选点” (各分图的左半部分) 的结果, 且用箭头标示。 图 1-7 4 幅包含 GGO 结节的影像 a) 含毛玻璃型结节影像 1 b) 含毛玻璃型结节影像 2 c) 含毛玻璃型结节影像 3 d) 含毛玻璃型结节影像 4 8图像检测与分割方法及其应用 图 1-8
20、本章算法提取 GGO 结节 “候选点” 的结果 a) 对影像 1 提取 “候选点” 结果 b) 对影像 2 提取 “候选点” 结果 c) 对影像 3 提取 “候选点” 结果 d) 对影像 4 提取 “候选点” 结果 9第 1 章 基于 Hessian 矩阵的球形区域检测方法及其应用 第 2 章 基于组合优化和 SVM 的 图像球形区域检测方法 在模式识别和图像区域检测中, 具有自我学习能力的支持向量机 (SVM, Support Vector Machine) 是一种常用方法9。 应用支持向量机, 先 要对图像进行特征提取。 在提取的众多特征中选取部分特征进行组合, 以 实现模式识别或图像区域
21、检测的最优效果。 选择特征组合的问题可以看作 是一个组合优化问题。 本章将遗传算法、 分散搜索算法等求解组合优化问 题的方法与 SVM 相结合, 并应用于图像区域检测。 2. 1 求解组合优化问题的智能计算方法 对于图像特征选取的组合优化问题, 采用了求解组合优化问题的两种 现代优化算法, 即遗传算法和分散搜索算法。 2. 1. 1 遗传算法 遗传算法10(GA, Genetic Algorithm) 模拟了达尔文的 “优胜劣汰” 进化过程, 即模拟了自然选择和遗传进化中发生的繁殖、 交配和突变现 象。 从一个初始种群出发, 通过随机选择、 交叉和变异操作, 产生一群新 的更适合环境的个体;
22、再使群体进化到搜索空间中越来越好的区域, 这样 一代代不断进化; 最后, 收敛到一个最适应环境的个体上, 求得问题的近 优解。 在遗传算法中, 需要用到适应度函数、 选择算子、 交叉算子和变异算 子等概念。 适应度是为实际问题预先定义的数学度量, 用于测试每个个体 的优劣程度。 选择算子保证父种群和子种群个体的连续性, 也使得子种群 继承父种群适应度函数高的个体。 交叉算子和变异算子用在种群进化中, 交叉算子使得下一代种群中的个体不但继承上代种群中父体的基因, 而且 还要继承母体的基因; 变异操作对应着生物界的基因突变, 增加种群中个 体的多样性。 每个用二进制串编码的个体叫作染色体。 遗传算
23、法的具体步骤如下: 1) 建立初始种群, 由 P 个个体组成, 每个个体为 d 位基因码, 计算 每个个体的适应度 (Fitness) 函数值。 2) 选择算子 (如轮盘法、 锦标赛选择等方式): 从当前种群中选择 繁衍到子种群的个体。 3) 从 2) 选择的个体经过交叉算子 (如两点交叉、 均匀交叉等方式) 和变异算子 (如 “位” 突变), 产生后代种群。 4) 从 3) 中选择前 P 个适应度函数值最大的个体作为当前种群。 重 复步骤 2) 4) 直到终止条件被满足。 步骤中的终止条件可以是事先定义的最多迭代次数和求解精度等。 2. 1. 2 分散搜索算法 与遗传算法类似, 分散搜索 (
24、SS, Scatter Search) 11 算法也是一种基 于种群的进化算法。 不同的是, 分散搜索算法在种群的选择中, 不仅考虑 个体解的质量, 还要考虑整个种群的分散性。 通过控制参考集中解的质量 和分散性, 使得搜索过程具有良好的广泛性, 不容易陷入局部最优。 算法 包括 5 个部分: 初始种群的产生策略、 子集产生策略、 解的组合策略、 解 的改进策略和参考集更新策略。 初始种群的产生策略必须能产生具有良好质量和分散性的初始种群, 这样从中精选出的参考解集, 才能广泛地分布在整个解空间, 且具有良好 的多样性。 子集产生策略构造若干个参考集的子集, 而解的组合策略分别 组合这些子集中
25、的解产生新解。 产生的这些新解经改进策略进行改进后, 用于更新参考集。 分散搜索算法步骤如下: 1) 以初始种群产生策略建立初始种群。 2) 使用参考集更新策略从初始种群构造参考集, 其过程 (参考集包 含新解) 如下: 用子集产生策略产生参考集的子集集合 NewSubsets。 对 NewSubsets 中的各个子集分别使用组合策略产生新解, 并以改 进策略进行改进。 用改进后的这些新解更新参考集。 2. 2 基于组合优化的特征选择模型 特征选择方法有两种模式: 过滤 (filter) 模式和封装 (wrapper) 模 11第 2 章 基于组合优化和 SVM 的图像球形区域检测方法 式12
26、。 过滤模式利用特征对数据的可分度和特征间的相关性作为选取特 征组合的指标, 一般具有效率高而效果差的特点; 封装模式利用分类器的 分类正确率作为选取特征组合的指标, 具有效率低但效果好的特点。 由于 建立分类器是在离线状态下进行的, 对速度的要求不高, 而且该分类器用 于医学背景下, 需要保证较高的敏感性和特异性, 所以选择封装模式较为 适宜。 特征选择实际是一个特征的组合优化问题, 已被证明是 NP-Hard 问 题, 常见的智能优化方法如 GA 被应用到解决该问题中。 对于许多图像检 测的应用 (如医学影像中的模式识别) 上的标准数据, 基于 SVM 建立的 分类器效果要优于人工神经元网
27、络 (ANN, Artificial Neural Networks) 13、 决策树 (DT, Decision Trees) 14 等其他分类器, 这是因为 SVM 是专门针 对有限样本分类情况的。 SVM 最终把分类问题转化成为一个二次型寻优问 题, 可以得到全局最优解, 解决了人工神经元网络中无法避免的局部极值 问题。 SVM 将原特征空间通过非线性变化转换到高维特征空间, 在高维特 征空间中构造线性判别函数来实现原空间中的非线性判别函数。 图 2-1 描 述了基于组合优化和 SVM 的特征选择的过程框架。 图 2-1 基于组合优化和 SVM 的特征选择的过程框架 在图 2-1 中首先
28、由组合优化算法产生初始候选特征组合集 (初始候选 特征子集), 并和训练集数据一起训练出 SVM 分类器; 然后, 用 SVM 分 类器测试用于特征选择的测试集, 得出的测试结果返回给组合优化算法进 行对候选特征组合的评估, 并产生下一代候选特征子集; 如此反复迭代到 最大代数, 从而求出最优特征组合。 对特征选择问题建立数学模型如下: maxf(X) = w1Sensitivity(X) + w2Specificity(X)(2-1) s. t. Sensitivity(X) = TP(X) / TP(X) + TN(X) Specificity(X) = FN(X) / FP(X) + F
29、N(X) 21图像检测与分割方法及其应用 Xi0,1 式中: w1+ w2=1 并且 w1 w2; Sensitivity 为敏感性率; Specificity 为特异性 率, 检测的敏感性和特异性之和为 1; TP 为真阳性; FP 为假阳性; FN 为 假阴性; TN 为真阴性; w1和 w2分别为敏感性和特异性的权重参数, 它们 是 0,1 之间的实数; f 为 0,1 之间的实数; X 为特征组合。 2. 3 基于改进 GA 和 SVM 的求解模型 首先, 定义染色体; 染色体为 0-1 二进制串, 其长度为所提取特征序 列的个数 R。 1 表示该特征被选中, 否则为没有被选中。 其次
30、, 设定初始 种群; 随机生成长度为 R 的染色体 N 个, 作为初始种群的个体; 为了保 证种群中个体的多样性, 本例中取 N =80。 再次, 设计适应度函数; 适应 度函数与 SVM 训练出的分类器的性能有关, 其中包括敏感性和特异性; 定义适应度函数为式 (2-1) 模型中的目标函数。 在分类效果相同的情况 下, 特征组合中所含特征数越多, 训练模型就越复杂, 越容易引起过拟合 问题。 当两个染色体的适应度函数值相等时, 染色体中所含被选中的特征 个数少的优于所含被选中的特征个数多的染色体。 然后, 确定遗传算子产 生下一代染色体; 利用轮盘赌的方式选择适应度高的染色体并复制到中间 种
31、群, 中间种群由概率 pc= 0. 1 的 “一点交叉” 和概率 pm= 0. 05 变异生 成下一代种群。 最后, 设定终止条件。 当 GA 的迭代次数等于最大迭代次 数 100 时, 程序终止。 为了得到更优的解, 加入了一个基于深度邻域的新 改的方法。 对于每一代的最好解 Cb= ,1, 通过变异每一位基因, 同时其他基因保持不变得到新的个体 Cc= ,0, 如果 f(Cc) f(Cb) 时, 更新 Cc为当前代的最好的解 Cb。 SVM 是基于统计学习理论的 VC 维 (Vapnik Cherovnenkis Dimension) 理论和结构风险最小原理 (Structural Ris
32、k Minimization Principle, SRM) 15, 通过解决一个线性二次规划问题来 求解决策面, 目标是找到训练错误和泛化能力的平衡点。 这也使得 SVM 方法比基于经验风险最小化 (Empirical Risk Minimization Principle, ERM) 的人工神经元网络等方法具有更好的泛化能力。 SVM 将非线性可分样本经 非线性变换函数 (核函数) 映射到一个高维空间上, 并在高维空间中构造 最优分类超平面, 这个超平面不但能将两类样本点正确分开, 而且使分类 间隔最大。 SVM 的基本思想可以用图 2-2 中的两维情况说明, 即实心点和 空心点分别代表两
33、类样本, H 为分类面, H1和 H2分别为过各类中离分类 31第 2 章 基于组合优化和 SVM 的图像球形区域检测方法 线最近的样本且平行于分类线的直线, 它们之间的距离叫作分类间隔 (margin)。 所谓最优分类面就是要求分类面不但能将两类正确地分开 (训 练错误率为 0), 而且使分类间隔最大。 图 2-2 线性可分情况下的最优分类面 SVM 的分类决策函数为 f(x) = sgn( i aiyik(xi,x) + b)(2-2) 式中: ai为支持向量; yi取 1 或 -1; b 为分类的阈值; k(xi,x) = (xi) (xj)为核函数。 这里的分类器类型用的是 C - S
34、VM, 核函数包括有多项式核函数、 高 斯径向核函数和多层感知器核函数, 这里用的是高斯径向核函数 (RBF, Radial Basic Function) 16, 即 k(xi,xj) = exp( - xi,xj2) 0(2-3) 式中: 通常取构造分类器训练样本的总个数的倒数。 SVM 分类器有一个缺点, 就是当训练样本集中的两类样本的数目相差 很大时, 分类结果总是偏向样本数目较大的类。 为了避免这一问题, 本书 用相同数目的样本来训练分类器, 而分类器的程序实现是基于 LIBSVM17 完成的。 2. 4 基于 SS 和 SVM 求解模型 在分散搜索 (SS, Scatter Sea
35、rch) 算法中, 解的编码表示和上节中改 进 GA 算法的染色体相同。 其具体步骤如下: 1) 随机产生 P Size (P Size =100) 个解组成初始种群 P, 并按照解的 41图像检测与分割方法及其应用 适应度从大到小的顺序对 P 中的解排序。 2) 从种群 P 中取前 b1个解 (b1=6) 加入参考集 RefSet, 并从 P 中去 除这些解。 3) 对 P 中的各个解分别求到参考集 RefSet 中解的最小距离, 选择该 最小距离最大的解加入参考集 RefSet, 并从 P 中去除这些解。 重复这个过 程 b2次 (b2=4), 使得参考集 RefSet 的规模达到 b =
36、 b1+ b2。 4) 对参考集 RefSet 中的解两两交叉进行组合, 产生 90 个新解。 并对 新得到的解进行改进。 5) 用新得到的这些解更新种群 P, 更新时要保留参考集中的最好解。 6) 步骤 3)5) 重复执行 MaxIter 次。 (1) 解的组合 上面步骤中需要用到解的组合过程, 即利用输入的两 个解, 产生一个新的、 具有这两解共同特征的解。 在具体实现时, 对于表示 输入解的2 个二进制字符串的各个位, 分3 种情况处理: 如果两个输入解 某位对应的数值都为1 (即都包含该特征), 则新解的相应位置取1; 若都 为0, 则取0。 如果两个输入解该位的数值不一致, 则随机选
37、取0 或1。 (2) 解的距离 SS 算法需要精确度量解与解之间的差异 (距离), 这 里选择文献 11 方法度量解之间的距离, 即两解选用的共同特征个数与 两解选择的特征总数之间的比。 设 2 个解选择的特征组合分别为 X1和 X2, 则两解 之 间 的 距 离 定 义 为 D ( X1, X2) =X1X2/X1X2, 其 中, 表示组合中包含的元素个数。 (3) 解的改进 SS 算法在迭代过程中, 需要对产生的所有解进行改 进。 这里采用简单的局部搜索改进方法, 即依次对解的各位取反并计算改 变后解的适应度函数值, 如果提高了解的适应度函数值就接受改变, 否则 该位改回原值。 2. 5
38、基于改进 GA 和 SVM 模型及其应用 本节以人体肺部图像中的肺结节检测为例, 将基于改进 GA 和 SVM 模 型应用在图像区域检测中。 图 2-3 是肺结节检测的计算框架, 包括两个单 元, 提取结节 “候选点” 和去假阳。 提取结节 “候选点” 单元的功能有: 肺实质分割、 基于 Hessian 矩阵的圆点滤波器提取结节 “候选点”、 自适 应地选取感兴趣区域 (VOI)、 基于区域生长分割 VOI 中待判断的物体。 去假阳单元的功能有: 提取待判断物体的特征、 基于改进 GA 和 SVM (或 51第 2 章 基于组合优化和 SVM 的图像球形区域检测方法 者基于 SS 和 SVM)
39、 选择最优的特征组合 (或者基于 SS 和 SVM 选择最优 的特征组合)、 用最优特征组合训练出的 SVM 分类器判断 VOI 中的物体是 否为结节。 图 2-3 肺 CAD 系统中的结节检测框架 2. 5. 1 肺分割 首先, 进行肺分割, 把肺实质区域提取出来, 肺结节检测只需在肺实 质区域中进行。 肺实质区自动分割的方法主要包括迭代阈值法、 区域生长 法、 最优路径法和曲率法。 本节介绍的肺实质分割方法可自动、 快速、 准 确地分割出肺实质区域, 主要包括以下步骤: CT 图像迭代阈值分割、 区 域生长和连通性排除肺外区域、 剔除气管、 填充内部空洞和剔除肝脏、 左 右肺精确分离和基于
40、曲率肺区域修补等。 图 2-4a 是肺 CT 影像, 图 2-4b 是肺实质区域分割结果。 图 2-4 肺 CT 影像与分割肺实质区域结果 a) 肺 CT 影像 b) 分割肺实质区 61图像检测与分割方法及其应用 2. 5. 2 自适应感兴趣区域获取 用迭代阈值法得到肺实质区域中的高亮区域 H, 图 2-5a 表示肺高亮区 域的轮廓。 再在高亮区域中用圆点滤波器增强具有圆形结构的像素点, 这 些像素点作为结节的 “候选点” 集合 SH; 图 2-5b 为肺结节 “候选点”。 这样做的好处是提高速度, 如果在肺实质中所有像素都计算 Hessian 矩阵 的特征值, 那么算法的速度是医生无法忍受的
41、。 在 S 中进行26 - 领域的连 通区域生长得到多个候选区域的中心点集合 C。 对于每个候选区域提取正 确特征的前提是自适应地选择该中心点的感兴趣体的尺寸, 如果待判断物 体的感兴趣体的尺寸不对, 计算出来的特征值就不能很好地反映待判断物 体的特性。 对于集合 C 中的元素 cC 其感兴趣体是以 c 为中心, 它的尺 寸从初始的 3 3 3 (像素个数) 逐步扩大, 直到感兴趣体中高亮区域的 个数占总感兴趣体像素个数的比率小于给定阈值 r。 而阈值 r 与 “候选点” 个数成正比, r 是 0 0. 5 之间小数。 由于结节中是高亮区域的像素个数 图 2-5 获得自适应 VOI a) 高亮
42、区域 b) 结节 “候选点” c) 结节 VOI 71第 2 章 基于组合优化和 SVM 的图像球形区域检测方法 多, 即使阈值 r 较大, 最后也能得到一个适合的结节感兴趣体, 不至于因 感兴趣体太小而不能包含整个结节。 由于血管交叉点和端点处属于高亮区 域像素个数少, 即使阈值 r 较小, 最后也能得到一个适合的血管感兴趣 体, 则不至于因感兴趣体太大而包含许多与检测血管无关的物体影响判 断。 图 2-5c 是一个粘连血管型结节三维可视化的结果, 白色框为感兴趣 体, 中间的球状物体为结节, 周边管状物体为血管。 设 Wk c 是以 c 为中心 第 k 次迭代的感兴趣体尺寸, rk c 是
43、以 c 为中心第 k 次迭代感兴趣体中高亮 区域的个数占总感兴趣体像素个数的比率, 则有 rk c = #xWk c|xH k3 (2-4) 2. 5. 3 特征提取 对于粘连血管型结节, 通常希望只提取结节部分特征, 这就需要把血 管和结节大致分割开。 但是由于血管和结节的 CT 值很相似, 精确地分割 需要过于复杂的方法, 而带约束的区域生长方法能够做到只生长出结节的 区域而不进入血管区域。 首先, 对 S 中的每个 26 领域的连通区域计算均 值 和方差 。 然后, 在初始候选区域的基础上逐渐向外扩张, 进行带约 束的区域生长, 得到新区域 Snext。 区域生长的条件是: 该像素属于初
44、始 候选区域像素的 4 领域。 该像素的 CT 值大于 -2 而小于 +2。 并 计算 Snext的均值和方差。 重复上述过程 4 次, 最后得到的区域能被视作粘 连血管型结节的结节部分, 可以看到分割结果没有渗透到血管区域中, 如 图 2-6 所示。 图 2-6a 为初始结节的候选区域, 图 2-6b 为约束区域生长后 的扩展区域, 图 2-6c 为 VOI 中待判断物体的区域, 即 VOI 中的高亮区域。 图 2-6 特征提取的 3 个区域 a) 初始结节的候选区域 b) 约束区域生长出的扩展区域 c) VOI 中待判断物体的区域 81图像检测与分割方法及其应用 计算图 2-6 中 3 个
45、区域的均值、 方差、 CT 最大值、 CT 最小值和像素 个数, 共 15 个特征。 VOI 中待判断物体区域的紧凑度、 球性、 最小长短 轴比率和对比度, 作为第 16 19 个特征。 紧凑度被定义为待判断物体的 内切球半径/ 外接球半径。 球性表示待判断物体与其等体积球的重叠度。 最小长短轴比率是 VOI 中待判断物体 X、 Y、 Z 方向上长度任意两者间比 例的最小值。 上述 3 个特征, 当待判断物体是球时, 取值为 1, 其他形状 属性值为 0 1 的小数。 对比度定义为带约束区域生长出的区域灰度平均 值与 VOI 中待判断物体灰度平均值的比率。 通过用服从高斯分布的球来模拟结节及用服从高斯分布的圆柱来模拟 血管, 由于圆柱的各个层面像素个数变化都比较小, 而球在各个层面上的 像素个数变化是先由小变大再变小的, 则提出一个新的特征作为第 20 种 特征; 计算 VOI 中待判断物体在 XY、 YZ 和 XZ 方向上各层像素个数的方 差, 取其三者的最小值, 如图 2-7 所示。 图 2-7 各层像素个数变化特征 a)
链接地址:https://www.31doc.com/p-5518756.html