关于图像异常检测的一些东西

[复制链接]
查看1780 | 回复0 | 2023-7-15 19:25:51 | 显示全部楼层 |阅读模式
图像异常检测的定义
& `: o3 r' o3 `0 Y1 [- v; {. r图像异常检测任务根据异常的形态可以分为定性异常的分类定量异常的定位两个类别。定性异常的分类, 类似于传统图像识别任务中的图像分类任务, 即整体地给出是否异常的判断, 无需准确定位异常的位置。, R# \6 s4 @% U/ T  L( x
1 x4 w* G/ Z" O0 c
关于图像异常检测的一些东西-1.jpg
' l1 h/ G- z7 f; Q; l5 ~
左上图中, 左侧代表正常图像, 右侧代表异常图像, 在第1行中, 模型仅使用服饰数据集Fashion-MNIST中衣服类型的样本进行训练, 则其他类别的样本图像 (鞋子等) 对模型来说都是需要检测的异常样本, 因为他们在纹理、结构和语义信息等方面都不相同。又或者如第 2 行所示, 异常图像中的三极管与正常图像之间只是出现了整体的偏移, 而三极管表面并不存在任何局部的异常区域, 难以准确地定义出现异常的位置, 更适合整体地进行异常与否的分类。
- m$ Y; P% }7 p' D. `$ o( X9 l而定量异常的定位则类似于目标检测或者图像分割任务, 需要得到异常区域的位置信息。在这种类型的图像异常检测中, 测试图像中只有一小部分区域出现了异常模式,而异常定位任务根据具体的图像背景又可分为以下几类。
1 x+ {; ], X4 I$ `. Z2 U+ g( ~1) 均匀背景; t- t; ], w" t$ n" c0 j
均匀背景代指一些内容较为单一的场景, 如磨砂玻璃表面对局部缺陷的定位, 或者深色山区图像中对盘山公路的定位。这一类背景下的异常检测属于相对简单的检测任务。
: Q! v2 n( W! g+ {, _- Q2) 纹理背景
& u1 F9 _" u1 w' ^8 K: Q纹理背景主要出现在工业生产领域中, 根据纹理形态又可以分为简单纹理、周期性纹理和随机纹理3 种。其中, 简单纹理代指因光照和材质反光等因素影响, 在原本均匀的物体表面产生的一些非均匀的纹理背景, 如钢板表面图像。而周期性纹理则代指各类由大量重复单元组成的具有显著周期性的图像, 最具代表性的就是各类布匹图像。而随机纹理则代指一些由无规则结构组成的图像背景, 如声呐和纳米材料图像。
" u7 r+ h  l; _" O2 C% @/ p% E3) 结构背景
$ d& g6 D% E; J% E7 `7 U% g- E/ h5 s6 R, L结构背景则是一类更为广泛的图像背景, 一般具有结构复杂、个体差异大和语义信息丰富等特点, 需要整体进行分析而无法仅依靠局部信息进行异常检测, 如各种医学图像。这类图像背景下的异常检测问题是相对较难的一类检测任务。2 o% N. H* Y' Z8 @$ o& w
机器学习中的异常值检测是如何定义异常事件的?
, r$ s& w: a& V3 i- F. A5 r. K一般情况下, 将常见的异常样本分为3个类别: 点异常、上下文异常和集群异常。
/ n+ H. X3 {9 a7 I2 k点异常一般表现为某些严重偏离正常数据分布范围的观测值, 如下图所示的二维数据点, 其中偏离了正常样本点的分布区域 (N1 , N2 )的点 (O1 , O2 和 O3) 即为异常点。4 @0 a1 L0 _3 M+ T. w! i( Z+ n7 f7 u
5 `# L/ i* }9 O4 E, q
关于图像异常检测的一些东西-2.jpg
3 e1 v1 V4 K7 l& R# x
上下文异常则表现为该次观测值虽然在正常数据分布范围内, 但联合周围数据一起分析就会表现出显著的异常. 如下图所示, t2点处的温度值虽然依然在正常范围内, 但联合前后两个月的数据就能发现该点属于异常数据。
. h. Q+ [9 w$ k; \/ L1 q
! y! p( K0 Y4 W7 b
关于图像异常检测的一些东西-3.jpg
8 V; ]6 h' Y: S1 c' L4 u
集群异常是由一系列观测结果聚合而成并且与正常数据存在差异的异常类型。该类异常中, 可能单独看其中任意一个点都不属于异常, 但是当一系列点一起出现时就属于异常, 如下图箭头所指区域内单独看每一个点的值都在正常范围内, 但这些点聚合在一起就形成了与正常信号模式完全不同的结构。9 P" H8 ^3 J. ^

% |8 a0 \1 Q, x/ ?. |
关于图像异常检测的一些东西-4.jpg

  H6 l; R' m& S* X! y. L图像异常检测问题面临的挑战是什么?
5 [  G: C6 x/ d* l' d$ X5 J8 H1) 异常样本的未知性
6 p+ p+ I5 j8 {2 F* s. {2 P  J2 ^在异常检测当中, 一般仅有正常样本可供使用, 由于异常样本的未知性, 传统的基于监督学习的目标识别算法难以直接应用到异常检测领域当中。这使得研究人员需要设计新的模型建立方法或者网络训练方法来进行异常检测。而且仅利用正常样本训练得到的异常检测模型对实际异常样本的检测还存在一定的风险, 依然可能会遗漏一些人眼认为较为显著的异常目标。1 @) P4 }- F4 H: ]+ p
2) 异常定义的不清晰  o, i. M: u" i2 f6 U  [' j
由于仅拥有正常样本, 对于异常的定义存在一定的难度, 比如异常程度到多少为异常, 如果设定太过严苛, 可能会导致很多因噪声而产生的误检出现, 而如果太过宽松又会使得一些较微弱的异常项被判定成正常。但又缺乏足够的真实异常样本来辅助这一决策过程, 使得现阶段检测方法往往较为严苛, 容易出现较多的误检区域。
  T  N1 t3 d4 d! n1 P; W& G6 f3) 微弱异常的定位8 N4 |9 A% L! W4 {" R4 o
图像异常检测一般有分类和定位两个类型。对于异常图像分类任务来说, 异常样本和正常样本之间存在明显差异。利用人工设计的特征或者预训练好的神经网络进行特征提取就有望将两者的特征向量区分开。但是对于异常定位任务而言, 图像中一般只有一部分区域出现了异常, 而且经常会出现面积较小的目标, 比如在工业外观检测过程中可能会出现宽度仅有 7 个像素的细微异常区域, 也可能会出现一些对比度较弱的异常区域。在高光谱图像异常检测或者医学图像中病变区域的定位中, 目标区域的面积一般都只占整张图像很小的比例, 使得异常区域的定位较为困难。* c, d6 C7 ]( m' V* L( p1 g( U% V
4) 维数灾难& }/ Q& j4 ~2 a# @$ g' i' B
异常检测是一个从数据挖掘领域中发展而来的概念, 因此早期的方法也大多是针对低维数据设计的, 而这些方法在面临高维数据时其检测性能会受到严重影响。而图像数据是一个典型的高维数据, 即便是最为基础的Mnist数据集, 如果仅仅是直接地将其转换成向量也会形成长达 784 维的向量, 这使得一些在数据挖掘中常用的异常检测算法很难直接用于图像数据。
5 W, R: b$ U" P$ y* i% ?5) 算法的通用性
" W* @9 D3 [4 [' C* ]/ X不同类型的图像数据差别很大, 其实际检测的目标也不尽相同, 导致现阶段许多异常检测算法是针对某一类图像而开发的。较低的通用性使得现有算法难以应用到新的图像类型当中。- K  r& o9 B( a  u# g. v0 B2 [0 @) r
一般情况下图像异常检测的目标是通过无监督或者半监督学习的方式, 检测与正常图像不同的异常图像或者局部异常区域。传统机器学习方法已经在图像异常检测领域有了较多的应用, 随着深度学习技术的发展, 越来越多的方法尝试结合神经网络来实现图像异常检测。根据在模型构建阶段有无神经网络的参与, 现有的图像异常检测方法可以分为基于传统方法和基于深度学习的方法两大类别。! {/ I# Y. v' J# O/ {" N- ?

* R4 y' }6 Y0 i6 H/ k9 Z
关于图像异常检测的一些东西-5.jpg

9 |5 X7 T. |6 s6 h基于传统方法的异常检测技术大致包含6个类别: 基于模板匹配、基于统计模型、基于图像分解、基于频域分析、基于稀疏编码重构和基于分类面构建的异常检测方法。而基于深度学习的方法大致包含 4 个类别: 基于距离度量、基于分类面构建、基于图像重构和结合传统方法的异常检测方法。
# s3 Z# ^) n  \, O! |2 `  k水论文的话很好水的,像传统方法嵌入到深度学习模型里面就很容易发了,相关的论文也较多。* o' a; N  v7 L2 Z0 N
相关的文章参考
/ i. ^# g. ?0 }2 @9 h# r, G: }几种信号降噪算法(第一部分)# b& M6 C# [% }# A  l' K
https://www.toutiao.com/article/7190201924820402721/

1 x$ X5 f, F0 u4 {$ m: M+ P几种信号降噪算法(第二部分)) g3 q6 \8 x- o; k8 O3 V, ~
https://www.toutiao.com/article/7190270349236683264/
; C& q/ l3 u1 o" v: F
机械故障诊断及工业工程故障诊断若干例子(第一篇)3 O; N# d4 i( c. F& Z7 I7 W
https://www.toutiao.com/article/7193957227231855163/
( ]4 y/ `: V( }: U: C0 z
知乎咨询:哥廷根数学学派
  ]; d3 k7 m* {6 K7 c/ Q算法代码地址,面包多主页:
! p, J$ |; y" y5 ghttps://mbd.pub/o/GeBENHAGEN/work

; m5 }; C. p9 n* ?擅长现代信号处理(改进小波分析系列,改进变分模态分解,改进经验小波变换,改进辛几何模态分解等等),改进机器学习,改进深度学习,机械故障诊断,改进时间序列分析(金融信号,心电信号,振动信号等)
% O4 z2 u0 u; P( a3 M% G, `& U) j  ^4 L% x8 y( L

, o7 Q0 S: b( m( w) j) [3 s# [; K
# b+ F; l5 r0 k6 [! U. V
关于图像异常检测的一些东西-6.jpg

( U7 o2 v: A4 Q+ s' _  [  k
/ o0 I7 N% [1 F4 y' L, \
) ]( \+ U2 O) p% p2 k
+ u& y# a: u7 `% v. E8 C& g0 s
关于图像异常检测的一些东西-7.jpg
7 M7 @! b* m2 v7 x
% j# u; \4 ^3 A' T+ @9 E

& B/ y- {" y* z% E- M* O! R. p8 \, z& K5 m4 K/ z. z. _
关于图像异常检测的一些东西-8.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

10

金钱

0

收听

0

听众
性别

新手上路

金钱
10 元