欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
当前页面

12个常见的开源缺陷检测数据集汇总,推荐收藏!

工业机器视觉
2022-06-03 14::50

导读

很多人可能已经知道当前人工智能发展的三大要素:数据、计算力和算法。数据集、计算力和算法是相辅相成、相互提升的,三者缺一不可。直白来说,数据是基础,任何研究都离不开数据,巧妇难为无米炊。今天推荐给大家缺陷检测中常见的12个开源数据集,一起来试试你的缺陷检测模型性能如何呀~

一、弱监督学习下的工业光学检测(DAGM 2007)

数据下载链接:

https://hci.iwr.uni-heidelberg.de/node/3616

数据集介绍:

  •  主要针对纹理背景上的杂项缺陷。

  •  较弱监督的训练数据。

  •  包含是个数据集,前六个为训练数据集,后四个为测试数据集。

  • 每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像。每个数据集由不同的纹理模型和缺陷模型生成。

  • “无缺陷”图像显示的背景纹理没有缺陷,“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。

  • 所有数据集已随机分为大小相等的训练和测试子数据集。

  •  弱标签以椭圆形表示,大致表示缺陷区域。         

注意:这里需要注册申请下才可以下载数据~

二、轧钢表面缺陷数据库

数据下载链接:

http://faculty.neu.edu.cn/yunhyan/NEU_surface_defect_database.html

数据集介绍:

由东北大学(NEU)发布的表面缺陷数据库,收集了热轧钢带的六种典型表面缺陷,即轧制氧化皮(RS),斑块(Pa),开裂(Cr),点蚀表面( PS),内含物(In)和划痕(Sc)。该数据库包括1,800个灰度图像:六种不同类型的典型表面缺陷,每一类缺陷包含300个样本。对于缺陷检测任务,数据集提供了注释,指示每个图像中缺陷的类别和位置。对于每个缺陷,黄色框是指示其位置的边框,绿色标签是类别分数。

如何使用数据库:  1、如果将NEU表面缺陷数据库用于缺陷分类任务,则只需下载名为NEU-CLS的仅图像文件。

2、如果将NEU表面缺陷数据库用于缺陷检测任务,则需要下载带有注释的图像文件,称为NEU-DET。

三、油污下的硅钢缺陷数据库

数据集下载链接:

http://faculty.neu.edu.cn/yunhyan/SLSM.html

数据介绍:主要包括油污干扰下硅钢的擦痕,划痕和小损伤缺陷数据。

四、磁砖表面缺陷

数据集下载链接:

https://github.com/abin24/Magnetic-tile-defect-datasets.

数据介绍:共拍摄了1344张图像,裁剪了磁砖的ROI,并根据缺陷类型将其分类为六个数据集。这六个数据集分别命名为:气孔,裂纹,磨损,断裂,不均匀(由磨削过程引起)和自由(无缺陷);每个都有像素级标签。为了模拟实际装配线中的制造过程,对于一个给定的磁砖,在多种照明条件下采集图像。

五、印刷电路板(PCB)瑕疵数据集

数据下载链接:

http://robotics.pkusz.edu.cn/resources/dataset/

数据介绍:这是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。

六、AITEX数据集(面料缺陷)

数据集下载链接:

https://pan.baidu.com/s/1cfC4Ll5QlnwN5RTuSZ6b7w

提取码:b9uy

数据介绍:该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像,每种类型的织物20个,除此之外,有105幅纺织行业中常见的不同类型的织物缺陷(12种缺陷)图像。图像的大尺寸允许用户使用不同的窗口尺寸,从而增加了样本数量。Internet上的数据库还包含所有具有缺陷的图像的分割mask,使得白色像素表示缺陷区域,其余像素为黑色。

七、天池布匹缺陷数据(竞赛)

数据下载链接:

https://pan.baidu.com/s/1LMbujxvr5iB3SwjFGYHspA

提取码:gat2

数据介绍:在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节,目前人工检测易受主观因素影响,缺乏一致性;并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大,导致布匹疵点智能检测是困扰行业多年的技术瓶颈。本数据涵盖了纺织业中布匹的各类重要瑕疵,每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类,其中,素色布数据约8000张,用于初赛;花色布数据约12000张,用于复赛。

八、天池铝型材表面瑕疵数据集(竞赛)

数据集下载链接:

https://tianchi.aliyun.com/competition/entrance/231682/information

数据介绍:在铝型材的实际生产过程中,由于各方面因素的影响,铝型材表面会产生裂纹、起皮、划伤等瑕疵,这些瑕疵会严重影响铝型材的质量。为保证产品质量,需要人工进行肉眼目测。然而,铝型材的表面自身会含有纹路,与瑕疵的区分度不高。传统人工肉眼检查十分费力,不能及时准确的判断出表面瑕疵,质检的效率难以把控。近年来,深度学习在图像识别等领域取得了突飞猛进的成果。铝型材制造商迫切希望采用最新的AI技术来革新现有质检流程,自动完成质检任务,减少漏检发生率,提高产品的质量,使铝型材产品的生产管理者彻底摆脱了无法全面掌握产品表面质量的状态。

大赛数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

九、RSDDs dataset(铁轨缺陷数据)

数据集下载链接:

http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspx

数据集介绍:

  • RSDDs数据集包含两种类型的数据集:第一种是从快车道捕获的I型RSDDs数据集,其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集,其中包含128个具有挑战性的图像。

  • 两个数据集的每幅图像至少包含一个缺陷,并且背景复杂且噪声很大。

  • RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。

十、Crack Forest Datasets(道路裂缝)

数据集下载链接:

https://github.com/cuilimeng/CrackForest

相关Matlab源码:

https://github.com/pdollar/edges

数据介绍:主要针对水泥路面的裂缝检测,可用于分类、分割和Detection。

十一、KTH-TIPS database

数据集下载链接:

http://www.nada.kth.se/cvap/databases/kth-tips/download.html

数据集介绍:一共11类真实世界物体表面纹理和材质的图像数据集,在不同姿态和光照下获取,可用来对物体表面材质进行检测和识别。

十二、桥梁裂缝图像数据

数据集下载链接:

https://pan.baidu.com/s/1bplPrPl

数据介绍:主要针对桥梁裂缝的检测数据。

3D视觉工坊
4篇文章
关注公众号
3D视觉工坊
4篇文章
3D视觉工坊的公众号