标注案例分享:道路病害图片数据标注项目

标注案例分享:道路病害图片数据标注项目


时间:2021-2-22     来源:曼孚科技


无论是水泥路面还是沥青路面,在通车使用一段时间之后,都会出现各种损坏、变形及其它缺陷,这些统称为道路病害。

常见的病害类型有:龟裂、坑槽、车辙、松散、沉陷、桥头涵顶跳车、表面破损等等,这些道路病害的存在不仅会影响到道路的正常使用,还会增加潜在的交通隐患,影响行车安全。

因此,及时发现并处理道路病害是一件非常现实的需求。以往,发现道路病害主要依赖于人力巡检,随着人工智能计算机视觉技术的发展,目前已经实现通过机器自动检测识别各种道路病害。

不过机器本身是并不具备识别各种道路病害的能力,前期机器学习依赖大量标注数据的投喂。因此,今天就分享一例数据标注在道路病害图片标注领域的具体应用。

一.项目名称

某机构道路病害图片标注。

二.项目要求

为了机器学习识别道路病害,需要标注大量的病害图片以便训练和验证。

三.业务要求

☆公路病害分类标注:

参见:《JTG H20-2007公路技术状况评定标准》

☆城镇道路病害分类标注:

参见《cjj36-2016城镇道路养护技术规范》

四.技术要求

1) 基本原则:

☆定检和日常巡检的分开;

☆市政道路和公路的分开;

☆沥青和混凝土的分开;

☆如果一个图片只有一种病害,那么放在单独目录,例:定检公路沥青龟裂xx.jpg。

2) 把图片上的所有病害都用多边形标注出来;

3) 不同的病害类型和病害要分开标注;

4) 标注的结果,每个图片对应一个json格式的文件。

五.标注效果

以上经过标注后的图片即可用于相关机器学习,满足诸如道路病害检测机器人的需要,减轻道路巡检对人力的依赖,并提高识别道路病害的准确率。


推荐文章

语音交互属于人机交互的范畴,是人机交互发展到目前的一种最前沿的交互方式,简单来说就是用人类的自然语言给机器下指令,达成自己目的的过程。随着人工智能的发展,语音交互技术逐渐成熟,并在人工智能时代有了先发优势。目前,语音交互已经加速在智能家居、手机、车载、智能穿戴、机器人等行业渗透和落地。日常生活中,我们接触到最多的语音交互应用大概就是各种语音助手,比如siri,比如小爱助手。此类语音交互工具不仅可以“听懂”我们说的话,而且还可以按照我们的要求完成各种任务。经常使用语音助手的用户可能会注意到,不同语音助手之间是有着很大差距的,一个明显的表现就是语音识别的准确率上。一些语音助手只能够识别简单的普通话,对于复杂的带有口音的内容识别的准确率很低,然而某些语音助手在这方面要表现的很好。这背后一个很重要的原因是机器学习的数据量不足。我们知道目前人工智能的实现主要依赖于机器学习,机器学习最终效果取决于投喂数据的质量与数量。语音交互领域常用的几种数据标注类型主要有:一.语音转录对不同说话人的说话内容进行转写:二.语音合成对说话内容进行合成转写:理论上而言,标注数据数量越多,质量越高,那么最终的模型效果就会越好,表现在语音助手上的效果就是识别率的提高。当然,语音交互的应用场景远不至此。未来的语音交互形式将会高效率、更加自然、更加接近于人本能的方向。

热门文章

        AI人工智能的迅猛发展得以于计算机深度学习技术的快速发展,而说到深度学习技术它又必然离不开底层基础的数据标注。        而在今天对于这种深度学习技术的基础数据标注工作也有相当一大部分人群不知道它到底是怎么个回事?什么是数据标注?数据标注是做什么的?这种问题就连一些从事这方面工作的人也有说不明白的。        要说起数据标注那我们也就不得不说下从事数据标注工作的数据标注员这个群体。人工智能、深度学习”这种名词看似高深莫测非常高大上,但目前提供给机器深度学习的数据标注采集等工作,仍是基于密集劳动力的人工智能数据标注产业。数据标注员和工厂流水线上的操作员也是没有多大区别的,可能有很多人觉得不可思议,但是目前这种情况 确实是事实。        那到底什么是数据标注呢?        要理解数据标注我们先来举个简单的例子:小时候大人教我们认识花朵时会指着花草给我们说 花会好多颜色,具体什么花开什么颜色,那我们就会慢慢记住什么花开什颜色。而人工智能深度学习也是和我们人类认知事物是一个道理。        人工智能深度机器学习的前提也是数据标注员根据不同的图片、语音、文本等数据标识出各种功能标签然后机器学习根据不同标签来认识出不同的事物。        数据标注是通过数据标注人员借助计算机标注工具软件对人工智能学习数据进行加工的一种行为。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3D画框、文本转录、图像打点、目标物体轮廓线等。        目前大多数的数据标注工具软件都是支持图像、文本、多边形、视频等多种类型的。        根据全国范围内的不完全统计,目前全国数据标注行业的从业人员已经达到 100万之多。在人工智火热与闪亮的背后,数据标注产业作为做基础的支撑确实处于行业的低端下游的。