本文介绍了 5 个很棒的标注工具,我希望它们能帮助你创建计算机视觉数据集。

如果你是一名计算机视觉领域的数据科学家,你可能也意识到了你需要一个快速而简单的标注工具,其原因至少是以下两个之一:

我深入探究了计算机视觉标注领域,发现它包含了大量令人印象深刻的工具(请看如下三个超级棒的工具清单:清单一,清单二,清单三,或者查看 这个博客)。我花了相当多的时间比较最有前景的(和活跃的)项目,发现其中大部分工具都只能达到如下三个设计目标中的其中一个:

1、如果你想在标注行业展开业务,你需要:

a. 先进的项目管理功能

b. 足够多的功能,以完成任何标注任务

c. 提高效率的自动化工具

2、如果你属于一家创业公司,你可能需要:

a. API,或者至少是将标注工具连接到私有 API 的简单方法

b. 直观的用户体验(UX),使你临时聘用的每个标注人员都可以立即开始工作

3、如果你只是为自己工作,你:

a. 不用关心 API 或者项目管理

b. 只是想尽快开始标注!

下面是我最喜欢的工具列表,这些工具允许为计算机视觉应用标注包围框(用于物体检测任务)和多边形框(用于分割任务)。

如果你发现这些工具不能正常工作,请尝试在 Chrome 中运行它们。

计算机视觉标注的简要基础知识 [可选]

在计算机视觉中,训练算法的数据主要有三种类型:

  1. 图片 + 分类器训练标签(ResNets)
  2. 包围框 + 检测器标签(YOLOv3,Faster R-CNN……)
  3. 多边形 + 用于分割应用程序标签(Mask R-CNN)

计算机视觉领域最好用的5个开源图像æ‡æ³¨å·¥å…·

注意分割数据(蓝色)与检测数据(紫色)的差异

正如你很可能已经意识到的,对于 AI 项目来说,成功的最重要的影响因素之一是你可以使用的“优质数据”的数量。我所说的计算机视觉应用的“优质数据”是指:

即使后一种定义明显缺乏客观性,但我们希望我们的算法能够达到人类的水平。因此,我们需要“人类水平”的标注。

打标公司的最佳开源标注工具

计算机视觉标注工具(CVAT)

计算机视觉领域最好用的5个开源图像æ‡æ³¨å·¥å…·

计算机视觉标注工具(CVAT)

在推出 OpenCV 近 20 年后,Intel 在计算机视觉领域再次发力,并发布了 CVAT,这是一个非常强大和完整的标注工具。尽管它需要一些时间来学习和掌握,但它包含了大量的功能来标注计算机视觉数据。

优点:

缺点:

点击这里查看在线演示:https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces!

创业公司的最佳开源标注工具

可视化对象标注工具(VoTT)

计算机视觉领域最好用的5个开源图像æ‡æ³¨å·¥å…·

可视化对象标注工具(VoTT)

VoTT 是由微软开发的,它提供了非常棒的用户体验,这可能会在你标注时为你节省大量的时间和精力。而且,创建项目也很直接,所以你可以不用深入阅读其文档就能使用它。

优点:

缺点:

点击 https://vott.z5.web.core.windows.net/ 查看网页应用程序!

DataTurks

计算机视觉领域最好用的5个开源图像æ‡æ³¨å·¥å…·

DataTurks

DataTurks 是一家成立于 2018 年的初创公司,提供图片、视频和文字的标注服务。然而,直到最近它才成为开源软件(这可能与沃尔玛在 2019 年 2 月买下了它有关),此前你都必须向其付费。尽管在那之后,他们几乎没有对外发声,而且似乎已经停止了任何开发,但是这个标注工具非常棒,而且现在是免费的!

当你使用它的时候,不用在意任何许可,也不用考虑随处可见的任何非商业用途的限制条款。Dataturks 现在免费啦,而且你可以使用它的所有功能(我已经尝试和测试过了)!

优点:

缺点:

自定义最好的开源图像标注工具

Make-Sense

计算机视觉领域最好用的5个开源图像æ‡æ³¨å·¥å…·

MakeSense.ai

Make-sense 在 2019 年 6 月刚刚发布,并且已经拥有了令人难以置信的用户体验。开始启动打标从来没有这么快!进入网站,拖放你的图片,即可开始标注。

优点:

缺点:

点击 https://www.makesense.ai/ 开始打标!

我希望这篇文章能够帮助你选择一个适合你需要的打标工具,如果你找到了更好的工具,请尽管在评论区告诉我们!

P.S. 以下是其他一些工具的简短列表,这些工具尽管我没有提到,但是都很酷。

  1. VGG VIA,一个非常容易使用的标注器,其由牛津机器人实验室开发。它被编码在单个的 html/js 文件里,所以它很容易进行开发!
  2. LabelMe,由麻省理工学院开发的。在 这里 可以看到一个在线版本,或者在 这里 可以运行它。
  3. Coco-Annotator 似乎功能很齐全,但它是最近才出现的(用户身份验证系统、API 接入点)。查看 这里 的演示(用户名:admin 密码:password)

【编辑推荐】

  1. 深度长文:技术管理者应该管些什么?
  2. 这个开源项目用Pytorch实现了17种强化学习算法
  3. 集合三大类无模型强化学习算法,BAIR开源RL代码库rlpyt
  4. 1.3万亿条数据查询如何做到毫秒级响应_技术栈微信半月刊第50期
  5. 打击换脸技术滥用,谷歌发布大型数据集对抗deepfake