1. 项目简介

AliLBS-CUG多源时空数据人机协作标注平台是UrbanComp团队联合阿里LBS团队,在阿里巴巴创新研究计划(Air)项目合作中开发的地理语义标注平台,目的是辅助在全国、全球大尺度土地利用、城市功能、社会经济识别和监测中,对多源时空大数据进行动态展示,支撑微观尺度人机协作标注和多尺度样本集快速建立。该平台耦合多种阿里内部高性能存储、计算平台,打通了不同平台间联动困难的壁垒。本平台经过多次版本迭代,实现了符合相关需求的操作简便、响应快速的人机协作智能标注。

2. 项目联系人

在阿里局域网外部的UrbanComp同学可以通过 https://imark.taobao.com/ 登陆到 iTAG 打标平台,该操作需要使用支付宝账号登陆注册后,联系管理员武浩 (wuh@cug.edu.cn )和董安宁 (donganning@cug.edu.cn )同学添加项目权限,即可开始标注任务。

3. 项目构成

3.1 iTAG平台简介

智能标注(iTAG)是一款由阿里巴巴开发的智能化数据标注平台,该平台支持图像、文本、视频、音频等多种数据类型的标注以及多模态的混合标注。智能标注(iTAG)提供了丰富的标注内容组件和题目组件,可以直接使用平台预置的标注模板,也可以根据自己的场景自定义模板进行数据标注。我们的AliLBS-CUG多源地理数据标注平台就是以该平台为基础二次开发得来的。

3.2 标注任务流程

在智能标注(iTAG)中,完整的数据标注流程包括以下步骤:

  1. 创建数据集
    通过数据集管理模块将待标注的原始数据创建为数据集。
  2. 创建标注任务
    对于已创建的数据集,通过智能标注(iTAG)提供的通用模板或自定义模板创建标注任务并分发任务。任务分发流程分为打标、质检及验收三个环节。因此创建标注任务时,您可以选择以下四种流程:打标、打标-检测、打标-验收、打标-检测-验收。
  3. 处理标注任务
    按照任务流程为任务包进行打标、质检或验收,从而获得标注好的数据。
  4. 导出标注结果数据
    将标注结果导出至指定的OSS目录,从而将其用于模型训练。

4. AliLBS-CUG标注平台

4.1 用户需求

该平台的目的是为了在给用户提供足够丰富的时空信息的情况下,为标注用户系统地提供方便、快捷、明确的AOI标注任务,我们整理了以下用户需求,如图1所示。

  1. 用户需要一个可以显示地图并通过拖动它来检测周围地形的平台,这样可以对该AOI的类型做出更准确的判断。
  2. 地图要不仅以矢量地图形式展示AOI附近的POI,还应以卫星地图的形式展示AOI区块的遥感影像,提供多种信息辅助用户判断该地区所属的土地利用类别。
  3. 对于AOI类别使用一级和二级类别递进的方式以便于用户理解,并且加入快捷键方便用户快速操作。

用户需求-水印
图1 用户需求图

4.2 平台架构

土地利用类别智能标注平台的架构图如图2所示。该平台除了集成阿里内部的iTAG平台之外,还集成了宜搭DataStudio平台。
宜搭平台是阿里巴巴自研的低代码应用构建平台,通过可视化拖拽的方式,传统模式下需要 2 周才能完成开发的应用,用宜搭 2 小时就能完成。无论你是专业开发者还是没有代码基础的业务人员,都可以通过宜搭构建更贴合业务实际需求的专属应用。
DataWorks是阿里巴巴的大数据工厂,包含了数据集成、DataStudio、运维中心、数据质量和数据服务五大功能模块。我们使用DataWokrs进行数据存储,以及使用数据服务提供API网络访问服务,可以用来获取AOI地块数据。
图2是该平台的架构图,可以分成三个部分。从下往上看,在服务提供层,宜搭负责显示前端页面,Data Studio负责为宜搭和ITAG提供数据访问服务。在UI设计层,我们集成了HTML、JS、CSS进行前端设计以及地图展示,开发了地图页面,并使用Dataworks显示的数据形成标记任务。对于每个用户,整个标记任务的工作流流程为:

  1. 任务发布:管理员发布任务,派发给标注用户。
  2. 用户抢单:每个任务都有额定的数量,用户需要以抢单的形式领取自己的任务。
  3. AOI标注:用户利用开发的平台进行AOI标注。
  4. 结果导出:当用户标注完毕后,可以提交任务,最后由管理员统一导出标注结果

打标架构图-水印
图2 平台架构图

5. 项目入口

https://imark.taobao.com

Q.E.D.