该网络为中国地质大学(武汉)信息工程学院关庆锋教授团队基于ADE_20K数据集训练的深度学习全卷积网络,软件编写语言为C++。
该程序由高性能计算实验室(CUG.HPSCIL)实验室提供,版权为CUG.HPSCIL实验室所有。
开放软件下载是为了方便各位老师和同学开展计算机视觉或城市计算相关的研究,请勿用做商业用途。
该网络在训练数据集的像素对比精度:0.814426,在测试数据集的像素对比精度:0.66839。
目前已在Win 10 (64位) & GTX 1050 / GTX 1080ti 测试通过,软件支持多显卡工作站和服务器。
有问题请在本文下方留言。
如果需要Caffe平台的训练模型文件,请和姚尧博士(yaoy@cug.edu.cn)联系。
【图片1】 生活场景照片分割
【图片2】 街景照片分割(叠加效果)
软件名称:GPU-CUDA-enabled Semantic Segmentation App. v1.0
链接:https://pan.baidu.com/s/19uqrUcOyMedvTt0ieQmkuw
密码:azmj
软件运行环境(必须):
Windows 8/10 (64位)
Microsoft Visual C++ 2015/2017 Redistributable
NVDIA CUDA 9.x (建议)
ADE_20K训练和测试数据集介绍和下载( 数字0代表位置物体 ):http://groups.csail.mit.edu/vision/datasets/ADE20K/
语义分割类别说明(151类):文件下载
BAT文件内参数如下所示:
【图片3】第15行为修改位置
修改方法:
./SemanticSegmentation.exe 输入DNN文件名(不用修改) 输入图像文件夹位置 输出地物百分比特征位置
输出数据为16位的分割PNG图像文件,命名规则为“输入图像文件名_seg.png”,存储于输入文件夹的”seg_files”文件夹内。
seg_files文件夹需要提前在分割图像文件夹内新建,否则不输出分割文件,只输出分割结果统计文件。
输出的分割PNG图像文件内每一个ID对应一类物体,类别ID在ADE20K_Class.txt文件中查询,0表示未知地物。
输出的特征CSV文件为每张图像中150类地物所占比例。
该程序为Windows控制台程序,需要vs2015以上的运行环境支持。
如果没有安装2015以上版本Visual Studio,请在这里下载VC运行库:https://www.microsoft.com/en-us/download/details.aspx?id=48145。
请保证程序目的和执行都在全英文路径环境下,包括输入参数和图像路径。
如果能启动后可识别图像文件,但处理失败的话,文件夹路径改为绝对路径。
每张图像不要超过1000*1000大小。文件如果过大可能会超出本地计算机/工作站的GPU内存承载能力,导致内存溢出错误。
注:使用可引用下方论文
Yao, Y., Liang, Z., Yuan, Z., Liu, P., Bie, Y., Zhang, J., … & Guan, Q. (2019). A human-machine adversarial scoring framework for urban perception assessment using street-view images. International Journal of Geographical Information Science, 33(12), 2363-2384.
Q.E.D.