传统FCN模型通过利用语义分割对地物类别进行划分,根据地物比例使用随机森林(Random Forest)对街景图片进行打分。虽然具备一定的可解释性,但是不如直接训练图片得到的结果更具备合理性。因为一旦只考虑地物比例,那地物的空间语义就考虑不到了,打出来的分数也便存在一定的误差。因此DCNN>FCN+RF。

笔者在这里使用了Resnet34残差网络模型,有效的消除卷积层数增加带来的梯度弥散或梯度爆炸问题。经过实验,Resnet34网络模型在情感打分上更具合理性。
image

Q.E.D.