本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:阿里iDST CVPR 2017论文解读:视频衣物精确检索(2)

时间:2017-07-26 19:41来源:118图库 作者:开奖直播现场 点击:
视频特征网络 (VFN ) :为了更好的考虑视频的空间序列模式,进一步提高衣物检索的性能。基于 LSTM,我们提出了视频特征网络 (VFN),如图 3 所示。其中实

视频特征网络 (VFN):为了更好的考虑视频的空间序列模式,进一步提高衣物检索的性能。基于 LSTM,我们提出了视频特征网络 (VFN),如图 3 所示。其中实验验证明两层堆叠式 LSTM 结构能够在视频特征学习中得到最佳性能。

码报:阿里iDST CVPR 2017论文解读:视频衣物精确检索

图 3 Asymnet 视频特征网络 (VFN)

相似性网络:明星同款匹配不同于近似衣物检索,精确匹配要求完全一致。在完全一致的 要求下,传统的通过相似性计算来进行检索的方法,不能满足明星同款精确匹配要求。已有的方法通常将精确匹配问题转换为一个二分类问题,但这种方式适应性差,只能利用单一时刻的视频帧。为了能够利用整个衣物运动轨迹,我们提出了如下的可变化的深度树形结构(Reconfigurable Deep Tree structure)将匹配问题转换为逻辑回归问题。匹配网络拟采用基于混合专家系统的逻辑回归网络。该结构可以认为是对现有 attention 模型的一种扩展,可以用来解决多模型融合问题。

码报:阿里iDST CVPR 2017论文解读:视频衣物精确检索

图 4 Asymnet 相似性网络

整个模型的目标函数是综合考虑每一帧的匹配结果,得到基于整个衣物运动序列和电商衣物的相似性,整个系统可以建模为对如下目标公式进行求解:

码报:阿里iDST CVPR 2017论文解读:视频衣物精确检索

类似于 attention 机制,我们提出如下后验概率模型,来对上式进行求解:

码报:阿里iDST CVPR 2017论文解读:视频衣物精确检索

得到如下梯度并采用端到端方式进行网络学习。

码报:阿里iDST CVPR 2017论文解读:视频衣物精确检索

试验结果:我们利用业务数据和最新的衣物检索方法进行了对比,试验结果如下表所示。相对于 alexnet,Asymnet 在前 20 的检索精确率指标上,其性能几乎提高了进一倍。相对于其他 2 种网络 CS 和 RC,我们发现 RC 的性能略优于 CS,因为 RC 具有较强的识别能力差异较小(采用多任务学习)。甚至在对于某些类别(无明显差别)RC 在精确率上甚至略好于 AsymNet,但是总的来说 AsymNet 比目前现有的方法拥有更好的性能。因为 Asymnet 可以处理现有的视频的时空动态变化,并结合自动视频帧的自动调节炉排判别信息的融合策略。

码报:阿里iDST CVPR 2017论文解读:视频衣物精确检索

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容