在本次大会上,来自微软亚洲研究院的研究团队以长文的方式展示了两个最新的研究成果。其中,“Share-and-Chat: Achieving Human-Level Video Commenting by Search and Multi-View Embedding”(相关报道链接:https://www.microsoft.com/en-us/research/publication/share-chat-achieving-human-level-video-commenting-search-multi-view-embedding/)一文提出了目前聊天机器人最重要的一个功能——视频聊天。微软研究院和中山大学联合培养的博士生李业豪同学在大会上描述了如何通过深度神经网络学习一种对视频的表达以及学习从视频内容到用户评论的最优embedding。中科院计算所的博士生吴波同学则报告了在社交网络中如何预测一张用户图片的流行度:大规模的实验表明,社交网络中图片的流行度与用户上载的时间和图片主题息息相关(相关报道含论文链接:https://www.microsoft.com/en-us/research/publication/time-matters-multi-scale-temporalization-social-media-popularity/)。
中山大学博士生李业豪同学在演示视频聊天技术 论文的三名共同作者(左起:梅涛、吴波、郑文皇) 在演示部分,来自微软亚洲研究院的王长虎博士展示了最新的图片描述技术,即给定一张图片,计算机自动生成一段用自然语言来描述图片内容的句子;同样来自微软亚洲研究院的姚霆博士则展示了如何针对实时传送的视频流产生文字描述和用户评论。 总结 多媒体计算的研究在近二十年不断壮大,热门方向有大规模图像视频分析、社会媒体研究、多模态人机交互、计算视觉、计算图像等等。若我们将ACM Multimedia主会(Main Conference)视为多媒体计算研究的前沿技术展示,那么,安排在本届大会最后的新星学术报告或许可以作为多媒体计算研究未来发展方向的一种探索和讨论。在新星学术报告中,过半的主题是与社会计算相关,从某种意义上来说,我们可以解读为,无论计算工具本身如何变化,多媒体计算研究的本质还是以人为中心。 多媒体计算作为一个贴近生活实际、包容并促进多学科合作的研究方向,研究人员将在其中不断探索出新的潜在应用、挖掘更多贴近实际的交叉学科研究问题,并将其影响力延伸到方方面面。与此同时,我们也发现,华人在多媒体方向扮演着越来越重要的角色,直播,本届大会的最佳论文、最佳学生论文作者均为华人。 下一届ACM Multimedia选在美国硅谷这具有标志意义之地举行,也很让人期待,期待看到更多高科技+创造力的碰撞,闪出启迪智慧的火花。 作者简介
梅涛 微软亚洲研究院资深研究员 研究方向:多媒体分析和计算机视觉等 来自山东大学的甘甜教授和中央研究院的郑文皇博士亦对本文有所贡献。 你也许还想看: 感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:[email protected]。微软小冰进驻微软研究院微信啦!快去主页和她聊聊天吧。 (责任编辑:本港台直播) |