LETOU.COM乐投

学院新闻

LETOU.COM乐投在国际权威多媒体分析检索大赛中取得八项第一

发布时间:2015-11-09     浏览量:

在刚刚结束的国际视频分析与检索技术评测TRECVID2015中,由LETOU.COM乐投院长胡瑞敏教授所领衔的国家多媒体软件工程技术研究中心(NERCMS)团队在实例检索任务(Instance Search Task)中取得佳绩,在30个官方规定的检索目标中有8个目标的检索准确率位居世界第一,整体总分位列INS项目全球第四名,超过日本NTT、澳大利亚昆士兰大学(UQ)、德国康姆尼斯工业大学(TUC)等世界知名研究机构。

由LETOU.COM乐投五名研究生(王正,叶茫,姚磊,刘俊,黄冰月)和两名本科生(柳东静,刘涛)组成的NERCMS团队,在胡瑞敏教授、陈军教授和梁超老师指导下,作为武汉大学唯一代表团队参加比赛。团队根据TRECVID2015中的实例检索任务(INstance Search task, INS),要求从海量视频数据(TB级)中检索出给定的30个包括人、车、物等(见图1)的特定目标(topic)。在面临检索目标大小不一,种类繁多,背景干扰大,对检索算法的性能和效果极具考验的情况下,团队基于经典的图像检索框架,提出了检索目标自适应的相似性度量方法,配合多源跨模态信息,如文本、人脸和车辆等,来综合得到初始的检索结果。在此基础上,团队进一步利用视频连续帧之间存在的时序关联特性,通过对相邻视频镜头的查询扩展来进一步优化初始检索结果,提高了算法准确率。

这是该团队第三次参加此项比赛,本次比赛进步明显,今年在INS任务上的检索准确率为0.367,较之2013年第一次参赛时的0.0063,成绩整整提高了58倍,使武汉大学在较短的时间内就成功跻身日本国立情报学研究所(NII)、香港城大(CityU)等视频检索领域世界一流的科研梯队。

据悉,面向视频检索的国际性评测TRECVID是由美国国家标准技术研究所(NIST)于2001年开始组织实施的,至今已经连续举办15届。历年的TRECVID评测都会向参评的世界知名高校和科研院所发布标准测试数据,参评者用这些标准测试数据测试自己设计的算法,并在规定时间内向组委会提交自己算法的运行结果,然后由美国国家标准技术研究所对提交结果进行评价和比较。今年TRECVID2015比赛共吸引了来自世界各地共69支队伍报名参赛,包括国内的一些知名科研院校以及一些世界著名科研机构(如卡内基梅隆大学、IBM研究院等)。

本次竞赛的相关技术已经运用在面向监控视频的特定目标检索中,并多次在实际案例中发挥了重大作用,极大地提高了视频监控中针对特定嫌疑目标的排查效率,对维护人民生命财产安全具有重大的意义。

图1:部分检索目标示例和算法结果。四个检索目标分别是“这盏灯”、“调味盒”、“这只狗”、“这辆车”。红色方框表示查询目标,绿色方框表示检索到的目标位置。