當前位置:首頁 > 新聞中心 > 媒體掃描

媒體掃描

【人民網】人民中科AI團隊獲國際視頻描述競賽中英文雙料冠軍

  • 发表日期:2019-11-06 【 【打印】【關閉】
  •   人民网北京11月5日电(赵竹青)计算机视觉方向的顶级学术会议之一国际计算机视觉大会(ICCV)近日在韩国首尔落幕。会议期间举办的视频描述竞赛(VATEX Captioning Challenge)结果也同时揭晓。中科院自动化所视频内容安全团队和人民中科智能技术有限公司组成的联合团队在中英文描述两个赛道均获冠军。

      “人民中科”是人民網與被稱爲“人工智能國家隊”的中科院自動化所強強聯合,共同發起設立的人工智能科技公司。人民中科融合了人民網的內容風控能力和中科院自動化所的人工智能技術儲備,人民中科作爲人民網的“人工智能技術引擎”,將圍繞“人工智能+內容安全”,深耕行業需求,攻克核心關鍵技術,研發一系列內容風控産品。

      據了解,ICCV會議由電氣和電子工程師協會(IEEE)主辦,每兩年召開一次,被中國計算機學會等機構評爲最高級別學術會議,在業內具有極高的評價。本次比賽由國際計算機視覺大會ICCV和美國加州大學聖巴巴拉分校UCSB聯合舉辦,分爲中文描述和英文描述兩個賽道,吸引了來自美國、歐洲、亞洲等世界各地20多支代表隊,包括英國帝國理工大學、澳大利亞阿德萊德大學、北京大學、人民大學等知名高校都派出代表隊參賽。

      冠軍聯隊由中科院自動化所研究員、人民中科首席科學家胡衛明,中科院自動化所研究員、人民中科董事長李兵,以及中科院自動化所副研究員原春鋒帶隊指導,團隊成員包括研究生張子琦、史雅雅和魏久桐。

      “視頻描述,簡單來講就是給出一段視頻,讓機器自動用文字進行描述,類似于‘看視頻說話’。”李兵告訴人民網記者,視頻描述涉及到計算機視覺和自然語言處理兩個領域,而且視頻中有表觀、運動、語義屬性甚至語音等多個模態。“因此如何更好地融合多模態信息,成爲本次比賽的最大挑戰。此外,在沒有大量樣本訓練的前提下,還需要采取恰當的訓練方式。”

      李兵说,团队坚实的技术积累是获胜的重要基础。他表示,视频内容安全团队是中國科學院自动化研究所模式识别国家重点实验室中以互联网内容理解与安全为主要研究方向的研究组。团队深耕视频理解与内容安全近20年,已在人工智能权威国际学术期刊和会议上发表论文200余篇。近年来作为第一完成单位获得北京市科学技术一等奖、北京市发明专利一等奖、吴文俊人工智能科学技术奖一等奖等多项奖励。主持了国家自然科学基金重點項目、重大国际合作项目、联合基金重点支持项目、国家杰出青年基金项目,国家863重点专项项目、北京市自然科学基金重點項目等三十余项重大科研项目。