报告题目:视觉语义理解理论研究
报告时间:2019年5月20日(周一)下午2:30
报告地点:电子与信息工程学院第一会议室(4B303)
内容摘要:
在大数据时代,如何对视觉信息中包含的复杂语义进行自动解析,是当前计算机视觉和人工智能领域的研究热点。视觉语义理解的目标是对视觉信息中的物体、行为、场景等不同类型的语义概念进行识别,并进一步生成自然语言描述,从而实现视觉模态到文本模态的映射,跨越视觉语义鸿沟。本次报告将从以下三个角度介绍团队在视觉语义理解领域的最新研究成果:1)在视觉语义概念识别层面,针对视觉模式相近的语义识别困难问题,提出视觉到语义以及语义到语义双重关联性的建模方法;2)在视觉类人解析层面,针对多模态数据耦合问题,提出创新的深度序列生成模型网络结构和优化算法;3)针对数据驱动的视觉解析模型缺乏评价准则引导问题,提出将视觉解析模型和基于客观评价准则的评价模型进行联合学习,实现视觉解析模型在客观评价准则引导下的优化。
报告人简介:
刘安安,天津大学电气自动化与信息工程学院,教授/博导,天津市131创新人才,天津大学北洋学者,先后赴美国卡耐基•梅隆大学和新加坡国立大学访问学习。从事多媒体分析和理解创新理论和关键技术研究,以第一及通讯作者发表SCI刊源论文50余篇,其中IEEE期刊长文10余篇(T-PAMI、T-IP、T-CSVT、T-CYB、T-MI等),两篇论文入选ESI热点论文(Top 1‰),四篇论文入选ESI高被引论文(Top 1%)。授权专利20余项,技术转让1项。担任IEEE Access 期刊Associate Editor,并担任IEEE Transactions on Big Data、Pattern Recognition等国际期刊客座编辑;担任ACM Multimedia 2019的Area Chair,多次作为共同主席主持CVPR Workshop、CVPR Contest、SHREC国际评测。在多媒体大数据分析和人工智能领域代表性研究成果已纳入2015年由工业和信息化部牵头组织的“《国家智能制造标准体系建设指南(2015年版)》解读丛书智能制造标准案例集”。
(撰稿人:谢玉芯;审稿人:肖志涛)
电子与信息工程学院
2019年5月17日