IEEE Fellow、AAAI Fellow、清华大学计算机科学系博世人工智能教授、TSAIL Group 联席董事、清华大学-博世机器学习联合研究中心课题组主任
研究领域:机器学习、贝叶斯方法、深度学习、数据挖掘。研究概况:研究工作围绕机器学习基础理论、高效算法和应用展开,注重理论与实际问题结合。针对复杂数据隐含结构的学习与利用中的共性问题,研究了结构学习及基于结构的统计学习中若干关键问题,提出:(1)最大熵判别式学习的PAC-Bayes理论与方法;(2)正则化贝叶斯推理及正则化非参数贝叶斯推理理论;(3)贝叶斯模型的最大间隔学习理论与高效算法;(4)“珠算”概率编程库等。针对互联网数据挖掘、社交网络分析、多模态数据融合、网络推荐等多个典型应用场景,将基础理论与实际问题结合,提出有效的计算模型和算法,包括:(1)将正则化贝叶斯推理用于解决大规模文本分类、社交网络分析、矩阵低秩分解、多模态数据融合等问题,提出高效学习算法;(2)将结构化最大熵判别式学习用于解决网络环境下信息抽取、实体关系抽取、多模态数据融合与检索等问题,建立了基于结构的网络数据抽取框架及包括StatSnowball在内的若干统计模型,申请/授权发明专利17项,含3项美国专利,研究成果已应用到微软的多个搜索引擎,包括人立方关系搜索引擎和学术搜索引擎等。
研究领域:机器学习、贝叶斯方法、深度学习、数据挖掘。研究概况:研究工作围绕机器学习基础理论、高效算法和应用展开,注重理论与实际问题结合。针对复杂数据隐含结构的学习与利用中的共性问题,研究了结构学习及基于结构的统计学习中若干关键问题,提出:(1)最大熵判别式学习的PAC-Bayes理论与方法;(2)正则化贝叶斯推理及正则化非参数贝叶斯推理理论;(3)贝叶斯模型的最大间隔学习理论与高效算法;(4)“珠算”概率编程库等。针对互联网数据挖掘、社交网络分析、多模态数据融合、网络推荐等多个典型应用场景,将基础理论与实际问题结合,提出有效的计算模型和算法,包括:(1)将正则化贝叶斯推理用于解决大规模文本分类、社交网络分析、矩阵低秩分解、多模态数据融合等问题,提出高效学习算法;(2)将结构化最大熵判别式学习用于解决网络环境下信息抽取、实体关系抽取、多模态数据融合与检索等问题,建立了基于结构的网络数据抽取框架及包括StatSnowball在内的若干统计模型,申请/授权发明专利17项,含3项美国专利,研究成果已应用到微软的多个搜索引擎,包括人立方关系搜索引擎和学术搜索引擎等。