数据科学研究资助:宣布第三轮获奖者

彭博数据科学研究资助计划旨在支持机器学习领域的前沿研究,包括自然语言处理、信息检索、机器翻译和深度神经网络等特定领域。在里面2015年4月我们宣布了第一轮获奖者名单,并在2015年10月我们宣布了我们的第二个目标。今天,我们很高兴地宣布第三轮获奖者。

在来自世界各地大学教师的数百份申请中,彭博研究人员委员会选择了八个研究项目的提案:

许大伟(哥伦比亚大学)和卡马利卡·乔杜里(加利福尼亚大学圣地亚哥分校):
具有先验信息的光谱学习及其在主题模型中的应用:复杂的统计模型很难适应大型、高维数据集。尽管机器学习的一些最新发展已经导致了基于简单代数技术的可伸缩拟合方法,但它们无法将先验知识约束纳入模型拟合。Chaudhuri和Hsu教授将开发这些可伸缩方法的新扩展,以处理此类约束,他们将应用这些方法对大型文档语料库进行比较分析。

岳一松(加州理工学院):
机器学习中的动态可解释性:在许多情况下,我们希望预测模型既准确又可解释。然而,由于可解释模型往往过于简单,准确性和可解释性的目标往往相互冲突。在这个项目中,岳教授提议研究另一种解释性概念,他称之为“动态解释性”。动态可解释模型的目标是做出可解释的预测,而不是让模型本身明确可解释。有了这个替代目标,人们可以绕过准确性和传统“静态”解释性之间的许多内在紧张关系,向可解释的生产强度模型迈进一步。

谢科恩(爱丁堡大学):
NLP的潜变量谱学习核化:自然语言处理社区现在正在寻求能够进行几何解释的文本的简洁表示。这样做的一种方法是使用所谓的谱学习,它利用线性代数技术来创建这样的表示。目前,光谱方法在几何表示中的表现力水平方面存在一些限制。为了解决这些问题,科恩博士打算进一步发展光谱方法,使它们能够比以前更丰富地表现出来。

斯蒂芬·贝克尔(科罗拉多大学博尔德分校):
时间敏感数据的在线聚类:现代数据集,如新闻文章或推特,具有时间敏感性,传统的离线监督或非监督学习无法很好地捕捉到这一点。Becker教授的工作将扩展一些聚类算法,以处理流式数据,并将现代方差缩减策略应用于在线环境。

克里斯托弗曼宁(斯坦福大学):
用于不同文本命名实体识别的字符级神经网络序列模型:查找对人和组织的引用是计算机理解人类语言文本的关键,但当使用像Tay、Fif或W这样的非正式名称时,像姓名列表这样的简单技术往往会失败。曼宁教授的建议将试图通过利用字符序列级深度学习模型的灵活性和强大功能来改进最先进的技术。

诺亚史密斯(华盛顿大学),琥珀博伊德斯顿(加州大学戴维斯分校),菲利普·雷斯尼克(马里兰大学),贾斯汀·格罗斯(马萨诸塞大学阿默斯特分校):
角度是多少?从新闻内容中分离视角:新闻报道不仅仅涉及被报道的主题或问题;视角也融入了用来讨论问题的语言中。视角与故事情节有关-记者选择强调和发展的故事方面。该项目开发了计算模型,使用文本中发现的语言信号来揭示新闻来源中的视角模式,从内容中分离视角。

莫希特班萨尔(芝加哥):
多模式事件摘要:Bansal教授提出了一个多模态事件突出显示和摘要系统,该系统使用结构化神经模型自动选择多模态、自由格式文本和视频数据库中最重要的事件,并口头总结它们。他将专注于这种模式在自动新闻突出显示和视频监控报警中的应用。

马尔滕·德里克(阿姆斯特丹大学):
背景实体建议:实体是许多信息需求的核心。上下文实体推荐方法通过在搜索任务的上下文中推荐实体,帮助用户理解和浏览复杂的信息空间。de Rijke教授提出了一系列基于深度学习实体推荐的方法。这些方法如何扩展到非常大的实体集?他们如何利用文本和知识库得出实体建议

祝贺获奖者。如果您有兴趣通过彭博数据科学研究资助计划申请未来的资助,请单击在这里.