在Grace Hopper演讲的3位彭博工程师分享了他们的创新项目

机器学习和深度学习等新兴技术是帮助彭博工程师解决复杂问题的关键。在与超过1亿种金融工具以及与每种工具相关的数千种不同属性打交道时,技术人员必须跟上技术的复杂性,确保数据的准确性和可访问性,同时为创造力和创新留下空间。

彭博社鼓励工程师通过他们承担的项目扩展他们的技能。我们与彭博资讯首席技术官办公室的数据科学家吉莉安·琴(Gillian Chin)以及纽约数据服务团队的软件开发人员鲁帕利·萨博(Rupali Saboo)和谢丽尔·张(Sheryl Zhang)进行了交谈。我们讨论了他们采用新技术的方法、他们能够将其应用到的项目,以及他们个人的工作如何帮助确保彭博数据的准确性和可访问性,同时提供卓越的用户体验。

利用深度学习检测文本数据集中的异常

作为数据服务团队的开发人员,Sheryl Zhang和Rupali Saboo负责构建基于机器学习的异常检测平台。虽然统计和基于规则的检查对某些类别的问题很有效,但他们意识到需要一种不同的方法来有效地处理文本数据。

Rupali说:“鉴于文本数据中可能出现的各种错误,基于规则的检查将造成一个难以管理的系统。”“我们的目标是创建一个低成本、易于使用的平台,可以在不同的基于文本的数据集上运行。如果我们能做到这一点,该系统可以有效地检测任何文本数据集中的异常。我们意识到,深度学习是实现这一目标的最佳方式。”

鲁帕里·萨布(摄影师:洛里·霍夫曼/彭博社)

“一开始,我们怀疑自己,对这个想法感到担忧。我们俩都没有正式的深度学习背景。我们只工作了一年,这甚至不在我们的商业计划中。我们不知道该怎么做。”

事实证明,畅所欲言是这个过程的关键部分。Rupali补充道:“我们把这个想法告诉了我们的经理,并对我们得到的全心全意的支持感到惊讶。“我们开始研究和扩展基于ml的异常检测方法的知识。”

在彭博社,持续学习是公司文化的重要组成部分。鲁帕里和谢丽尔利用了世界级的现场培训课程和内部教育门户网站,以及像彭博社的《机器学习基础》. 该团队还参加了每周的ML阅读小组,并参加了黑客竞赛,以提高他们的技能。在短短的几个月里,经过深夜和艰苦的工作,团队已经准备好了一个最低限度的可行产品。

谢丽尔和鲁帕里在彭博科技女性组织(Bloomberg Women in Technology, BWIT)中拥有强大的支持网络,该组织为整个公司提供指导、接触盟友和赞助商的渠道。BWIT还为谢丽尔和鲁帕里提供了向高管推介产品的机会。Rupali说:“BWIT的导师帮助我们获得了信心,提高了我们的演讲技巧,变得更有创业精神。”“在我们普林斯顿办公室举办的BWIT科技博览会上的展示,迫使我们超越技术思考,转而关注我们产品提供的价值,帮助我们完善了我们的宣传。”

谢里尔说:“我们在科技博览会上获得的曝光率导致多个团队在他们的数据集上与我们合作。”。“这一经验帮助我们改进了算法并提高了其准确性。”

Sheryl Zhang(摄影师:Lori Hoffman/Bloomberg)

该系统现在在5个不同应用程序的数据集上运行,每个数据集包含数百万条记录。它已经帮助检测和解决了超过10,000个案例,其中数据库中的文本看起来可疑,并可能出现输入错误。

谢丽尔说:“如果我们当时犹豫,等到我们知道了所有的事情,就什么也做不了了。”“我很高兴我们参与进来,让它成为现实。”

Sheryl和Rupali团队的经验、背景和观点的多样性,加上他们从工程、数据和产品利益相关者那里获得的反馈,使得创建基于深度学习的平台成为可能。

Rupali说:“面对文本异常检测的难题,我们进行了前沿研究,使每一位彭博数据消费者受益。”。

Sheryl补充道:“数据是我们业务的一个关键部分。我们采纳了一个抽象的想法并交付了一个有影响力的产品,这让人感觉很棒。”。

Sheryl和Rupali将在会议期间介绍他们的项目“基于深度学习的文本异常检测”Grace Hopper庆祝2018海报会议,于美国东部时间9月26日星期三上午11:30至下午2:00。

利用数据科学改善彭博客户的搜索体验

在彭博资讯首席技术官办公室,Gillian Chin为公司制定战略技术计划。她目前专注于智能自动完成项目,该项目将提高彭博终端的可发现性,以便用户能够更快地找到信息。她说:“我可以观察到我们的客户在终端搜索和信息发现方面遇到的问题,我决心改善客户的体验。”。

Gillian在项目中有几个不同的角色。她管理路线图和sprint工作,并进行定量分析,以评估用户行为、产品采用和产品成功。作为一名数据科学家,她通过观察数据跟踪用户的观点,以了解他们在任何可能的情况下如何体验产品。然后,她用这些见解来指导未来的增强。

Gillian Chin(摄影师:Lori Hoffman/Bloomberg)

“现在,我们正在慢慢发展命令行和自动完成帮助用户发现信息的方式,”Gillian说。“当前的流程是严格的,因为它是为支持以下工作流而构建的:加载安全性,运行功能。”Gillian的创新工作将允许用户以更直观的方式与命令行交互,从而使用户通过的发现路径变得越来越流畅和可访问。

除了改进公司的系统,拥有西北大学博士学位的Chin还担任了彭博的董事长2018年数据科学研究补助金2018年数据科学博士研究生奖学金程序。她说:“这些项目使彭博社成为数据科学和机器学习领域的研究引擎,并表明该公司愿意参与和投资解决重要的商业和技术问题。”。“它还将彭博社与从事前沿研究的学者联系起来,并切实支持这些社区。”

虽然彭博社为像Gillian这样的技术专家提供了广泛的参数来鼓励创造力,但她说:“我也很欣赏这家公司的运作方式,以及彭博社的慈善精神。”“我觉得有必要在一家我坚信价值观的公司工作,彭博无疑就是其中之一。”

Gillian参加了9月28日周五下午1-2点在Grace Hopper举办的“出乎意料的但普遍的:毕业后的行业”职业研讨会(Lanier J in Hilton Americas-Houston)。