NASA正在利用图形数据库来组织从过去项目中汲取的经验教训

NASA以维护一个“经验教训”数据库而闻名,该数据库包含了NASA过去计划和项目中的宝贵信息。但自1994年以来一直在线的庞大系统并不总是很容易导航。现在,在社交媒体比太空任务更熟悉的工具——图形数据库——的帮助下,该机构正在对其进行现代化改造。

广告变革的起源始于大约一年半前,当时一名工程师试图从“经验教训”中寻找相关文件,发现可能的结果数量惊人。NASAs首席知识架构师大卫·梅扎回忆说:“他得到的东西与他所寻找的东西并不相关。”。

为了使数据库更有用,并帮助用户调查基本关键字搜索无法发现的关系,Meza尝试将信息存储在图形数据库中,也就是优化为存储数据记录信息以及它们之间的连接的数据库。近年来,这种网络图已经成为网络社交网络的一个常见特征。

个别课程撰写本身就是网络中的节点,与课程相关联的主题也是机器学习算法。为了存储和组织这些数据,Meza转向Neo4j,这是一个专门设计用来比传统的SQL支持的关系数据库更有效地存储图形数据的数据库系统。

「我们经常有客户告诉我们,比关系数据库快一千倍或一百万倍。」

这个工具还被国际调查记者联合会特别用来映射在被称为巴拿马报纸的大量海外金融数据泄露集合中发现的人与公司之间的联系。而且,Eifrem说,它经常被电子商务公司使用,这些公司希望根据用户和产品之间的关系生成自动化的产品推荐,也经常被金融机构用来识别可疑的交易集——即使在个别交易不是独立地看不见的情况下。

「诈骗团伙就是关系」,Eifrem说。

广告在NASA,Neo4j和一个名为Linkurious的图形可视化工具帮助Mezas团队建立了一个界面,以探索课程数据库,找到与特定主题相关的文档,甚至发现不同主题之间的联系。Meza说,在一个案例中,他在有关受污染流体阀门的课程和处理电池火灾风险的课程之间遇到了一种看起来令人费解的紧密联系。

「我无法弄清楚阀门污染实际上是如何与电池内部的火灾危险相关联的。」“我意识到谈论电池危险和火灾的话题,有铅从电池中泄漏出来污染水的问题。“

这可以让研究阀门污染问题的工程师发现有关电池问题的潜在相关文档,这些文档可能没有出现在关键字搜索中。

Meza说,他现在正在研究如何按照时间和地理位置对课程进行聚类分析,这可能有助于发现报告的问题类型的趋势,或者NASA特定站点报告的问题类型更多的情况。

他还在考虑使用Neo4j来存储其他类型文档之间的关系,尤其是当一个文档引用另一个文档时。他说,随着政策指令等权威文件随着时间的推移而变化,这些变化可能需要一段时间才能通过文件链相互引用来传播。“

”有了图形数据库,我可以很快发现哪些文档可能会受到影响,”Meza说。他说,

广告这个工具也许还能帮助追踪NASA的特定研究项目是如何影响其他研究或工业发展的,甚至是产品受到另一项发明影响的间接案例,而另一项发明本身也受到NASA研究的影响。

Copyright © 2017 时时彩平台 版权所有