图形数据库专家 Neo4j 推出了图形分析工作区,作为完全托管的云服务。
根据 Carl 的说法,它被称为 AuraDS,直接针对希望使用 Neo4j 图形数据库及其机器学习库的功能的数据科学家,承诺将数据科学家从建立数据库的枯燥任务中解放出来,并扩大图形数据库的吸引力。 Olofson,IDC 研究副总裁。
Neo4j于 2020 年 4 月在一个环境中推出了原生图形分析工作区、图形数据库、可扩展图形算法、机器学习库和图形可视化。
那年晚些时候,它在其工具套件中添加了图形嵌入。
在最新版本中,数据科学工具包以完全托管的云服务形式提供,带有适用于数据科学家的 Python 本地客户端。
Neo4j 图形数据科学主管 Alicia Frame 告诉The Register: “数据科学家真的很喜欢 Python。与开发人员项目不同,没有多样性。每个人都在使用 Python。”
尽管它在技术上支持 Python,但 Neo4j 使用 Cypher(类似 SQL 的查询语言)作为主界面构建了它的数据科学工作区。
Frame 表示,虽然数据科学家喜欢图形功能,但他们真的很挣扎。“他们说:'你想让我学习一门新语言?我不懂你的司机。这很难。'
“我们了解到 Python 有多强大,以及几乎任何摩擦都会让新用户望而却步。”
除了对 Python 的本机支持外,Neo4j AuraDS 还包括在单个工作区中访问超过 65 种图算法以及图内 ML 模型,以减轻数据科学负担。
Frame 表示,Neo4j 已经在产品中内置了护栏,因此用户不会无意中破坏后端。“如果你现在尝试运行一个没有足够内存的算法,而不是让你这样做,你会收到一条消息,‘嘿,你正在尝试运行图形,它需要这么多内存'"
我毫不怀疑,DIY 者最初会遇到阻力
她说,用户可以选择终止进程、调整服务器实例的大小或自行承担风险。
图数据库适用于高维问题,因此在早期被应用于理解社交网络。金融风险管理和欺诈检测已成为其他流行的用例,而这一概念在化学、生物学和药物研究中越来越受欢迎。
“要考虑的最重要的事情是连接数据——根据定义,它是超高维的。在这些关系中编码了很多信息。
“所以,典型的数据科学工作流程:我有一个数据框;上帝保佑,我有一个电子表格;我有一个矩阵;而且我并不真正关心事物之间是如何相互联系的。我将每件事都视为独特的个体分散式。
“使用图表,您可以从一个表转到一个巨大的邻接矩阵,突然间我必须考虑每个数据点。它连接到哪些其他数据点?然后它连接到什么?所以你得到非常高维非常快,”Frame 说,他在加入科技行业之前曾在微生物学和遗传学领域使用图形数据库。
IDC 的 Olofson 表示,Neo4j 图形 DBMS 旨在处理复杂问题,并且主要以扩展方式实现,这意味着用户必须预测最苛刻的查询并扩展其系统以支持它。
“AuraDS 服务支持动态扩展,因此问题不在用户手中。这是部署 Neo4j 最自然的方式,”他说。
Olofson 说,用户会对它的易用性和动态分配资源的能力印象深刻。“配置图形数据库可能是一项棘手的工作,尤其是在涉及数据科学的情况下,因此 AuraDS 服务将用户从这项工作中解放出来,这样他们就可以专注于分析。”
他说,这些优势意味着大多数用户会偏向托管云服务。
“我毫不怀疑,DIY 者最初会遇到阻力,但总体收益明显超过了显式物理部署可能获得的微小优势,因此大多数人肯定会转向云服务,除非在罕见的特殊情况下在非常特殊的系统要求需要手动设置的情况下,”他说。
AuraDS 在 Google Cloud 中可用。它将于今年晚些时候在 AWS 上推出,不久之后在 Azure 上推出。
免费试用尝鲜
贴心会员服务
服务可用性
数据安全保障
全年不间断在线
工作时间:早上9:00-下午6:30
河南快米云网络科技有限公司
公安备案编号:41010302002363
Copyright © 2010-2023 All Rights Reserved. 地址:河南自由贸易区开封片区经济开发区宋城路122号