如何进行SequoiaDB + JanusGraph的实践

网友投稿 352 2023-12-06

如何进行SequoiaDB + JanusGraph的实践

如何进行SequoiaDB + JanusGraph的实践，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

JanusGraph

实际上，在图数据领域里，Neo4j 才是真正处于统治地位的，但是无奈它的社区版本，性能“限（yan）制（ge）”得太过分了，功能也是各种被砍，难以使用在生产环境里。至于企业版，目前也没有专门的预算给到这块的需求。

而看看图数据库里的老二 -- JanusGraph ，Apache 基金会顶级项目，顶着当年明星项目 Titan 的光环，继续忍辱负重地前行。“这个孩子肯定有出息”，我就是这么想的。

如果大家好奇 JanusGraph 的前世今生，可以扒一扒 DataStax（Cassandra 母公司）对 Titan 干了啥。然后一群热爱开源，又相当牛叉的程序猿就独立单干了。反正这个故事听起来，和当年 MySQL 和 MariaDB 相爱相杀的故事差不多，只是 JanusGraph 的下场更加壮烈。

我从 JanusGraph 的官网里找了一个整体的架构图，大家可以看到 JanusGraph 的模块还是挺丰富的，功能也是比较的全面。

因为这种计算和存储分离的架构，使得应用的开发者，完全不需要关注底层的数据分布式实现，只要专心做好自己的应用逻辑就好了。

当然，如果你是一名 DBA，那样你还是要学习如何配置 SequoiaDB 底层的分布式存储的。

前面也讲到了，由于 JanusGraph 对底层存储的设计和接口，都是根据列存储来设计的，所以在为 SequoiaDB for JanusGraph 设计时，就需要做出一些调整。

首先是列簇里的 family 设计，我把它拆开来了，将不同的 family 直接对应成 SequoiaDB 的一个 Collection。

最开始时候，我是希望将一条记录的所有列都保存到 SequoiaDB 一个 BSON 里面，但是写到后面，由于 JanusGraph 会依赖 HBase 的列排序功能返回记录，所以这个在 SequoiaDB 里面无法对一条记录的不同列进行排序。所以在最后， JanusGraph 中的一条记录被我拆分成多个 BSON 记录，形式变成了以下的形式。记录以 RowKey 来维护其一条记录的完整性。

{RowKey:"", Key:"", Value:""}{RowKey:"", Key:"", Value:""}{RowKey:"", Key:"", Value:""}{RowKey:"", Key:"", Value:""}

在 BSON 中，RowKey、Key和Value 三个字段的数据类型都是 Binary 格式，这个也是 JanusGraph 自己所独有的解析方法。JanusGraph 保存于 SequoiaDB 中的记录如下面的例子：

{ "_id": { "$oid": "5e410c444f025855e5552b4c" }, "Key": { "$binary": "///////+x38ABZ40DXrgsGMwYTgxZmZiMTc2ODYtY2hlbjE=", "$type": "0" }, "RowKey": { "$binary": "AAAAAAAAAAM=", "$type": "0" }, "Value": { "$binary": "", "$type": "0" }}

JanusGraph 代码改造

在前面我向大家介绍 JanusGraph 如何识别不同的存储产品的，所以要增加 SequoiaDB 数据库这个存储选项，首先需要为StandardStoreManager 类增加 SequoiaDB 的选项，修改的部分如下：BDB_JE("org.janusgraph.diskstorage.berkeleyje.BerkeleyJEStoreManager", "berkeleyje"),CASSANDRA_THRIFT("org.janusgraph.diskstorage.cassandra.thrift.CassandraThriftStoreManager", "cassandrathrift"),CASSANDRA_ASTYANAX("org.janusgraph.diskstorage.cassandra.astyanax.AstyanaxStoreManager", ImmutableList.of("cassandra", "astyanax")),CASSANDRA_EMBEDDED("org.janusgraph.diskstorage.cassandra.embedded.CassandraEmbeddedStoreManager", "embeddedcassandra"),CQL("org.janusgraph.diskstorage.cql.CQLStoreManager", "cql"),HBASE("org.janusgraph.diskstorage.hbase.HBaseStoreManager", "hbase"),IN_MEMORY("org.janusgraph.diskstorage.keycolumnvalue.inmemory.InMemoryStoreManager", "inmemory"),SEQUOIADB("org.janusgraph.diskstorage.sequoiadb.SequoiadbStoreManager", "sequoiadb");

StandardStoreManager 类是属于 janusgraph-cord 的模块，所以后续编译后，应该将最新的 janusgraph-core jar 包替换旧的 jar 包。

然后大家只要从 github 上- SequoiaDB for JanusGraph 的项目，将其放到 JanusGraph 源码的根目录，修改 maven 的pom.xml 编译脚本，增加 SequoiaDB 的驱动版本说明和添加编译 SequoiaDB for JanusGraph 的项目编译。

<titan.compatible-versions>1.0.0,1.1.0-SNAPSHOT</titan.compatible-versions> … <httpcomponents.version>4.4.1</httpcomponents.version> <hadoop2.version>2.7.7</hadoop2.version> <hbase1.version>1.4.10</hbase1.version> <hbase2.version>2.1.5</hbase2.version> <hbase.server.version>1.4.10</hbase.server.version> <sequoiadb.version>3.2.1</sequoiadb.version> ... <modules> … <module>janusgraph-doc</module> <module>janusgraph-solr</module> <module>janusgraph-examples</module> <module>janusgraph-sequoiadb</module> </modules>

对 JanusGraph 重新编译：

最后将编译好的 janusgraph-sequoiadb-0.4.0.jar 和 SequoiaDB 的 API 驱动 jar 包保存至 ${JANUSGRAPH_BINARY_HOME}/lib 目录中，就完成了 JanusGraph 扩展 SequoiaDB 存储的操作了。

JanusGraph 配置 SequoiaDB 作为存储

大家将 janusgraph-sequoiadb 的模块编译出来的 jar 包和 SequoiaDB 的 JSON API jar 包一起放到 JunasGraph 的 lib 目录里，同时更新 janusgraph-core 的 jar 包后，就完成了 JanusGraph 扩展 SequoiaDB 存储的操作了。

为了让 JanusGraph 能够认识 SequoiaDB 的连接信息，大家还需要准备一个 config 文件。大家在 JunasGraph 的conf 目录里增加一个 janusgraph-sequoiadb.properties的文件，内容大致如下：

gremlin.graph=org.janusgraph.core.JanusGraphFactorystorage.backend=sequoiadbstorage.hostname=10.211.55.7storage.port=11810#storage.username=sdbadmin#storage.password=sdbadminstorage.meta.visibility = truecache.db-cache = falsecache.db-cache-clean-wait = 20cache.db-cache-time = 180000cache.db-cache-size = 0.5

我给大家介绍几个重要的参数

storage.hostname，SequoiaDB coord 节点的 IP 地址，或者是 hostname

storage.port，SequoiaDB coord 节点的端口号

storage.username，如果 SequoiaDB 配置了鉴权，那样就需要配置鉴权的用户名

storage.password，如果 SequoiaDB 配置了鉴权，那样就需要配置鉴权的密码

当我们已经将 SequoiaDB 的配置信息写到了 config 文件里面了，那么 JanusGraph 对接 SequoiaDB 也是顺利成章的事情。

大家可以直接打开 Gremlin 控制界面，然后就像平时使用 JanusGraph 那样操作即可。

这里，我给大家准备了一下小 demo。

graph = JanusGraphFactory.open(conf/janusgraph-sequoiadb.properties);graph.addVertex("name", "aaa", "num", 123)g = graph.traversal()g.V().values(name)

关于如何进行SequoiaDB + JanusGraph的实践问题的解答就分享到这里了，希望以上内容可以对大家有一定的帮助，如果你还有很多疑惑没有解开，可以关注行业资讯频道了解更多相关知识。

标签：程序代码数据库学习版本

暂时没有评论，来抢沙发吧~

如何进行SequoiaDB + JanusGraph的实践

如何进行SequoiaDB + JanusGraph的实践

智慧屏安装APP的最佳实践与跨平台小程序开发的结合

洞察探索小米电视app开发如何利用FinClip的小程序容器技术，实现跨平台便捷开发，并助力企业快速数字化转型。

如何通过低成本的代驾app系统开发实现高效运营和企业数字化转型？

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计