GraphSage 代码阅读笔记-FinClip官网

GraphSage 代码阅读笔记

网友投稿 722 2022-10-29

GraphSage 代码阅读笔记

relation也就是边没有embedding

supervised_train.py 是用节点分类的label来做loss训练，不能输出节点embedding，使用NodeMinibatchIterator

unsupervised_train.py 是用节点和节点的邻接信息做loss训练，训练好可以输出节点embedding，使用EdgeMinibatchIterator

在NodeMinibatchIterator的__init__方法最后加上

train_node_set = set(self.train_nodes)valid_node_set = set(self.val_nodes)print("train_node_set size", len(train_node_set))print("valid_node_set size", len(valid_node_set))print("train_node_set valid_node_set intersect size",len(train_node_set.intersection(valid_node_set)))

打印结果

train_node_set size 9716valid_node_set size 1825train_node_set valid_node_set intersect size 0

在EdgeMinibatchIterator的__init__方法最后加上

train_edge_set = set(self.train_edges)valid_edge_set = set(self.val_edges)print("train_edge_set size", len(train_edge_set))print("valid_edge_set size", len(valid_edge_set))print("train_edge_set valid_edge_set intersect size", len(train_edge_set.intersection(valid_edge_set)))

打印结果

train_edge_set size 1336764valid_edge_set size 75407train_edge_set valid_edge_set intersect size 0

在EdgeMinibatchIterator的__init__方法最后改成

train_nodes = [n for n in G.nodes() if not G.node[n]['test'] and not G.node[n]['val']]print(len(train_nodes), 'train nodes')test_nodes = [n for n in G.nodes() if G.node[n]['test'] or G.node[n]['val']]print(len(test_nodes), 'test nodes')print("train test node intersect number", len(set(test_nodes).intersection(set(train_nodes))))

打印结果

9716 train nodes5039 test nodestrain test node intersect number 0

总结

初始化的每个节点的init embedding是比如Glove这样词向量得到的，模型学到训练数据的节点间连接/拓扑信息，然后这个连接/拓扑信息可以泛化到测试数据，在训练节点和测试节点完全没有交集时，给测试数据生成final embedding。

更多理解https://discuss.dgl.ai/t/graphsage-question-the-train-data-and-valid-data-have-no-intersection-then-how-does-the-valid-data-get-the-embedding-for-downstream-model/539/3

微前端架构如何改变企业的开发模式与效率提升

722 2022-10-29

GraphSage 代码阅读笔记

微前端架构如何改变企业的开发模式与效率提升

前端开源框架如何提升开发效率与用户体验的关键因素

前端移动端框架如何推动数字化转型与创新发展

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计