配资网站建设做游戏人设计网站
图数据库neo4j部分用法浅讲
一、简单介绍
1、✅ 简要说明
Neo4j 是基于图结构的数据存储系统,与传统的关系型数据库(如 MySQL、PostgreSQL)不同,它使用节点(Node)、关系(Relationship)和属性(Property)来存储和查询数据。
2、📌 核心概念
| 概念 | 说明 | 
|---|---|
| 节点(Node) | 表示实体,例如:人、地点、产品等,相当于关系型数据库中的一行记录 | 
| 关系(Relationship) | 表示节点之间的连接和关系,关系是图数据库的核心优势 | 
| 属性(Property) | 存储在节点或关系上的键值对,例如:name, age, time 等 | 
| 标签(Label) | 给节点分类的标识,例如:Person, Company 等 | 
| Cypher 查询语言 | Neo4j 使用的类 SQL 的图查询语言,用来创建、查询、更新图数据 | 
3、🧠 为什么使用图数据库?
- 更适合处理复杂关系(例如:社交网络、推荐系统、交通网络)
 - 查询关系路径(path)效率高,不需要 JOIN 多表
 - 更直观的数据建模
 
二、neo4j桌面版

1、🧭 左侧导航栏(Sidebar)
Data services
-  
Local instances(本地实例):显示你在本机上运行的所有 Neo4j 实例,如 addressSearch。
 -  
Remote connections(远程连接):用于连接 Neo4j Aura 或其他远程服务器上的 Neo4j 实例。
 -  
Import(导入):用于导入 CSV、JSON、GraphML 等数据文件进入数据库。
 
Tools
- Query(查询):进入 Cypher 查询编辑器,执行查询语句。
 - Explore(探索):图形化地浏览图数据库中的数据节点和关系。
 
About
- Settings(设置):修改 Neo4j Desktop 的全局设置,比如 JDK 路径、插件管理等。
 
三、Neo4j 的 Cypher语言
1、 查询
MATCH (p:poi)
RETURN keys(p), p
LIMIT 100
 
1.1 详细解释
MATCH (p:poi)
查找图中所有标签为 poi 的节点,并将它们绑定到变量 p。
- p:是一个变量名,代表匹配到的节点。
 - :poi:是标签(label),表示我们只关注拥有 poi 标签的节点。
 - MATCH:是 Cypher 查询中用于模式匹配的关键字,相当于 SQL 的 FROM + JOIN,用于从图中查找结构
 
RETURN keys§, p
返回每个 poi 节点的:
- keys§:该节点的所有属性名称(即字段名、键名)
 - p:整个节点对象,包括其所有属性值
 
2、添加新的字段
MATCH (p:poi)
SET p.location = point({longitude: toFloat(p.lng), latitude: toFloat(p.lat)})
 
2.1 详细解释
🔹 MATCH (p:poi)
- 匹配所有带有 poi 标签的节点。
 - 把每个匹配的节点赋值给变量 p。
 
SET p.location = …
- 对每个匹配到的节点,**设置(或覆盖)**一个名为 location 的新属性。
 - 这个属性将被赋值为一个 point 类型(地理坐标点)。
 
🔹 point({longitude: …, latitude: …})
Neo4j 中支持 原生地理空间类型,point() 是一个函数,用来创建一个地理坐标点。
- longitude: 经度,对应东-西方向。
 - latitude: 纬度,对应北-南方向。
 
这个点会是 WGS-84 坐标系中的一个 2D 点(默认 SRID 为 4326)
3、构建“就近关系”图谱
MATCH (a:POI), (b:POI)
WHERE id(a) < id(b) AND point.distance(a.location, b.location) < 500
MERGE (a)-[:NEARBY]->(b)
 
3.1 详细解释
🔹 MATCH (a:POI), (b:POI)
- 匹配所有 POI 标签的节点对 (a, b)。
 - 这会产生 所有可能的两两组合(即笛卡尔积)。
 - ⚠️ 如果有 n 个 POI 节点,组合总数是 n²,因此加上 WHERE 限制很重要
 
🔹 WHERE id(a) < id(b)
-  
防止重复组合和自连接:
- 例如 (a, b) 和 (b, a) 是一样的距离关系,只需要创建一条。
 - 同时 a != b,避免自己连自己。
 
 -  
id(a) 是 Neo4j 内部自动生成的唯一节点 ID
 
🔹 point.distance(a.location, b.location) < 500
- 使用 point.distance 函数计算两个点之间的直线(欧几里得)距离(单位:米,基于 WGS84 坐标)。
 - 这里表示:a 和 b 节点之间的距离小于 500 米。
 - 前提是两个节点的 location 属性都必须是 point 类型(即之前你设置的那种):
 
SET p.location = point({latitude: ..., longitude: ...})
 
🔹 MERGE (a)-[:NEARBY]->(b)
- 如果 a 到 b 之间还没有 NEARBY 关系,就创建一条有向边。
 - MERGE 语义类似 SQL 的 UPSERT,保证不会创建重复的关系
 
🧠 注意:
- MERGE 是有向的,这里是 a → b,不是 b → a。
 - 如果你希望两个方向都存在(双向连接),可以写成:
 
MERGE (a)-[:NEARBY]->(b)
MERGE (b)-[:NEARBY]->(a)
 
双向连接⚠️ 性能提示
这种写法可能在节点数量多时非常慢,因为:
- 它是 全图两两比较(复杂度 O(n²))。
 - 建议在实际场景中加 空间索引 + 分批处理
 
CREATE INDEX poi_location_index FOR (p:POI) ON (p.location)
 
或者使用 Neo4j 的 空间范围搜索方式更高效(基于 WITH 和 apoc.spatial.*)
3、查询某个关系信息
MATCH p = ()-[:NEARBY]->()
RETURN p
LIMIT 250;
 
🔹 MATCH p = ()-[:NEARBY]->()
✅ 含义:
- 匹配图中所有带有 NEARBY 关系的节点对(即边)。
 - () 表示任意节点(不限制标签)。
 - [:NEARBY] 表示只匹配名为 NEARBY 的边(关系类型)。
 - -> 表示关系方向是从左节点指向右节点。
 
✅ p = … 的作用:
- 把匹配到的整个路径(起点节点、关系、终点节点)赋值给变量 p。
 - 这样你可以在 RETURN 中一次性返回整个路径对象
 
