一种智慧城市数据处理方法、装置、设备及可读存储介质

摘要:

本发明涉及人工智能技术领域,具体公开了一种智慧城市数据处理方法、装置、设备及可读存储介质,通过自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统,自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型的方式构建智慧城市图计算模型,实现了跨场景的隐含的关联建模,通过将智慧城市图计算模型的应用程序接口部署至用户设备,以接收智慧城市数据处理任务进行智慧城市数据处理,实现了智慧城市跨领域不同场景下的关联计算与分析,推动传统的智慧城市从信息化方案转型为智能化方案。

申请号: CN202410078615.X 专利名称: 一种智慧城市数据处理方法、装置、设备及可读存储介质 申请(专利权)人: [广东浪潮智慧计算技术有限公司] 发明人: [朱洪银, 张闯, 王敏] 其他信息:
1.一种智慧城市数据处理方法,其特征在于,包括: 自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统; 自所述智慧城市存储系统抽取各所述领域的所述信息源的数据,构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图; 基于所述智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取所述智慧城市异质图中的特征转换为低维嵌入表示后嵌入所述智慧城市图计算模型; 将所述智慧城市图计算模型的应用程序接口部署至用户设备,以接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理; 其中,基于所述智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取所述智慧城市异质图中的特征转换为低维嵌入表示后嵌入所述智慧城市图计算模型,包括: 获取所述节点的特征; 自所述智慧城市异质图中提取语义特征和结构特征; 将所述节点的特征、所述语义特征和所述结构特征进行融合处理,得到融合特征; 将所述融合特征嵌入图卷积网络以学习所述智慧城市异质图的特征,生成所述智慧城市图计算模型。 2.根据权利要求1所述的智慧城市数据处理方法,其特征在于,所述构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图,包括: 以所述信息源实体的本体为实体节点,以所述信息源实体所属的类别为虚拟节点,以不同所述实体节点之间的关联关系、所述实体节点和所述虚拟节点之间的关联关系为所述边,构建所述智慧城市异质图。 3.根据权利要求1所述的智慧城市数据处理方法,其特征在于,所述构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图,包括: 以两个所述节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各所述节点对中两个所述节点之间的关联关系; 利用各所述节点的信息和各所述节点之间的关联关系构建所述智慧城市异质图。 4.根据权利要求3所述的智慧城市数据处理方法,其特征在于,利用所述网络文档挖掘各所述节点对中两个所述节点之间的关联关系,包括: 采用多策略的中文开放关系抽取算法自所述网络文档中分别抽取各所述节点对中两个所述节点之间的关联关系。 5.根据权利要求3所述的智慧城市数据处理方法,其特征在于,利用所述地图软件挖掘各所述节点对中两个所述节点之间的关联关系,包括: 分别自所述地图软件搜索各所述节点对中两个所述节点之间的地理距离; 对比所述地理距离和邻居节点距离阈值,若所述地理距离大于或等于所述邻居节点距离阈值,则确定两个所述节点之间不存在地理邻居关系;若所述地理距离小于所述邻居节点距离阈值,则确定两个所述节点之间存在所述地理邻居关系。 6.根据权利要求3所述的智慧城市数据处理方法,其特征在于,利用所述人工智能大模型挖掘各所述节点对中两个所述节点之间的关联关系,包括: 根据所述节点对中两个所述节点的信息生成对应的关联关系识别任务; 将所述关联关系识别任务输入所述人工智能大模型,输出所述节点对中两个所述节点的关联关系。 7.根据权利要求3所述的智慧城市数据处理方法,其特征在于,所述以两个所述节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各所述节点对中两个所述节点之间的关联关系,包括: 初始化节点接口、网络文档接口、地图软件接口和人工智能大模型接口; 生成第一关联关系列表、第二关联关系列表和第三关联关系列表; 自所述节点接口接收各所述节点对的信息; 根据各所述节点对的信息自所述网络文档抽取各所述节点对中两个所述节点之间的第一关联关系,将所述第一关联关系写入所述第一关联关系列表; 分别自所述地图软件搜索各所述节点对中两个所述节点之间的地理距离; 对比所述地理距离和邻居节点距离阈值,若所述地理距离大于或等于所述邻居节点距离阈值,则确定两个所述节点之间不存在地理邻居关系;若所述地理距离小于所述邻居节点距离阈值,则确定两个所述节点之间存在所述地理邻居关系; 将存在所述地理邻居关系的两个所述节点的信息写入所述第二关联关系列表; 根据所述节点对中两个所述节点的信息生成对应的关联关系识别任务; 将所述关联关系识别任务输入所述人工智能大模型,输出所述节点对中两个所述节点的第三关联关系; 将所述第三关联关系写入所述第三关联关系列表; 输出更新后的所述第一关联关系列表、更新后的所述第二关联关系列表和更新后的所述第三关联关系列表。 8.根据权利要求1所述的智慧城市数据处理方法,其特征在于,所述构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图,包括: 利用预训练的第一语言模型抽取所述信息源实体的特征为所述节点的特征,将所述节点和所述边构建为所述智慧城市异质图; 其中,所述节点的特征包括节点名称、所述节点的静态信息和所述节点的动态信息。 9.根据权利要求1所述的智慧城市数据处理方法,其特征在于,自所述智慧城市异质图中提取所述语义特征,包括: 基于所述智慧城市异质图,得到由第一节点h、第二节点t以及所述第一节点和所述第二节点间的关联关系r构成的三元组数据; 采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到所述智慧城市异质图的所述语义特征。 10.根据权利要求9所述的智慧城市数据处理方法,其特征在于,所述采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到所述智慧城市异质图的所述语义特征,包括: 将所述三元组数据表示为随机初始化向量; 对所述随机初始化向量进行采样,得到负样本; 以为目标函数和语义损失函数对所述负样本进行学习,得到所述智慧城市异质图的所述语义特征; 其中,所述语义损失函数为: ; 其中,为间隔参数,为取正数计算,为负样本集合,为采样得到的头实体,为采样得到的尾实体。 11.根据权利要求1所述的智慧城市数据处理方法,其特征在于,自所述智慧城市异质图中提取所述结构特征,包括: 以将所述智慧城市异质图中的所述节点转换为低维稠密的嵌入表示、使所述智慧城市异质图中相似的所述节点在低维空间距离相近为目标,采用图嵌入算法学习所述智慧城市异质图的图结构嵌入表示,得到所述智慧城市异质图中的所述结构特征。 12.根据权利要求11所述的智慧城市数据处理方法,其特征在于,所述以将所述智慧城市异质图中的所述节点转换为低维稠密的嵌入表示、使所述智慧城市异质图中相似的所述节点在低维空间距离相近为目标,采用图嵌入算法学习所述智慧城市异质图的图结构嵌入表示,得到所述智慧城市异质图中的所述结构特征,包括: 以基于中心节点的嵌入能够最大概率观测到网络邻域为目标,采用偏置随机游走模型学习各所述节点的关系结构; 根据各所述节点的向量表示和各所述节点的关系结构的向量表示计算得到所述智慧城市异质图中的所述结构特征。 13.根据权利要求1所述的智慧城市数据处理方法,其特征在于,所述将所述节点的特征、所述语义特征和所述结构特征进行融合处理,得到融合特征,通过下式计算得到: ; 其中,为所述融合特征,为第i个所述节点的节点特征,为第i个所述节点的所述结构特征,为第i个所述节点的所述语义特征,为矩阵连接操作。 14.根据权利要求1所述的智慧城市数据处理方法,其特征在于,所述智慧城市图计算模型的训练方法,包括: 获取初始的所述图卷积网络; 为初始的所述图卷积网络设置初始参数; 根据所述语义特征和/或所述结构特征以及所述节点的特征对所述图卷积网络进行训练,得到对所述节点的预测类别; 利用所述节点的实际类别与所述节点的预测类别的损失对所述图卷积网络的模型参数进行优化,直至满足对所述节点的类别预测目标,得到所述智慧城市图计算模型。 15.根据权利要求14所述的智慧城市数据处理方法,其特征在于,所述类别预测目标,通过下式表示: ; 其中,为负对数似然损失,为所述图卷积网络的模型参数,为在模型参数为对应的所述负对数似然损失最小,为所述节点的数量,W为参数矩阵,为参数矩阵W的转置矩阵,为第i个所述节点对应的隐状态表示,为第i个所述节点对应每个类别的概率。 16.根据权利要求1所述的智慧城市数据处理方法,其特征在于,所述接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理,包括: 接收所述用户设备发送的智慧城市监控任务; 识别所述智慧城市监控任务中的节点属性和监控项目; 调用所述智慧城市图计算模型对所述智慧城市异质图中属于所述节点属性的所述节点根据所述监控项目进行节点分类和/或节点聚类处理,得到节点分类结果和/或节点聚类结果; 输出所述节点分类结果和/或所述节点聚类结果。 17.根据权利要求1所述的智慧城市数据处理方法,其特征在于,所述接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理,包括: 接收所述用户设备发送的待解答问题; 调用所述智慧城市图计算模型搜索所述待解答问题的相关节点的信息以及所述相关节点的邻域信息; 调用预训练的第二语言模型根据所述相关节点的信息和所述相关节点的邻域信息生成回答信息; 输出所述回答信息。 18.一种智慧城市数据处理装置,其特征在于,包括: 采集单元,用于自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统; 建图单元,用于自所述智慧城市存储系统抽取各所述领域的所述信息源的数据,构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图; 建模单元,用于基于所述智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取所述智慧城市异质图中的特征转换为低维嵌入表示后嵌入所述智慧城市图计算模型; 处理单元,用于将所述智慧城市图计算模型的应用程序接口部署至用户设备,以接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理; 其中,基于所述智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取所述智慧城市异质图中的特征转换为低维嵌入表示后嵌入所述智慧城市图计算模型,包括: 获取所述节点的特征; 自所述智慧城市异质图中提取语义特征和结构特征; 将所述节点的特征、所述语义特征和所述结构特征进行融合处理,得到融合特征; 将所述融合特征嵌入图卷积网络以学习所述智慧城市异质图的特征,生成所述智慧城市图计算模型。 19.一种智慧城市数据处理设备,其特征在于,包括: 存储器,用于存储计算机程序; 处理器,用于执行所述计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至17任意一项所述智慧城市数据处理方法的步骤。 20.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至17任意一项所述智慧城市数据处理方法的步骤。

一种智慧城市数据处理方法、装置、设备及可读存储介质

技术领域

本发明涉及人工智能技术领域,特别是涉及一种智慧城市数据处理方法、装置、设备及可读存储介质。

背景技术

智慧城市、智慧农场、智慧交通等智慧城市均为利用信息和通信技术(ICT)以及其他智能技术,来规划跨场景的管理方案。人工智能技术在智慧城市的应用也是涉及跨场景的多个方面。然而,目前的智慧城市还停留在信息化阶段,即通过大规模搜集跨领域数据、建立信息库的方式对信息进行可视化表示,但各场景的信息为信息孤岛,缺乏深度关联,无法实现跨场景的智能化处理方案。目前的人工智能模型如目标检测模型、人体姿态估计模型等,均只能在单一场景中发挥作用,认知能力较弱,不能满足智能平台的建设要求。

提供一种适用于跨场景的智能平台数据处理方案,是本领域技术人员需要解决的技术问题。

发明内容

本发明的目的是提供一种智慧城市数据处理方法、装置、设备及可读存储介质,用于实现跨场景的智慧城市数据处理方案。

为解决上述技术问题,本发明提供一种智慧城市数据处理方法,包括:

自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统;

自所述智慧城市存储系统抽取各所述领域的所述信息源的数据,构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图;

基于所述智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取所述智慧城市异质图中的特征转换为低维嵌入表示后嵌入所述智慧城市图计算模型;

将所述智慧城市图计算模型的应用程序接口部署至用户设备,以接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理。

在一些实施中,所述构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图,包括:

以所述信息源实体的本体为实体节点,以所述信息源实体所属的类别为虚拟节点,以不同所述实体节点之间的关联关系、所述实体节点和所述虚拟节点之间的关联关系为所述边,构建所述智慧城市异质图。

在一些实施中,所述构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图,包括:

以两个所述节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各所述节点对中两个所述节点之间的关联关系;

利用各所述节点的信息和各所述节点之间的关联关系构建所述智慧城市异质图。

在一些实施中,利用所述网络文档挖掘各所述节点对中两个所述节点之间的关联关系,包括:

采用多策略的中文开放关系抽取算法自所述网络文档中分别抽取各所述节点对中两个所述节点之间的关联关系。

在一些实施中,利用所述地图软件挖掘各所述节点对中两个所述节点之间的关联关系,包括:

分别自所述地图软件搜索各所述节点对中两个所述节点之间的地理距离;

对比所述地理距离和邻居节点距离阈值,若所述地理距离大于或等于所述邻居节点距离阈值,则确定两个所述节点之间不存在地理邻居关系;若所述地理距离小于所述邻居节点距离阈值,则确定两个所述节点之间存在所述地理邻居关系。

在一些实施中,利用所述人工智能大模型挖掘各所述节点对中两个所述节点之间的关联关系,包括:

根据所述节点对中两个所述节点的信息生成对应的关联关系识别任务;

将所述关联关系识别任务输入所述人工智能大模型,输出所述节点对中两个所述节点的关联关系。

在一些实施中,所述以两个所述节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各所述节点对中两个所述节点之间的关联关系,包括:

初始化节点接口、网络文档接口、地图软件接口和人工智能大模型接口;

生成第一关联关系列表、第二关联关系列表和第三关联关系列表;

自所述节点接口接收各所述节点对的信息;

根据各所述节点对的信息自所述网络文档抽取各所述节点对中两个所述节点之间的第一关联关系,将所述第一关联关系写入所述第一关联关系列表;

分别自所述地图软件搜索各所述节点对中两个所述节点之间的地理距离;

对比所述地理距离和邻居节点距离阈值,若所述地理距离大于或等于所述邻居节点距离阈值,则确定两个所述节点之间不存在地理邻居关系;若所述地理距离小于所述邻居节点距离阈值,则确定两个所述节点之间存在所述地理邻居关系;

将存在所述地理邻居关系的两个所述节点的信息写入所述第二关联关系列表;

根据所述节点对中两个所述节点的信息生成对应的关联关系识别任务;

将所述关联关系识别任务输入所述人工智能大模型,输出所述节点对中两个所述节点的第三关联关系;

将所述第三关联关系写入所述第三关联关系列表;

输出更新后的所述第一关联关系列表、更新后的所述第二关联关系列表和更新后的所述第三关联关系列表。

在一些实施中,所述构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图,包括:

利用预训练的第一语言模型抽取所述信息源实体的特征为所述节点的特征,将所述节点和所述边构建为所述智慧城市异质图;

其中,所述节点的特征包括节点名称、所述节点的静态信息和所述节点的动态信息。

在一些实施中,所述基于所述智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取所述智慧城市异质图中的特征转换为低维嵌入表示后嵌入所述智慧城市图计算模型,包括:

自所述智慧城市异质图中提取语义特征和/或结构特征,将所述语义特征和/或所述结构特征嵌入图卷积网络以学习所述智慧城市异质图的特征,生成所述智慧城市图计算模型。

在一些实施中,所述自所述智慧城市异质图中提取语义特征和/或结构特征,将所述语义特征和/或所述结构特征嵌入图卷积网络以学习所述智慧城市异质图的特征,生成所述智慧城市图计算模型,包括:

获取所述节点的特征;

自所述智慧城市异质图中提取所述语义特征和所述结构特征;

将所述节点的特征、所述语义特征和所述结构特征进行融合处理,得到融合特征;

将所述融合特征嵌入所述图卷积网络以学习所述智慧城市异质图的特征,生成所述智慧城市图计算模型。

在一些实施中,自所述智慧城市异质图中提取所述语义特征,包括:

基于所述智慧城市异质图,得到由第一节点 h、第二节点 t以及所述第一节点和所述第二节点间的关联关系 r构成的三元组数据;

采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到所述智慧城市异质图的所述语义特征。

在一些实施中,所述采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到所述智慧城市异质图的所述语义特征,包括:

将所述三元组数据表示为随机初始化向量;

对所述随机初始化向量进行采样,得到负样本;

以为目标函数和语义损失函数对所述负样本进行学习,得到所述智慧城市异质图的所述语义特征;

其中,所述语义损失函数为:

其中,为间隔参数,为取正数计算,为负样本集合,为采样得到的头实体,为采样得到的尾实体。

在一些实施中,自所述智慧城市异质图中提取所述结构特征,包括:

以将所述智慧城市异质图中的所述节点转换为低维稠密的嵌入表示、使所述智慧城市异质图中相似的所述节点在低维空间距离相近为目标,采用图嵌入算法学习所述智慧城市异质图的图结构嵌入表示,得到所述智慧城市异质图中的所述结构特征。

在一些实施中,所述以将所述智慧城市异质图中的所述节点转换为低维稠密的嵌入表示、使所述智慧城市异质图中相似的所述节点在低维空间距离相近为目标,采用图嵌入算法学习所述智慧城市异质图的图结构嵌入表示,得到所述智慧城市异质图中的所述结构特征,包括:

以基于中心节点的嵌入能够最大概率观测到网络邻域为目标,采用偏置随机游走模型学习各所述节点的关系结构;

根据各所述节点的向量表示和各所述节点的关系结构的向量表示计算得到所述智慧城市异质图中的所述结构特征。

在一些实施中,所述将所述节点的特征、所述语义特征和所述结构特征进行融合处理,得到融合特征,通过下式计算得到:

其中,为所述融合特征,为第 i个所述节点的节点特征,为第 i个所述节点的所述结构特征,为第 i个所述节点的所述语义特征,为矩阵连接操作。

在一些实施中,所述智慧城市图计算模型的训练方法,包括:

获取初始的所述图卷积网络;

为初始的所述图卷积网络设置初始参数;

根据所述语义特征和/或所述结构特征以及所述节点的特征对所述图卷积网络进行训练,得到对所述节点的预测类别;

利用所述节点的实际类别与所述节点的预测类别的损失对所述图卷积网络的模型参数进行优化,直至满足对所述节点的类别预测目标,得到所述智慧城市图计算模型。

在一些实施中,所述类别预测目标,通过下式表示:

其中,为负对数似然损失,为所述图卷积网络的模型参数,为在模型参数为对应的所述负对数似然损失最小,为所述节点的数量, W为参数矩阵,为参数矩阵 W的转置矩阵,为第 i个所述节点对应的隐状态表示,为第 i个所述节点对应每个类别的概率。

在一些实施中,所述接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理,包括:

接收所述用户设备发送的智慧城市监控任务;

识别所述智慧城市监控任务中的节点属性和监控项目;

调用所述智慧城市图计算模型对所述智慧城市异质图中属于所述节点属性的所述节点根据所述监控项目进行节点分类和/或节点聚类处理,得到节点分类结果和/或节点聚类结果;

输出所述节点分类结果和/或所述节点聚类结果。

在一些实施中,所述接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理,包括:

接收所述用户设备发送的待解答问题;

调用所述智慧城市图计算模型搜索所述待解答问题的相关节点的信息以及所述相关节点的邻域信息;

调用预训练的第二语言模型根据所述相关节点的信息和所述相关节点的邻域信息生成回答信息;

输出所述回答信息。

为解决上述技术问题,本发明还提供一种智慧城市数据处理装置,包括:

采集单元,用于自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统;

建图单元,用于自所述智慧城市存储系统抽取各所述领域的所述信息源的数据,构建以信息源实体为节点、以所述信息源实体之间的关联关系为边的智慧城市异质图;

建模单元,用于基于所述智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取所述智慧城市异质图中的特征转换为低维嵌入表示后嵌入所述智慧城市图计算模型;

处理单元,用于将所述智慧城市图计算模型的应用程序接口部署至用户设备,以接收所述用户设备的智慧城市数据处理任务并基于所述智慧城市图计算模型进行智慧城市数据处理。

为解决上述技术问题,本发明还提供一种智慧城市数据处理设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序,所述计算机程序被所述处理器执行时实现如上述任意一项所述智慧城市数据处理方法的步骤。

为解决上述技术问题,本发明还提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述智慧城市数据处理方法的步骤。

本发明所提供的智慧城市数据处理方法,通过自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统,实现对跨领域的智慧城市信息的信息化处理;通过自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,再通过抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型的方式构建智慧城市图计算模型,实现了跨场景的隐含的关联建模,从而支持全局最优调控,问题及时发现,资源优化调度等任务;通过将智慧城市图计算模型的应用程序接口部署至用户设备,以接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,实现了智慧城市跨领域不同场景下的关联计算与分析,推动传统的智慧城市从信息化方案转型为智能化方案。

本发明提供的智慧城市数据处理方法,通过在构建智慧城市异质图时,除了以信息源实体的本体作为实体节点外,还以信息源实体所属的类别为虚拟实体,构建了层次化的概念本体结构,通过向智慧城市异质图中一并添加实体节点和虚拟节点,增强了智慧城市异质图分析的语义理解能力。

本发明提供的智慧城市数据处理方法,还通过以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型等信息源挖掘各节点对中两个节点之间的关联关系,从而利用各节点和各节点之间的关联关系构建智慧城市异质图,实现了对多维度关联关系的深度挖掘。

本发明提供的智慧城市数据处理方法,还通过自智慧城市异质图中抽取语义特征和结构特征嵌入神经网络学习进行节点分类训练,增强了图卷积网络对节点表示的泛化能力,从而能够基于构建的智慧城市异质图进行图卷积网络深度分析,可以广泛应用于各种智能平台场景中。

本发明还提供一种智慧城市数据处理装置、设备及可读存储介质,具有上述有益效果,在此不再赘述。

附图说明

为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种智慧城市数据处理系统的架构示意图;

图2为本发明实施例提供的一种智慧城市数据处理方法的流程图;

图3为本发明实施例提供的一种智慧城市图计算模型的建模过程示意图;

图4为本发明实施例提供的一种智慧城市数据处理装置的结构示意图;

图5为本发明实施例提供的一种智慧城市数据处理设备的结构示意图。

具体实施方式

本发明的核心是提供一种智慧城市数据处理方法、装置、设备及可读存储介质,用于实现跨场景的智慧城市数据处理方案。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面对本发明实施例一进行说明。

图1为本发明实施例提供的一种智慧城市数据处理系统的架构示意图。

为便于理解,首先介绍本发明实施例提供的智慧城市数据处理系统。

如图1所示,本发明实施例提供一种智慧城市数据处理系统来实现本发明各实施例提供的智慧城市数据处理方法,该智慧城市数据处理系统主要由智慧城市存储系统、智慧城市计算系统和智慧城市客户端设备组成。

其中,智慧城市存储系统用于存储自智慧城市对应的各领域的信息源采集到的数据,如图1所示,可以将不同领域的数据存入不同的存储区域,可以根据不同数据的重要程度确定对应的存储策略与备份策略,根据数据更新的频次确定使用的存储设备。在智慧城市数据处理系统构建到运行过程中,可以通过智慧城市存储系统不断接收各领域更新的数据,以保证智慧城市数据处理系统的数据实时性。

智慧城市客户端设备为部署了智慧城市客户端的用户设备,可以为个人用户持有的手机、个人电脑,也可以为企业、单位等团体的数据中心的服务器。应用本发明实施例提供的智慧城市数据处理方法,搭建了一个智能化的智慧城市平台,可以包括智慧交通、智慧文旅、智慧农场、智慧公安、智慧政务等子平台,可以衍生出多种不同的平台产品,并提供给用户应用程序接口作为用户客户端部署在用户设备上,以供用户访问智慧城市平台,利用智慧城市图计算模型实现智慧城市数据的分析与处理。

智慧城市计算系统用于实现智慧城市异质图的构建以及智慧城市图计算模型的构建,并解决用户设备提出的智慧城市数据处理任务,如监控预警任务,用户问答服务等,其实现方法请参见本发明下述实施例的介绍。智慧城市计算系统可以包括一台或多台计算设备,计算设备可以采用但不限于中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)、现场可编程逻辑门阵列(Field Programmable GateArray,FPGA)等作为计算模块。由于本发明提供了一种轻量化的智慧城市实现方案,无需大成本投入计算设备即可实现方案。

在上述架构的基础上,下面结合附图对本发明实施例提供的智慧城市数据处理方法进行说明。

下面对本发明实施例二进行说明。

图2为本发明实施例提供的一种智慧城市数据处理方法的流程图。

智慧城市的信息技术解决方案通常采用云、边、端协同的计算架构,它涵盖的内容很多,包括物联网、人工智能、移动互联网开发技术栈。传统的智慧城市解决方案大多处于信息化阶段,没有很好的实现智能化,仍面临很多局限性:

(1)跨场景分析难,各场景的信息成为信息孤岛,缺乏深度关联,无法实现对整个平台对应的各场景的全局调控。人工智能仅能在单一场景中发挥作用,例如车牌识别模型、文旅景点模型都是独立运行的,但交通拥堵的路段不利于文旅出行,传统智慧城市方案却无法建模多种场景下信息的关联性。

(2)通用性差,传统的智慧城市方案仅有针对单一场景训练的人工智能模型,每个人工智能模型只能解决单一的任务,例如车流量预测模型只能进行车流量预测,而不能执行目标检测任务。由于单个模型训练成本较高,通用性差,无法针对智慧城市的每种需求、每个场景都专门训练模型。

(3)智能化程度较低。传统的机器学习模型在智慧城市解决方案中解决问题的成功率较低,例如只能提供简单的目标检测功能、人脸识别功能,对于建设智慧城市的需求越来越无法满足。

(4)部署、维护成本高,传统的智慧城市系统大多是上一代的人工智能+物联网(AIoT)方案,组织结构复杂,故障频发,对于新场景、新需求的适应性差,无法灵活添加新的功能,导致系统部署和维护的成本较高。

针对传统的智慧城市方案所面临的问题,本发明实施例提供一种智慧城市数据处理方法,包括基于图计算的建模方法和基于图计算模型的数据搜索方法两大部分,通过将智慧城市对应的多源多场景信号源构建为异质图,利用图计算方法进行智慧城市的跨场景分析。

如图2所示,本发明实施例提供的智慧城市数据处理方法包括:

S201:自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统。

S202:自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图。

S203:基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型。

S204:将智慧城市图计算模型的应用程序接口部署至用户设备,以接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理。

在本发明实施例的一些实施方式中,对于S201,定义可以对外主动或被动发出信息的实体为信息源。例如,建筑具有被外界知晓的建筑名称、地理位置、功能属性、建成时间等信息,那么就可以将某建筑视为一个信息源实体。

对于智慧城市来说,信息源的类别可以包括:城市、建筑、机构、交通工具、用户终端等。

对于S202,本发明实施例提供一种多源多场景的信息建模方法,通过将多源多场景的信息构建为一个异质图G=(V,E),其中V代表节点集合,E代表边集合。每个节点代表智慧城市面对的各场景中的一个信息源,如B城市中的古建筑1、古建筑2、高校1、高校2都可以作为智慧城市异质图中的节点。边则代表节点之间的连接关系,例如(古建筑1,邻居,古建筑2)。

为扩展信息源实体间的关联关系,在本发明实施例提供的智慧城市数据处理方法中,还可以构建信息源实体间的虚拟节点。则S202中构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,可以包括:以信息源实体的本体为实体节点,以信息源实体所属的类别为虚拟节点,以不同实体节点之间的关联关系、实体节点和虚拟节点之间的关联关系为边,构建智慧城市异质图。即是说,假设高校1和高校2并不存在表面的关联关系,但因其都属于高校,可以构建一个定义为“高校”的虚拟节点,即“高校”为“高校1”的类别,可以得到(高校1,类别,高校)这样一个关联关系,同理还可以得到(高校2,类别,高校)的关联关系,由此建立了高校1和高校2的关联关系。

通过搜集节点的特征,节点之间的关联关系的特征,可以构建形成与智慧城市对应的智慧城市异质图。

异质图(Heterogeneous Graph)是一种包括多种类型节点和边的图结构,与此对应的同质图(Homogeneous Graph)中只有一种类型的节点和边。知识图谱构建技术旨在通过本体建模、实例层建模的技术,将实体、概念通过不同类型的关系进行关联,从而构建为语义网络。该语义网络通常是异质图,知识图谱构建的过程是重量级工程,本发明实施例采用一种轻量级的方法构建智慧城市异质图,与大多数根据现实节点构建的异质图不同的是,本发明实施例采用了知识图谱中的本体建模思想,通过构建层次化的概念本体结构,向异质图中添加虚拟节点,例如“高校”、“景点”、“公司”、“停车场”、“社区”、“地铁”等类别概念,从而帮助增强异质图分析的语义理解能力。

对于S203,为实现基于智慧城市异质图解决智慧城市相关的问题,需要对智慧城市异质图进行表达建模。在本发明实施例中,通过构建智慧城市图计算模型实现对智慧城市异质图的表达,在构建智慧城市图计算模型的过程中,通过抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型,实现将智慧城市中各领域的信息源的数据为不同维度的数据转换到同一维度,实现了跨场景的隐含的关联建模,从而支持全局最优调控,问题及时发现,资源优化调度等任务。

对于S204,创建智慧城市图计算模型的应用程序接口,并将应用程序接口部署到用户设备中,用户可以通过在用户设备中下载智慧城市客户端来访问智慧城市平台以获取所需的智慧城市数据处理服务。应用本发明实施例提供的智慧城市数据处理方法,接收用户通过用户设备输入的智慧城市数据处理任务,可以基于智慧城市图计算模型执行对智慧城市异质图中的节点进行分类、聚类、链接预测等下游任务,真正实现将智慧城市从传统的信息化阶段转换为智能化平台。

本发明实施例提供的智慧城市平台是一个跨领域的综合平台,可以解决用户对其中任意跨领域的数据分析任务。在本发明实施例提供的智慧城市平台之下,还可以设置智慧交通子平台、智慧文旅子平台、智慧农场子平台、智慧公安子平台、智慧政务子平台等子平台,每个子平台可以对应一个或多个领域,在智慧城市平台之下,如果用户所需使用的智慧城市数据分析服务为一个或部分领域的数据分析服务,则调用智慧城市图计算模型可以基于子平台对应的节点信息及其邻域信息执行单领域或跨领域的数据分析任务。

本发明实施例提供的智慧城市数据处理方法,通过自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统,实现对跨领域的智慧城市信息的信息化处理;通过自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,再通过抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型的方式构建智慧城市图计算模型,实现了跨场景的隐含的关联建模,从而支持全局最优调控,问题及时发现,资源优化调度等任务;通过将智慧城市图计算模型的应用程序接口部署至用户设备,以接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,实现了智慧城市跨领域不同场景下的关联计算与分析,推动传统的智慧城市从信息化方案转型为智能化方案。

本发明实施例提供的智慧城市数据处理方法实现了通过一个智慧城市图计算模型实现对智慧城市的多源多场景建模,无需针对各信息源各场景分别训练人工智能模型,显著降低了模型训练难度,即降低了建造智慧城市所需的算力资源和存储资源,在实际应用中支持通用的中央处理器+图形处理器方案,无需对数据中心的服务器硬件进行调整,大大降低了模型训练的成本和新业务开发、维护的周期。另外,本发明实施例提供的智慧城市数据处理方法提供了一种低耦合方案,可以快速适配和接入新业务数据,而且无需人工标注数据。

下面对本发明实施例三进行说明。

在上述实施例的基础上,本发明实施例进一步对构建智慧城市异质图的方法进行说明。

在本发明实施例提供的智慧城市数据处理方法中,S202中以信息源实体为节点,以信息源实体之间的关联关系为边,构建智慧城市异质图,可以包括:

以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系;

利用各节点的信息和各节点之间的关联关系构建智慧城市异质图。

在本发明实施例的一些实施方式中,对于节点之间的关联关系,一方面可以根据本体建模在概念层面建立一种关联,另外还可以通过网络文档、地图软件和人工智能大模型等信息源,挖掘节点之间的深层关联关系。

其中,利用网络文档挖掘各节点对中两个节点之间的关联关系,可以包括:采用多策略的中文开放关系抽取算法自网络文档中分别抽取各节点对中两个节点之间的关联关系。网络文档可以来源于各互联网平台,通过将两个节点的信息输入搜索引擎,搜索得到与两个节点相关联的网络文档后,利用多策略的中文开放关系抽取算法自网络文档中抽取两个节点之间的关联关系。

利用地图软件挖掘各节点对中两个节点之间的关联关系,可以包括:分别自地图软件搜索各节点对中两个节点之间的地理距离;对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系。通过设置邻居节点距离阈值来判定两个节点之间是否存在地理邻居关系。进一步的,可以结合所有节点的分布情况,对于分布密集区域设置较小的邻居节点距离阈值,对于分布稀疏的区域设置较大的邻居节点距离阈值。

利用人工智能大模型挖掘各节点对中两个节点之间的关联关系,可以包括:根据节点对中两个节点的信息生成对应的关联关系识别任务;将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的关联关系。人工智能大模型可以采用chatgpt。针对每个节点对,可以将其中两个节点的信息输入预设的问题模板,生成提示语(prompt)输入人工智能大模型,获得节点之间的关联关系。如果人工智能大模型的输出结果不为空(空、null表示回答中包含“不存在关联”、“无法识别”等情况),则得到两个节点的关联关系。

基于上述信息源,以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系,可以包括:

初始化节点接口、网络文档接口、地图软件接口和人工智能大模型接口;

生成第一关联关系列表、第二关联关系列表和第三关联关系列表;

自节点接口接收各节点对的信息;

根据各节点对的信息自网络文档抽取各节点对中两个节点之间的第一关联关系,将第一关联关系写入第一关联关系列表;

分别自地图软件搜索各节点对中两个节点之间的地理距离;

对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系;

将存在地理邻居关系的两个节点的信息写入第二关联关系列表;

根据节点对中两个节点的信息生成对应的关联关系识别任务;

将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的第三关联关系;

将第三关联关系写入第三关联关系列表;

输出更新后的第一关联关系列表、更新后的第二关联关系列表和更新后的第三关联关系列表。

上述步骤可以通过下述算法实现:

上述算法的输入为智慧城市节点集合V、网络文档集合D、各节点的地理坐标位置信息Loc、人工智能大模型接口chatgpt;输出为各节点对中的两个节点之间的三种关联关系:第一关联关系(relation1)、第二关联关系(relation2)、第三关联关系(relation3)。

算法第1行是初始化三种关联关系的来源的列表。

第2-5行是基于百科和新闻等文档集合中挖掘的关联关系,其中第3行可以采用多策略的中文开放关系抽取算法进行计算得到。第4行是将抽取到的信息加入到第一关联关系表中。

第6-12行是基于地理坐标信息挖掘的关联关系方法。其中第6行将节点集合进行成对组合,第7-8行是基于地图软件接口API进行节点的地理距离计算,第9-10行是将存在地理邻居关系的节点对加入第二关联关系表,其中t是设置的邻居节点距离阈值。

第13-18行是利用人工智能大模型chatgpt的开放API,通过提示问答的形式进行节点之间关联关系的挖掘,第14行是针对每一对节点,通过设计问题模板prompt进行提问,获得节点之间的关系。第15-16行是判断人工智能大模型chatgpt回答的内容不为null(null代表回答中提到“不存在关联”或者说“抱歉,无法回答”等情况时),则将关联关系加入第三关联关系表。

通过上述算法得到的节点之间的关联关系,可以直接用于构建智慧城市异质图的数据并执行后续的分析。

此外,还需提取节点的特征加入智慧城市异质图。S202中构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,可以包括:利用预训练的第一语言模型抽取信息源实体的特征为节点的特征,将节点和边构建为智慧城市异质图;其中,节点的特征包括节点名称、节点的静态信息和节点的动态信息。

即利用预训练的语言模型抽取每个节点的特征,可以将节点的特征采用下式的表示:

x=F(<[CLS],Name,[SEP0],text,[SEP1],dynamic,[SEP]>);

其中,F(·)代表一个预训练的语言模型, x代表预训练的语言模型对节点输入提取的特征,[CLS]代表序列的第一个特殊令牌(token),Name代表节点的名称,text代表节点的静态信息,dynamic代表节点的动态信息。[SEP0]、[SEP1]代表人工设计的模板,由令牌(token)序列构成,旨在提示模型更好的理解输入组成的部分。通过上述方法得到的节点特征可以作为后续智慧城市图计算模型分析过程中节点特征的重要组成部分。

本发明实施例提供的智慧城市数据处理方法,还通过以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型等信息源挖掘各节点对中两个节点之间的关联关系,从而利用各节点和各节点之间的关联关系构建智慧城市异质图,实现了对多维度关联关系的深度挖掘。还通过预训练的语言模型提取节点特征,方便进行智慧城市图计算模型的学习。

下面对本发明实施例四进行说明。

图3为本发明实施例提供的一种智慧城市图计算模型的建模过程示意图。

在上述实施例的基础上,本发明实施例进一步对训练智慧城市图计算模型的过程进行说明。

在本发明实施例提供的智慧城市数据处理方法中,S203中基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型,可以包括:自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络(GCN)以学习智慧城市异质图的特征,生成智慧城市图计算模型。

传统的图卷积网络主要依靠设计的模型架构学习特定于任务的特征,没有针对性地提取图数据自然存在的结构和语义特征。对此,本发明实施例提供一种语义-结构图卷积网络(SS-GCN),通过从智慧城市异质图中提取语义特征和结构特征嵌入图卷积网络来增强图卷积网络的节点分类等分析过程。

则自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型,可以包括:

获取节点的特征;

自智慧城市异质图中提取语义特征和结构特征;

将节点的特征、语义特征和结构特征进行融合处理,得到融合特征;

将融合特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型。

本发明实施例提供的语义-结构图卷积网络(SS-GCN),可以采用下式表示:

其中,为第 i个节点的特征,为结构特征的嵌入表示,为语义特征的嵌入表示,为图卷积网络模型, G为智慧城市异质图,为图卷积网络产生的隐状态表示。

如图3所示,在构建智慧平台图计算模型的过程中,嵌入节点的特征、智慧平台异质图的语义特征和智慧平台异质图的结构特征,实现智慧平台图计算模型对节点的分类处理( y1、 y2……)。

在本发明实施例提供的语义-结构图卷积网络(SS-GCN)中,将节点的特征、语义特征和结构特征进行融合处理,得到融合特征,可以通过下式计算得到:

其中,为融合特征,为第 i个节点的节点特征,为第 i个节点的结构特征,为第 i个节点的语义特征,为矩阵连接操作。

其中,语义特征可以采用知识图谱嵌入算法学习智慧城市异质图的实体之间的语义关系表示得到,结构特征可以采用图嵌入算法通过随机游走学习智慧城市异质图的结构信息得到,而后通过融合语义-结构嵌入到图卷积网络中,可以进一步提升模型的泛化性能。

最终将得到的隐状态表示通过线性层映射为类别的概率,进而得到模型优化的目标函数为负对数似然损失,可以如下式所示:

其中,为负对数似然损失,为图卷积网络的模型参数,为在模型参数为对应的负对数似然损失最小,为节点的数量, W为参数矩阵,为参数矩阵 W的转置矩阵,为第 i个节点对应的隐状态表示,为第 i个节点对应每个类别的概率。

下面分别对本发明实施例提供的语义特征嵌入方法、结构特征嵌入方法和图卷积网络的训练方法进行说明。

在本发明实施例提供的智慧城市数据处理方法中,可以采用知识图谱嵌入算法学习语义特征嵌入。给定三元组集合,其中 E代表实体集合, R代表关系类型集合,知识图谱嵌入旨在找到一个映射,将智慧城市异质图中的实体和关系的表示为低维稠密向量。通过这种表示使得智慧城市异质图能够方便下游任务的使用。

知识图谱嵌入算法可以采用TransE算法,其优化的目标是使得向量表示满足,可以采用基于间隔的排序损失(triplet ranking loss)进行学习。

则在本发明实施例提供的智慧城市数据处理方法中,自智慧城市异质图中提取语义特征,包括:

基于智慧城市异质图,得到由第一节点 h、第二节点 t以及第一节点和第二节点间的关联关系 r构成的三元组数据;

采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征。

TransE算法学习过程中包含对关系类型的建模,而开放关系抽取得到的关系类型比较多样化,对于直接应用抽取数据的情况,本发明实施例将其视为只有默认的一种关系类型,即不考虑关系类型的区别。对于关系类型经过规范化处理后的图数据,则可以直接使用多种关系类型。此外图数据中,会存在较多的一对多或者多对多关系,该问题在其他方法中例如TransR、TransD等提供了相应的解决方案。

在本发明实施例中,采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征,可以包括:

将三元组数据表示为随机初始化向量;

对随机初始化向量进行采样,得到负样本;

以 h+ t≈ r为目标函数和语义损失函数对负样本进行学习,得到智慧城市异质图的语义特征;

其中,语义损失函数为:

其中,为间隔参数,为取正数计算,为负样本集合,为采样得到的头实体,为采样得到的尾实体。

TransE通过无监督的学习算法,获取节点的表示形式。该算法学习了节点之间的语义关系,这种表示形式是原始的图卷积网络所无法提取的,图卷积网络主要利用有监督的学习任务,被动地从图数据中提取邻域的信息。最终,通过结合知识图谱嵌入表示,从而提升节点表示的泛化能力。

在本发明实施例提供的智慧城市数据处理方法中,可以采用图嵌入算法通过随机游走学习智慧城市异质图的结构信息得到智慧城市异质图的结构特征。自智慧城市异质图中提取结构特征,可以包括:以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征。

即是说,图嵌入算法旨在找到一个映射:,将图中的节点转换为低维稠密的嵌入表示,使得图中相似的节点在低维空间距离相近。

其中,以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征,可以包括:

以基于中心节点的嵌入能够最大概率观测到网络邻域为目标,采用偏置随机游走模型学习各节点的关系结构;

根据各节点的向量表示和各节点的关系结构的向量表示计算得到智慧城市异质图中的结构特征。

在本发明实施例中,采用node2vec算法。通过将连续跳字模型(Skip-gram)的思想用于图数据中,该算法优化的目标是基于中心节点 u的嵌入能够最大概率的观察到网络的邻域。

图嵌入表示通过无监督的学习算法,捕获了智慧城市异质图的结构相关性信息。图卷积网络在有监督的学习过程中无法提取随机游走的结构相关性。最终,通过图嵌入表示增强了节点特征的泛化性。

在本发明实施例提供的智慧城市数据处理方法中,智慧城市图计算模型的训练方法,可以包括:

获取初始的图卷积网络;

为初始的图卷积网络设置初始参数;

根据语义特征和/或结构特征以及节点的特征对图卷积网络进行训练,得到对节点的预测类别;

利用节点的实际类别与节点的预测类别的损失对图卷积网络的模型参数进行优化,直至满足对节点的类别预测目标,得到智慧城市图计算模型。

对于基于谱的图神经网络研究方法,图数据被看作无向的,图卷积网络(GCN)模型是一种特殊的图神经网络,正则化图拉普拉斯矩阵具有较好的数学特性,可以作为对智慧城市异质图中的图数据的一种鲁棒性数学表示,如下所示:

其中, A是邻接矩阵,对角矩阵 D是度矩阵,计算过程如下式所示:

其中,鲁棒性表示的图拉普拉斯阵是一个实对称半正定矩阵,这类矩阵根据数学性质可以进行谱分解,如下式所示:

其中 U是特征向量构成的矩阵,特征向量构成一组正交基,Λ为 L的特征值矩阵。图卷积的计算过程如下式所示:

其中, I为单位矩阵。是的度矩阵,计算过程同上述公式。是每一层的隐状态,是原始输入特征 X,是非线性激活函数。

图卷积网络将最后一层编码的隐状态向量输入线性层,映射为类别概率可以实现节点分类任务。也有相关研究加入残差连接或者门控机制,训练深层的图卷积网络并建模时序信息。

在本发明实施例中,优化用于学习智慧城市异质图的特征的图卷积网络的类别预测目标,可以通过下式表示:

其中,为负对数似然损失,为图卷积网络的模型参数,为在模型参数为对应的负对数似然损失最小,为节点的数量, W为参数矩阵,为参数矩阵 W的转置矩阵,为第 i个节点对应的隐状态表示,为第 i个节点对应每个类别的概率。

本发明实施例提供的智慧城市数据处理方法,还通过自智慧城市异质图中抽取语义特征和结构特征嵌入图卷积网络学习进行节点分类训练,增强了图卷积网络对节点表示的泛化能力,从而能够基于构建的智慧城市异质图进行图卷积网络深度分析,可以广泛应用于各种智能平台场景中。

下面对本发明实施例五进行说明。

基于本发明上述实施例给出的智慧城市异质图的构建方法以及智慧城市图计算模型的构建方法,给定多源多场景的智慧城市信号源,首先可以采用知识图谱中的本体建模技术、关联关系挖掘算法、预训练语言模型特征提取方法构建出智慧城市异质图。然后,基于智慧城市异质图,采用预训练的语言模型表示的节点特征、采用知识图谱嵌入算法学习的语义特征、采用图嵌入算法学习的结构特征嵌入图神经网网络(SS-GCN)进行训练和预测,整个计算过程可以在人工智能服务器中完成。

基于本发明实施例提供的智慧城市异质图的构建方法,通过本体构建、关联关系挖掘算法、预训练语言模型特征表示,构建出跨场景的异质图。本发明实施例提供的实体关联关系挖掘方法可以应用于各领域的智慧城市的知识抽取场景,既能实现大规模自动化知识图谱构建,也可以插入到其他自然语言处理模型的流程之中。

通过本发明实施例提供的智慧城市异质图的构建方法,通过连接不同节点的信息,可以从中构建出不同的异质图数据,并且基于智慧城市图计算模型的进行深度分析,支持对图数据的可视化功能。

在本发明实施例提供的智慧城市数据处理方法中,S204中接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,可以包括:

接收用户设备发送的智慧城市监控任务;

识别智慧城市监控任务中的节点属性和监控项目;

调用智慧城市图计算模型对智慧城市异质图中属于节点属性的节点根据监控项目进行节点分类和/或节点聚类处理,得到节点分类结果和/或节点聚类结果;

输出节点分类结果和/或节点聚类结果。

在本发明实施例的一些实施方式中,在数据中心、监控中心等场所,可以应用本发明实施例提供的智慧城市数据处理方法实现将智慧城市异质图中的所有图数据进行可视化展示以及执行监控预警等智慧城市数据分析任务。对于跨领域的监控任务,通过获取其监控权限确定监控对象,监控对象的信息可以包括节点名称或节点属性。对于确定节点名称的目标节点可以直接加入图计算分析中,对于确定节点属性的节点可以基于智慧城市图计算模型进行图计算确定对应的节点。在执行监控预警任务中,通过监控预警任务设置的监控预警阈值,实现对智慧城市异质图中的节点进行分类、聚类、链接等处理,如将超出监控预警阈值的节点和未超出监控预警阈值的节点进行不同形式的可视化展示。

S204中接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,还可以包括:

接收用户设备发送的待解答问题;

调用智慧城市图计算模型搜索待解答问题的相关节点的信息以及相关节点的邻域信息;

调用预训练的第二语言模型根据相关节点的信息和相关节点的邻域信息生成回答信息;

输出回答信息。

在本发明实施例的一些实施方式中,用户可以基于本发明实施例提供的智慧城市平台解决问题。在传统方案中,用户产生的问题仅能在单个领域内获得解决办法,需要用户自行搜集各领域的信息进行整合,如用户需要出行,需要自行查询路况确定交通出行方式,查询目的地的住宿情况,查询旅游景点的旅游政策和人流量等,才能制定合理的出行计划。应用本发明实施例提供的智慧城市数据处理方法,利用智慧城市图计算模型进行跨领域地搜索与用户设备发送的待解答问题相关的节点及其邻域,围绕待解答问题进行跨领域的节点关联计算,继而可以结合第二语言模型将智慧城市图计算模型输出的向量表示解码为回答信息,解决用户的跨领域搜索问题。如用户需要出行,应用本发明实施例提供的智慧城市数据处理方法,可以搜索得到与出行目的地相关的交通状况、当地文旅政策、节假日人流量、天气等多维度信息以通过关联关系计算自动生成合理的出行计划,实现智慧城市的智能化服务。

基于本发明实施例提供的智慧城市图计算模型的构建方法,基于图计算模型对智慧城市异质图的学习,实现了对智慧城市的跨场景建模,利用预训练语言模型抽取节点特征和图嵌入的动态知识表示的方法,通过融合不同场景的实时信息和在全局中的结构信息,产生统一的动态知识表示。通过融合图卷积网络和预训练语言模型的智慧城市图计算模型,可以进行跨场景关联计算与分析。

利用本发明实施例提供的智慧城市数据处理方法,可以实现跨场景的隐含的关联建模,进而实现支持全局最优调控,问题及时发现,资源优化调度等任务,可以解决如智慧城市、智慧公安、智慧文旅、智慧政务、智慧交通、智慧农场等各种类型的智慧城市的跨场景信息融合、分析、通用计算等问题,可应用于优化数据中心图数据智能分析的需求,解决图数据节点分类需求,优化分类的效果。

应用本发明实施例提供的智慧城市数据处理方法,在构建一个智慧城市的初始阶段,利用本发明实施例提供的智慧城市数据处理方法,支持在领域知识不足的情况下开展业务,进行系统冷启动分析。本发明实施例提供的智慧城市数据处理方法还可以包括:利用节点的动态信息以及新加入的节点更新智慧城市异质图,并利用更新后的智慧城市异质图更新智慧城市图计算模型。

上文详述了智慧城市数据处理方法对应的各个实施例,在此基础上,本发明还公开了与上述方法对应的智慧城市数据处理装置、设备及可读存储介质。

下面对本发明实施例六进行说明。

图4为本发明实施例提供的一种智慧城市数据处理装置的结构示意图。

如图4所示,本发明实施例提供的智慧城市数据处理装置包括:

采集单元401,用于自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统;

建图单元402,用于自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图;

建模单元403,用于基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型;

处理单元404,用于将智慧城市图计算模型的应用程序接口部署至用户设备,以接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理。

在一些实施中,建图单元402构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,包括:

以信息源实体的本体为实体节点,以信息源实体所属的类别为虚拟节点,以不同实体节点之间的关联关系、实体节点和虚拟节点之间的关联关系为边,构建智慧城市异质图。

在一些实施中,建图单元402构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,包括:

以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系;

利用各节点的信息和各节点之间的关联关系构建智慧城市异质图。

在一些实施中,建图单元402利用网络文档挖掘各节点对中两个节点之间的关联关系,包括:

采用多策略的中文开放关系抽取算法自网络文档中分别抽取各节点对中两个节点之间的关联关系。

在一些实施中,建图单元402利用地图软件挖掘各节点对中两个节点之间的关联关系,包括:

分别自地图软件搜索各节点对中两个节点之间的地理距离;

对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系。

在一些实施中,建图单元402利用人工智能大模型挖掘各节点对中两个节点之间的关联关系,包括:

根据节点对中两个节点的信息生成对应的关联关系识别任务;

将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的关联关系。

在一些实施中,建图单元402以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系,包括:

初始化节点接口、网络文档接口、地图软件接口和人工智能大模型接口;

生成第一关联关系列表、第二关联关系列表和第三关联关系列表;

自节点接口接收各节点对的信息;

根据各节点对的信息自网络文档抽取各节点对中两个节点之间的第一关联关系,将第一关联关系写入第一关联关系列表;

分别自地图软件搜索各节点对中两个节点之间的地理距离;

对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系;

将存在地理邻居关系的两个节点的信息写入第二关联关系列表;

根据节点对中两个节点的信息生成对应的关联关系识别任务;

将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的第三关联关系;

将第三关联关系写入第三关联关系列表;

输出更新后的第一关联关系列表、更新后的第二关联关系列表和更新后的第三关联关系列表。

在一些实施中,建图单元402构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,包括:

利用预训练的第一语言模型抽取信息源实体的特征为节点的特征,将节点和边构建为智慧城市异质图;

其中,节点的特征包括节点名称、节点的静态信息和节点的动态信息。

在一些实施中,建模单元403基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型,包括:

自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型。

在一些实施中,建模单元403自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型,包括:

获取节点的特征;

自智慧城市异质图中提取语义特征和结构特征;

将节点的特征、语义特征和结构特征进行融合处理,得到融合特征;

将融合特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型。

在一些实施中,建模单元403自智慧城市异质图中提取语义特征,包括:

基于智慧城市异质图,得到由第一节点 h、第二节点 t以及第一节点和第二节点间的关联关系 r构成的三元组数据;

采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征。

在一些实施中,建模单元403采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征,包括:

将三元组数据表示为随机初始化向量;

对随机初始化向量进行采样,得到负样本;

以为目标函数和语义损失函数对负样本进行学习,得到智慧城市异质图的语义特征;

其中,语义损失函数为:

其中,为间隔参数,为取正数计算,为负样本集合,为采样得到的头实体,为采样得到的尾实体。

在一些实施中,建模单元403自智慧城市异质图中提取结构特征,包括:

以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征。

在一些实施中,建模单元403以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征,包括:

以基于中心节点的嵌入能够最大概率观测到网络邻域为目标,采用偏置随机游走模型学习各节点的关系结构;

根据各节点的向量表示和各节点的关系结构的向量表示计算得到智慧城市异质图中的结构特征。

在一些实施中,建模单元403将节点的特征、语义特征和结构特征进行融合处理,得到融合特征,可以通过下式计算得到:

其中,为融合特征,为第 i个节点的节点特征,为第 i个节点的结构特征,为第 i个节点的语义特征,为矩阵连接操作。

在一些实施中,智慧城市图计算模型的训练方法,包括:

获取初始的图卷积网络;

为初始的图卷积网络设置初始参数;

根据语义特征和/或结构特征以及节点的特征对图卷积网络进行训练,得到对节点的预测类别;

利用节点的实际类别与节点的预测类别的损失对图卷积网络的模型参数进行优化,直至满足对节点的类别预测目标,得到智慧城市图计算模型。

在一些实施中,类别预测目标,可以通过下式表示:

其中,为负对数似然损失,为图卷积网络的模型参数,为在模型参数为对应的负对数似然损失最小,为节点的数量, W为参数矩阵,为参数矩阵 W的转置矩阵,为第 i个节点对应的隐状态表示,为第 i个节点对应每个类别的概率。

在一些实施中,处理单元404接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,包括:

接收用户设备发送的智慧城市监控任务;

识别智慧城市监控任务中的节点属性和监控项目;

调用智慧城市图计算模型对智慧城市异质图中属于节点属性的节点根据监控项目进行节点分类和/或节点聚类处理,得到节点分类结果和/或节点聚类结果;

输出节点分类结果和/或节点聚类结果。

在一些实施中,处理单元404接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,包括:

接收用户设备发送的待解答问题;

调用智慧城市图计算模型搜索待解答问题的相关节点的信息以及相关节点的邻域信息;

调用预训练的第二语言模型根据相关节点的信息和相关节点的邻域信息生成回答信息;

输出回答信息。

由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。

下面对本发明实施例七进行说明。

图5为本发明实施例提供的一种智慧城市数据处理设备的结构示意图。

如图5所示,本发明实施例提供的智慧城市数据处理设备包括:

存储器510,用于存储计算机程序511;

处理器520,用于执行计算机程序511,该计算机程序511被处理器520执行时实现如上述任意一项实施例所述智慧城市数据处理方法的步骤。

其中,处理器520可以包括一个或多个处理核心,比如3核心处理器、8核心处理器等。处理器520可以采用数字信号处理DSP(Digital Signal Processing)、现场可编程门阵列FPGA(Field-Programmable Gate Array)、可编程逻辑阵列PLA(Programmable LogicArray)中的至少一种硬件形式来实现。处理器520也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器CPU(CentralProcessing Unit);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器520可以集成有图像处理器GPU(Graphics Processing Unit),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器520还可以包括人工智能AI(Artificial Intelligence)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器510可以包括一个或多个可读存储介质,该可读存储介质可以是非暂态的。存储器510还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器510至少用于存储以下计算机程序511,其中,该计算机程序511被处理器520加载并执行之后,能够实现前述任一实施例公开的智慧城市数据处理方法中的相关步骤。另外,存储器510所存储的资源还可以包括操作系统512和数据513等,存储方式可以是短暂存储或者永久存储。其中,操作系统512可以为Windows。数据513可以包括但不限于上述方法所涉及到的数据。

在一些实施例中,智慧城市数据处理设备还可包括有显示屏530、电源540、通信接口550、输入输出接口560、传感器570以及通信总线580。

本领域技术人员可以理解,图5中示出的结构并不构成对智慧城市数据处理设备的限定,可以包括比图示更多或更少的组件。

本发明实施例提供的智慧城市数据处理设备,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如上所述的智慧城市数据处理方法,效果同上。

下面对本发明实施例八进行说明。

本发明实施例还提供一种可读存储介质,该可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如智慧城市数据处理方法的步骤。

该可读存储介质可以包括:U盘、移动硬盘、只读存储器ROM(Read-Only Memory)、随机存取存储器RAM(Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本实施例中提供的可读存储介质所包含的计算机程序能够在被处理器执行时实现如上所述的智慧城市数据处理方法的步骤,效果同上。

以上对本发明所提供的一种智慧城市数据处理方法、装置、设备及可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备及可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明的核心是提供一种智慧城市数据处理方法、装置、设备及可读存储介质,用于实现跨场景的智慧城市数据处理方案。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面对本发明实施例一进行说明。

图1为本发明实施例提供的一种智慧城市数据处理系统的架构示意图。

为便于理解,首先介绍本发明实施例提供的智慧城市数据处理系统。

如图1所示,本发明实施例提供一种智慧城市数据处理系统来实现本发明各实施例提供的智慧城市数据处理方法,该智慧城市数据处理系统主要由智慧城市存储系统、智慧城市计算系统和智慧城市客户端设备组成。

其中,智慧城市存储系统用于存储自智慧城市对应的各领域的信息源采集到的数据,如图1所示,可以将不同领域的数据存入不同的存储区域,可以根据不同数据的重要程度确定对应的存储策略与备份策略,根据数据更新的频次确定使用的存储设备。在智慧城市数据处理系统构建到运行过程中,可以通过智慧城市存储系统不断接收各领域更新的数据,以保证智慧城市数据处理系统的数据实时性。

智慧城市客户端设备为部署了智慧城市客户端的用户设备,可以为个人用户持有的手机、个人电脑,也可以为企业、单位等团体的数据中心的服务器。应用本发明实施例提供的智慧城市数据处理方法,搭建了一个智能化的智慧城市平台,可以包括智慧交通、智慧文旅、智慧农场、智慧公安、智慧政务等子平台,可以衍生出多种不同的平台产品,并提供给用户应用程序接口作为用户客户端部署在用户设备上,以供用户访问智慧城市平台,利用智慧城市图计算模型实现智慧城市数据的分析与处理。

智慧城市计算系统用于实现智慧城市异质图的构建以及智慧城市图计算模型的构建,并解决用户设备提出的智慧城市数据处理任务,如监控预警任务,用户问答服务等,其实现方法请参见本发明下述实施例的介绍。智慧城市计算系统可以包括一台或多台计算设备,计算设备可以采用但不限于中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)、现场可编程逻辑门阵列(Field Programmable GateArray,FPGA)等作为计算模块。由于本发明提供了一种轻量化的智慧城市实现方案,无需大成本投入计算设备即可实现方案。

在上述架构的基础上,下面结合附图对本发明实施例提供的智慧城市数据处理方法进行说明。

下面对本发明实施例二进行说明。

图2为本发明实施例提供的一种智慧城市数据处理方法的流程图。

智慧城市的信息技术解决方案通常采用云、边、端协同的计算架构,它涵盖的内容很多,包括物联网、人工智能、移动互联网开发技术栈。传统的智慧城市解决方案大多处于信息化阶段,没有很好的实现智能化,仍面临很多局限性:

(1)跨场景分析难,各场景的信息成为信息孤岛,缺乏深度关联,无法实现对整个平台对应的各场景的全局调控。人工智能仅能在单一场景中发挥作用,例如车牌识别模型、文旅景点模型都是独立运行的,但交通拥堵的路段不利于文旅出行,传统智慧城市方案却无法建模多种场景下信息的关联性。

(2)通用性差,传统的智慧城市方案仅有针对单一场景训练的人工智能模型,每个人工智能模型只能解决单一的任务,例如车流量预测模型只能进行车流量预测,而不能执行目标检测任务。由于单个模型训练成本较高,通用性差,无法针对智慧城市的每种需求、每个场景都专门训练模型。

(3)智能化程度较低。传统的机器学习模型在智慧城市解决方案中解决问题的成功率较低,例如只能提供简单的目标检测功能、人脸识别功能,对于建设智慧城市的需求越来越无法满足。

(4)部署、维护成本高,传统的智慧城市系统大多是上一代的人工智能+物联网(AIoT)方案,组织结构复杂,故障频发,对于新场景、新需求的适应性差,无法灵活添加新的功能,导致系统部署和维护的成本较高。

针对传统的智慧城市方案所面临的问题,本发明实施例提供一种智慧城市数据处理方法,包括基于图计算的建模方法和基于图计算模型的数据搜索方法两大部分,通过将智慧城市对应的多源多场景信号源构建为异质图,利用图计算方法进行智慧城市的跨场景分析。

如图2所示,本发明实施例提供的智慧城市数据处理方法包括:

S201:自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统。

S202:自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图。

S203:基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型。

S204:将智慧城市图计算模型的应用程序接口部署至用户设备,以接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理。

在本发明实施例的一些实施方式中,对于S201,定义可以对外主动或被动发出信息的实体为信息源。例如,建筑具有被外界知晓的建筑名称、地理位置、功能属性、建成时间等信息,那么就可以将某建筑视为一个信息源实体。

对于智慧城市来说,信息源的类别可以包括:城市、建筑、机构、交通工具、用户终端等。

对于S202,本发明实施例提供一种多源多场景的信息建模方法,通过将多源多场景的信息构建为一个异质图G=(V,E),其中V代表节点集合,E代表边集合。每个节点代表智慧城市面对的各场景中的一个信息源,如B城市中的古建筑1、古建筑2、高校1、高校2都可以作为智慧城市异质图中的节点。边则代表节点之间的连接关系,例如(古建筑1,邻居,古建筑2)。

为扩展信息源实体间的关联关系,在本发明实施例提供的智慧城市数据处理方法中,还可以构建信息源实体间的虚拟节点。则S202中构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,可以包括:以信息源实体的本体为实体节点,以信息源实体所属的类别为虚拟节点,以不同实体节点之间的关联关系、实体节点和虚拟节点之间的关联关系为边,构建智慧城市异质图。即是说,假设高校1和高校2并不存在表面的关联关系,但因其都属于高校,可以构建一个定义为“高校”的虚拟节点,即“高校”为“高校1”的类别,可以得到(高校1,类别,高校)这样一个关联关系,同理还可以得到(高校2,类别,高校)的关联关系,由此建立了高校1和高校2的关联关系。

通过搜集节点的特征,节点之间的关联关系的特征,可以构建形成与智慧城市对应的智慧城市异质图。

异质图(Heterogeneous Graph)是一种包括多种类型节点和边的图结构,与此对应的同质图(Homogeneous Graph)中只有一种类型的节点和边。知识图谱构建技术旨在通过本体建模、实例层建模的技术,将实体、概念通过不同类型的关系进行关联,从而构建为语义网络。该语义网络通常是异质图,知识图谱构建的过程是重量级工程,本发明实施例采用一种轻量级的方法构建智慧城市异质图,与大多数根据现实节点构建的异质图不同的是,本发明实施例采用了知识图谱中的本体建模思想,通过构建层次化的概念本体结构,向异质图中添加虚拟节点,例如“高校”、“景点”、“公司”、“停车场”、“社区”、“地铁”等类别概念,从而帮助增强异质图分析的语义理解能力。

对于S203,为实现基于智慧城市异质图解决智慧城市相关的问题,需要对智慧城市异质图进行表达建模。在本发明实施例中,通过构建智慧城市图计算模型实现对智慧城市异质图的表达,在构建智慧城市图计算模型的过程中,通过抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型,实现将智慧城市中各领域的信息源的数据为不同维度的数据转换到同一维度,实现了跨场景的隐含的关联建模,从而支持全局最优调控,问题及时发现,资源优化调度等任务。

对于S204,创建智慧城市图计算模型的应用程序接口,并将应用程序接口部署到用户设备中,用户可以通过在用户设备中下载智慧城市客户端来访问智慧城市平台以获取所需的智慧城市数据处理服务。应用本发明实施例提供的智慧城市数据处理方法,接收用户通过用户设备输入的智慧城市数据处理任务,可以基于智慧城市图计算模型执行对智慧城市异质图中的节点进行分类、聚类、链接预测等下游任务,真正实现将智慧城市从传统的信息化阶段转换为智能化平台。

本发明实施例提供的智慧城市平台是一个跨领域的综合平台,可以解决用户对其中任意跨领域的数据分析任务。在本发明实施例提供的智慧城市平台之下,还可以设置智慧交通子平台、智慧文旅子平台、智慧农场子平台、智慧公安子平台、智慧政务子平台等子平台,每个子平台可以对应一个或多个领域,在智慧城市平台之下,如果用户所需使用的智慧城市数据分析服务为一个或部分领域的数据分析服务,则调用智慧城市图计算模型可以基于子平台对应的节点信息及其邻域信息执行单领域或跨领域的数据分析任务。

本发明实施例提供的智慧城市数据处理方法,通过自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统,实现对跨领域的智慧城市信息的信息化处理;通过自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,再通过抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型的方式构建智慧城市图计算模型,实现了跨场景的隐含的关联建模,从而支持全局最优调控,问题及时发现,资源优化调度等任务;通过将智慧城市图计算模型的应用程序接口部署至用户设备,以接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,实现了智慧城市跨领域不同场景下的关联计算与分析,推动传统的智慧城市从信息化方案转型为智能化方案。

本发明实施例提供的智慧城市数据处理方法实现了通过一个智慧城市图计算模型实现对智慧城市的多源多场景建模,无需针对各信息源各场景分别训练人工智能模型,显著降低了模型训练难度,即降低了建造智慧城市所需的算力资源和存储资源,在实际应用中支持通用的中央处理器+图形处理器方案,无需对数据中心的服务器硬件进行调整,大大降低了模型训练的成本和新业务开发、维护的周期。另外,本发明实施例提供的智慧城市数据处理方法提供了一种低耦合方案,可以快速适配和接入新业务数据,而且无需人工标注数据。

下面对本发明实施例三进行说明。

在上述实施例的基础上,本发明实施例进一步对构建智慧城市异质图的方法进行说明。

在本发明实施例提供的智慧城市数据处理方法中,S202中以信息源实体为节点,以信息源实体之间的关联关系为边,构建智慧城市异质图,可以包括:

以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系;

利用各节点的信息和各节点之间的关联关系构建智慧城市异质图。

在本发明实施例的一些实施方式中,对于节点之间的关联关系,一方面可以根据本体建模在概念层面建立一种关联,另外还可以通过网络文档、地图软件和人工智能大模型等信息源,挖掘节点之间的深层关联关系。

其中,利用网络文档挖掘各节点对中两个节点之间的关联关系,可以包括:采用多策略的中文开放关系抽取算法自网络文档中分别抽取各节点对中两个节点之间的关联关系。网络文档可以来源于各互联网平台,通过将两个节点的信息输入搜索引擎,搜索得到与两个节点相关联的网络文档后,利用多策略的中文开放关系抽取算法自网络文档中抽取两个节点之间的关联关系。

利用地图软件挖掘各节点对中两个节点之间的关联关系,可以包括:分别自地图软件搜索各节点对中两个节点之间的地理距离;对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系。通过设置邻居节点距离阈值来判定两个节点之间是否存在地理邻居关系。进一步的,可以结合所有节点的分布情况,对于分布密集区域设置较小的邻居节点距离阈值,对于分布稀疏的区域设置较大的邻居节点距离阈值。

利用人工智能大模型挖掘各节点对中两个节点之间的关联关系,可以包括:根据节点对中两个节点的信息生成对应的关联关系识别任务;将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的关联关系。人工智能大模型可以采用chatgpt。针对每个节点对,可以将其中两个节点的信息输入预设的问题模板,生成提示语(prompt)输入人工智能大模型,获得节点之间的关联关系。如果人工智能大模型的输出结果不为空(空、null表示回答中包含“不存在关联”、“无法识别”等情况),则得到两个节点的关联关系。

基于上述信息源,以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系,可以包括:

初始化节点接口、网络文档接口、地图软件接口和人工智能大模型接口;

生成第一关联关系列表、第二关联关系列表和第三关联关系列表;

自节点接口接收各节点对的信息;

根据各节点对的信息自网络文档抽取各节点对中两个节点之间的第一关联关系,将第一关联关系写入第一关联关系列表;

分别自地图软件搜索各节点对中两个节点之间的地理距离;

对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系;

将存在地理邻居关系的两个节点的信息写入第二关联关系列表;

根据节点对中两个节点的信息生成对应的关联关系识别任务;

将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的第三关联关系;

将第三关联关系写入第三关联关系列表;

输出更新后的第一关联关系列表、更新后的第二关联关系列表和更新后的第三关联关系列表。

上述步骤可以通过下述算法实现:

上述算法的输入为智慧城市节点集合V、网络文档集合D、各节点的地理坐标位置信息Loc、人工智能大模型接口chatgpt;输出为各节点对中的两个节点之间的三种关联关系:第一关联关系(relation1)、第二关联关系(relation2)、第三关联关系(relation3)。

算法第1行是初始化三种关联关系的来源的列表。

第2-5行是基于百科和新闻等文档集合中挖掘的关联关系,其中第3行可以采用多策略的中文开放关系抽取算法进行计算得到。第4行是将抽取到的信息加入到第一关联关系表中。

第6-12行是基于地理坐标信息挖掘的关联关系方法。其中第6行将节点集合进行成对组合,第7-8行是基于地图软件接口API进行节点的地理距离计算,第9-10行是将存在地理邻居关系的节点对加入第二关联关系表,其中t是设置的邻居节点距离阈值。

第13-18行是利用人工智能大模型chatgpt的开放API,通过提示问答的形式进行节点之间关联关系的挖掘,第14行是针对每一对节点,通过设计问题模板prompt进行提问,获得节点之间的关系。第15-16行是判断人工智能大模型chatgpt回答的内容不为null(null代表回答中提到“不存在关联”或者说“抱歉,无法回答”等情况时),则将关联关系加入第三关联关系表。

通过上述算法得到的节点之间的关联关系,可以直接用于构建智慧城市异质图的数据并执行后续的分析。

此外,还需提取节点的特征加入智慧城市异质图。S202中构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,可以包括:利用预训练的第一语言模型抽取信息源实体的特征为节点的特征,将节点和边构建为智慧城市异质图;其中,节点的特征包括节点名称、节点的静态信息和节点的动态信息。

即利用预训练的语言模型抽取每个节点的特征,可以将节点的特征采用下式的表示:

x=F(<[CLS],Name,[SEP0],text,[SEP1],dynamic,[SEP]>);

其中,F(·)代表一个预训练的语言模型, x代表预训练的语言模型对节点输入提取的特征,[CLS]代表序列的第一个特殊令牌(token),Name代表节点的名称,text代表节点的静态信息,dynamic代表节点的动态信息。[SEP0]、[SEP1]代表人工设计的模板,由令牌(token)序列构成,旨在提示模型更好的理解输入组成的部分。通过上述方法得到的节点特征可以作为后续智慧城市图计算模型分析过程中节点特征的重要组成部分。

本发明实施例提供的智慧城市数据处理方法,还通过以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型等信息源挖掘各节点对中两个节点之间的关联关系,从而利用各节点和各节点之间的关联关系构建智慧城市异质图,实现了对多维度关联关系的深度挖掘。还通过预训练的语言模型提取节点特征,方便进行智慧城市图计算模型的学习。

下面对本发明实施例四进行说明。

图3为本发明实施例提供的一种智慧城市图计算模型的建模过程示意图。

在上述实施例的基础上,本发明实施例进一步对训练智慧城市图计算模型的过程进行说明。

在本发明实施例提供的智慧城市数据处理方法中,S203中基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型,可以包括:自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络(GCN)以学习智慧城市异质图的特征,生成智慧城市图计算模型。

传统的图卷积网络主要依靠设计的模型架构学习特定于任务的特征,没有针对性地提取图数据自然存在的结构和语义特征。对此,本发明实施例提供一种语义-结构图卷积网络(SS-GCN),通过从智慧城市异质图中提取语义特征和结构特征嵌入图卷积网络来增强图卷积网络的节点分类等分析过程。

则自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型,可以包括:

获取节点的特征;

自智慧城市异质图中提取语义特征和结构特征;

将节点的特征、语义特征和结构特征进行融合处理,得到融合特征;

将融合特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型。

本发明实施例提供的语义-结构图卷积网络(SS-GCN),可以采用下式表示:

其中,为第 i个节点的特征,为结构特征的嵌入表示,为语义特征的嵌入表示,为图卷积网络模型, G为智慧城市异质图,为图卷积网络产生的隐状态表示。

如图3所示,在构建智慧平台图计算模型的过程中,嵌入节点的特征、智慧平台异质图的语义特征和智慧平台异质图的结构特征,实现智慧平台图计算模型对节点的分类处理( y1、 y2……)。

在本发明实施例提供的语义-结构图卷积网络(SS-GCN)中,将节点的特征、语义特征和结构特征进行融合处理,得到融合特征,可以通过下式计算得到:

其中,为融合特征,为第 i个节点的节点特征,为第 i个节点的结构特征,为第 i个节点的语义特征,为矩阵连接操作。

其中,语义特征可以采用知识图谱嵌入算法学习智慧城市异质图的实体之间的语义关系表示得到,结构特征可以采用图嵌入算法通过随机游走学习智慧城市异质图的结构信息得到,而后通过融合语义-结构嵌入到图卷积网络中,可以进一步提升模型的泛化性能。

最终将得到的隐状态表示通过线性层映射为类别的概率,进而得到模型优化的目标函数为负对数似然损失,可以如下式所示:

其中,为负对数似然损失,为图卷积网络的模型参数,为在模型参数为对应的负对数似然损失最小,为节点的数量, W为参数矩阵,为参数矩阵 W的转置矩阵,为第 i个节点对应的隐状态表示,为第 i个节点对应每个类别的概率。

下面分别对本发明实施例提供的语义特征嵌入方法、结构特征嵌入方法和图卷积网络的训练方法进行说明。

在本发明实施例提供的智慧城市数据处理方法中,可以采用知识图谱嵌入算法学习语义特征嵌入。给定三元组集合,其中 E代表实体集合, R代表关系类型集合,知识图谱嵌入旨在找到一个映射,将智慧城市异质图中的实体和关系的表示为低维稠密向量。通过这种表示使得智慧城市异质图能够方便下游任务的使用。

知识图谱嵌入算法可以采用TransE算法,其优化的目标是使得向量表示满足,可以采用基于间隔的排序损失(triplet ranking loss)进行学习。

则在本发明实施例提供的智慧城市数据处理方法中,自智慧城市异质图中提取语义特征,包括:

基于智慧城市异质图,得到由第一节点 h、第二节点 t以及第一节点和第二节点间的关联关系 r构成的三元组数据;

采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征。

TransE算法学习过程中包含对关系类型的建模,而开放关系抽取得到的关系类型比较多样化,对于直接应用抽取数据的情况,本发明实施例将其视为只有默认的一种关系类型,即不考虑关系类型的区别。对于关系类型经过规范化处理后的图数据,则可以直接使用多种关系类型。此外图数据中,会存在较多的一对多或者多对多关系,该问题在其他方法中例如TransR、TransD等提供了相应的解决方案。

在本发明实施例中,采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征,可以包括:

将三元组数据表示为随机初始化向量;

对随机初始化向量进行采样,得到负样本;

以 h+ t≈ r为目标函数和语义损失函数对负样本进行学习,得到智慧城市异质图的语义特征;

其中,语义损失函数为:

其中,为间隔参数,为取正数计算,为负样本集合,为采样得到的头实体,为采样得到的尾实体。

TransE通过无监督的学习算法,获取节点的表示形式。该算法学习了节点之间的语义关系,这种表示形式是原始的图卷积网络所无法提取的,图卷积网络主要利用有监督的学习任务,被动地从图数据中提取邻域的信息。最终,通过结合知识图谱嵌入表示,从而提升节点表示的泛化能力。

在本发明实施例提供的智慧城市数据处理方法中,可以采用图嵌入算法通过随机游走学习智慧城市异质图的结构信息得到智慧城市异质图的结构特征。自智慧城市异质图中提取结构特征,可以包括:以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征。

即是说,图嵌入算法旨在找到一个映射:,将图中的节点转换为低维稠密的嵌入表示,使得图中相似的节点在低维空间距离相近。

其中,以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征,可以包括:

以基于中心节点的嵌入能够最大概率观测到网络邻域为目标,采用偏置随机游走模型学习各节点的关系结构;

根据各节点的向量表示和各节点的关系结构的向量表示计算得到智慧城市异质图中的结构特征。

在本发明实施例中,采用node2vec算法。通过将连续跳字模型(Skip-gram)的思想用于图数据中,该算法优化的目标是基于中心节点 u的嵌入能够最大概率的观察到网络的邻域。

图嵌入表示通过无监督的学习算法,捕获了智慧城市异质图的结构相关性信息。图卷积网络在有监督的学习过程中无法提取随机游走的结构相关性。最终,通过图嵌入表示增强了节点特征的泛化性。

在本发明实施例提供的智慧城市数据处理方法中,智慧城市图计算模型的训练方法,可以包括:

获取初始的图卷积网络;

为初始的图卷积网络设置初始参数;

根据语义特征和/或结构特征以及节点的特征对图卷积网络进行训练,得到对节点的预测类别;

利用节点的实际类别与节点的预测类别的损失对图卷积网络的模型参数进行优化,直至满足对节点的类别预测目标,得到智慧城市图计算模型。

对于基于谱的图神经网络研究方法,图数据被看作无向的,图卷积网络(GCN)模型是一种特殊的图神经网络,正则化图拉普拉斯矩阵具有较好的数学特性,可以作为对智慧城市异质图中的图数据的一种鲁棒性数学表示,如下所示:

其中, A是邻接矩阵,对角矩阵 D是度矩阵,计算过程如下式所示:

其中,鲁棒性表示的图拉普拉斯阵是一个实对称半正定矩阵,这类矩阵根据数学性质可以进行谱分解,如下式所示:

其中 U是特征向量构成的矩阵,特征向量构成一组正交基,Λ为 L的特征值矩阵。图卷积的计算过程如下式所示:

其中, I为单位矩阵。是的度矩阵,计算过程同上述公式。是每一层的隐状态,是原始输入特征 X,是非线性激活函数。

图卷积网络将最后一层编码的隐状态向量输入线性层,映射为类别概率可以实现节点分类任务。也有相关研究加入残差连接或者门控机制,训练深层的图卷积网络并建模时序信息。

在本发明实施例中,优化用于学习智慧城市异质图的特征的图卷积网络的类别预测目标,可以通过下式表示:

其中,为负对数似然损失,为图卷积网络的模型参数,为在模型参数为对应的负对数似然损失最小,为节点的数量, W为参数矩阵,为参数矩阵 W的转置矩阵,为第 i个节点对应的隐状态表示,为第 i个节点对应每个类别的概率。

本发明实施例提供的智慧城市数据处理方法,还通过自智慧城市异质图中抽取语义特征和结构特征嵌入图卷积网络学习进行节点分类训练,增强了图卷积网络对节点表示的泛化能力,从而能够基于构建的智慧城市异质图进行图卷积网络深度分析,可以广泛应用于各种智能平台场景中。

下面对本发明实施例五进行说明。

基于本发明上述实施例给出的智慧城市异质图的构建方法以及智慧城市图计算模型的构建方法,给定多源多场景的智慧城市信号源,首先可以采用知识图谱中的本体建模技术、关联关系挖掘算法、预训练语言模型特征提取方法构建出智慧城市异质图。然后,基于智慧城市异质图,采用预训练的语言模型表示的节点特征、采用知识图谱嵌入算法学习的语义特征、采用图嵌入算法学习的结构特征嵌入图神经网网络(SS-GCN)进行训练和预测,整个计算过程可以在人工智能服务器中完成。

基于本发明实施例提供的智慧城市异质图的构建方法,通过本体构建、关联关系挖掘算法、预训练语言模型特征表示,构建出跨场景的异质图。本发明实施例提供的实体关联关系挖掘方法可以应用于各领域的智慧城市的知识抽取场景,既能实现大规模自动化知识图谱构建,也可以插入到其他自然语言处理模型的流程之中。

通过本发明实施例提供的智慧城市异质图的构建方法,通过连接不同节点的信息,可以从中构建出不同的异质图数据,并且基于智慧城市图计算模型的进行深度分析,支持对图数据的可视化功能。

在本发明实施例提供的智慧城市数据处理方法中,S204中接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,可以包括:

接收用户设备发送的智慧城市监控任务;

识别智慧城市监控任务中的节点属性和监控项目;

调用智慧城市图计算模型对智慧城市异质图中属于节点属性的节点根据监控项目进行节点分类和/或节点聚类处理,得到节点分类结果和/或节点聚类结果;

输出节点分类结果和/或节点聚类结果。

在本发明实施例的一些实施方式中,在数据中心、监控中心等场所,可以应用本发明实施例提供的智慧城市数据处理方法实现将智慧城市异质图中的所有图数据进行可视化展示以及执行监控预警等智慧城市数据分析任务。对于跨领域的监控任务,通过获取其监控权限确定监控对象,监控对象的信息可以包括节点名称或节点属性。对于确定节点名称的目标节点可以直接加入图计算分析中,对于确定节点属性的节点可以基于智慧城市图计算模型进行图计算确定对应的节点。在执行监控预警任务中,通过监控预警任务设置的监控预警阈值,实现对智慧城市异质图中的节点进行分类、聚类、链接等处理,如将超出监控预警阈值的节点和未超出监控预警阈值的节点进行不同形式的可视化展示。

S204中接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,还可以包括:

接收用户设备发送的待解答问题;

调用智慧城市图计算模型搜索待解答问题的相关节点的信息以及相关节点的邻域信息;

调用预训练的第二语言模型根据相关节点的信息和相关节点的邻域信息生成回答信息;

输出回答信息。

在本发明实施例的一些实施方式中,用户可以基于本发明实施例提供的智慧城市平台解决问题。在传统方案中,用户产生的问题仅能在单个领域内获得解决办法,需要用户自行搜集各领域的信息进行整合,如用户需要出行,需要自行查询路况确定交通出行方式,查询目的地的住宿情况,查询旅游景点的旅游政策和人流量等,才能制定合理的出行计划。应用本发明实施例提供的智慧城市数据处理方法,利用智慧城市图计算模型进行跨领域地搜索与用户设备发送的待解答问题相关的节点及其邻域,围绕待解答问题进行跨领域的节点关联计算,继而可以结合第二语言模型将智慧城市图计算模型输出的向量表示解码为回答信息,解决用户的跨领域搜索问题。如用户需要出行,应用本发明实施例提供的智慧城市数据处理方法,可以搜索得到与出行目的地相关的交通状况、当地文旅政策、节假日人流量、天气等多维度信息以通过关联关系计算自动生成合理的出行计划,实现智慧城市的智能化服务。

基于本发明实施例提供的智慧城市图计算模型的构建方法,基于图计算模型对智慧城市异质图的学习,实现了对智慧城市的跨场景建模,利用预训练语言模型抽取节点特征和图嵌入的动态知识表示的方法,通过融合不同场景的实时信息和在全局中的结构信息,产生统一的动态知识表示。通过融合图卷积网络和预训练语言模型的智慧城市图计算模型,可以进行跨场景关联计算与分析。

利用本发明实施例提供的智慧城市数据处理方法,可以实现跨场景的隐含的关联建模,进而实现支持全局最优调控,问题及时发现,资源优化调度等任务,可以解决如智慧城市、智慧公安、智慧文旅、智慧政务、智慧交通、智慧农场等各种类型的智慧城市的跨场景信息融合、分析、通用计算等问题,可应用于优化数据中心图数据智能分析的需求,解决图数据节点分类需求,优化分类的效果。

应用本发明实施例提供的智慧城市数据处理方法,在构建一个智慧城市的初始阶段,利用本发明实施例提供的智慧城市数据处理方法,支持在领域知识不足的情况下开展业务,进行系统冷启动分析。本发明实施例提供的智慧城市数据处理方法还可以包括:利用节点的动态信息以及新加入的节点更新智慧城市异质图,并利用更新后的智慧城市异质图更新智慧城市图计算模型。

上文详述了智慧城市数据处理方法对应的各个实施例,在此基础上,本发明还公开了与上述方法对应的智慧城市数据处理装置、设备及可读存储介质。

下面对本发明实施例六进行说明。

图4为本发明实施例提供的一种智慧城市数据处理装置的结构示意图。

如图4所示,本发明实施例提供的智慧城市数据处理装置包括:

采集单元401,用于自智慧城市对应的多领域的信息源采集数据并存入智慧城市存储系统;

建图单元402,用于自智慧城市存储系统抽取各领域的信息源的数据,构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图;

建模单元403,用于基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型;

处理单元404,用于将智慧城市图计算模型的应用程序接口部署至用户设备,以接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理。

在一些实施中,建图单元402构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,包括:

以信息源实体的本体为实体节点,以信息源实体所属的类别为虚拟节点,以不同实体节点之间的关联关系、实体节点和虚拟节点之间的关联关系为边,构建智慧城市异质图。

在一些实施中,建图单元402构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,包括:

以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系;

利用各节点的信息和各节点之间的关联关系构建智慧城市异质图。

在一些实施中,建图单元402利用网络文档挖掘各节点对中两个节点之间的关联关系,包括:

采用多策略的中文开放关系抽取算法自网络文档中分别抽取各节点对中两个节点之间的关联关系。

在一些实施中,建图单元402利用地图软件挖掘各节点对中两个节点之间的关联关系,包括:

分别自地图软件搜索各节点对中两个节点之间的地理距离;

对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系。

在一些实施中,建图单元402利用人工智能大模型挖掘各节点对中两个节点之间的关联关系,包括:

根据节点对中两个节点的信息生成对应的关联关系识别任务;

将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的关联关系。

在一些实施中,建图单元402以两个节点为一个节点对,利用网络文档、地图软件和人工智能大模型中至少一个挖掘各节点对中两个节点之间的关联关系,包括:

初始化节点接口、网络文档接口、地图软件接口和人工智能大模型接口;

生成第一关联关系列表、第二关联关系列表和第三关联关系列表;

自节点接口接收各节点对的信息;

根据各节点对的信息自网络文档抽取各节点对中两个节点之间的第一关联关系,将第一关联关系写入第一关联关系列表;

分别自地图软件搜索各节点对中两个节点之间的地理距离;

对比地理距离和邻居节点距离阈值,若地理距离大于或等于邻居节点距离阈值,则确定两个节点之间不存在地理邻居关系;若地理距离小于邻居节点距离阈值,则确定两个节点之间存在地理邻居关系;

将存在地理邻居关系的两个节点的信息写入第二关联关系列表;

根据节点对中两个节点的信息生成对应的关联关系识别任务;

将关联关系识别任务输入人工智能大模型,输出节点对中两个节点的第三关联关系;

将第三关联关系写入第三关联关系列表;

输出更新后的第一关联关系列表、更新后的第二关联关系列表和更新后的第三关联关系列表。

在一些实施中,建图单元402构建以信息源实体为节点、以信息源实体之间的关联关系为边的智慧城市异质图,包括:

利用预训练的第一语言模型抽取信息源实体的特征为节点的特征,将节点和边构建为智慧城市异质图;

其中,节点的特征包括节点名称、节点的静态信息和节点的动态信息。

在一些实施中,建模单元403基于智慧城市异质图构建智慧城市图计算模型,在构建过程中,抽取智慧城市异质图中的特征转换为低维嵌入表示后嵌入智慧城市图计算模型,包括:

自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型。

在一些实施中,建模单元403自智慧城市异质图中提取语义特征和/或结构特征,将语义特征和/或结构特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型,包括:

获取节点的特征;

自智慧城市异质图中提取语义特征和结构特征;

将节点的特征、语义特征和结构特征进行融合处理,得到融合特征;

将融合特征嵌入图卷积网络以学习智慧城市异质图的特征,生成智慧城市图计算模型。

在一些实施中,建模单元403自智慧城市异质图中提取语义特征,包括:

基于智慧城市异质图,得到由第一节点 h、第二节点 t以及第一节点和第二节点间的关联关系 r构成的三元组数据;

采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征。

在一些实施中,建模单元403采用知识图谱嵌入算法,以使得向量表示满足为优化目标,学习得到智慧城市异质图的语义特征,包括:

将三元组数据表示为随机初始化向量;

对随机初始化向量进行采样,得到负样本;

以为目标函数和语义损失函数对负样本进行学习,得到智慧城市异质图的语义特征;

其中,语义损失函数为:

其中,为间隔参数,为取正数计算,为负样本集合,为采样得到的头实体,为采样得到的尾实体。

在一些实施中,建模单元403自智慧城市异质图中提取结构特征,包括:

以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征。

在一些实施中,建模单元403以将智慧城市异质图中的节点转换为低维稠密的嵌入表示、使智慧城市异质图中相似的节点在低维空间距离相近为目标,采用图嵌入算法学习智慧城市异质图的图结构嵌入表示,得到智慧城市异质图中的结构特征,包括:

以基于中心节点的嵌入能够最大概率观测到网络邻域为目标,采用偏置随机游走模型学习各节点的关系结构;

根据各节点的向量表示和各节点的关系结构的向量表示计算得到智慧城市异质图中的结构特征。

在一些实施中,建模单元403将节点的特征、语义特征和结构特征进行融合处理,得到融合特征,可以通过下式计算得到:

其中,为融合特征,为第 i个节点的节点特征,为第 i个节点的结构特征,为第 i个节点的语义特征,为矩阵连接操作。

在一些实施中,智慧城市图计算模型的训练方法,包括:

获取初始的图卷积网络;

为初始的图卷积网络设置初始参数;

根据语义特征和/或结构特征以及节点的特征对图卷积网络进行训练,得到对节点的预测类别;

利用节点的实际类别与节点的预测类别的损失对图卷积网络的模型参数进行优化,直至满足对节点的类别预测目标,得到智慧城市图计算模型。

在一些实施中,类别预测目标,可以通过下式表示:

其中,为负对数似然损失,为图卷积网络的模型参数,为在模型参数为对应的负对数似然损失最小,为节点的数量, W为参数矩阵,为参数矩阵 W的转置矩阵,为第 i个节点对应的隐状态表示,为第 i个节点对应每个类别的概率。

在一些实施中,处理单元404接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,包括:

接收用户设备发送的智慧城市监控任务;

识别智慧城市监控任务中的节点属性和监控项目;

调用智慧城市图计算模型对智慧城市异质图中属于节点属性的节点根据监控项目进行节点分类和/或节点聚类处理,得到节点分类结果和/或节点聚类结果;

输出节点分类结果和/或节点聚类结果。

在一些实施中,处理单元404接收用户设备的智慧城市数据处理任务并基于智慧城市图计算模型进行智慧城市数据处理,包括:

接收用户设备发送的待解答问题;

调用智慧城市图计算模型搜索待解答问题的相关节点的信息以及相关节点的邻域信息;

调用预训练的第二语言模型根据相关节点的信息和相关节点的邻域信息生成回答信息;

输出回答信息。

由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。

下面对本发明实施例七进行说明。

图5为本发明实施例提供的一种智慧城市数据处理设备的结构示意图。

如图5所示,本发明实施例提供的智慧城市数据处理设备包括:

存储器510,用于存储计算机程序511;

处理器520,用于执行计算机程序511,该计算机程序511被处理器520执行时实现如上述任意一项实施例所述智慧城市数据处理方法的步骤。

其中,处理器520可以包括一个或多个处理核心,比如3核心处理器、8核心处理器等。处理器520可以采用数字信号处理DSP(Digital Signal Processing)、现场可编程门阵列FPGA(Field-Programmable Gate Array)、可编程逻辑阵列PLA(Programmable LogicArray)中的至少一种硬件形式来实现。处理器520也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器CPU(CentralProcessing Unit);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器520可以集成有图像处理器GPU(Graphics Processing Unit),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器520还可以包括人工智能AI(Artificial Intelligence)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器510可以包括一个或多个可读存储介质,该可读存储介质可以是非暂态的。存储器510还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器510至少用于存储以下计算机程序511,其中,该计算机程序511被处理器520加载并执行之后,能够实现前述任一实施例公开的智慧城市数据处理方法中的相关步骤。另外,存储器510所存储的资源还可以包括操作系统512和数据513等,存储方式可以是短暂存储或者永久存储。其中,操作系统512可以为Windows。数据513可以包括但不限于上述方法所涉及到的数据。

在一些实施例中,智慧城市数据处理设备还可包括有显示屏530、电源540、通信接口550、输入输出接口560、传感器570以及通信总线580。

本领域技术人员可以理解,图5中示出的结构并不构成对智慧城市数据处理设备的限定,可以包括比图示更多或更少的组件。

本发明实施例提供的智慧城市数据处理设备,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如上所述的智慧城市数据处理方法,效果同上。

下面对本发明实施例八进行说明。

本发明实施例还提供一种可读存储介质,该可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如智慧城市数据处理方法的步骤。

该可读存储介质可以包括:U盘、移动硬盘、只读存储器ROM(Read-Only Memory)、随机存取存储器RAM(Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本实施例中提供的可读存储介质所包含的计算机程序能够在被处理器执行时实现如上所述的智慧城市数据处理方法的步骤,效果同上。

以上对本发明所提供的一种智慧城市数据处理方法、装置、设备及可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备及可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

个性化你的检索平台
使用键盘键 进行切换