1.知识图谱系统
0.OpenSPG
简介
OpenSPG (Semantic-enhanced Programmable Graph) 是蚂蚁集团与开放知识图谱(OpenKG)合作开发并开源的知识图谱引擎。它基于SPG框架设计实现,凝结了蚂蚁集团在金融场景中构建和应用领域知识图谱的多年经验,旨在为领域知识图谱提供明确的语义表示、逻辑规则定义和操作框架能力。核心功能
- 领域模型约束的知识建模:支持对特定领域知识进行结构化和约束性的建模。
- 事实与逻辑融合表示:能够将事实数据与逻辑规则进行融合表示,增强知识的表达能力。
- 可编程的知识图谱框架:提供明确的语义表示、逻辑规则定义、以及包括构建和推理在内的算子框架。
- 可插拔的引擎和算法服务:支持各类厂商的基础引擎和算法服务的可插拔适配,以构建定制化解决方案。
- 原生支持KAG:内置对KAG(Logical Form-Guided Reasoning and Retrieval Framework)的支持,用于构建专业领域知识库的逻辑推理和事实问答解决方案。
- 大模型统一知识抽取与图谱可视化:提供基于大模型的统一知识抽取功能,并具备直观的产品可视化界面,便于用户探索和分析复杂关系网络。
技术原理
OpenSPG 的核心技术原理是基于SPG(Semantic-enhanced Programmable Graph)框架。该框架通过以下几个方面实现其功能:- 语义增强:强调对知识的显式语义表示,使得机器能够更好地理解和处理领域知识。
- 可编程性:允许用户定义和编程知识图谱的结构、行为和推理逻辑,这包括:
- DAG构建执行能力:支持基于构建算法逻辑的DAG(有向无环图)构建执行能力,实现知识图谱的高效构建和更新。
- 多模态融合:通过KAG等框架,与大语言模型(LLM)结合,实现知识的符号表示与大模型的双向驱动,增强LLM在实际应用中的可控性。
- 模块化与可扩展性:设计上支持底层引擎(如图数据库、存储引擎)和算法服务的灵活替换和集成,以适应不同场景的需求。
应用场景
- 金融风控与反欺诈:利用知识图谱进行复杂金融关系网络的分析,识别潜在风险和欺诈行为。
- 智能问答系统:结合KAG框架和大语言模型,构建专业领域的逻辑推理和事实问答解决方案,例如企业内部知识库问答。
- 领域知识管理:帮助企业或组织构建、管理和维护其特定领域的知识体系,实现知识的数字化和智能化。
- 数据治理与集成:通过标准化业务实体属性的语义富集,实现跨知识图谱的无缝集成,打破数据孤岛,提升业务效率。
- 智能决策支持:为业务决策提供多维度的知识支撑和推理能力,辅助更精准的判断。
- 大模型增强:作为大语言模型的外挂知识库和推理引擎,提升大模型在特定领域的准确性、可控性和解释性。
- OpenSPG/openspg: OpenSPG is a Knowledge Graph Engine developed by Ant Group in collaboration with OpenKG, based on the SPG (Semantic-enhanced Programmable Graph) framework. Core Capabilities: 1) domain model constrained knowledge modeling, 2) facts and logic fused representation, 3) kNext SDK(python): LLM-enhanced knowledge construction, reasoning and generation
- OpenSPG/openspg: OpenSPG is a Knowledge Graph Engine developed by Ant Group in collaboration with OpenKG, based on the SPG (Semantic-enhanced Programmable Graph) framework. Core Capabilities: 1) domain model constrained knowledge modeling, 2) facts and logic fused representation, 3) kNext SDK(python): LLM-enhanced knowledge construction, reasoning and generation
- 企业供应链
- 黑产挖掘
-----------------------------------------------------------
0.Oxigraph
简介
Oxigraph是一个用Rust语言开发的图数据库,专注于实现SPARQL标准。其目标是提供一个符合规范、安全且快速的磁盘图数据库,并支持RDF数据的读取、写入和处理。核心功能
- SPARQL标准实现: 全面支持SPARQL 1.1查询(Query)、更新(Update)和联邦查询(Federated Query)。
- RDF文件处理: 提供用于读写和处理RDF文件的实用函数。
- 多格式支持: 支持多种RDF序列化格式,包括Turtle、TriG、N-Triples、N-Quads和RDF/XML,用于数据摄取和检索。PyOxigraph还扩展支持JSON-LD 1.0。
- 持久化存储: 提供基于RocksDB的持久化存储能力,确保数据安全和快速访问。
技术原理
Oxigraph基于Rust语言构建,以提供高性能和内存安全性。其核心存储层利用高性能的键值存储系统RocksDB,实现数据的持久化和快速检索。为了支持与其他编程语言的集成,特别是Python,Oxigraph提供了基于PyO3的绑定(PyOxigraph),使得Python开发者也能方便地使用其功能。它严格遵循W3C的SPARQL和RDF相关规范。应用场景
- 语义网应用: 构建和查询符合语义网标准的知识图谱和关联数据。
- 知识图谱管理: 用于存储、管理和查询大规模知识图谱,支持复杂关系的推理和发现。
- 数据集成: 作为统一的数据存储层,集成来自不同源的RDF数据。
- 数据分析与发现: 对RDF数据集进行高效查询和分析,发现数据间的深层联系。
- oxigraph/oxigraph: SPARQL graph database
------------------------------------------------------------
1.Apache Jena
简介
Apache Jena是一个免费且开源的Java框架,用于构建语义网和关联数据(Linked Data)应用。它提供了一系列工具和库,支持对RDF(资源描述框架)、SPARQL(RDF查询语言)和OWL(Web本体语言)的操作,旨在帮助开发者创建和管理知识图谱、本体以及实现数据集成。此外,该工具集也被应用于特定领域知识图谱的构建,例如结合问答系统应用于建筑企业数据管理。核心功能
- RDF数据模型操作: 提供API用于读取、操作和写入RDF图(模型),支持从文件、数据库、URL等多种来源获取数据。
- SPARQL查询引擎: 内置ARQ查询引擎,全面支持SPARQL 1.1协议,包括联邦查询功能。
- 本体支持: 提供Ontology API,支持处理RDFS和OWL本体,用于定义和理解领域知识的结构。
- 数据序列化与解析: 支持多种RDF格式的解析器,如RDF/XML、Turtle和N-triples。
- 推理引擎: 包含基于规则的推理引擎,可实现RDFS和OWL的蕴含推理。
- 持久化存储: 提供TDB(Triple DataBase)作为健壮的、事务性的持久化存储层。
- SPARQL服务器: Jena Fuseki是一个独立的SPARQL服务器,可独立运行或嵌入到应用程序中,提供SPARQL查询、更新和图存储协议服务,并与TDB及Jena文本查询集成。
- 领域知识图谱构建: 支持构建特定领域的知识图谱,例如在建筑领域中构建企业知识图谱,并在此基础上开发可视化问答系统。
技术原理
Apache Jena的核心技术原理围绕着语义网标准展开。它将数据抽象为“模型”(即RDF图),这些模型由三元组(主语-谓语-宾语)构成,用以表达实体及其关系。通过RDF数据模型,Jena能够实现数据的灵活表示和互联。其内置的推理引擎基于RDFS和OWL本体,通过规则和逻辑推导,从现有数据中发现隐含信息,增强知识的深度和准确性。SPARQL作为其查询语言,允许用户以结构化的方式对RDF图进行复杂查询。在数据存储方面,TDB等持久化组件能够高效地存储和管理大规模RDF数据。知识图谱的构建则强调将数据表示为节点(实体)和边(关系)的图结构,从而支持超越传统关系数据库的复杂推理和查询。应用场景
- 语义网和关联数据应用开发: 作为基础框架,用于开发符合语义网和关联数据原则的应用程序。
- 知识图谱的构建与管理: 适用于构建和管理各种通用或特定领域的知识图谱,如建筑企业知识图谱。
- 本体工程: 用于本体的创建、编辑、验证和应用,实现知识的标准化和结构化。
- 数据集成与互操作: 通过RDF、OWL等标准,实现不同数据源之间的集成和信息共享。
- 智能问答系统: 基于构建的知识图谱,开发领域专属的问答系统,提供智能化的信息查询和推荐服务,例如针对建筑企业数据的可视化问答系统。
- 数据分析与推理: 利用推理能力,从现有数据中发现新知识或验证已知事实。
- Apache Jena - Home
- apache/jena: Apache Jena
- 搭建基于Apache的Jena图数据平台apache jena敷衍zgf的博客-CSDN博客
- 基于Python面向《海贼王》领域数据的知识图谱项目【100010385】python海贼王神仙别闹的博客-CSDN博客
- 基于Python构建民航业知识图谱【100010384】神仙别闹的博客-CSDN博客
- 基于Python面向《海贼王》领域数据的知识图谱项目【100010385】python海贼王神仙别闹的博客-CSDN博客
- 基于建筑企业知识图谱的问答系统(建筑企业图谱构建及其应用研究) - 知乎
- 基于建筑企业知识图谱的问答系统
------------------------------------------------------------
1.RDF4j
简介
Eclipse RDF4J是一个针对Java语言的可扩展RDF(资源描述框架)开发框架。它是一个多模块的Maven项目,旨在提供一套全面的工具和API,用于处理、存储和查询RDF数据,支持构建语义网应用程序。核心功能
- RDF数据处理与管理:提供创建、读取、更新和删除(CRUD)RDF三元组和图的能力。
- 可扩展的RDF存储:支持对大规模RDF数据进行高效存储和管理,可能包括内存、文件系统或数据库后端。
- RDF查询:提供强大的查询功能,允许用户通过SPARQL等查询语言检索RDF数据。
- Java集成:作为Java库和框架,方便地集成到各种Java应用程序中。
技术原理
Eclipse RDF4J的核心技术原理围绕RDF数据模型和语义网技术构建:- RDF数据模型:严格遵循W3C的RDF规范,将数据表示为由主语-谓语-宾语组成的三元组,形成图结构。
- Java平台:完全基于Java语言开发,利用Java生态系统的优势,实现跨平台兼容性和高性能。
- 模块化架构:采用Maven多模块项目结构,将不同功能(如核心API、存储层、查询引擎等)分离,提高了可维护性和可扩展性。
- SPARQL支持:内置或支持SPARQL查询语言,允许复杂的数据模式匹配和数据检索。
- 存储后端抽象:可能抽象了不同的存储后端,例如内存存储、持久化文件存储或与各种NoSQL/SQL数据库集成,以实现数据的高效存取和可伸缩性。
应用场景
- 语义网与知识图谱构建:用于开发和管理语义数据,构建和操作知识图谱。
- 数据集成与互操作性:作为不同数据源之间集成和互操作的中间件,实现异构数据的统一表示和查询。
- 企业数据管理:在企业级应用中处理和分析非结构化或半结构化数据,实现更智能的数据驱动决策。
- 学术研究与本体论开发:为本体论(Ontology)的开发、管理和推理提供基础支持。
- 推荐系统与智能助手:利用RDF的语义关联性,构建更精准的推荐系统和智能问答系统。
- eclipse-rdf4j/rdf4j: Eclipse RDF4J: scalable RDF for Java
------------------------------------------------------------
2.国内知识图谱平台
- 2022-15款知识图谱产品盘点
- 2021·最佳知识图谱平台TOP10
- 阿里风报
- 合合信息知识图谱
- !达观数据智能知识图谱平台
- 知识图谱平台 - 云知声-智享未来
- 竹间Gemini 知识工程平台文本数据中台知识应用平台|竹间智能
- 联汇科技—全球人工智能2.0技术领跑者
- 柯基数据KGDATA知识图谱平台
- DataExa-Sati 认知智能平台
- 渊亭科技DataExa-Login 认知推理
- 知识图谱构建系统_百分点科技
- 达观数据智能化知识图谱构建平台
- -第四范式自动知识图谱构建平台-低门槛自动化
- 国双科技
- 海致星图
- 海致科技集团|领先的认知智能技术供应商
- 金山云智知识图谱
- 海又知科技PlantData - 新一代知识图谱认知智能中台
- PlantData - 新一代知识图谱认知智能中台
- Sophon KG-星环科技知识图谱平台-
- 和美信息发布知识图谱V3.2平台-和美(深圳)信息技术股份有限公司
- 明略科技-中国企业数据智能应用软件的领先者
- 知识图谱-云图_同盾科技
- 中数智汇DGraph知识图谱平台
- 金智塔科技-专业的数据要素流通与隐私计算平台,公共数据授权运营,政务数据多跨共享,社会数据合规流通,数据可用不可见
------------------------------------------------------------
业务落地产品toG
简介
该“数据集团”致力于成为成都市智慧城市建设与运营的核心投融资主体,同时也是成都市大数据产业链的“链主”企业以及主要数据资源和产品的供应商。其业务体系围绕数据资源运营服务、数字基础设施、数字治理和数字生活四大板块展开,旨在构建“1+3+N”的业务生态。核心功能
- 投融资功能: 作为成都市智慧城市建设运营的核心投融资平台。
- 生态构建功能: 牵头并主导成都市大数据产业链的健康发展。
- 运营服务功能: 提供主要的数据资源和数据产品,支撑各类数字应用。
- 数字治理: 构建并运营市、区(市)县、镇(街道)三级运行管理平台,例如“智慧蓉城”运行管理平台,并支持市级部门的城运分中心建设与运营。
- 业务体系建设: 围绕数据资源运营、数字基础设施建设、数字治理和数字生活四大核心领域,形成全面的业务服务能力。
技术原理
该集团的核心能力基于对海量数据资源的整合、分析与运营,并通过构建分层级的数字化平台实现城市精细化管理。其技术原理主要体现在:- 数据资源聚合与管理: 建立统一的数据汇聚、存储和管理体系,实现跨部门、跨领域的数据共享与流通。
- 数字基础设施建设: 支撑城市级数字底座的搭建,包括数据中心、网络通信等关键基础设施。
- 平台化运营与服务: 采用平台化思维,通过三级运行管理平台(市、区县、街道)实现城市运行数据的实时感知、智能分析和决策支持,提升城市治理的智能化水平。
- 大数据分析与应用: 运用大数据技术对城市运行数据进行深度挖掘,为智慧城市各项功能的实现提供数据支撑。
应用场景
- 智慧城市建设与运营: 支撑城市级的智慧化规划、建设及日常运行管理,提升城市综合治理能力。
- 大数据产业生态构建: 促进大数据相关企业发展,带动产业链上下游协同创新。
- 政务服务数字化转型: 为各级政府部门提供数据资源和平台支撑,优化公共服务效能。
- 城市运行管理: 应用于城市应急指挥、交通管理、环境监测、公共安全等领域,实现精细化、实时化管理。
- 民生服务与数字生活: 推动数字技术在教育、医疗、文旅、社区服务等民生领域的应用,提升居民数字生活体验。
- 智慧公安-数字化咨询_中建(山东)大数据产业运营服务有限公司
- 解决方案-数字化咨询_中建(山东)大数据产业运营服务有限公司
------------------------------------------------------------
华为
简介
华为云自然语言处理(NLP)是一项基于人工智能技术的云服务,旨在为企业及开发者提供强大的文本分析和挖掘能力。它致力于实现计算机与人类语言的自然交互,帮助用户高效、准确地处理和理解文本信息。核心功能
华为云NLP服务提供多项核心功能,包括:- 文本分析与挖掘: 对非结构化文本数据进行深度分析,提取关键信息。
- 情感分析: 识别文本中表达的情感倾向(如积极、消极、中立)。
- 内容分类: 根据文本内容对其进行自动化分类。
- 实体识别与关系抽取: 从文本中识别出命名实体并分析它们之间的关系。
- 意图识别: 理解用户在自然语言中表达的真实意图。
- 语言生成与理解: 支持机器生成自然语言以及对人类语言的深度理解。
- 机器翻译: 提供不同语言之间的自动翻译能力。
- 智能问答: 实现基于文本内容的智能问答系统。
- API与SDK支持: 通过开放API和多语言SDK(如Java、Python)提供服务能力,简化开发集成。
技术原理
华为云NLP服务依托先进的人工智能技术,特别是深度学习和机器学习算法。它通过复杂的模型和算法处理海量的非结构化文本数据,从而实现对人类语言的理解、解释和合成。服务以REST API的形式对外提供能力,封装了底层的语言处理逻辑和计算资源,使得开发者无需关注复杂的算法实现,即可利用其强大的自然语言处理能力。应用场景
华为云NLP服务的应用场景广泛,涵盖多个领域:- 智能客服与问答系统: 构建高效的智能问答机器人,提升客户服务体验。
- 内容管理与推荐: 对海量文本内容进行自动化分析、分类和推荐。
- 舆情监控与分析: 实时监测网络舆论,进行情感倾向分析。
- 智能办公与文档处理: 自动化文档摘要、翻译及信息抽取,提高办公效率。
- 智能助手: 为各类应用提供自然语言交互能力,如语音助手、聊天机器人。
- 金融风控: 分析非结构化文本数据(如财报、新闻),辅助风险评估。
- 医疗健康: 处理医疗报告、病历数据,辅助诊断与科研。
- 知识图谱知识图谱构建工具一站式知识图谱构建平台-华为云
- 增量更新图谱知识图谱 KG用户指南华为云
------------------------------------------------------------
百度
简介
百度知识图谱系列产品与解决方案,是百度依托其领先的AI技术、搜索核心技术和丰富行业经验,构建的开放数据平台和一体化服务。它们旨在通过知识图谱技术,实现对多源异构数据的深度挖掘、高效整合与智能应用,从而赋能企业智能化业务,提升用户体验,并促进数据生态的共建与共享。核心功能
- 数据整合与开放: 提供高质量的数据资源,支持XML、JSON等多种数据格式,并支持爬虫抓取和合作方主动推送等灵活的数据接入方式,确保数据安全与时效性。
- 知识图谱构建: 具备从结构化、半结构化及非结构化数据中抽取、融合和构建知识图谱的能力,形成全面且深入的知识体系。
- 数据深度洞察: 基于构建的知识图谱,实现对数据的深度挖掘和全方位关联分析,揭示隐藏的价值信息。
- 智能应用赋能: 提供智能检索、智能问答、实体关系刻画等AI应用能力,支持上层业务的智能化决策与服务。
技术原理
- 知识图谱(Knowledge Graph): 核心技术,通过实体识别、关系抽取、知识融合、知识存储等步骤,将零散信息构建成结构化的知识网络。
- 人工智能(AI)与机器学习: 运用自然语言处理(NLP)、深度学习等AI技术,实现非结构化数据的理解、语义分析及知识推理,驱动智能应用。
- 大数据技术: 具备处理、存储和分析海量数据的能力,为知识图谱的构建、更新及应用提供底层支撑。
- 图数据库技术: 可能采用图数据库技术存储知识图谱,以便高效地进行图遍历和复杂关系查询。
应用场景
- 搜索与推荐: 优化搜索引擎的理解能力和结果精准度,提供更智能的搜索体验和个性化内容推荐。
- 企业智能化转型: 帮助企业实现业务的智能化升级,例如风险控制、客户画像分析、智能客服、行业报告生成等。
- 垂直行业解决方案: 在特定领域如智慧司法中,构建法律知识图谱,支持智能类案检索、法律法规问答、司法实体图谱分析等。
- 数据共享与生态合作: 作为开放平台,促进不同机构和开发者之间的数据共享与应用创新,共同构建知识生态。
- 百度知识图谱开放平台
- 安全知识图谱 - 百度安全
- 知识图谱构建与应用-百度AI开放平台
------------------------------------------------------------
腾讯
简介
分别介绍了腾讯云容器服务TKE分布式云中心(TKG)以及企业数字化服务平台云巴巴(Yun88.com)。腾讯云TKG是一个面向多云多集群场景的云原生应用管理平台,旨在提供统一的分布式应用管理能力。云巴巴则是一个致力于企业数字化转型的服务平台,主要为企业提供数字化解决方案的筛选、咨询与采购服务。核心功能
腾讯云容器服务TKE分布式云中心 (TKG):- 多云多集群统一管理: 提供全局视角,对分布在不同云环境和多个Kubernetes集群中的应用和资源进行集中管理与运维。
- 分布式应用部署与调度: 支持将云原生应用弹性扩展至分布式云环境,实现一次部署,多地运行,便于业务的全球化发布。
- Serverless容器服务: 包含TKE Serverless版本,用户无需管理底层计算节点,通过Pod粒度购买和管理计算资源,简化运维。
- 高可用与安全隔离: 基于腾讯云成熟的虚拟化与网络技术,确保容器间的安全隔离,提供高达99.95%的服务可用性。
- 企业数字化转型咨询: 为企业提供数字化转型策略建议与专业咨询服务。
- 一站式产品选型与采购: 聚合海量优质厂商、产品、技术和解决方案,帮助企业高效筛选并采购所需的数字化工具,涵盖SaaS、云计算等多种品类。
- 供需匹配与资源整合: 作为连接企业与技术服务商的桥梁,优化供需双方的匹配效率,助力企业实现降本增效。
技术原理
腾讯云容器服务TKE分布式云中心 (TKG):- 云原生架构设计: 采用基于Kubernetes的云原生设计理念,实现分布式应用的容器化编排、部署与管理。
- 分布式管理模型: 构建于分布式应用管理模型之上,通过控制平面纳管多个物理或逻辑分离的集群,实现资源和应用的统一视图。
- 容器虚拟化与网络隔离: 运用先进的虚拟化技术,为容器提供安全独立的运行环境,并支持通过安全组、网络ACL等配置精细化的网络策略。
- 弹性计算与按需调度: Serverless模式下,计算资源(Pod)根据实际负载按需弹性伸缩,由底层系统自动化调度和管理。
- 大数据聚合与分类: 通过自动化和人工方式收集、整理并分类海量的企业数字化产品与解决方案信息。
- 智能匹配算法: 可能采用用户行为分析和关键词匹配等算法,根据企业需求智能推荐合适的厂商和产品。
- 平台化服务集成: 构建SaaS平台,整合多种企业级应用和服务的信息展示、询价、试用及采购流程,提供流畅的用户体验。
应用场景
腾讯云容器服务TKE分布式云中心 (TKG):- 跨区域业务部署: 适用于需要将业务部署到全球不同数据中心或多个云环境,并进行统一管理的场景。
- 混合云与多云管理: 企业已在不同公有云或私有云中拥有集群,希望通过一个平台统一纳管和调度应用。
- 成本优化与弹性伸缩: 对计算资源有潮汐效应的业务,通过Serverless模式实现按需付费,降低运维成本。
- 微服务与容器化应用: 适用于大规模微服务架构应用部署、管理和运维,需要高可用和弹性伸缩能力的场景。
- 企业数字化转型初期: 缺乏数字化经验,需要专业咨询和从海量产品中选择适合自身业务解决方案的企业。
- IT采购与供应商评估: 企业需要采购各类SaaS软件、云服务、AI解决方案等,但缺乏评估标准和优质供应商渠道。
- 降本增效需求: 寻求通过数字化工具提升运营效率、优化业务流程、降低IT投入成本的企业。
- SaaS产品市场推广: 科技厂商和SaaS服务商希望通过平台扩大品牌影响力,获取潜在客户。
- 知识图谱图数据库图计算图可视化-腾讯云
- 腾讯云知识图谱TKG图可视化分析图计算引擎-云巴巴
------------------------------------------------------------
阿里
简介
阿里云数据资源平台(DataQ)或大数据开发治理平台(DataWorks)是阿里云推出的一站式数据资产管理与服务平台。它旨在为企业提供从数据定义、加工、管理到服务的全生命周期能力,支撑构建统一的数据中台,并为各类智能数据应用提供持续、标准、高质量的数据供给。核心功能
- 数据资产全链路管理: 覆盖数据同步、探查、标准、建模、加工、质量评估、标签构建、资产管理及数据服务。
- 智能化数据开发与治理: 提供ETL数据开发、数据分析工具,并具备主动式数据资产治理能力。
- 业务洞察与模型构建: 支持业务模型的构建和用户画像分析。
- 多源数据与计算引擎适配: 兼容多种数据源(如OSS、MySQL、SQLServer、Oracle),并深度适配MaxCompute、Flink、EMR等主流大数据计算引擎。
技术原理
- 云原生大数据架构: 平台构建于阿里云IaaS、PaaS服务之上,利用云的弹性与高可用性。
- 湖仓一体(Lake-House)架构: 融合数据湖和数据仓库的优势,实现结构化与非结构化数据的高效存储、管理和分析。
- 分布式计算与存储: 依托MaxCompute、Flink等分布式计算框架和对象存储OSS,实现海量数据的并行处理与弹性扩展。
- 统一元数据管理与数据治理: 通过数据标准、血缘分析、质量监控等机制,确保数据资产的规范化和高可用性。
应用场景
- 企业数据中台建设: 构建企业级数据仓库、数据湖或湖仓一体架构,实现数据资源的统一汇聚与管理。
- 商业智能与数据分析: 为BI报表、数据大屏、用户画像、精准营销等提供高质量数据支撑。
- 大数据开发与运维: 满足数据工程师在数据集成、清洗、转换、加载(ETL)、任务调度、监控等日常开发运维需求。
- 数据服务与API开放: 将处理后的数据以标准API形式对外提供服务,赋能业务应用。
- 知识图谱开放平台dataG-知识建模-知识图谱系统-阿里云
------------------------------------------------------------
2.实例
- NewsMiner
- Magi KG | Peak Labs
- 思知机器人 | 对话机器人 | 聊天机器人 | 知识图谱 - OwnThink
- 知識工場
- XLore
- 北京旅游知识图谱
- 博拉图知识生产平台
- 北京大学知识图谱自动化构建平台gBuilder - 工具 - 开放知识图谱
------------------------------------------------------------
北京大学图数据库-gStore
简介
gStore是由北京大学王选计算机所数据管理实验室(PKUMOD)研发的一款面向知识图谱的高效图数据库系统。它是一个开源的原生图数据库引擎,专门用于管理大规模RDF(Resource Description Framework)数据集,并支持SPARQL查询语言。gStore提供可下载版本、云端系统,并已适配多种国产自主可控计算平台。核心功能
- 知识图谱管理: 作为原生的图数据库系统,高效管理大规模RDF知识图谱数据。
- SPARQL查询支持: 提供对SPARQL查询语言的全面支持,方便用户进行图数据查询和分析。
- 事务隔离: gStore 1.0版本支持四种事务隔离级别:读未提交(read-uncommitted)、读已提交(read-committed)、可重复读(repeatable read)和可串行化(serializable),确保数据一致性和并发性。
- 查询优化: 引入了两种连接操作(worst-case-optimal joins 和 binary joins)以优化查询执行和提升性能。
- 用户自定义图分析算子: gStore 1.0版本新增支持用户自定义图分析算法功能。
- 多平台兼容: 提供一键安装的可下载版本和拆箱即用的云端系统,并已与鲲鹏、飞腾等多个国产自主可控计算平台进行适配。
技术原理
gStore采用原生图数据模型(Native Graph Model)来存储和管理数据,而非传统基于关系数据库的方法。其核心实现语言为C++,并借助readline、antlr等库。在数据库内核层面,gStore 1.0对事务处理和查询优化进行了重建与改进,包括支持多种事务隔离级别,以及引入特定连接算法(如worst-case-optimal joins和binary joins)来优化查询计划生成逻辑和执行效率。此外,其系统设计专注于大规模RDF数据集的管理和高效SPARQL查询处理。应用场景
- 金融领域: 用于构建金融知识图谱,支持风险控制、反欺诈等。
- 公安领域: 应用于案件分析、情报关联等场景。
- 医疗健康: 构建医疗知识图谱,辅助疾病诊断、药物研发、病历管理等。
- 政府公共服务: 实现政务数据整合、智能决策支持。
- 教育领域: 用于构建学习资源图谱、知识点关联分析等。
- 大规模知识图谱应用: 适用于任何需要高效存储、查询和分析大规模复杂关系数据(如RDF数据)的场景。
- 图数据库引擎gStore系统
- 登录界面
- gStore/README.md at 1.0 · pkumod/gStore
------------------------------------------------------------