企业级数据库，可以处理卢旺达国防军的大数据集？

https://stackoverflow.com/questions/1676512

16-09-2019
|

题

是否有任何企业级别的数据库引擎(Oracle,MS SQL...等等)，可以处理卢旺达国防军的大数据集(320万)和SPARQL查询？我想我的问题是：是SPARQL/卢旺达国防军/猫头鹰准备好提供服务的大型真正的世界数据仓库的一个企业？如果没有，是否有有效的机制，为适应SPARQL/卢旺达国防军针对一个典型的数据仓库的明星的架构。

谢谢！

解决方案

演奏家 -是的数据存储使用过 Bio2RDF 和 DBPedia

其他提示

从Kaarel的建议继今年在ISWC提出使用4store这并不规模远远尽管竞争对手在Gralik的CTO（谁开发4store）说明我和同事们为“一些奇怪的配置设置它的其中一个条目疯狂”但4store将能够如此规模的 - http://4store.org

此外炫技在这个规模支持商店，他们就可以在大多数其所占比重合计约9个十亿三同

主要的LOD（关联开放数据）数据源使用SPARQL查询实时应用

炫技 - http://virtuoso.openlinksw.com 结果 LOD的应用 - http://lod.openlinksw.com/sparql

我保持对W3C维基大triplestores名单：点击 http://esw.w3.org/topic/LargeTripleStores

有已知为能够容纳超过十亿三元组7个7 triplestores。他们四人都是开源的。如果你有更多信息，请更新上述维基页面。

显然，性能取决于你作什么用途。我用的Virtuoso在大规模工业项目，并且它是相当快的。

Neo4j 处理约1亿三倍，航行API 在这里，, 同时还有整个曲线图做到先进的东西喜欢的东西小鬼, 或SPARQL.

免责声明：我的一部分Neo4j队。

Intellidimension 提供了一个解决方案，称为语义服务器这是开发上的Microsoft SQL Server2005年或2008年。它很容易地扩展到数以百计的数以百万计的三倍，而且我知道他们有至少一个客户愉快地运行一个企业的部署有超过一亿的发言。

我是他们的一个客户的工作与数据集>100万美元。我们的计划是朝着10亿的发言。

4store 看起来是一个很好的解决方案，但是此时的文档非常稀疏，当我上次查看它时，无法从图表中删除单个三元组。

我也想看看大数据

以下是他们主页上的一句话，总结了他们的产品。

Bigdata(R) 是一种开源横向扩展存储和计算结构，支持可选事务、非常高的并发性和非常高的聚合 IO 速率。Bigdata 是从头开始设计的一种分布式数据库架构，针对在 100 到 1000 台机器的集群上运行的非常高的聚合 IO 速率进行了优化，但也可以在单服务器模式下运行。Bigdata 提供了一个分布式文件系统（类似于 Google 文件系统），但也可用于工作流队列、数据可扩展稀疏行存储（类似于 Google 广泛认可的 bigtable 项目）以及用于在集群上并行化数据密集型工作流的映射/归约处理。

Bigdata(R) 附带一个非常高性能的 RDF 存储，支持 RDF(S) 和 OWL Lite 推理。Bigdata RDF Store 是目前唯一能够在具有动态键范围索引分区的集群上分布式运行的 RDF 数据库。Bigdata RDF Store 专为满足超大规模语义对齐和联合的要求而设计。RDF 是一种语义 Web 技术，特别适合对图形数据和元数据进行建模，例如关联实体链接模型，其中参与者在不断发展的概念本体的背景下以特定方式相互链接用于与特定问题域相关的实体类型和链接类型。Bigdata RDF Store 可在数据收集系统中使用，以模式灵活的方式创建来自无数来源的结构化、半结构化和非结构化数据的混搭。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow