本体/语义/OWL/RDF 有杀手级应用吗?[关闭]
-
23-09-2019 - |
题
在阅读了大量书籍、博客和网上的文章后,我对语义技术产生了兴趣,这些技术将使数据变得机器可以理解,允许智能代理进行强大的推理,自动化和动态服务组合等。
两年来我仍在阅读同样的内容。文章/博客/语义会议的数量大幅增加。但我仍然看不到任何杀手级应用程序。为什么会这样呢?或者是否已经存在一些应用程序/产品(商业/开源),它们实际上正在做所有被吹嘘的事情?
更准确地说,是否有任何产品利用语义技术(尤其是 RDF/OWL/SPARQL)并提供现有(非语义)技术不可能实现的功能/性能/可维护性?一些完全依赖语义技术并真正为客户增加价值并产生收入的产品?
没有正确的解决方案
其他提示
我认为 德鲁帕尔7 有机会成为杀手级语义应用程序,它是具有相当大安装基础的 CMS 的下一个版本,当最终版本发布并且每个人都开始突然升级时,大量站点将自动以嵌入式 RDFa 的形式公开 RDF,无需任何干预就用户而言。
从商业角度我认为事情 链接数据 像这样的东西 良好关系 是一个潜在的杀手级应用程序,例如,请参阅这些 斯科特·布林克 和 普里扬克·莫汉 博客文章讨论了 BestBuy 在开始嵌入后如何实现流量增加 30% 良好关系 基于 链接数据 在他们的网页中作为 RDFa。
一般来说 链接数据 是用机器可读数据增强网站的绝佳方法,并在网站可见性方面显示出显着的效果,我最近看到了 BBC 人员的一些演示,他们的 野生动物发现者 应用程序(使用 BBC 自然历史资源的链接数据应用程序)在 Google 搜索结果中的动物搜索结果已经优于某些维基百科页面
在生物学中,RDF和相关技术的兴趣是非常高的。人们想都不到分析和自定义代码来整合数据,以及更高级的查询。 RDF已经提供了前者;例如,的UniProtKB ,最大的生物医学资源之一,在RDF提供他们的数据。对于高级查询我们还没有应用,因为良好的RDF数据和OWL本体的性能和可用性仍然是一个有点欠缺。但是它的开始,请 BioGateway 有关可为例来进行。
在光,这些技术成果是不是个别的杀手级应用,但所有累积的时间节省了研究人员谁可以探索的数据,而不是写特设脚本,并设立临时SQL数据库而这一切的管道。
刚发现 DBpedia中。这是一个有前途的尝试从维基百科表示大量的数据为RDF。您可以下载整个提取为16GB的文件,但它也有一个关键字搜索页面。被表示为RDF允许非常具体的“语义”查询。 这显示了一些示例查询,比如你将如何找到的官方网站列表的公司拥有超过50000名员工。你甚至可以查询“云”远程与任何包装,可以用它的公共API接口,如这个Python模块
在语义网络依赖于内容提供者采取努力以正确注释一切以使其机器可读
这是不属于图书馆大多数人的工作太多了。
在真正的杀手级应用似乎有什么东西是可以得到从非结构化内容的语义没有特殊标记。看看了不起的工作,谷歌的例子,其搜索引擎来完成。
为了使系统工作,它不能把一个沉重的负担,它的用户。
一个中间接地被标记系统如这里#1。他们工作得很好,即使标签是完全即兴和部分不一致。
深层语义支持有趣了许多其中需要强大的查询功能的地方。一个例子是在项目我工作的地方最近曾用于查找在服务到调度工作量语义为基础,以。 RDF / SPARQL本身很有趣,因为它可以让你很有钱查询了蝙蝠的权利,但是当你添加一个OWL本体中它会变得更好,因为它意味着你可以回答更丰富的查询(即,提问更贴近用户什么 - 和他们的雇主 - 真正想要的),同时允许服务提供商来表达他们提供更清晰了。这并不是说,这意味着每个人都告诉大家一切,一点都没有。取而代之的是,我们必须描述什么是提供,而不是服务,他们使用什么样的配置,以提供这些服务方。并将其所有通过使用语义技术的普遍地在整个信息系统授权。
目前我正在 Taverna的这是目前使用RDF提供各式的测井系统;特别是,用户(特别是科学家)可以通过比,如果他们通过一个巨大的文本文件必须只grep
记录更容易的丰富信息进行搜索。毕竟,这将是一个有点荒唐,如果你不得不使用文本挖掘,找出到底发生了什么在你的文本挖掘工作流程...
我用印象 AceWiki 。这几个项目的wiki在那里,正尝试语义组织人员输入的信息之一。
它仍然是一个进展中的工作,并具有一定的局限性。例如,只允许人进入符合英语词汇和语法的一个子集句。
然而,希望这些起飞。有免费的数据如此庞大的在那里(例如维基百科),我们不能在它创建方案,原因是因为内容过于嘈杂。
的的Protege 强> 是好用于开发本体。