Já existe algum aplicativo matador para Ontologia/semântica/OWL/RDF?[fechado]

https://stackoverflow.com/questions/2543507

23-09-2019
|

Pergunta

Me interessei por tecnologias semânticas depois de ler muitos livros, blogs e artigos na rede dizendo que isso tornaria os dados compreensíveis pela máquina, permitiria que agentes inteligentes fizessem ótimos raciocínios, composição de serviços automatizada e dinâmica etc.

Ainda estou lendo as mesmas coisas há 2 anos.O número de artigos/blogs/conferências semânticas aumentou consideravelmente.Mas ainda não consigo ver nenhum aplicativo matador.Por que é tão?Ou já existe algum aplicativo/produto (comercial/código aberto) que realmente está fazendo tudo o que se vangloria?

Para ser mais preciso, existe algum produto que aproveite tecnologias semânticas (especialmente RDF/OWL/SPARQL) e forneça funcionalidade/desempenho/manutenção, o que não teria sido possível com as tecnologias existentes (sem semânticas)?Algum produto que é totalmente dependente de tecnologias semânticas e realmente agrega valor aos clientes e gera receita?

Nenhuma solução correta

Outras dicas

Eu penso Drupal7 tem uma chance de ser um aplicativo semântico matador, é a próxima versão de um CMS com uma base instalada considerável e quando o lançamento for final e todos começarem a atualizar, de repente, toneladas de sites exporão automaticamente o RDF na forma de RDFa incorporado sem qualquer intervenção por parte dos usuários.

Do ponto de vista empresarial, penso que as coisas dados vinculados coisas como Boas relações são um aplicativo potencialmente matador, por exemplo, veja estes Scott Brinker e Priyank Mohan postagens de blog que discutem como a BestBuy obteve um aumento de 30% no tráfego após iniciar a incorporação Boas relações baseado dados vinculados como RDFa em suas páginas da web.

Em geral dados vinculados é uma excelente maneira de aumentar seu site com dados legíveis por máquina e mostra resultados notáveis na visibilidade do seu site. Recentemente, vi algumas apresentações de caras da BBC cujos localizador de vida selvagem aplicativo (um aplicativo de dados vinculados que usa recursos de história natural da BBC) já supera algumas páginas da Wikipedia para animais nos resultados de pesquisa do Google

Em biologia, o interesse em RDF e tecnologia relacionada é muito alta. As pessoas querem menos análise e código personalizado para integrar dados e consultas mais avançadas. RDF já está fornecendo o primeiro; por exemplo, Uniprotkb, um dos maiores recursos biomédicos está oferecendo seus dados no RDF. Para uma consulta avançada ainda não estamos lá, pois ainda falta desempenho e disponibilidade de bons dados de RDF e ontologias de coruja. Mas está começando, confira BioGateway Para um exemplo do que pode ser feito.

Nessa luz, os frutos dessas tecnologias não são aplicativos matadores individuais, mas todas as economias de tempo acumuladas para pesquisadores que podem explorar os dados em vez de escrever scripts ad hoc e configurar bancos de dados SQL temporários e todo esse encanamento.

Acabei de descobrir DBpédia.É uma tentativa promissora de representar muitos dados da Wikipedia como RDF.Você pode baixar toda a extração como um arquivo de 16 GB, mas também possui um página de pesquisa por palavra-chave.Ser representado como RDF permite consultas "semânticas" muito específicas. Esse mostra alguns exemplos de consultas, como encontrar uma lista de sites oficiais de empresas com mais de 50.000 funcionários.Você pode até consultar "a nuvem" remotamente com qualquer wrapper que possa interagir com sua API pública, como este módulo Python.

A Web semântica depende de provedores de conteúdo que se esforçam para anotar adequadamente tudo para torná-lo legível por máquina.

Isso é muito trabalho para a maioria das pessoas que não são bibliotecários.

O aplicativo assassino real parece ser algo que pode derivar semântica de conteúdo não estruturado sem marcação especial. Veja o incrível trabalho que o Google, por exemplo, fez com seu motor de pesquisa.

Para que um sistema funcione, ele não deve colocar uma carga pesada em seus usuários.

Um meio termo são sistemas de marcação como aqui no Stackoverflow. Eles funcionam muito bem, mesmo que as tags sejam completamente adhoc e em partes inconsistentes.

O suporte semântico profundo é interessante para vários lugares onde são necessárias consultas poderosas. Um exemplo estava em um projeto Eu estava trabalhando recentemente em que o serviço usado para procurar onde despachar a carga de trabalho era semanticamente baseado. O próprio RDF/SPARQL é interessante porque oferece uma consulta bastante rica logo de cara, mas quando você adiciona uma ontologia de coruja, fica ainda melhor, pois significa que você pode responder a perguntas mais ricas (ou seja, que fazem perguntas mais próximas do que o usuário - e seu empregador - realmente quer), permitindo que os provedores de serviços expressem o que estão oferecendo com mais clareza também. O que não quer dizer que isso significa que todos dizendo a todos tudo, de jeito nenhum. Em vez disso, tínhamos partes descrevendo quais serviços eram fornecidos e não qual a configuração eles estavam usando para prestar esses serviços. E tudo foi capacitado pelo uso de tecnologias semânticas generalizadas em todos os sistemas de informação.

Atualmente estou trabalhando em Taverna que agora está usando o RDF para fornecer um sistema de registro de preparação; Em particular, os usuários (especialmente cientistas) podem pesquisar a riqueza de informações registradas com muito mais facilidade do que se tivessem que apenas grep através de um enorme arquivo de texto. Afinal, seria um pouco absurdo se você tivesse que usar a mineração de texto para descobrir o que realmente aconteceu no seu fluxo de trabalho de mineração de texto ...

Fiquei impressionado com Acewiki. É um dos vários projetos da Wiki por aí que está tentando organizar semanticamente as informações que as pessoas entram.

Ainda é um trabalho em andamento e tem algumas limitações. Por exemplo, ele apenas permite que as pessoas entrem em frases que estão em conformidade com um subconjunto de vocabulário e gramática em inglês.

No entanto, espero que eles decolem. Existe uma quantidade tão grande de dados gratuitos por aí (por exemplo, Wikipedia) e não podemos criar programas para raciocinar sobre eles, porque o conteúdo é muito barulhento.

Protege é bom para o desenvolvimento de ontologias.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow