Question

Je veux mettre en œuvre une recherche sémantique basé python sur un ensemble de mots-clés (principalement passe-temps, les dernières nouvelles, etc que les gens pourraient être intéressés à parler). Je veux savoir s'il existe une base de données de l'ontologie (s) pour les mêmes et les algorithmes de recherche open source / mises en œuvre pour la même.

Par exemple. Mon set = {parler, boire, tweeting, Katrina Kaif, le cyclone Katrina, la collecte de roche, numismatique}

Alors, sur la recherche « Accumuler » Je pourrais obtenir la collection rock et numismatique comme la sortie.

Edit: Les termes peuvent avoir plusieurs mots. C'est « le président. Barack Obama aux Etats-Unis » est une requête valide.

Était-ce utile?

La solution

Vous pouvez utiliser « indexation aléatoire ». Il peut faire exactement ce dont vous avez besoin, il calcule un vecteur caractéristique pour chaque mot et définit une métrique de similarité sémantique entre deux mots.

Tout ce que vous avez besoin est de récupérer une copie de Introduction à l'indexation aléatoire et semanticvectors package pour vous aider à démarrer ...

J'espère que cette aide, si vous avez besoin d'autres conseils, s'il vous plaît commentaire ...

Autres conseils

Je l'espère, mais je suis pas sûr si cela est utile pour vous.

gnowsys

  • encore sous developement lourd
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top