Quel est le meilleur système de base de données gratuit qu'il est préférable de stocker et de calculer / analyser des comparaisons de texte volumineuses à partir desquelles la base de données créerait des statistiques exploitables? [fermé]

StackOverflow https://stackoverflow.com/questions/202715

  •  03-07-2019
  •  | 
  •  

Question

Je suis parvenu à créer un script permettant de comparer des milliers de textes volumineux (entre eux). Et je me demande si MySQL est la meilleure solution pour cela. Existe-t-il un autre système de base de données gratuit que je pourrais utiliser pour faire de l’informatique simple mais qui prend beaucoup de temps de processeur?

S'il vous plaît, jetez-moi dans le réservoir de vos connaissances!

Modifier: Nature des documents - Documents de 500 à 7 000 caractères, - > comparer les documents si le texte correspond à l'autre document (plagiat) et aux statistiques - > % correspondance de toute phrase trouvée avec de jolies configurations comme celle-ci. J'aimerais définir combien de caractères l'autre chaîne pourrait être différente sera toujours considérée comme une correspondance.

La technologie devrait être basée sur un serveur, la base de données m'intéresse plus, puis je choisirais un langage approprié pour le script.

Plus de spécification: la taille de la base de données doit être illimitée.

Était-ce utile?

La solution

Vous devriez envisager d’utiliser Lucene. Il vous permet de stocker de grandes quantités de texte et de les interroger très rapidement. Avec une bonne correspondance aussi.

Autres conseils

Vous ne mentionnez pas la technologie que vous utiliserez; taille des entrées de texte ou nature des comparaisons. Toutefois, j’ai trouvé que la base de données h2 était excellente. Il est java natif et peut être utilisé comme base de données en mémoire, ce qui rend la configuration simple.

PostgreSql est un moteur de base de données gratuit, bien évolutif et largement utilisé, en plus de MySQL.

SQL Server Express

Je recommanderais MySQL. Il possède de nombreuses fonctions de gestion de chaînes intégrées.

Parce que vous ne précisez pas, pourquoi pas SQL Server 2008 Express Edition ?

Toutes les fonctionnalités de recherche du grand frère SQL Server 2008 avec le seul problème que vous ne pouvez pas dépasser 4 Go de base de données.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top