Question

Salut à tous: Si je stocke des articles News dans une base de données avec différentes catégories telles que « Tech », « Finance » et « Santé », un travail bien serait de base de données distribuée dans ce système vs un SGBDR? Chacun des éléments d'information auraient les articles de presse ci-joint, ainsi que quelques autres éléments. Je me demande si l'interrogation serait plus rapide, cependant.

Le mot Let je n'ai jamais plus d'un million de lignes, et je veux saisir les dernières (moins de 5 heures) des articles de haute technologie. Je suppose que ce serait une carte-reduce de « Donnez-moi tous les articles de haute technologie » (peut-être 10000), puis éliminer seulement ceux qui ont le dernier horodatage.

Suis-je pensé à faire face au problème de la bonne façon, et serait un DDB encore la meilleure solution? Dans quelques années, il pourrait y avoir 5 millions d'articles, mais même alors ....

Était-ce utile?

La solution

Que ce soit pour utiliser un magasin de base de données ou la valeur de clé distribuée dépend plus de vos besoins opérationnels que votre problème de domaine.

Quand les gens demandent comment nous suggérons souvent faire des requêtes a ordonné de temps à Riak, plusieurs stratégies (même si aucun d'entre eux sont une balle d'argent Riak ne dispose pas commandé des requêtes de gamme):

1) Si vous accédez souvent un morceau en particulier la taille du temps, répartir les données dans des seaux qui reflètent cette période. Par exemple, toutes les données du jour, l'heure ou la minute spécifiée seraient soit stockées ou liées à un seau qui contient l'horodatage approprié. Si je voulais toutes les nouvelles de la technologie d'aujourd'hui, le nom du seau pourrait être « tech-20100616 ». Comme vos données vient, ajouter des liens appropriés dans le seau de temps en boîte à l'élément réel.

2) Si les données sont plus orientées séquence et ne sont pas liées à un point spécifique dans le temps, utiliser des liens pour créer une chaîne de données, de liaison descendante dans le temps, en avant, ou les deux. (Cela fonctionne bien pour les données versionnées aussi, comme des pages wiki.) Vous pouvez également garder un objet qui pointe seulement à la tête de la liste.

Ces stratégies de côté, Riak est probablement pas la solution à 100% pour des informations à la minute, mais peut-être mieux pour le stockage à long terme. Vous pouvez le combiner avec quelque chose comme Redis, memcached, ou même MongoDB (qui a d'excellentes performances si vos données sont légèrement transitoire et peut tenir dans la mémoire) pour maintenir un indice de roulement de la dernière des choses.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top