Utilisations de base de données NoSQL dans la science des données
Question
Comment
La solution Pour être honnête, la plupart des bases de données NoSQL ne sont pas très bien adaptés aux applications dans les grandes données. Pour la grande majorité de toutes les grandes applications de données, les performances de MongoDB par rapport à une base de données relationnelle comme < a href = "http://en.wikipedia.org/wiki/MySQL" rel = "noreferrer"> MySQL est significative est assez pauvre pour mandat de rester loin de quelque chose comme MongoDB entièrement. Cela dit, il y a quelques propriétés vraiment utiles de bases de données NoSQL qui certainement en votre faveur lorsque vous travaillez avec de grands ensembles de données, bien que les chances de ces avantages trop élevés au regard des performances généralement médiocres de NoSQL par rapport à < a href = "http://en.wikipedia.org/wiki/SQL" rel = "noreferrer"> SQL pour les opérations de lecture intensive (les plus similaires aux données typiques gros les cas d'utilisation) est faible. Personnellement, je pourrais vous suggère de vérifier également comme
Autres conseils L'un des avantages de l'approche NoSQL sans schéma est que vous ne commettez pas prématurément et vous pouvez appliquer le bon schéma au moment de la requête à l'aide d'un outil approprié comme Apache Drill . Voir cette présentation pour plus de détails. MySQL ne serait pas mon premier choix dans un grand établissement de données. Considérez, essayer, et peut-être même utiliser plusieurs bases de données. Il est non seulement une question de « performance » en jeu ici. Ça va vraiment de venir à vos besoins. Combien de données parlez-vous? quel genre de données? comment rapide vous en avez besoin? Êtes-vous plus lourd ou lecture écriture lourde? Voici une chose que vous ne pouvez pas faire dans une base de données SQL: Calculer le sentiment. http://www.slideshare.net/shift8/mongodb-machine-learning Bien sûr, la vitesse dans ce cas, peut ne pas être assez rapide pour vos besoins, mais il est quelque chose qui est possible. Avec une mise en cache des valeurs globales spécifiques, il était encore tout à fait acceptable. Pourquoi voudriez-vous faire cela? Commodité. La commodité est vraiment quelque chose que vous allez être convaincu par. C'est exactement pourquoi (à mon avis) les bases de données NoSQL ont été créés. Performance aussi bien sûr, mais je suis en train de repères d'escompte et se concentrer davantage sur d'autres préoccupations. MongoDB (et d'autres bases de données NoSQL) ont des fonctionnalités très puissantes telles que carte intégrée / réduire. Cela pourrait se traduire par une économie à la fois dans le temps et le coût plus utiliser quelque chose comme Hadoop. Ou il pourrait fournir un prototype ou MVP pour lancer une entreprise plus grande. Qu'en est-il des bases de données de graphique? Ils sont « NoSQL » aussi. Regardez les bases de données comme OrientDB. Si vous voulez faire valoir la performance ... Je ne pense pas que tu vas me montrer une base de données SQL qui est plus rapide = il) ... et bases de données graphiques ont une application vraiment étonnante basée sur ce que vous devez faire. Règle de la technologie (et Internet) ne soit pas trop à l'aise avec une chose. Tu vas être limité et vous mettre en place pour l'échec.