Question

Je suis à la recherche d'un outil qui me permettra de générer un ensemble de données avec certaines propriétés statistiques. Par exemple, supposons que je veux générer 1 million d'entiers avec x nombre de valeurs aberrantes utilisées dans les essais.

Y a-t-il des outils pour générer des ensembles de données de test comme celui-ci? Je ne dois pas nécessairement quelque chose de fantaisie, juste quelques fonctionnalités de base.

Était-ce utile?

La solution

Math de communes apache a des outils que vous pouvez utiliser pour générer des données des distributions de probabilité simples. Il est en fait assez facile rouler votre propre variante de ces fonctions de génération en utilisant la fonctionnalité aléatoire () de tout système que vous utilisez. En supposant aléatoire () retourne un nombre aléatoire uniformément réparti entre 0 et 1 vous passez juste que par le inverse fonction de distribution cumulative quelle que soit la distribution dont vous avez besoin pour obtenir les nombres aléatoires dont vous avez besoin. Si vous avez besoin quelque chose que vous pouvez utiliser très chic Markov chaînes .

Autres conseils

La technique la plus facile, au moins le plus facile à comprendre, mathématiquement, est acceptation-rejet algorithme algorithme.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top