Question

La discussion cette question est la cause directe de me poser cette question. La raison plus générale est le fait que je dois souvent expliquer l'utilisation de R à des gens qui ne connaissent que SPSS. Je sais que la plupart des bases de SPSS, comme nous l'utilisons encore dans les statistiques de cours de base. Mais comme je suis plus un gars de R, il est difficile de savoir comment les utilisateurs SPSS l'expérience de la première rencontre avec R.

Je sais qu'il ya le livre R pour les utilisateurs SAS et SPSS et qui contient déjà quelques informations. Et pourtant, je voudrais savoir ce que les parties les plus difficiles sont lorsque vous passez de SPSS à R.

Ou en d'autres termes: si vous devez expliquer R en un jour aux utilisateurs SPSS, qui sont les sujets que vous concentrer? Ceci est pas une question hypothétique de la façon (oui, je sais, ce n'est pas parce que l'on payé pour cela qu'il est toujours bon ...).

Était-ce utile?

La solution

Tout d'abord, la manipulation des données a été la chose la plus difficile à apprendre en provenance de SPSS / SAS à R. Je l'ai trouvé, personnellement, que l'obtention des données dans la bonne forme pour une analyse est généralement beaucoup plus difficile que l'analyse elle-même . En second lieu, une véritable compréhension de la façon de traiter avec des valeurs catégoriques par l'utilisation de facteurs. Enfin, les statistiques sommaires et peuvent parfois être Descriptive difficiles à obtenir dans un format qui est transmutable PPT ou Excel qui sont ce que (mes) clients attendent généralement / demande de rapports.

Je me concentrerais sur:

1 Manipulation de données

structures de données Comprendre. Importer / Exporter. Ensuite, une formation approfondie sur l'utilisation des emballages comme plyer, avec refaçonner un accent particulier sur la façon d'utiliser efficacement coulé avec des formules et faire fondre avec ids. Comment appliquer des fonctions numériques dans un data.frame en utilisant ddply.

2 Données Factoring

En général, une explication de traiter avec recodage, epicalc ou une fonction définie par l'utilisateur. Par ailleurs, une explication de l'importance des facteurs, des niveaux et des étiquettes

3 Descriptives

Prenez quelques minutes pour présenter xtabs (), table (), prop.table () en utilisant CAST () de Reshape pour créer des tables de données en colonnes qui sont plus raisonnablement exportés vers Excel.

Les graphiques sont en option, si vous avez fait un bon travail de ce qui précède, ils devraient être en mesure d'obtenir les données dont ils ont besoin pour créer des graphiques dans tous les logiciels qu'ils sont plus à l'aise.

4 graphiques

Si vous avez fait un bon travail d'enseignement la manipulation des données, l'obtention de données dans la forme nécessaire pour devrait être assez graphique simple (ou au moins reproductible) à ce stade. ggplot2 est complexe et nécessite une journée par elle-même à jouer avec. Mais il est possible de donner un aperçu rapide de celui-ci. Alternativement, les graphiques de base sont simples à comprendre et à l'aide est beaucoup plus clair sur ce que les choses faire et comment les travaux de syntaxe.

Note: J'ai quitté l'analyse statistique. Cependant, une vue d'ensemble lm () et peut-être ANOVA (), ou cor () serait utile comme point de départ. Mais cela devrait être expliqué en même temps que data.manipulation.

Autres conseils

Bien que je « écrit le livre » sur R à la migration SPSS, qui avait pour but de programmeurs et la plupart des utilisateurs SPSS que je connais préfèrent « pointer-cliquer » à la place. Une interface utilisateur graphique comme Deducer (ou R commandant) peut les aider à se sentir à la maison tout en leur enseignant comment le code de programmation R fonctionne s'ils veulent le voir. Constructeur de terrain de Deducer fait aussi un bon travail qui vous permet de créer des tracés complexes facilement, et si vous voulez apprendre à code ggplot2, il vous montrera aussi. Ian a fait un excellent travail avec elle!

Cependant, alors que l'interface utilisateur graphique SPSS couvre 98% de ce que SPSS peut faire, Deducer couvre peut-être 1% de ce que R peut faire. C'est probablement encore 75% de ce que vos besoins de chercheur en moyenne, mais R est si large que, pour tirer le meilleur parti de celui-ci les gens devront apprendre à programmer. La version gratuite de mon livre, « R pour les utilisateurs SAS et SPSS » est seulement 80 pages et couvre les domaines de la programmation que je pense sont les plus susceptibles de confondre les débutants. Il est à http://r4stats.com .

Tout récemment, j'ai eu un étudiant qui a été quelque peu versé dans les statistiques et a fait une analyse préalable dans SPSS. alors je lui ai montré comment faire exactement la même chose dans l'affaire R. Nous sommes passés par le code et le traçage, expliquer et débattre chaque ligne. Il se rendit compte de la facilité et il est commode de le faire dans l'affaire R. Ainsi, la communauté R a augmenté de 1.:)

Le plus gros problème que les chercheurs que j'ai eu affaire ont est l'absence d'interface graphique pointer-cliquer. Bien qu'il existe un certain nombre d'efforts là-bas dans la communauté R, aucun d'entre eux ont atteint la facilité d'utilisation / niveau de puissance que SPSS a.

Étant donné que le codage est une seconde nature pour les utilisateurs R, nous oublions parfois que la majorité des utilisateurs de logiciels de statistique ne peut pas programmer (et éviterait comme la peste), même si elles peuvent avoir une bonne compréhension pratique des statistiques.

Si je devais un jour pour apporter un utilisateur SPSS en R, je les commencer sur Deducer . Deducer est un projet GUI R (note auto-promotion: Je suis l'auteur) qui devrait se sentir très familier à un utilisateur provenant de SPSS. Comme ils se trouvent besoin des fonctions plus avancées, ils se déplaceront naturellement à la ligne de commande pour répondre à leurs besoins.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top