Frage

Ich habe Netzwerkverkehrsdaten im Folgenden für jede Stunde von zehn Tagen, wie folgt wie folgt in einem R-Dataset. generasacodicetagpre.

Wie gesehen gibt es auch innerhalb einer einzigen Stunde Wiederholung der Kategorie. Ich muss die Volatilität und die Spitzenstunde in durchschnittliche Stundenverhältnisse dieser verschiedenen Anwendungskategorien berechnen.

Volatilität : Standardabweichung der stündlichen Volumina, die durch stündlich durchschnittlich geteilt wird.

Peak-Stunde nach AVG. Stundenverhältnis : Verhältnis des Volumens der Höchststunden bis zum Vol. der durchschnittlichen Stunde für diese Anwendung.

Wie aggregiere ich diese beiden Statistiken für jede Kategorie? Ich bin neu für R und habe nicht viel Kenntnis, wie man aggregiert und die Durchschnittswerte wie erwähnt bekommen sollen.

Das Endergebnis würde also so aussehen, dass zunächst das Volumen für jede Kategorie auf einem einzelnen 24-Stunden-Zeitraum durch Summieren des Volumens aggregiert ist und dann die beiden Statistiken berechnet generasacodicetagpre.

edit: pryr hat mich so weit wie das bekommen. generasacodicetagpre.

Das ist aber nicht das, wonach ich gehofft habe. Ich möchte die Statistiken pro Kategorie, in denen alle Stunden der Tage zuerst in 24 Stunden aggregiert sind, indem Sie die Bände summieren, und dann die erwähnte Volatilitäts- und PA-Verhältnis berechnet. Jegliche Vorschläge zur Verbesserung?

War es hilfreich?

Lösung

You'd need to do it in two stages (using the plyr package): First, as you pointed out, there can be multiple Day-Hour combos for the same category, so we first aggregate, for each category, its totals within each Hour, regardless of the day:

df1 <- ddply( df, .(Hour, Category), summarise, Volume = sum(Volume))

Then you get your stats:

> ddply(df1, .(Category), summarise,
+            Volatility = sd(Volume)/mean(Volume),
+            PeakToAvg = max(Volume)/mean(Volume) )

  Category Volatility PeakToAvg
1      P2P  0.3225399  1.228070
2      Web         NA  1.000000
3    email  0.2999847  1.212121
4   gaming  0.7071068  1.500000
5    video         NA  1.000000
6      web  0.7564398  1.534884
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top