Frage

Ich interessiere mich für das Problem, den Bergbau unter Spielern sozialer Networking -Spiele zu strukturieren. Zum Beispiel Erkennung von Betrügern eines Spiels angesichts der Benutzerdatenbank eines Unternehmens. Bisher habe ich das übliche Rezept für ein Data Mining -Projekt verfolgt:

  • Erstellen Sie ein Data Warehouse, das erhebliche Informationen aggregiert
  • Wählen Sie einen Klassifizierer aus und trainieren Sie ihn mit einem Teilsektor von Datensätzen aus dem Lagerhaus
  • Validieren Sie den Klassifizierer mit einem anderen Testsatz
  • Schaume, spülen, wiederholen

Überraschenderweise habe ich in diesem Bereich nur sehr wenig in Bezug auf Literatur, Best Practices usw. gefunden. Ich hoffe, dass ich das Problem des Informationssammelns hier Crowdsource -Problem. Speziell das, wonach ich suche:

  • Was Klassifikatoren für diese Art von Musterabbau gearbeitet haben (es scheint sehr zeitlich zu sein, Benutzer spielen Spiele, Benutzer, die Belohnungen erhalten, Benutzer, die Preise übertragen usw.).
  • Gibt es eine stark vereinbarte Attribute, die für soziale Netzwerke- / Gaming -Daten spezifisch sind?
  • Was ist eine praktische Menge an Informationen, die berücksichtigt werden sollten? Ein Problem, auf das ich mich begegne, ist die Datenüberlastung, bei der Abfragen und Datenreinigung Tage dauern können.
  • Welche Hardware -Ressourcen sind im Zusammenhang mit Punkten oben erforderlich, um Ergebnisse zu erzielen? Ich habe es schwierig gefunden, die Menge an Rechenleistung abzuschätzen, die ich für die Produktionsnutzung benötige. Es ist offensichtlich, dass eine weiße Schachtel in der Ecke nicht genug Pferdestärken für ein solches Projekt hat. Greifen Unternehmen im Allgemeinen auf Cloud -Lösungen zurück? Kaufen sie Cluster?

Grundsätzlich wären alle Ressourcen (theoretisch, akademisch oder praktisch) zur Implementierung eines sozialen Netzwerk- / Gaming-Muster-Mining-Programms sehr geschätzt.

Vielen Dank.

War es hilfreich?

Lösung

Ich suche nach den gleichen Ressourcen. Hier sind einige Dinge, die ich für ziemlich interessant halte. Ich hoffe, Sie können es nutzen. Wenn Sie mehr Ressourcen entdecken, lassen Sie es mich wissen. Hier sind sie:http://techcrunch.com/2010/04/06/turiya-media-games/http://www.kdnuggets.com/2010/08/video-tutorial-christian-thurau-data-ming-in-n-names.html?k10n21http://www.gamasutra.com/view/feature/2816/better_game_design_through_data_.phpDies ist in Portuguesse, ist aber hervorragend: http://thiagofalcao.info/

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top