Erstellen eines maschinellen Lernmodells zur Vorhersage von Ernteerträgen basierend auf Umgebungsdaten

datascience.stackexchange https://datascience.stackexchange.com/questions/9598

  •  16-10-2019
  •  | 
  •  

Frage

Ich habe einen Datensatz, der Daten zu Temperatur, Niederschlag und Sojabohnen für einen Bauernhof für 10 Jahre (2005 - 2014) enthält. Ich möchte die Erträge für 2015 auf der Grundlage dieser Daten vorhersagen.

Bitte beachten Sie, dass der Datensatz tägliche Werte für Temperatur und Niederschlag enthält, jedoch nur 1 Wert pro Jahr für die Rendite, da die Ernte der Ernte am Ende der Vegetationsperiode der Ernte erfolgt.

Ich möchte eine Regression oder ein anderes maschinelles Lernmodell aufbauen, um die Ausbeuten von 2015 vorherzusagen, basierend auf einer Regression/einem anderen Modell, das durch die Untersuchung der Beziehung zwischen Ausbeuten und Temperatur und Niederschlag in den Vorjahren abgeleitet wurde.

Ich kenne mich mit dem maschinellen Lernen mit Scikit-Learn aus. Ich bin mir jedoch nicht sicher, wie dieses Problem dargestellt werden soll. Der schwierige Teil hier ist, dass Temperatur und Niederschlag täglich sind, der Ertrag jedoch nur 1 Wert pro Jahr beträgt.

Wie nähere ich mich dem?

War es hilfreich?

Lösung

Für den Anfang können Sie die Rendite für das kommende Jahr basierend auf den täglichen Daten für das Vorjahr vorhersagen. Sie können die Modellparameter schätzen, indem Sie die Daten jedes Jahres als "Punkt" betrachten und das Modell mithilfe der Kreuzvalidierung validieren. Sie können dieses Modell erweitern, indem Sie mehr als das vergangene Jahr in Betracht ziehen, aber zu weit zurückblicken und Sie haben Probleme, Ihr Modell und Ihr Überfit zu validieren.

Andere Tipps

Sie können das Bayes'sche Glaubensnetzwerk für die Vorhersage verwenden. Sie ist ein Link für die grundlegende Erklärung.Bayesianes Netzwerk

Sie haben 10 Datenpunkte mit jedem Datenpunkt mit 365 (Temperatur für jeden Tag) + 365 (Niederschlag für jeden Tag) Dimensionen. Im Idealfall würde ich zuerst die Abmessungen über maschinelles Lernmethoden, z. B. PCA, reduzieren. Verwenden Sie dann Methoden für maschinelles Lernen, um ein Vorhersagemodell zu erstellen. Aufgrund des kleinen Datensatzes denke ich jedoch nicht, dass maschinelles Lernen für Ihr Problem angemessen ist.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top