Construir un modelo de aprendizaje automático para predecir los rendimientos de los cultivos según los datos ambientales

datascience.stackexchange https://datascience.stackexchange.com/questions/9598

  •  16-10-2019
  •  | 
  •  

Pregunta

Tengo un conjunto de datos que contiene datos sobre temperatura, precipitación y rendimientos de soja para una granja durante 10 años (2005 - 2014). Me gustaría predecir los rendimientos para 2015 en función de estos datos.

Tenga en cuenta que el conjunto de datos tiene valores diarios para la temperatura y la precipitación, pero solo 1 valor por año para el rendimiento, ya que la recolección de cultivos ocurre al final de la temporada de cultivo de cultivo.

Quiero construir una regresión o algún otro modelo basado en el aprendizaje automático para predecir los rendimientos de 2015, basado en una regresión/algún otro modelo derivado al estudiar la relación entre los rendimientos y la temperatura y la precipitación en años anteriores.

Estoy familiarizado con realizar el aprendizaje automático usando Scikit-Learn. Sin embargo, no estoy seguro de cómo representar este problema. La parte difícil aquí es que la temperatura y la precipitación son diarias, pero el rendimiento es solo 1 valor por año.

¿Cómo me acerco a esto?

¿Fue útil?

Solución

Para empezar, puede predecir el rendimiento para el próximo año basado en los datos diarios del año anterior. Puede estimar los parámetros del modelo considerando los datos de cada año como un "punto", luego validar el modelo utilizando validación cruzada. Puede extender este modelo considerando más que el año pasado, pero mire demasiado lejos y tendrá problemas para validar su modelo y sobrepits.

Otros consejos

Puede usar la red de creencias bayesiana para la predicción. Ella es un enlace para una explicación básica.Red bayesiana

Tiene 10 puntos de datos con cada punto de datos que tiene 365 (temperatura para cada día) + 365 (precipitación para cada día) dimensiones. Idealmente, primero reduciría las dimensiones a través de métodos de aprendizaje automático, por ejemplo, PCA. Luego use métodos de aprendizaje automático para construir un modelo de predicción. Sin embargo, debido al pequeño conjunto de datos, no creo que las técnicas de aprendizaje automático sean apropiadas para su problema.

Licenciado bajo: CC-BY-SA con atribución
scroll top