Y at-il des modèles d'apprentissage machine pour les réseaux?

https://datascience.stackexchange.com/questions/16762

16-10-2019
|

Question

Je travaille sur un problème de régression, où l'objectif est d'estimer les volumes de trafic historiques à travers un réseau de transport. Je compteurs de trafic à 100 emplacements, donc un modèle peut apprendre la relation entre les volumes de trafic et un certain nombre de variables explicatives (par exemple, des vitesses, des caractéristiques routières, météorologiques). Par la suite, je peux appliquer le modèle pour estimer les volumes de trafic historiques dans des endroits où je n'ai pas les compteurs de trafic.

Mon réseau de neurones fonctionne assez bien, mais je me demande s'il existe des modèles d'apprentissage de la machine qui pourrait prendre en compte explicitement la topologie de mon réseau routier et le fait que le trafic sur les voisins liaisons routières est fortement corrélé. Je pourrais ajouter « volume de trafic au comptoir de la circulation le plus proche » comme une variable d'entrée à mon ANN, mais je me demande s'il y a une approche plus intelligente.

À cet égard, je suis tombé sur les réseaux bayésiens, qui peuvent représenter la topologie du réseau et la corrélation. Cependant, ils semblent applicables aux cas où nous avons des capteurs à 100 endroits et nous voulons prédire l'état de la circulation (à ces 100 emplacements) à un point de temps futur. D'autre part, je mesure à 100 emplacements et cherchent à estimer le trafic à un endroit différent pour le même point de temps.

Toute suggestion est très apprécié!

La solution

En venant du domaine connexe de mesure et de prédire la sécurité du réseau, je suggère fortement d'essayer une prévision de séries chronologiques. Je suppose que vos données sont horodatage sur la base (valeurs de congestion du réseau, échantillonnés à un certain intervalle? Sinon passer à la seconde idée)

idée 1er: J'emprunte de séries chronologiques le concept d'aplatir les 100 mesures en 1 donnée. Ainsi, au lieu de:

[t1 + delta1, location1, messurement1]

[t1 + delta2, location2, messurement2]

[t1 + delta3, Location3, messurement3]

Replier en:

[t1-bucketed, loc1, mess1, LOC2, mess2, LOC3, mess3.]

Cela aiderait le modèle « saisir » la relation entre les différentes mesures, en mettant l'accent sur l'axe du temps

2ème idée Aplatir dans chaque ligne de mesure les mesures les plus proches de topologie (ou même les 100 entiers voisins) dans:

[désordre, Topol-1-mess, Topol-1-dist, Topol-1-autre, Topol-2-mess, Topol-2-dist, Topol-2-autre, ..]

Cela aiderait le modèle « saisir » la relation entre une mesure spécifique et ses mesures de voisinage, en mettant l'accent sur la topologie dispose de chaque mesure

S'il vous plaît laissez-nous savoir si cela a aidé:)

Autres conseils

Une approche simple serait d'utiliser k plus proches voisins , où la métrique de distance est, dans votre cas, « le nombre de liaisons routières loin. » La technique est décrite dans les chapitres 2 et 13 de Neo4j pour interroger beaucoup plus facile la distance de lien. Vous pouvez coder probablement le « modèle » KNN vous en utilisant seulement 3-4 lignes de code si vous utilisez une base de données de graphique.

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange