Come ruotare correttamente l'immagine e le etichette per l'aumento dei dati di segmentazione semantica in Tensorflow?

https://datascience.stackexchange.com/questions/44708

01-11-2019
|

Domanda

Qual è una procedura corretta per eseguire la rotazione dell'immagine ed etichetta per la segmentazione semantica nell'aumento del set di dati usando TensorFlow?

immagini

Ho visto la funzione tf.contib.image.rota (), ma questa funzione riempie lo spazio vuoto con zeri (dai documenti):

Lo spazio vuoto a causa della rotazione sarà riempito con zeri.

Vorrei riempire quello spazio vuoto con un valore diverso (forse un po 'costante, come il set di dati medio pixel). Come questo può essere fatto in Tensorflow (so che ci sono opzioni in Preelaborazione dell'immagine di Keras, ma ho bisogno di TF)?

Etichette

Inoltre, per quanto riguarda le etichette? Se uso solo la stessa funzione (tf.contrib.image.rotate()), riempirà lo spazio vuoto con zeri che suggeriscono che il pixel in quei luoghi appartiene alla classe con ID 0 (poiché ho la classe etichettata con 0). L'unica soluzione potrebbe essere quella di mettere Etichetta Ignora su quei pixel (ad esempio 255), ma, ancora una volta, la funzione corrente non supporta il valore di riempimento predefinito ...

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a datascience.stackexchange