Question

données augmentation techniques de données d'image et des données audio (par exemple, la reconnaissance vocale) ont fait leurs preuves et sont maintenant communs.

Y at-il des bibliothèques ou des techniques pour augmenter text données?

Par exemple:

: «Comment vas-tu?
out: [? comment allez-vous », 'COMMENT ÊTES-VOUS?', 'hwo sont y ou?', 'comment r u', ... 'Comment ça?]

Était-ce utile?

La solution

Autres conseils

Vous pouvez coder certaines règles simples comme celles que vous avez mentionnées dans la question. De plus, vous pouvez utiliser des bases de connaissances comme Freebase et WordNet pour enrichir votre modèle de langage. Notez que ce ne sera pas nécessairement « noisify » vos données, mais aurait un effet similaire à l'effet sur l'augmentation des données sur les images pour les tâches en aval disons.

Licencié sous: CC-BY-SA avec attribution
scroll top