Question

Je suis en train de développer une application en ligne où l'utilisateur écrit un texte et le logiciel, il chante à l'utilisateur.

Je peux actuellement générer le fichier audio avec les mots prononcés par l'ordinateur à l'aide espeak, mais je ne sais pas comment le faire sonner comme une chanson, comment ajouter le rythme à elle.

Je suis en mesure de changer la tonalité et le tempo à l'aide rubberband, mais qui est aussi loin que je suis devenu.

Quelqu'un at-il la moindre idée de comment y arriver?

Était-ce utile?

La solution 2

J'ai fini par utiliser le mode de chant du Festival. Il semble assez bien, à l'exception du fait qu'il fonctionne uniquement avec les voix anglaises.

Autres conseils

Si vous voulez utiliser rubberband la durée du changement et pas, alors je pense que le plus dur va être la cartographie de phonèmes / syllabes dans le texte à des plages audio correspondant à la sortie du discours, pour lequel je ne simple suggestion . (Idéalement, vous obtiendriez à l'intérieur du synthétiseur de la parole afin qu'il vous fournir la correspondance entre phonèmes à l'emplacement audio.)

Une alternative plus simple est peut-être essayer Speech Synthesizer Markup - SSML . Il a un « pas » et éléments « durée » qui ne peut absolument pas spécifier en Hz et la durée en secondes. Vous pouvez également spécifier le volume, pour contrôler la dynamique.

Compte tenu de cela, vous pouvez essayer de convertir le texte dans un document SSML et marquer des mots / syllabes / phonemees avec des attributs hauteur / durée et le volume.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top