La mejor manera de manejar los puntos de referencia en un archivo de audio (desde el micrófono)

https://stackoverflow.com/questions/5487595

14-11-2019
|

Pregunta

Me gustaría grabar audio de un micrófono y me gustaría que el usuario pueda agregar puntos de referencia durante la grabación, por lo que cuando carga el archivo después, puede saltar fácilmente a una posición específica.

Realmente no sé qué formato de archivo debería usar y cómo almacenar los metadatos (puntos de referencia)

pensé en

codificando un WAV / MP3 y almacena metadatos en un archivo .cue (Fácil de hacer, pero 2 archivos para almacenar)
almacenamiento de datos XMP en un archivo MP3 (parece un poco más difícil, pero metadatos estándar incrustados en 1 archivo)
flv / F4V con audio solamente y puntos de referencia estándar, pero no estoy seguro de poder crearlos directamente del cliente
¿Qué piensas?

Solución

¿Sabía que el formato de archivo WAV admite los chunks incrustados?

La especificación dice:

The <cue-ck> cue-points chunk identifies a series of positions in 
the waveform data stream. The <cue-ck> is defined as follows:
<cue-ck> -> cue( <dwCuePoints:DWORD> // Count of cue points
                 <cue-point>... ) // Cue-point table

<cue-point> -> struct {
    DWORD dwName;
    DWORD dwPosition;
    FOURCC fccChunk;
    DWORD dwChunkStart;
    DWORD dwBlockStart;
    DWORD dwSampleOffset;
}

Para un archivo WAV con un solo trozo de datos (el estándar), FCCCHIK debe ser "DATOS", ChunkStart y BlockStart son 0, y Sampleffset es la muestra que desea marcar.

Esta podría ser la forma más portátil de grabar sus señales.

Otros consejos

En mi opinión, la mejor manera sería guardar el sonido de sonido. Posición de los puntos de referencia del usuario en un XML o algo similar. Me doy cuenta de que esto emitirá dos archivos, pero también podría conformar su propio tipo de archivo propietario y escribir el Audio Data + Cue Point NFO a un solo archivo. De todos modos, digo esto por varias razones. El primer ser, encontrar buenos codificadores MP3 para Flash va a ser un poco complicado. La mayoría de ellos se basan en Alchemy, que es una tecnología de vista previa (ni siquiera Beta, simplemente se puso a la vista de la vista previa). También es muy propenso a las fugas de la memoria, el rendimiento lento (como los codificadores de flash que intentan codificar c / c ++, generalmente los procesos de mala gestión o sobrecarga) y también es difícil encontrar un completo completo completo. Yo diría que lo mismo probablemente se aplica a la codificación FLV / F4V en el lado flash. Si desea ir a esta ruta, se trata de lo mejor que ha salido (como un comienzo): http://www.zeropointnine.com/blog/simpleflvwriteras-as3-class-to-create-flvs/

Entonces, si se reduce a lo que va a hacer que su proyecto complete el más rápido y corriendo el más estable, vaya con la solución de 2 archivos. No me equivoque si quisiera, hay muchas soluciones de codificación MP3 MP3 medio completadas (así como FLV, como se mencionó anteriormente), pero va a realizar un tiempo y esfuerzo invertido para conocer estos formatos de archivo, Aprenda cómo funcionan estas clases / marcos / marcos existentes, aprendiendo a extenderlos y luego estabilizarlos y depurarlos. Si desea invertir ese tiempo, por lo que todos los medios se sumergen en: http://code.google .com / p / flash-kikko / .

Una opción es usarla base64 codificación para guardar los datos de audio como texto dentro de un archivo XML junto con los datos de CuePoint.Esta sería una forma realmente ineficiente de almacenar los datos y produciría un archivo grande, especialmente si fue una grabación larga.Sin embargo, utilizando un codificador / decodificador MP3 o Algún otro codificador podría ayudarlo con eso.

Por cierto, ¿es el FLOARIAN F. con el que solía trabajar?

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow