¿Existe alguna herramienta de código abierto que automáticamente 'detecte' los subprocesos de correo electrónico como Gmail? [cerrado

StackOverflow https://stackoverflow.com/questions/2390656

Pregunta

Por ejemplo, si el mensaje original (mensaje 1) es ...

Hola Jon,
¿Quieres ir a buscar pizza?
-Factura

Y la respuesta (mensaje 2) es ...

Factura,
Lo siento, no puedo hacer el almuerzo hoy.
Jonathon Parks, CTO ACME Systems

El miércoles 24 de febrero de 2010 a las 4:43 pm, Bill Waters escribió:

> Hola John,
> ¿Quieres ir a buscar pizza?
> -Bill

En Gmail, el sistema (a) detecta que el mensaje 2 es una respuesta al mensaje 1 y convierte esto en una especie de 'hilo' y (b) detecta dónde La parte respondida del mensaje en realidad es y la oculta del usuario. (En este caso, la parte oculta comenzaría en "el miércoles, febrero ..." y continuará hasta el final del mensaje).

Obviamente, en este simple ejemplo sería fácil detectar el "enu003CDate> ,u003CName> escribió: "o los prefijos de personajes"> ". Pero muchos sistemas de correo electrónico tienen muchos estilo diferente de respuestas de marcado (sin mencionar los correos electrónicos de HTML). Tengo la sensación de que tendrías que tener algunos algoritmos de análisis de cuerdas inteligentes para acercarse a Qué bueno es el de Gmail.

¿Esta tecnología ya existe en un proyecto de código abierto en alguna parte? ¿Ya sea en alguna biblioteca dedicada a esto exclusivamente o tal vez en algún cliente de correo electrónico de código abierto que realiza subprocesos de mensajes similares?

Gracias.

¿Fue útil?

Solución

Hay un buen artículo escrito por Zawinski aquí:

http://www.jwz.org/doc/threading.html

Otros consejos

Creo que Gmail funciona por Título del tema. No puedo comprobarlo en este momento, pero un cambio rápido al título podría romper el roscado.

Lo siguiente es difícil de predecir, como usted menciona:

On Wed, Feb 24, 2010 at 4:43 PM, Bill Waters wrote:

Pero agarrar el título de correo electrónico Pizza tomorrow y asumiendo un prefijo de Re: Pizza tomorrow es considerablemente más predecible. También podría asumir los casos de FW: y RE: (en gorras).

¿Quiere resolver problemas donde el corresponsal no se establece en respuesta: o referencias: campos de encabezado?

De lo contrario, puede usar Mutt y configurarlo para no mostrar cotizaciones de forma predeterminada.

(Debe ser realizado por cualquier otra herramienta de correo en la Tierra también. (Bueno, nunca obtuve una vista de árbol de árbol en Outlook).

Editado a continuación en reacción al comentario

Si intenta construir su propio software, entonces esta pregunta obviamente es adecuada. Pero entonces, solo puedo darte mi 2C en esto. Si no puede confiar en los encabezados explícitos, lo único que debe hacer es tomar un montón de correos, aprender las frases más comunes utilizadas para indicar citas. (Afortunadamente, hay algunas convenciones, y los formatos de fecha y los nombres/correos electrónicos no son completamente arbitrarios).

Si hace esto para el análisis de los hilos de comunicación, probablemente desee indicar la probabilidad de la relación. Si solo lo hace por conveniencia del usuario ... bueno, ... ¿mi opinión personal? No se preocupe por las personas que no pueden usar un Mailtool decente.

Que tipo de Agente de entrega de correo ¿Estas usando?

¿Estás desarrollando el tuyo? En ese caso, ¿planea implementar el protocolo IMAP?

Si está usando Cyrus (o cualquier otro producto que maneja IMAP) con Extensiones de clasificación y hilo, entonces ya está integrado.

En ambos casos, debe echar un vistazo a RFC 5256.

Podrías echar un vistazo a SUP http://freshmeat.net/articles/sup-gmail-meets-the-console Como hace casi lo que quieres

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top