¿Cuáles son los problemas asociados con la recuperación de correo electrónico usando CURL?

StackOverflow https://stackoverflow.com/questions/740791

Pregunta

Una nueva característica que me gustaría añadir a nuestra red local es la capacidad de recuperar el correo electrónico desde servicios gratuitos de correo electrónico como Gmail, Yahoo y Hotmail usando PHP. Hay servicios que podemos pagar pero preferiría entrar ilegalmente en él yo mismo!

Me parece que Google sólo tiene una API, pero el resto no lo hacen. ¿Cuáles son los problemas asociados a continuación, conmigo sólo la recuperación de correo electrónico usando CURL?

Incluso me han implementado la parte Gmail usando CURL y PHP.

¿Fue útil?

Solución

Es casi seguro que viola sus términos de servicio a la pantalla-raspar sus sitios web para tal fin. Si rediseñar su sitio, las secuencias de comandos que está utilizando para analizar el contenido de correo electrónico, etc. probablemente se romperá de manera catastrófica, también.

Yahoo, Gmail y Hotmail todo el apoyo POP3, un protocolo estándar para la recuperación de e- mails. ¿Por qué no usar ese lugar?

Otros consejos

Cuando alguien le da un API, que le están prometiendo que "si se ejecuta código de X, Y va a suceder. Cuando Capturar datos de pantalla, no hay tal promesa del proveedor, y muchos proveedores tienen elementos en sus términos de servicio que prohíbe explícitamente captura de imágenes. Desde un punto de vista técnico, esto significa que su página / aplicación puede sufrir cambios que rompan su captura de imágenes, se marchitan accidentalmente o intencionadamente por el proveedor. esto es por qué existen Captcha.

Además, cada vez más, estas aplicaciones están utilizando cada vez más las arquitecturas de estilo "Ajax", lo que significa que estás comprometiendo a la ingeniería de cómo funciona su aplicación, así como mantenerse al día con los cambios en cada aplicación hace marcha atrás.

Por último, bueno, lo estás haciendo mal. El correo electrónico es un conjunto de protocolos de por sí. La mayoría de los proveedores tienen una forma de acceder al correo electrónico a través de POP3 e IMAP. Me miro en la piratería código PHP para interactuar con los servidores de correo POP / IMAP que, como una API, son un conjunto de comportamientos prometida. También tiene la ventaja de que el código escrito para un proveedor es probable que trabajar (con ajustes menores) por otro.

Asumo que tenga una razón para no usar el protocolo POP, que es la forma estándar compatible para recuperar correo electrónico. Para hacerlo como quieres es algo que no es compatible y tal vez también no serán cubiertos por los términos de uso de los proveedores.

Pero si no hay solución de código de imagen se interpone en su camino es técnicamente posible. Usted tendrá que escribir una aplicación diferente para cada proveedor. En caso de que cambien algo que tendrá que adoptar su aplicación.

Para hacer que funcione con el enrollamiento asegúrese de recoger todas las galletas que te dan en todas las páginas y restituirlos en cada petición.

En caso de cualquier problema (y para el desarrollo) se podría analizar las peticiones HTTP y respuestas con alguna herramienta (por ejemplo Proxomitron en las ventanas) y hacer que las solicitudes se curvan más y más se ven exactamente como las peticiones del navegador hasta que tenga éxito. Al final no hay nada que puedan hacer para distinguir sus peticiones enrollamiento de las solicitudes humanos a través de un navegador. Excepto código de imagen como he dicho antes.

Otra cosa son los intervalos entre las solicitudes, se podía bloquearse para solicitar a menudo o cuando no hay pausa entre 2 peticiones (que un ser humano no puede hacer). Intente insertar pausas modificados aleatoriamente entre las peticiones si sospecha que esto.

Me puedo imaginar que bloquean sus cuentas o IPs durante el desarrollo, en este caso, sería necesario cambiar la IP y / o la cuenta que trabaja en.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top