Troubleshooter - Extractor de Concesionarios

Esta herramienta te ayuda a diagnosticar problemas con la extracción de datos de concesionarios.

Ejemplo: https://www.mercadolibre.com.ar/tienda/toyota-panamericana
Soluciones comunes

Este error general puede deberse a varias razones:

  • URL incorrecta: Asegúrate de que estás usando la URL correcta del concesionario. Debe ser la URL de la tienda oficial en MercadoLibre.
  • Cambio de estructura: MercadoLibre puede haber cambiado la estructura de su página. Esto requeriría actualizar el código de extracción.
  • Bloqueo de acceso: MercadoLibre puede estar limitando o bloqueando solicitudes automatizadas desde tu servidor.
  • Sin productos: Es posible que el concesionario no tenga productos listados actualmente.

Intenta con otro concesionario para ver si el problema es específico de una URL.

Si obtienes errores de conexión o tiempo de espera:

  • Verifica tu conexión a Internet.
  • El servidor de MercadoLibre puede estar experimentando problemas temporales.
  • Tu proveedor de hosting puede estar bloqueando las solicitudes salientes a MercadoLibre.
  • Aumenta el tiempo de espera en la configuración de cURL (actualmente establecido en 30 segundos).

Si recibes un código HTTP 403 (Forbidden):

  • MercadoLibre está bloqueando activamente las solicitudes automatizadas desde tu IP.
  • Puedes intentar:
    • Cambiar el User-Agent en la solicitud
    • Reducir la frecuencia de las solicitudes
    • Usar un proxy o VPN (si es posible en tu entorno)
    • Consultar la API oficial de MercadoLibre en lugar de usar scraping

Si la detección de elementos muestra ceros en todos los patrones:

  • MercadoLibre ha cambiado la estructura de su HTML o está usando una estructura diferente para ese concesionario.
  • La página puede estar devolviendo contenido JavaScript que necesita ser ejecutado para mostrar los productos.
  • Es posible que hayas sido redirigido a una página de error o a una página de inicio de sesión.

Verifica el HTML devuelto y busca nuevos patrones o clases que identifiquen los elementos de las publicaciones.