Migración y recuperación de datos para Cantabria24Horas


Extracción estructurada de cerca de 60.000 artículos desde una web obsoleta
Resumen del proyecto
Cantabria24Horas es una publicación digital con cerca de 60.000 artículos publicados. El objetivo del proyecto era extraer todo su contenido desde una instalación obsoleta y poco accesible, para migrarlo a una nueva plataforma WordPress más moderna, funcional y mantenible.
Reto
La web original estaba construida con un sistema antiguo, sin panel de control moderno, sin acceso a base de datos limpia, y con enlaces internos caóticos. El reto consistía en extraer la información sin acceso estructurado, conservando texto, títulos y fechas de cada artículo, para luego preparar su importación.


Solución técnica
Se desarrolló un sistema personalizado de scraping basado en Python y Selenium, con reintentos automáticos ante errores de conexión, guardado en HTML local y posterior parsing a CSV limpio. El proceso se estructuró por bloques secuenciales para asegurar el control sobre la cantidad y la integridad de los datos extraídos.


Resultados
Se logró recuperar cerca de 60.000 artículos de forma estructurada, generando un archivo preparado para importación en WordPress con formato limpio, etiquetas, fechas y títulos originales. El proceso, ejecutado por fases, incluyó validaciones manuales, optimización de tiempos de carga y trazabilidad completa de la operación.


Impacto
El trabajo ha permitido a Cantabria24Horas planificar su relanzamiento con base tecnológica moderna y datos históricos preservados, ahorrando miles de euros en desarrollo personalizado o licencias externas. Una migración crítica resuelta de forma ágil, eficiente y escalable.


Conectamos tus raíces con el mundo digital.
Creamos marcas y webs que reflejan tu esencia y te impulsan al futuro.
Contacto
Formulario de contacto
contacto@ibioestudiocreativo.com
Desarrollado por Ibio Estudio Creativo © 2025. All rights reserved.