Atrás ERREKA ya funciona en Gipuzkoa con el objetivo de liberar 8.300 horas de tareas administrativas cada año
ERREKA ya funciona en Gipuzkoa con el objetivo de liberar 8.300 horas de tareas administrativas cada año
El sistema de inteligencia artificial desarrollado por Izfe automatiza la clasificación de apuntes de registro, abriendo la puerta a la automatización inteligente en la administración pública vasca.

Cada día, cientos de documentos llegan al Registro de la Diputación Foral de Gipuzkoa: solicitudes ciudadanas, comunicaciones de otras administraciones, documentación técnica, etc. Todos ellos necesitan ser clasificados y derivados a la unidad administrativa correcta antes de que pueda comenzar su tramitación. Durante años, una parte significativa de este trabajo se ha hecho a mano.
Las cifras hablan por sí solas: durante 2022 en el registro de la Diputación se recibieron de un total de 1.640.583 apuntes, de los cuales más de 100.000 apuntes tuvieron que ser clasificados manualmente. Esa tarea, repetitiva y de escaso valor añadido, consume el equivalente a 8.300 horas de trabajo anuales, lo que supone la dedicación a tiempo completo de alrededor de cinco personas durante un año entero. A eso hay que sumar un problema adicional: la clasificación manual no es homogénea. Varía según la persona y la unidad, y genera reasignaciones en al menos el 8% de los casos.
Para abordar ese cuello de botella, Izfe ha desarrollado ERREKA (ERRegistro apunteen sailKatzaile Automatikoa, es decir, Clasificador Automático de Apuntes de Registro), un sistema basado en inteligencia artificial (IA) que, desde octubre de 2025, clasifica automáticamente la documentación entrante con una precisión superior al 93%.
|
100.000 |
93,4% |
~80% |
| apuntes clasificados año | AA precisión del modelo | clasificación automatizada |
Un río de documentos que desbordaba las oficinas
El Registro de la Diputación funciona como la puerta de entrada de toda la documentación que recibe la institución. Los apuntes llegan por cuatro vías principales: presencialmente en las oficinas, a través de aplicaciones internas, mediante el registro electrónico online y por el sistema de interoperabilidad entre administraciones (SIR). La mayoría de los apuntes tienen la unidad destinataria bien definida. Sin embargo, hay un número significativo de apuntes que deben ser revisados, analizados y derivados de forma manual a la unidad administrativa correspondiente.
Esa labor la realizan las Unidades Genéricas, gestionadas desde las Secretarías Técnicas de cada departamento. Sus responsables revisan los metadatos y los archivos adjuntos de cada apunte y deciden a qué unidad administrativa enviarlo. Es un trabajo imprescindible, pero que consume gran cantidad de tiempo y recursos humanos.
El coste no era solo económico. Esas mismas personas podrían dedicarse a tareas de mayor valor: atención ciudadana, resolución de expedientes o mejora de procesos internos. Existe, en definitiva, un importante coste de oportunidad que va más allá de las horas invertidas.
Aprendizaje automático
El desarrollo de ERREKA, tal y como hemos publicado la plataforma de Gobierno Abierto de la Diputación Foral de Gipuzkoa Gipuzkoa Irekia, ha seguido la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), una referencia en proyectos de minería de datos. El proceso comenzó con un análisis de viabilidad en el que se estudiaron aproximadamente 150.000 apuntes clasificados manualmente entre enero de 2022 y agosto de 2023.
Ese análisis reveló un dato clave: tan solo 21 unidades administrativas reciben cerca del 70% de todos los apuntes a clasificarse manualmente. El resto procesa menos del 1% cada una. Esa concentración permitía focalizar el esfuerzo del modelo de IA en un número manejable de destinos con alto volumen.
Para entrenar el modelo, se seleccionaron 14 unidades administrativas y se construyó una base de datos con 38.037 apuntes . De cada uno se extrajo el texto de los archivos PDF adjuntos mediante zOCR , el servicio de reconocimiento óptico de caracteres desarrollado internamente por Izfe (basado en Tesseract 5.5 y compatible con más de 100 idiomas). A continuación, se aplicaron técnicas avanzadas de procesamiento de lenguaje natural (NLP) para identificar y codificar las palabras más relevantes de cada documento.
La heterogeneidad de los PDF supuso uno de los mayores retos técnicos. La calidad de los documentos es muy dispar: en la documentación de los apuntes se mezclan texto e imágenes, incluyen firmas digitales o proceden de antiguos documentos escaneados. En esta situación la tarea fundamental consiste en garantizar una extracción de texto robusta y fiable, que se pueda adaptar a todo tipo de documentos y que permita correcto el entrenamiento del modelo.
Tras la preparación de los datos, el algoritmo elegido fue LightGBM , una técnica de aprendizaje automático que destaca por su velocidad, su capacidad para trabajar con datos ruidosos y su nivel de explicabilidad. El modelo se entrenó con el 72,5% de los datos y se evaluó con el 27,5% restante, obteniendo unas métricas iniciales de 0,84 en precisión, 0,81 en exhaustividad y 0,81 en F1-score. El sistema se desplegó en STRATIO y procesa información en bloques automáticamente cada cinco minutos.
Siete meses de prueba silenciosa
Antes de activar ERREKA en producción, el equipo optó por una estrategia poco habitual: un piloto oculto. Durante siete meses, el sistema procesó 19.265 apuntes en paralelo al flujo normal de trabajo, sin que las unidades lo supieran. De ellos, se utilizaron 5.637 para comparar las predicciones de ERREKA con la clasificación real realizada por las personas empleadas.
El objetivo era triple: verificar la precisión real del modelo en condiciones de producción, comprobar la velocidad y estabilidad del procesamiento masivo, y detectar posibles efectos imprevistos. Al no condicionar a las personas trabajadoras, los datos obtenidos reflejaban fielmente el rendimiento del sistema.
| Durante siete meses, el sistema procesó 19.265 apuntes en paralelo al flujo normal de trabajo, sin que las unidades lo supieran |
Resultados que convencen
ERREKA opera en tres tramos de actuación. Cuando su nivel de confianza es alto, realiza una clasificación automática directa. Cuando es medio, envía una propuesta de clasificación que la persona responsable valida o corrige con un solo clic. Y cuando la confianza es baja, el apunte sigue el flujo manual habitual, sin intervención del sistema.

Los resultados de la fase de validación son significativos. En la unidad de Gestión de Personal (Gobernanza), ERREKA logró una precisión del 92,4% en clasificación automática, cubriendo el 77% de los apuntes. En las secciones de Inspección del Transporte y Ordenación del Transporte (Movilidad y Turismo), la precisión alcanzó el 95% y el 86,3% respectivamente. En Infraestructuras Viarias, la sección de Planificación y Explotación registró un 92,7%, mientras que, en Equilibrio Territorial Verde, la unidad de Registros llegó al 93,5%.
| Más de 93 de cada 100 predicciones son correctas, y casi el 80% de los apuntes se clasifican ya de forma completamente automatizada |
Con la evolución del modelo a su versión 2.0, ERREKA ha alcanzado una precisión global del 93,4% , lo que significa que más de 93 de cada 100 predicciones son correctas. La tasa de error se sitúa muy por debajo de la variabilidad que presentaba la clasificación manual. Además, casi el 80% de los apuntes se clasifican de forma completamente automatizada, lo que reduce drásticamente el volumen de trabajo pendiente de revisión humana.
Menos repetición, más resolución
Desde octubre de 2025, ERREKA está operativo en producción. La primera unidad en activarse fue Gestión de Personal del departamento de Gobernanza a finales de octubre. A comienzos de noviembre se sumaron tres departamentos más: Movilidad y Turismo, Infraestructuras Viarias, y Equilibrio Territorial Verde. Y por último en febrero de 2026 se han incorporado Cuidados y Políticas Sociales, y Hacienda y Finanzas.
Para las personas que trabajan en las Unidades Genéricas, el cambio es tangible. Gran parte del trabajo repetitivo ha desaparecido o se ha aligerado notablemente. Los apuntes llegan ya clasificados o con una propuesta de destino, y el personal solo tiene que revisar los casos dudosos. Ese tiempo liberado se redirige ahora a resolver expedientes y mejorar los tiempos de respuesta a la ciudadanía.
Es importante subrayar que ERREKA no sustituye a las personas . El control sigue residiendo en las unidades: el sistema propone, pero la decisión final siempre es humana. Esa filosofía de IA como asistente, no como sustituto , ha sido clave para generar confianza interna. La resistencia al cambio ha sido mínima, en buena parte gracias a la transparencia con la que se ha comunicado el proyecto y a la participación activa de las unidades durante las pruebas.
Lo que trae la corriente
ERREKA no es un proyecto cerrado. El equipo trabaja ya en un sistema de reentrenamiento semi-automático que permita mejorar el modelo de forma continua, incorporando los apuntes validados por las propias unidades. El objetivo es doble: perfeccionar la precisión en las unidades actuales y extender el sistema a nuevas unidades administrativas.
Para las unidades con menor volumen de tráfico (que representan el 30% restante), se explora una vía diferente: la IA generativa . Mediante una prueba de concepto, se está evaluando la capacidad de modelos generativos para clasificar apuntes incluso cuando los datos históricos son escasos, algo que los métodos clásicos de aprendizaje automático dificultan.
La visión a largo plazo es ambiciosa pero concreta: que ERREKA se extienda a todas las unidades de la Diputación y que sirva como punto de partida para un ecosistema de automatización más amplio. Un ecosistema que, en última instancia, mejore tanto la experiencia de las personas empleadas públicas como la de la ciudadanía.
ERREKA demuestra que la inteligencia artificial puede integrarse en la administración pública de forma segura, controlada y útil. No se trata de reemplazar a las personas, sino de liberar su tiempo para lo que realmente importa : servir mejor a la ciudadanía. Desde Gipuzkoa, hacia el futuro.