Atzealdea Gipuzkoak 8.300 lanordu aurreztu nahi ditu urtean ERREKA sistemari esker
Gipuzkoak 8.300 lanordu aurreztu nahi ditu urtean ERREKA sistemari esker
Izfek garatutako adimen artifizial sistemak erregistro-apunteen sailkapena automatizatzen du, euskal administrazio publikoan automatizazio adimendunaren atea irekiz.

Egunero, ehunka dokumentu iristen dira Gipuzkoako Foru Aldundiaren Erregistrora: herritarren eskaerak, beste administrazio batzuen komunikazioak, dokumentazio teknikoa... Guztiak sailkatu eta dagokien administrazio-unitatera esleitu behar dira izapidetzea hasi aurretik. Urtetan, lan hori eskuz egin ohi izan da.
Zifrak zinez esanguratsuak dira: Aldundiak urtero ia bi milioi apunte jasotzen ditu eta gehiengoa bideratuta iristen dira. Horietatik 100.000 erregistro-apunte, ordea, ez daude bideratuta eta eskuz sailkatu behar dira. Zeregin errepikakorra eta balio erantsi txikikoa da hori, eta, urtean 8.300 lan-ordu inguru kontsumitzen ditu, hau da, bost pertsonaren lanaldi osoa urte batean . Horri arazo osagarri bat gehitu behar zaio: eskuzko sailkapena ez da homogeneoa. Pertsonaren eta unitatearen arabera aldatzen da, eta kasuen %8an, gutxienez, berresleipenak sortzen ditu.
Botila-lepo horri aurre egiteko, Izfek ERREKA garatu du (ERREgistro apunteen sailKatzaile Automatikoa), adimen artifizialean (AA) oinarritutako sistema da. 2025eko urritik aurrera, sartzen den dokumentazioa automatikoki sailkatzen hasi da, %93tik gorako zehaztasunarekin.
|
100.000 |
%93,4 |
%~80 |
| apunte/urteko sailkatuta | AA ereduaren zehaztasuna | sailkapen automatizatua |
Dokumentu-uholdea; bulegoa gainezka
Aldundiaren Erregistroa erakundeak jasotzen duen dokumentazio guztiaren sarrera da. Apunteak lau bide nagusietatik iristen dira: aurrez aurre bulegoetan, barne-aplikazioen bidez, online erregistro elektronikoaren bidez eta administrazioen arteko elkarreragingarritasun-sistemaren bidez (SIR). Apunte bakoitza berrikusi, aztertu eta dagokion administrazio-unitatera bideratu behar da.
Lan hori Unitate Generikoek egiten dute, departamentu bakoitzeko Idazkaritza Teknikoetatik kudeatuta. Arduradunek apunte bakoitzaren metadatuak eta erantsitako fitxategiak berrikusi eta zein administrazio-unitatera bidali erabakitzen dute. Ezinbesteko lana da, baina denbora eta giza baliabide asko kontsumitzen ditu.
Kostua ez zen soilik ekonomikoa. Pertsona horiek balio handiagoko zereginetan aritu zitezkeen: herritarren arreta, espedienteen ebazpena edo barne-prozesuen hobekuntza. Azken finean, garrantzizko aukera-kostu bat zegoen, inbertitutako orduez haratago zihoana.
Ikaskuntza automatikoa
ERREKAren garapena, Gipuzkoa Irekia Gipuzkoako Foru Aldundiaren Gobernu Irekiaren plataforma argitaratatu dugun bezala, CRISP-DM (Cross Industry Standard Process for Data Mining) metodologiari jarraiki egin da, datu-meatzaritzako proiektuetako erreferentzia dena. Prozesua bideragarritasun-analisi batekin hasi zen, 2022ko urtarriletik 2023ko abuztura arte eskuz sailkatutako 150.000 bat apunte aztertuz.
Analisi horrek datu gako bat agerian utzi zuen: 21 administrazio-unitatek soilik apunte guztien ia %70 jasotzen dute. Gainerakoek %1 baino gutxiago prozesatzen dute bakoitzak. Metaketa horri esker, AA ereduaren ahalegina helmuga-kopuru maneiagarri baina bolumen handiko batean ardaztu zen.
Eredua trebatzeko, 14 administrazio-unitate hautatu ziren eta datu-base bat eraiki zen 38.037 apunteekin . Bakoitzean erantsitako PDF fitxategien testua ateratzeko zOCR erabili zen, Izfek garatutako karaktere-ezagutza optikoko zerbitzua (Tesseract 5.5ean oinarritua eta 100 hizkuntza baino gehiagorekin bateragarria dena). Ondoren, hizkuntza naturalaren prozesamendu (NLP) teknika aurreratuak aplikatu ziren dokumentu bakoitzeko hitz garrantzitsuenak identifikatu eta kodifikatzeko.
PDFen heterogeneotasuna erronka tekniko handienetako bat izan zen. Dokumentuen kalitatea ez zen parekoa: apunteen dokumentazioan testua eta irudiak nahasten dira, sinadura digitalak sartzen dituzte edo eskaneatutako dokumentu zaharretatik datoz. Egoera horretan, funtsezko zeregina da testu sendoa eta fidagarria erauztea, mota guztietako dokumentuetara egokitzeko modukoa, eta eredua behar bezala entrenatzeko aukera ematen duena.
Hautatutako algoritmoa LightGBM izan zen; ikaskuntza automatikoko teknika hau bere abiaduragatik, datu zaratatsuekin duen eraginkortasunagatik eta eskaintzen duen azalgarritasun-mailagatik nabarmentzen da. Eredua datuen %72,5ekin trebatu eta gainerako %27,5ekin ebaluatu zen, hasierako metrika hauek lortuz: 0,84 zehaztasunean, 0,81 osotasunean eta 0,81 F1-scorean. Sistema STRATIOn zabaldu zen eta bost minuturo informazioa blokeka prozesatzen du automatikoki.
Zazpi hilabeteko proba isila
ERREKA ekoizpenean aktibatu aurretik, taldeak ohikoa ez den estrategia bat bideratu zuen: ezkutuko pilotajea . Zazpi hilabetez, sistemak 19.265 apunte prozesatu zituen lan-fluxu normalarekin batera, paraleloan eta unitateek jakin gabe. Haietatik, 5.637 erabili ziren ERREKAren iragarpenak langileek egindako benetako sailkapenarekin alderatzeko.
Helburu hirukoitza zen: ereduaren benetako zehaztasuna ekoizpen-baldintzetan egiaztatzea, prozesamendu masiboaren abiadura eta egonkortasuna probatzea, eta aurreikusi gabeko efektu posibleak hautematea. Langileak baldintzatu gabe, lortutako datuek sistemaren errendimendua fideltasunez islatzen zuten.
| Zazpi hilabetez, sistemak 19.265 apunte prozesatu zituen lan-fluxu normalarekin paraleloan, unitateek jakin gabe |
Konbentzitzen duten emaitzak
ERREKAk hiru jardun-tartetan dihardu. Konfiantza-maila altua denean, zuzeneko sailkapen automatikoa egiten du. Erdi-mailakoa denean, sailkapen-proposamen bat bidaltzen du, arduradunak klik bakarrarekin balioztatu edo zuzentzen duena. Eta konfiantza baxua denean, apunteak ohiko eskuzko fluxuari jarraitzen dio, sistemaren esku-hartzerik gabe.

Balidazio-fasearen emaitzak adierazgarriak dira. Pertsonal Kudeaketa unitatean (Gobernantza), ERREKAk %92,4ko zehaztasuna lortu zuen sailkapen automatikoan, apunteen %77 bere gain hartuta. Garraioaren Ikuskapen eta Antolaketa ataletan (Mugikortasuna eta Turismoa), zehaztasunak %95 eta %86,3 lortu zituen hurrenez hurren. Bide Azpiegituretan, Plangintza eta Ustiapen atalak %92,7 erregistratu zuen, eta Lurralde Oreka Berdean, Erregistroen unitateak %93,5era iritsi zen.
| 100 iragarpenetik 93 baino gehiago zuzenak dira, eta apunteen ia %80 guztiz automatizatuta sailkatzen dira dagoeneko |
Ereduaren 2.0 bertsiora eboluzionatzean, ERREKAk %93,4ko zehaztasun globala lortu du, hau da, 100 iragarpenetik 93 baino gehiago zuzenak dira. Akats-tasa eskuzko sailkapenak zuen aldakortasunaren azpitik dago. Gainera, apunteen ia %80 guztiz automatizatuta sailkatzen dira, eta horrek nabarmen murrizten du giza berrikuspena behar duen lan-bolumena.
Errepikapen gutxiago, ebazpen gehiago
2025eko urritik aurrera, ERREKA ekoizpenean dago. Aktibatu zen lehen unitatea Gobernantza departamentuko Pertsonal Kudeaketa izan zen, urriaren amaieran, eta azaroaren hasieran beste sei unitate gehitu ziren, Mugikortasuna, Turismoa eta Lurralde Antolaketa, Bide Azpiegiturak eta Lurralde Estrategia eta Lurralde Oreka Berdekoak. Eta azkenik, 2026ko otsailean Zainketa eta Gizarte Politikak eta Ogasuna eta Finantzak sartu dira.
Unitate Generikoetan lan egiten duten pertsonentzat, aldaketa nabarmena da. Lan errepikakorraren zati handi bat desagertu edo nabarmen arindu da. Apunteak dagoeneko sailkatuta edo helmuga-proposamen batekin iristen dira, eta langileek kasu zalantzagarriak soilik berrikusi behar dituzte. Horrela, aurreztutako denbora orain espedienteak ebazteko eta herritarrei erantzuteko epeak laburtzeko bideratzen da.
Azpimarratzekoa da ERREKAk ez dituela pertsonak ordezkatzen . Kontrola unitateetan jarraitzen du: sistemak proposatu egiten du, baina azken erabakia beti gizakiarena izan daiteke. “AA laguntzaile gisa, ez ordezkari gisa” filosofia gakoa izan da erakunde-barneko konfiantza sortzeko. Aldaketaren aurreko erresistentzia oso txikia izan da, neurri handi batean proiektua komunikatzeko gardentasunari eta probetan unitateen parte-hartze aktiboari esker.
Korronteak dakarrena
ERREKA ez da proiektu itxi bat. Taldea dagoeneko ber-trebatze semi-automatikoko sistema batean lanean ari da, eredua etengabe hobetzeko, eta unitateek beraiek balioztaturiko apunteak txertatzea ahalbidetzeko. Helburua bikoitza da: oraingo unitateen zehaztasuna hobetzea eta sistema administrazio-unitate berrietara zabaltzea.
Trafiko-bolumen txikiagoa duten unitateentzat (gainerako %30a), bide desberdina aztertzen da: AA sortzailea . Kontzeptu-proba baten bidez, eredu sortzaileek apunteak sailkatzeko duten gaitasuna aztertzen ari da Izfe. Helburua da ikustea nola jokatzen duten datu historiko gutxi dagoenean, egoera horretan ikasketa automatikoko metodo klasikoek mugak izaten baitituzte.
Epe luzerako ikuspegia handinahia bezain zehatza da: ERREKA Aldundiko unitate guztietara zabaltzea eta automatizazio-ekosistema zabalago baten abiapuntu izatea; finean, langile publikoen zein herritarren esperientzia hobetuko duen ingurune digitala eraikitzea.
ERREKAk erakusten du adimen artifiziala administrazio publikoan modu seguruan, kontrolatuan eta erabilgarrian integra daitekeela. Ez da pertsonak ordezkatzea, denbora benetan garrantzitsua denera bideratzea baizik: herritarrei hobeto zerbitzatzera.