Itzulpen automatikoan genero-alborapena zuzentzeko teknika sortu du Oraik
Genero-alborapena arazo ezaguna da adimen artifizialaren alorrean. Izan ere, gaur egun alor horretan erabiltzen diren algoritmo gehienek adibideetatik ikasten dute, eta adibide horietan dauden alborapen eta estereotipo sozialak ere ikasten dituzte. Hortaz, algoritmo horiekin ikasitako sistemek alborapen hori errepikatzeko joera dute.
Itzulpen automatikoko sistema neuronalek ere arazo bera dute, eta entrenamendu-adibideetan ageri den genero-alborapena itzulpenetara eramaten dute, gaztelaniara itzulitako adibide hauetan ikus daitekeen moduan: "Nire ama errementaria da. ⇒Mi madre es herrero". "Nire aita erizaina da. ⇒ Mi padre es enfermera".
Oraik azaldu duenez, "itzulpen automatikoko sistemen erabilera masiboa dela eta, halako genero-alborapenak iraunarazteko eta areagotzeko arriskua dago. Genero-alborapenaren arazoa kudeatzea ez da erraza, eta are gutxiago itzulpena generorik gabeko hizkuntza batetik egiten denean, hala nola euskaratik".
Egoerari konponbidea bilatze aldera, generorik gabeko hizkuntzentzat baliagarria den teknika ikertu eta garatu du Oraik. NLP teknologietako ikertzaile den Ander Corralek adierazi duenez, proposatutako teknikak bi metodo uztartzen ditu: “Alborapena duen sistema neuronalak adibide orekatuetatik ikasiz alborapen hori zuzentzeko metodo bat, eta sistema neuronalari generorik gabeko hizkuntzan genero-informazioa modu esplizituan txertatzeko metodo bat”.
NLP teknologietako arduraduna den Xabier Saralegiren hitzetan, “sortutako teknika konputazionalki arina da, eta ez da konplexua produkzioan dauden sistemetan txertatzea. Teknika honi esker, genero-alborapenik gabeko itzulpen automatikotik hurbilago gaude; pauso garrantzitsua da hau genero-alborapenik gabeko itzulpen automatikoak lortzeko norabidean”.
Ikerketa-lana abenduaren 7 eta 8an izandako Itzulpen Automatikoko Zazpigarren Konferentzian (Seventh Conference on Machine Translation - WMT22) aurkeztu dute. Ander Corral eta Xabier Saralegiren artikulua hemen irakur daiteke, ingelesez.

