¿Puede la IA reemplazar a un jurado creativo de periodistas? Los Premios Epica responden

La inte­li­gen­cia arti­fi­cial es uno de los temas más popu­la­res del momen­to, y pre­ci­sa­men­te por ello es que los Epi­ca Awards, cono­ci­dos des­de hace más de 30 años como los pre­mios del sec­tor que cuen­tan con un jura­do inte­gra­do úni­ca y exclu­si­va­men­te por perio­dis­tas, se han pre­gun­ta­do: ¿pue­de una IA sus­ti­tuir a un jura­do crea­ti­vo?

Así es como nace «AIJE», un expe­ri­men­to de jura­do de inte­li­gen­cia arti­fi­cial, que tie­ne como prin­ci­pal obje­ti­vo explo­rar el poten­cial de la IA para eva­luar y com­pren­der ideas crea­ti­vas. El expe­ri­men­to se reali­zó en para­le­lo al con­cur­so 2023, cele­bra­do el pasa­do mes de diciem­bre en Bru­se­las, y su resul­ta­do no se incor­po­ró a los pre­mios prin­ci­pa­les, que juz­ga un jura­do de más de 150 perio­dis­tas huma­nos.

Mark Tun­ga­te, direc­tor edi­to­rial de los Pre­mios Epi­ca, lo expli­ca: «Nues­tro jura­do de pren­sa, deseo­so de docu­men­tar acon­te­ci­mien­tos de actua­li­dad, reco­no­ció que la IA es un tema acu­cian­te. Esto nos lle­vó a unir­nos a la con­ver­sa­ción con un expe­ri­men­to des­en­fa­da­do pero que invi­ta a la refle­xión».

  • Los Pre­mios Epi­ca expe­ri­men­tan con un jura­do de inte­li­gen­cia arti­fi­cial

Como deta­llan los resul­ta­dos de este curio­so expe­ri­men­to, el pro­ce­so de eva­lua­ción de la IA fue rigu­ro­so. En esta pri­me­ra ver­sión, se basó úni­ca­men­te en las des­crip­cio­nes tex­tua­les de las cam­pa­ñas pro­por­cio­na­das por los par­ti­ci­pan­tes, a quie­nes se les faci­li­tó una herra­mien­ta de estan­da­ri­za­ción para ayu­dar­les a estruc­tu­rar los con­cep­tos crea­ti­vos en des­crip­cio­nes que la IA podía pro­ce­sar fácil­men­te.

En este sen­ti­do, Nico­las Huvé, direc­tor de ope­ra­cio­nes de Epi­ca Awards y crea­dor de AIJE, comen­tó: «Basar­se úni­ca­men­te en la des­crip­ción tex­tual tie­ne sus ven­ta­jas, ya que es algo más demo­crá­ti­co. Al fin y al cabo, una bue­na idea debe­ría poder resu­mir­se en un ‘ele­va­tor pitch’».

Den­tro de la meto­do­lo­gía, las des­crip­cio­nes de todas las entra­das se agru­pa­ron por cate­go­rías y se intro­du­je­ron en la últi­ma GPT4- Tur­bo API jun­to con un men­sa­je que incluía la des­crip­ción de la cate­go­ría, así como la esca­la de pun­tua­ción de los Pre­mios Epi­ca, de este modo se garan­ti­za­ba que las eva­lua­cio­nes de la IA coin­ci­die­ran con los cri­te­rios uti­li­za­dos por los miem­bros huma­nos del jura­do.

Lue­go, la IA gene­ró pun­tua­cio­nes, así como una jus­ti­fi­ca­ción tex­tual de su elec­ción para cada entra­da. Un pro­ce­so que no se eje­cu­tó una sola vez, sino 80. Las 80 jus­ti­fi­ca­cio­nes de tex­to tam­bién se sin­te­ti­za­ron para pro­du­cir comen­ta­rios gene­ra­les sobre cada cam­pa­ña por par­te de la IA.

  • ¿Qué pre­mió la IA?

«Nues­tras prue­bas ini­cia­les mos­tra­ron una corre­la­ción pro­me­te­do­ra con las pun­tua­cio­nes huma­nas, espe­cial­men­te en el nivel infe­rior. Sin embar­go, en el expe­ri­men­to en vivo, nos cen­tra­mos úni­ca­men­te en la lis­ta de fina­lis­tas, lo que dio lugar a una dis­cre­pan­cia nota­ble, aun­que no sor­pren­den­te, ya que todas estas can­di­da­tu­ras ya habían sido con­si­de­ra­das de alta cali­dad por un jura­do humano», deta­lla Nico­las Huvé.

Las pun­tua­cio­nes de la IA fue­ron más altas, con una media de 7,45, en con­tras­te con las pun­tua­cio­nes huma­nas, que pro­me­dia­ron 6.60. Esta ten­den­cia pone de mani­fies­to una dife­ren­cia fun­da­men­tal en el enfo­que de eva­lua­ción.

«Los perio­dis­tas, cono­ci­dos por su aná­li­sis crí­ti­co, sue­len ser más duros en su pun­tua­ción. En cam­bio, la AIJE ten­día a dejar­se impre­sio­nar más fácil­men­te. En la sala del jura­do, los perio­dis­tas podían iden­ti­fi­car ideas que se habían hecho antes de algu­na mane­ra, mien­tras que AIJE per­ci­bía la nove­dad», con­ti­núa Huvé.

Esta dife­ren­cia pone de relie­ve una mayor com­pren­sión de los perio­dis­tas a la hora de iden­ti­fi­car la ori­gi­na­li­dad. Pero AIJE fue más impar­cial. «AIJE pare­cía más efi­caz a la hora de eva­luar una cam­pa­ña estric­ta­men­te den­tro del ámbi­to de su cate­go­ría. A dife­ren­cia de los jura­dos huma­nos, que pue­den dar pun­tua­cio­nes más altas o más bajas a tra­ba­jos que per­so­nal­men­te pre­fie­ren o les dis­gus­tan, AIJE no se vio influi­do por esos ses­gos huma­nos», aña­de Huvé.

  • El fac­tor humano ver­sus la inte­li­gen­cia arti­fi­cial

Para ilus­trar el fac­tor humano en la eva­lua­ción, Huvé expli­ca el ejem­plo de The XTin­ction Time­li­ne, de McCann World­group Ale­ma­nia, una acción que yux­ta­po­ne el cam­bio de mar­ca del pája­ro de Twit­ter en «X» con la extin­ción de ani­ma­les, un tra­ba­jo que obtu­vo una pla­ta en la cate­go­ría Topi­cal & Real Time de los Epi­ca Awards.

Sobre este caso, la IA comen­tó: «Una cam­pa­ña poten­te y líder en el mer­ca­do que apro­ve­cha inte­li­gen­te­men­te la ola de un acon­te­ci­mien­to de actua­li­dad para abor­dar un pro­ble­ma mun­dial acu­cian­te. El para­le­lis­mo crea­ti­vo tra­za­do entre el cam­bio de mar­ca de Twit­ter y la extin­ción de la fau­na sal­va­je com­bi­na efi­caz­men­te la cul­tu­ra pop con el acti­vis­mo medioam­bien­tal».

Por su par­te, un miem­bro del jura­do humano opi­nó: «Una for­ma muy inte­li­gen­te de apro­ve­char y redi­ri­gir la indig­na­ción. Si no tener rela­cio­nes públi­cas es tener malas rela­cio­nes públi­cas, enton­ces tam­bién bene­fi­ció a X, por des­gra­cia. Espe­re­mos que se con­vir­tie­ra en dona­cio­nes para WWF y no solo en aten­ción a la arro­gan­cia de Musk».

De esta for­ma, el expe­ri­men­to apor­ta valio­sas ideas sobre el papel poten­cial de la IA en la eva­lua­ción de la crea­ti­vi­dad. Las siguien­tes ver­sio­nes de AIJE inclui­rán más cate­go­rías y ele­men­tos visua­les. «Aho­ra pode­mos hacer que no solo mire imá­ge­nes, sino que vea e inter­pre­te vídeos ente­ros de casos prác­ti­cos, lo que abre vías pro­me­te­do­ras para su futu­ro. Aun­que no exclui­mos entre­nar un mode­lo exclu­si­va­men­te con los resul­ta­dos de los pre­mios, pre­fe­ri­ría­mos que AIJE se basa­ra en una IA gene­ral, que es hacia don­de creo que avan­za el cam­po, y que ade­más está más en con­so­nan­cia con el espí­ri­tu outsi­der de los Epi­ca Awards, ale­ján­do­se del ‘bucle de retro­ali­men­ta­ción’ de la indus­tria crea­ti­va», con­clu­ye Huvé.