Por qué la Inteligencia Artificial ‘piensa’ en inglés y qué consecuencias puede tener para la diversidad

Una investigación reveló cómo los modelos de lenguaje procesan los idiomas diferentes del inglés, y desató un debate sobre el anglocentrismo y su impacto social y cultural

Guardar
El predominio del inglés en los modelos de IA plantea graves preguntas sobre equidad y diversidad (Imagen Ilustrativa Infobae)
El predominio del inglés en los modelos de IA plantea graves preguntas sobre equidad y diversidad (Imagen Ilustrativa Infobae)

La inteligencia artificial (IA) se entrelaza cada vez más con nuestras vidas cotidianas, lo cual plantea una cuestión que despierta tanto curiosidad como preocupación: ?por qué los modelos de lenguaje de gran tama?o (LLM), el cerebro de los chatbots, piensan en inglés incluso cuando interactúan en otros idiomas? Si bien tanto los términos cerebro y piensan son sólo analogías, permiten analizar por qué lo que podría parecer una peculiaridad técnica sin mayores consecuencias es, en realidad, algo realmente complicado. Esta característica de los LLM tiene implicaciones profundas, no solo en la eficiencia de la comunicación global digital sino también en la diversidad cultural y lingüística de nuestra sociedad global.

Cuando se plantean preguntas en chino, francés, alemán o ruso a estos modelos de lenguaje, parece que procesan las consultas en inglés, lo cual podría generar problemas culturales dada la prevalencia de conceptos más comunes en las culturas de habla inglesa. Este fenómeno se puso de manifiesto con el lanzamiento de ChatGPT, que marcó un punto de inflexión en la popularización de los LLM (y, para los hablantes de castellano, inundó el mundo de gerundios mal empleados). Una investigación reciente realizada por Chris Wendler, Veniamin Veselovsky y sus colegas del Instituto Federal Suizo de Tecnología, de Lausana, mostró cómo procesan las consultas los modelos Llama 2 de Meta. Al difundirla, New Scientist ofreció una visión fascinante del funcionamiento interno de estos sistemas y sus posibles sesgos.

?Cómo “piensan” los modelos en inglés?

Los modelos de lenguaje grande procesan idiomas no ingleses a través de un "subespacio inglés" (Imagen Ilustrativa Infobae)
Los modelos de lenguaje grande procesan idiomas no ingleses a través de un "subespacio inglés" (Imagen Ilustrativa Infobae)

Los científicos alimentaron a los modelos Llama 2 con tres tipos de instrucciones en chino, francés, alemán y ruso: una solicitaba repetir la palabra dada; otra pedía traducir de uno de esos idiomas a otro; y la tercera solicitaba completar un espacio en blanco en una oración. Al rastrear cómo los modelos procesaban cada instrucción, descubrieron que casi siempre la ruta de procesamiento a través de las capas pasaba por lo que denominaron el subespacio inglés. Esto indica fuertemente que el inglés es utilizado como un puente para ayudar a entender los conceptos: para que los LLM comprendan y procesen conceptos en varios idiomas, primero traducen estos conceptos al inglés, procesan la información, y luego traducen las respuestas de vuelta al idioma de origen.

?Por qué es importante esta “anglocentración”?

El dominio del inglés en los modelos de IA plantea preguntas cruciales sobre la diversidad y la equidad. Carissa Véliz, de la Universidad de Oxford, y Aliya Bhatia, del Centro para la Democracia & Tecnología en Washington DC, comentaron a New Scientist cómo el anglocentrismo podría reducir la diversidad y superponer una vista limitada del mundo sobre regiones lingu?ística y culturalmente distintas. Esto no solo afecta a la precisión con que se generan respuestas en otros idiomas pero podría también llevar a resultados irrelevantes o incluso peligrosos en situaciones críticas.

?Qué dicen los especialistas?

Existen desafíos logísticos y financieros para crear un modelo de IA global y representativo (Imagen Ilustrativa Infobae)
Existen desafíos logísticos y financieros para crear un modelo de IA global y representativo (Imagen Ilustrativa Infobae)

Aunque tales modelos pueden ofrecer un rendimiento fuerte en tareas en varios idiomas, gracias al inglés como lengua pivote, el riesgo de sesgo es significativo. Veselovsky, uno de los investigadores, subrayó a New Scientist que la prevalencia de datos de alta calidad en inglés para entrenar a estos modelos es mayor que en la mayoría de otros idiomas, lo cual puede favorecer inadvertidamente los valores culturales anglocéntricos.

?Es factible implementar un modelo multilingüe equitativo?

La implementación de un modelo LLM verdaderamente multilingüe plantea desafíos no solamente técnicos, sino también éticos y económicos. Aunque los modelos como Llama 2 de Meta han demostrado capacidad para procesar y responder preguntas en varios idiomas, estos todavía dependen predominantemente del inglés como un “lenguaje puente”.

Dise?ar e implementar un modelo que opere de manera nativa en múltiples idiomas sin recurrir al inglés como intermediario implica superar varios obstáculos. Primero, requiere la compilación de un corpus de entrenamiento diverso y representativo que abarque una amplia gama de idiomas y dialectos. Esto, a su vez, conlleva a la necesidad de recabar y procesar enormes cantidades de datos en idiomas menos dominantes en el entorno digital, lo que representa un desafío logístico y financiero considerable.

Los investigadores suizos destacaron la importancia de desarrollar modelos de IA multilingües (Imagen Ilustrativa Infobae)
Los investigadores suizos destacaron la importancia de desarrollar modelos de IA multilingües (Imagen Ilustrativa Infobae)

Además, la dependencia del inglés en los LLM refleja patrones de poder y privilegio en el mundo real. Combatir esta tendencia significa enfrentar y cuestionar estos patrones, pero sobre todo hacer un esfuerzo para lograr una representación equitativa de todas las culturas y lenguas.

?Hacia dónde nos dirigimos?

La detección de un sesgo anglocéntrico en los LLM abre un campo de investigación crucial para el futuro de la inteligencia artificial: cómo garantizar que los avances tecnológicos beneficien equitativamente a todas las culturas y lenguas. Es esencial que las futuras versiones de modelos de lenguaje grande se desarrollen con una cobertura lingüística más equitativa para reflejar y respetar la rica diversidad del panorama lingüístico y cultural humano, destacaron los investigadores suizos.

Guardar
seductrice.net
universo-virtual.com
buytrendz.net
thisforall.net
benchpressgains.com
qthzb.com
mindhunter9.com
dwjqp1.com
secure-signup.net
ahaayy.com
tressesindia.com
puresybian.com
krpano-chs.com
cre8workshop.com
hdkino.org
peixun021.com
qz786.com
utahperformingartscenter.org
worldqrmconference.com
shangyuwh.com
eejssdfsdfdfjsd.com
playminecraftfreeonline.com
trekvietnamtour.com
your-business-articles.com
essaywritingservice10.com
hindusamaaj.com
joggingvideo.com
wandercoups.com
wormblaster.net
tongchengchuyange0004.com
internetknowing.com
breachurch.com
peachesnginburlesque.com
dataarchitectoo.com
clientfunnelformula.com
30pps.com
cherylroll.com
ks2252.com
prowp.net
webmanicura.com
sofietsshotel.com
facetorch.com
nylawyerreview.com
apapromotions.com
shareparelli.com
goeaglepointe.com
thegreenmanpubphuket.com
karotorossian.com
publicsensor.com
taiwandefence.com
epcsur.com
southstills.com
tvtv98.com
thewellington-hotel.com
bccaipiao.com
colectoresindustrialesgs.com
shenanddcg.com
capriartfilmfestival.com
replicabreitlingsale.com
thaiamarinnewtoncorner.com
gkmcww.com
mbnkbj.com
andrewbrennandesign.com
cod54.com
luobinzhang.com
faithfirst.net
zjyc28.com
tongchengjinyeyouyue0004.com
nhuan6.com
kftz5k.com
oldgardensflowers.com
lightupthefloor.com
bahamamamas-stjohns.com
ly2818.com
905onthebay.com
fonemenu.com
notanothermovie.com
ukrainehighclassescort.com
meincmagazine.com
av-5858.com
yallerdawg.com
donkeythemovie.com
corporatehospitalitygroup.com
boboyy88.com
miteinander-lernen.com
dannayconsulting.com
officialtomsshoesoutletstore.com
forsale-amoxil-amoxicillin.net
generictadalafil-canada.net
guitarlessonseastlondon.com
lesliesrestaurants.com
mattyno9.com
nri-homeloans.com
rtgvisas-qatar.com
salbutamolventolinonline.net
sportsinjuries.info
wedsna.com
rgkntk.com
bkkmarketplace.com
zxqcwx.com
breakupprogram.com
boxcardc.com
unblockyoutubeindonesia.com
fabulousbookmark.com
beat-the.com
guatemala-sailfishing-vacations-charters.com
magie-marketing.com
kingstonliteracy.com
guitaraffinity.com
eurelookinggoodapparel.com
howtolosecheekfat.net
marioncma.org
oliviadavismusic.com
shantelcampbellrealestate.com
shopleborn13.com
topindiafree.com
v-visitors.net
djjky.com
053hh.com
originbluei.com
baucishotel.com
33kkn.com
intrinsiqresearch.com
mariaescort-kiev.com
mymaguk.com
sponsored4u.com
crimsonclass.com
bataillenavale.com
searchtile.com
ze-stribrnych-struh.com
zenithalhype.com
modalpkv.com
bouisset-lafforgue.com
useupload.com
37r.net
autoankauf-muenster.com
bantinbongda.net
bilgius.com
brabustermagazine.com
indigrow.org
miicrosofts.net
mysmiletravel.com
selinasims.com
spellcubesapp.com
usa-faction.com
hypoallergenicdogsnames.com
dailyupdatez.com
foodphotographyreviews.com
cricutcom-setup.com
chprowebdesign.com
katyrealty-kanepa.com
tasramar.com
bilgipinari.org
four-am.com
indiarepublicday.com
inquick-enbooks.com
iracmpi.com
kakaschoenen.com
lsm99flash.com
nana1255.com
ngen-niagara.com
technwzs.com
virtualonlinecasino1345.com
wallpapertop.net
casino-natali.com
iprofit-internet.com
denochemexicana.com
eventhalfkg.com
medcon-taiwan.com
life-himawari.com
myriamshomes.com
nightmarevue.com
healthandfitnesslives.com
androidnews-jp.com
allstarsru.com
bestofthebuckeyestate.com
bestofthefirststate.com
bestwireless7.com
britsmile.com
declarationintermittent.com
findhereall.com
jingyou888.com
lsm99deal.com
lsm99galaxy.com
moozatech.com
nuagh.com
patliyo.com
philomenamagikz.net
rckouba.net
saturnunipessoallda.com
tallahasseefrolics.com
thematurehardcore.net
totalenvironment-inthatquietearth.com
velislavakaymakanova.com
vermontenergetic.com
kakakpintar.com
begorgeouslady.com
1800birks4u.com
2wheelstogo.com
6strip4you.com
bigdata-world.net
emailandco.net
gacapal.com
jharpost.com
krishnaastro.com
lsm99credit.com
mascalzonicampani.com
sitemapxml.org
thecityslums.net
topagh.com
flairnetwebdesign.com
rajasthancarservices.com
bangkaeair.com
beneventocoupon.com
noternet.org
oqtive.com
smilebrightrx.com
decollage-etiquette.com
1millionbestdownloads.com
7658.info
bidbass.com
devlopworldtech.com
digitalmarketingrajkot.com
fluginfo.net
naqlafshk.com
passion-decouverte.com
playsirius.com
spacceleratorintl.com
stikyballs.com
top10way.com
yokidsyogurt.com
zszyhl.com
16firthcrescent.com
abogadolaboralistamd.com
apk2wap.com
aromacremeria.com
banparacard.com
bosmanraws.com
businessproviderblog.com
caltonosa.com
calvaryrevivalchurch.org
chastenedsoulwithabrokenheart.com
cheminotsgardcevennes.com
cooksspot.com
cqxzpt.com
deesywig.com
deltacartoonmaps.com
despixelsetdeshommes.com
duocoracaobrasileiro.com
fareshopbd.com
goodpainspills.com
hemendekor.com
kobisitecdn.com
makaigoods.com
mgs1454.com
piccadillyresidences.com
radiolaondafresca.com
rubendorf.com
searchengineimprov.com
sellmyhrvahome.com
shugahouseessentials.com
sonihullquad.com
subtractkilos.com
valeriekelmansky.com
vipasdigitalmarketing.com
voolivrerj.com
zeelonggroup.com
1015southrockhill.com
10x10b.com
111-online-casinos.com
191cb.com
3665arpentunitd.com
aitesonics.com
bag-shokunin.com
brightotech.com
communication-digitale-services.com
covoakland.org
dariaprimapack.com
freefortniteaccountss.com
gatebizglobal.com
global1entertainmentnews.com
greatytene.com
hiroshiwakita.com
iktodaypk.com
jahatsakong.com
meadowbrookgolfgroup.com
newsbharati.net
platinumstudiosdesign.com
slotxogamesplay.com
strikestaruk.com
trucosdefortnite.com
ufabetrune.com
weddedtowhitmore.com
12940brycecanyonunitb.com
1311dietrichoaks.com
2monarchtraceunit303.com
601legendhill.com
850elaine.com
adieusolasomade.com
andora-ke.com
bestslotxogames.com
cannagomcallen.com
endlesslyhot.com
iestpjva.com
ouqprint.com
pwmaplefest.com
qtylmr.com
rb88betting.com
buscadogues.com
1007macfm.com
born-wild.com
growthinvests.com
promocode-casino.com
proyectogalgoargentina.com
wbthompson-art.com
whitemountainwheels.com
7thavehvl.com
developmethis.com
funkydogbowties.com
travelodgegrandjunction.com
gao-town.com
globalmarketsuite.com
blogshippo.com
hdbka.com
proboards67.com
outletonline-michaelkors.com
kalkis-research.com
thuthuatit.net
buckcash.com
hollistercanada.com
docterror.com
asadart.com
vmayke.org
erwincomputers.com
dirimart.org
okkii.com
loteriasdecehegin.com
mountanalog.com
healingtaobritain.com
ttxmonitor.com
nwordpress.com
11bolabonanza.com