Latijns-Amerika ontwerpt eigen AI-model

Estimated read time 11 min read
AM Whiteboard compressed

Er bestaat kunstmatige intelligentie die buiten big tech om wordt ontwikkeld. In Chili bouwen meer dan twintig Latijns-Amerikaanse landen aan Latam-GPT, een open en traceerbaar AI-model dat hun eigen geschiedenis en cultuur centraal zet.

Wie wil mag naar binnen. Bijna iedereen komt uit nieuwsgierigheid. Maar deze man, die vooralsnog wantrouwig is en aan een leeg tafeltje gaat zitten, komt met de bedoeling om het systeem te foppen. Hij heeft zich voor een willekeurige laptop geïnstalleerd. Verder is de tafel leeg. De laptop is door wetenschappers van het vasteland meegenomen. Op het scherm zie je twee kolommen. In de ene mag hij een woord schrijven. Eén enkel woord, maakt niet uit welk. Net als diverse andere nieuwsgierigen die al zijn langsgekomen en zullen blijven langskomen in de loop van de dag.

De wetenschappers, die toekijken hoe hij daar zit, hebben verteld dat het gaat om kunstmatige intelligentie. Ze zijn hier niet voor het eerst. Een jaar eerder, in november 2023, kwamen ze al eens uit Santiago op uitnodiging van leden de Taalacademie van het eiland Rapa Nui [Paaseiland], om een woordenboek te maken dat de oude taal, die op sterven na dood is, nieuw leven in te blazen. Er zijn nog geen tweeduizend sprekers meer over op de hele wereld, bijna allemaal op het eiland zelf, de helft ouder dan veertig, terwijl nog maar een op de tien kinderen daar de taal verstaat.

AM Meeting in kring compressed
© Latam-GPT

En nu zit hier die wantrouwige man. Hij heeft zijn woord al gekozen. Een woord dat niet bestaat. Hij heeft er goed over nagedacht: het gaat om een woord dat nog nooit iemand op Rapa Nui heeft uitgesproken. Dat niets te maken heeft met hun leven of hun wereld. Hij brengt zijn vingers naar het toetsenbord en tikt: astronaut.

Even gebeurt er niets. De machine denkt na. Of niet. Het lijkt of hij nadenkt: hij is aan het verwerken. Het woord bestaat niet. Niemand heeft ooit ‘astronaut’ gezegd in het Rapa Nui. Maar de machine doet wat hij moet doen. Op het scherm voor de wantrouwige man verschijnen twee woorden: ha’ere hetu’u – wandelaar van de sterren. Astronaut bestaat niet in het Rapa Nui, maar de machine heeft iets vergelijkbaars bedacht en de eerst zo wantrouwige man is gefascineerd.

‘Wat een mooie vertaling,’ zegt hij.

Ook de wetenschappers in het vertrek zijn gefascineerd. Ze zien dat hun app leert en werkt. En dat geldt ook voor hun werkmethode. Ze weten ook dat ze iets veel groters in handen hebben.

Latam-GPT

‘Ik wil dat we allemaal horen over Latam-GPT,’ zegt Ben Cashdan, een cineast en activist uit Zuid-Afrika, die optreedt als gastheer en uitnodigend gebaart naar Alexandra García. ‘In Chili proberen ze een eigen model op te zetten. Wij wensen ze succes bij het uitdagen van de grote en machtige bedrijven. Wat is jullie doel?’ García glimlacht en knikt. De jonge biochemicus is naar deze bijeenkomst in Genève gekomen om uit te leggen waar ze mee bezig zijn in het Cenia, het Nationaal Centrum voor Kunstmatige Intelligentie in Chili, waar zij werkt aan haar postdoc en de dataploeg aanvoert.

‘We proberen een nieuw model te bouwen, ja. Een gezamenlijk model,’ zegt ze. ‘We proberen contact te leggen met alle instanties in Latijns-Amerika. We vinden dat modellen als ChatGPT, Gemini of Claude, die we allemaal gebruiken, onze regio niet vertegenwoordigen zoals wij dat willen. Ze spreken Spaans, maar onze cultuur en kennis zien we er niet in terug.’

Hierover is men komen discussiëren in het hoofdkantoor van de Wereldorganisatie voor Intellectuele Eigendom (WIPO), die valt onder de Verenigde Naties.

‘Het huidige verhaal wil doen geloven dat de enig mogelijke AI die is van de vijf bigtechbedrijven die we allemaal kennen. En die een roofmodel hebben om aan hun data te komen. Maar er zijn een heleboel kleinere AI-projecten die levensvatbaar zijn en culturele diversiteit weerspiegelen.’

AM Programmeren compressed edited
© Latam-GPT

Beatriz Busaniche, een Argentijnse activist op het gebied van digitale rechten, steekt haar vinger op. ‘Ja,’ zegt ze. ‘Er is sprake van een wedloop, dat is zo. Waar het om gaat, is dat niet alle neuzen dezelfde kant op staan.’

García brengt het gesprek terug op Latam-GPT en legt uit waarin het zich onderscheidt. ‘Voor ons is het grootste probleem de weergave en transparantie van data. Als je in de technische rapporten van de grote bedrijven leest waar zij hun data vandaan halen, word je geen cent wijzer. Er staat dat die uit boeken en van Wikipedia komen. We tasten in het duister als we die technologie gebruiken.’

In dit gat, het ontbreken van betrouwbare bronnen, wil Latam-GPT springen. Het is een deel van hun kracht: dat ze hun dataset opbouwen met wetenschappelijke, openbare en particuliere instellingen uit de regio, naast een eigen taalmodel dat de gegevens verwerkt en coherente tekst kan genereren, vragen kan beantwoorden, kan vertalen en verschillende taken met betrouwbare informatie kan uitvoeren.

‘Voor ons is het grootste probleem de weergave en transparantie van data’

Het taalmodel van Latam-GPT zal zijn bron openhouden. Het omvat 70 biljoen parameters, elk met een numerieke waarde, een instructie die het systeem geschikt maakt om te leren specifieke taken uit te voeren. De inhoud is vergelijkbaar met die van Deep Seek (dat tussen de 70 en 90 biljoen parameters heeft), maar haalt het niet bij Gemini (200 biljoen), ChatGPT (175 biljoen), of Claude (130 biljoen).

Het einddoel van Latam-GPT is niet alleen een grote chatbot met algemene thema’s. De dataset en het taalmodel moeten beschikbaar zijn voor iedereen die de handschoen opneemt en afwijkende apps wil ontwerpen. De vertaaltool in het Rapa Nui was een eerste experiment van die aard, dat het Cenia uitvoerde samen met het Centrum voor Toegepaste Antropologie van de Katholieke Universiteit van Chili. Ze verwachten veel meer tools te kunnen ontwikkelen.

Het model verschilt qua schaal en filosofie van alles wat tot nu toe is gedaan. García twijfelt niet: ‘Wij proberen de manier waarop AI zich ontwikkelt te veranderen.’

Mayonaise

Latam-GPT zal tegen de herfst worden gelanceerd. In juni 2025 worden de aanwezige buitenlandjournalisten in Santiago toegesproken door de Chileense minister van Wetenschap, Technologie, Kennis en Innovatie en de directeur van het Cenia. Omdat het project moeilijk uit te leggen is, kiest iedereen zijn eigen metaforen. Ook Álvaro Soto spreekt de journalisten toe. Vandaag draagt hij een donker overhemd, maar op bijna alle officiële foto’s zie je hem in een T-shirt met korte mouwen en een ketting om zijn hals. Hij woonde een groot deel van zijn leven in de Verenigde Staten, waar hij in de cognitieve robotica werkte tot hij bedacht dat het geen zin had om te doen wat iedereen in Noord-Amerika al deed. Hij kon zich beter inzetten voor iets wat niemand in het Zuiden deed. Terug in Chili richtte hij in 2021 het Cenia op.

‘Eén ding moet je goed begrijpen over deze technologie,’ zegt hij. ‘Ik zie het als het maken van mayonaise. Je doet olie en eieren in een kom, en roeren maar. Alleen ging het bij AI niet om eieren maar om data, algoritmes. Die almaar door elkaar werden geroerd. Tot iemand zich afvroeg wat er gebeurde als we sneller gingen roeren. En ze voegden meer berekeningen en meer data toe. Zo veel, dat er sprake was van miljarden operaties en er ineens een zelflerend proces ontstond dat we niet eerder hadden gezien. Dat is wat er met ChatGPT gebeurde. Iets waar de hele wereld versteld van stond.’

AM Meeting aan tafel compressed
© Latam-GPT

Het Cenia wordt gefinancierd door de Chileense regering en internationale instanties. Er zijn momenteel ruim honderd wetenschappers van vijftien Chileense universiteiten aan verbonden, die werken aan diverse AI-gerelateerde initiatieven. Minstens dertig van hen, mannen en vrouwen in verschillende stadia van hun leerproces, zijn betrokken bij Latam-GPT en doen het mensenwerk, verdeeld over vier fases, waaronder ethiek. Het niet-menselijke werk, de fase waarin het systeem zelflerend wordt, vindt plaats in een computercentrum van de Universiteit van Tarapacá, dat is opgezet in de woestijnachtige provincie Arica, aan de grens met Bolivia.

De informatie bestrijkt een breed aantal onderwerpen, uiteenlopend van wetenschap, politiek en sport tot kunst, gezondheid en recreatie. Latam-GPT zal een ‘antigedicht’ van Nicanor Parra nauwkeurig kunnen begrijpen, kunnen vertellen waarom Chili buiten de boot viel bij het laatste WK voetbal, weten wie Tía Pikachu is en wat de nieuwe rechten in de regio zijn, en hoe het zit met de diverse posities van de inheemse gemeenschappen wat betreft recht op water in de Lithiumdriehoek.

Nog een andere Argentijnse bijdrage van was cruciaal voor de Cenia-ploeg. Toen zij Álvaro Soto leerde kennen, vroeg Beatriz Busaniche hem naar het beleid van Latam-GPT ten aanzien van intellectueel eigendom. De directeur van Cenia vroeg of zo’n beleid dan nodig was. Busaniche waarschuwde hem: een van de grote problemen waar big tech mee kampt, zijn de vele aanklachten uit de culturele sector vanwege het gebruik en de invoer van hun werk in de databases waarmee vervolgens winst wordt gemaakt.

Auteursrecht

In Latijns-Amerika zitten de experts op dit gebied aan de andere kant van de Río de la Plata [de natuurlijke grens tussen Argentinië en Uruguay]. Zo is Data Uruguay een ngo die zich bezighoudt met technologie en mensenrechten. In 2024 sloot de organisatie zich aan bij Latam-GPT. Vanuit Montevideo leggen ze uit wat hun werk inhoudt. ‘Bijvoorbeeld: mag je de notulen van alle parlementen, van tientallen jaren debat tussen overlegorganen van Latijns-Amerika, zomaar overnemen? In eerste instantie denk je misschien dat het gaat om openbare informatie. Maar de toespraken vallen onder het auteursrecht en de bepalingen over de toegang tot openbare informatie zijn niet duidelijk. Bovendien verschillen ze per land. Daar moet je allemaal op letten.’

Busaniche licht toe dat de bigtechbedrijven geen moeite hebben met de rechtszaken die grote onder- nemingen uit de culturele sector tegen hen aanspannen en rustig doorgaan met het verzamelen van data, maar organisaties met minder economische en financiële armslag zullen zwaar worden getroffen. Latam-GPT besloot dit punt op te lossen door een disclaimer toe te voegen met een e-mailadres waar iedere instantie of persoon zich desgewenst kan melden met het verzoek om verwijdering van zijn data.

AM Man en vrouw compressed
© Latam-GPT

‘Het grote probleem van dit gedeelde verzamelmodel zijn de transactiekosten,’ zegt Patricia Díaz, een andere betrokkene. ‘Alle werkuren die gaan zitten in het tekenen van overeenkomsten om gegevens te verkrijgen. En de tijd: Deep Seek werd bijvoorbeeld in zes maanden opgezet; Latam-GPT is al
twee jaar bezig met het verzamelen van data. Maar dat is de prijs voor fatsoen en nette praktijken. Dat is deels waarmee dit project zich onderscheidt.’ Bij het slotbanket van een bedrijfsevenement in de VS kwam Soto eens een oude studievriend tegen, laten we hem Damián noemen. Het was 2005 en ze waren elkaar al een paar jaar uit het oog verloren. Soto vroeg hoe het hem was vergaan en toen de ander begon te vertellen over zijn nieuwe werk, gaf een van de mensen aan de andere kant van de ronde tafel hem een seintje. Damián trok zijn gezicht in de plooi, stond op en liep naar de man toe, die hem kort iets influisterde. Toen hij weer op zijn plaats zat, zei hij tegen Soto: ‘Sorry, ik kan er verder niks over zeggen.’

Later ontdekte Soto dat daar toen bijna allemaal leidinggevenden van Google zaten, het bedrijf waar zijn oude vriend was gaan werken. Twintig jaar later vertelt de directeur van Cenia in Santiago dat hij tijdens dat banket begreep dat bigtechbedrijven terughoudend begonnen te worden over hun vorderingen en er niets meer over kwijt wilden. Maar met ChatGPT ging het anders: ‘Het is niet zo dat een paar wetenschappers een geheime formule aan het bedenken waren en wij nu dertig jaar achterlopen omdat we zulke wetenschappers niet hadden, iets wat wel gebeurt bij andere technologische ontwikkelingen. Het was een recept dat iedereen kende. Het ging om OpenAI, dat daarna veranderde in ClosedAI, maar zijn poorten een beetje te laat sloot. Het is niet als bij Coca-Cola, dat iemand zegt: Jeetje, wat zou de formule van Coca-Cola zijn. Nee, hier is alles openbaar en kunnen we allemaal Coca-Cola maken. Net als mayonaise. Dat is de formule die wij willen hanteren en proberen op te schalen.’

You May Also Like

More From Author