A constatação de que, no presente e mais ainda no futuro, múltiplos aspetos cruciais da atividade social, económica ou científica são realizados com recurso a intermediação tecnológica coloca a governação da internet (do digital, em geral) como questão central na discussão pública. Juntando a esta a de que a tecnologia e os recursos computacionais de inteligência artificial (IA) generativa (como o chatgpt) e os milhões de dados que os alimentam e de que se alimentam são detidos e estão concentrados num núcleo reduzido de grandes tecnológicas (big techs), algumas questões emergem.
Partindo dos dados que gerem de forma fechada, os modelos de linguagem desenvolvidos por essas grandes tecnológicas, detentoras da tecnologia, traduzem e veiculam padrões, sistemas, serviços e aplicações próprios, que não refletem necessariamente nem convocam as realidades e a diversidade que o mundo encerra, sem que, pelas exigências financeiras que os recursos computacionais nos quais assentam exigem, o panorama se possa alterar com facilidade.
Juntando a esse facto o de privilegiarem uma determinada língua na construção desses modelos, os padrões linguísticos, as sequências discursivas e os conteúdos gerados (codificados nos dados) veiculam também eles uma forma própria e específica de se estruturar e de representar a realidade, assim tornada hegemónica.
A construção de uma internet socialmente justa, que respeite a diversidade, o multilinguismo, assente numa visão multissetorial e multilateral, surge, por tal, entre os desígnios que o Fórum inscreveu no que nomeou “Carta de São Paulo”, realçando a importância de diminuir a assimetria computacional, abrir a tecnologia a um maior número possível de atores e advogar uma política de acesso aberto aos dados.
A dimensão da tarefa de criar bases de dados específicas (datasets) que constituam amostras para treino de algoritmos de IA e desenvolver modelos de computação (em língua portuguesa - LP) é enorme e apenas, ao nível da CPLP, uma forte cooperação entre os Estados (mobilizando empresas e a academia) facilitará avanços nessa maior autonomização, vista também como uma questão de soberania.
Todas estas questões são também decisivas para uma presença forte da LP na internet e no digital, ao mesmo tempo que a ciência construída nesse embasamento linguístico e simbólico estará mais próxima dos valores e das realidades daqueles que a usam.
Sendo, assim, fundamentais, outras, porém, se lhe acrescentam onde focámos a intervenção.
No referido estudo sobre a PPI, focado no uso das línguas em contexto digital e aplicando uma metodologia que toma por referência os dados relativos a falantes de L1 e L2 (língua materna e não materna), a LP ocupa a 6ª posição mundial, com a possibilidade de reforçar a sua presença, mas também com o risco de perder até 4 posições.
Para além das condicionantes estratégicas sinalizadas, em termos da LP e dos espaços onde circula, a assunção da internet (do digital) como um bem público e um direito fundamental dos cidadãos afigura-se também como um vetor central.
O relevo que a incorporação da dimensão tecnológica digital detém hoje no empoderamento dos cidadãos, no exercício da sua cidadania, no acesso ao conhecimento, na criação e na expressão de informação e de conteúdos e na proteção de outros direitos humanos acentua a necessidade da sua consideração como um bem comum, humano e público, importando, por tal, que as agendas digitais dos países confiram às pessoas uma relevância idêntica à que merecem a economia e a modernização do Estado.
Os dados da International Communication Unit ajudam a compreender essa necessidade. Considerando a população, o acesso à internet em metade dos países de LP situa-se ainda bem abaixo da média mundial (64,4%), variando entre os 17,4% e os 85,1%. Tal poderá significar cerca de 70 milhões de pessoas excluídas, sendo que, se se associar a taxa de acesso ao peso que a faixa dos 0-14 anos tem na estrutura demográfica (representando o maior peso precisamente nos países com menor conectividade), tudo indica que parte importante desses excluídos serão jovens em formação e em processo de aquisição da própria LP, L2 em muitos contextos sociolinguísticos destes países. Num outro dado relevante, o custo de acesso pesa quatro vezes mais no rendimento mensal (6%) nos países menos desenvolvidos do que no resto do mundo, o que indiciará também níveis elevados de precariedade no acesso.
Entendendo o acesso ao digital e às suas tecnologias como forma de reforçar a cidadania e a participação nas dinâmicas sociais, económicas, culturais e académicas, o cenário aponta para uma brecha digital dos países relativamente a outros na mesma região e, sobretudo, para desigualdades e diferenças de oportunidade dentro de cada país, a afastarem muitos das novas formas de participar. E tudo isto de forma significativa (que não exclusiva) em português, que é também uma forma de construir e exercer cidadania.
O alargamento da acessibilidade e a aposta na literacia digital (o acesso não significa o uso ou o bom uso, dependendo isso das competências digitais que o indivíduo possua, das condições de que disponha para que as possa desenvolver e da adequação dessas competências a um princípio de bem comum) constituem, por isso, outro nível de cooperação e de articulação no âmbito da governação da internet nos países de LP.
Caberá à ARME - Agência Reguladora Multissectorial da Economia organizar o 2ª Fórum, em 2024. Boas notícias serão aí a mitigação das brechas e das desigualdades digitais, o investimento no património informacional (“digitização”), na coleção de dados (“dataficação”) e no reforço dos bens públicos e da inovação (“digitalização), o que aumentará os 3,7% do tráfego linguístico na internet que agora decorre em LP.
Texto originalmente publicado na edição impressa do Expresso das Ilhas nº 1139 de 27 de Setembro de 2023.