Anunciado na semana passada pelo primeiro-ministro, Luís Montenegro, na Web Summit, em Lisboa, o Large Language Model - Grande Modelo de Linguagem - em português de Portugal que será em breve desenvolvido levantou algumas questões acerca do investimento público e da sua aplicabilidade real. Ao DN, o especialista Paulo Dimas afirma que há defesa do património cultural que apenas o país pode fazer. E lembra que este tipo de dados ficam disponíveis para o mundo..“A necessidade de existir um LLM treinado com dados portugueses de Portugal é um imperativo de soberania”, diz o presidente do Center for Responsible AI. “Nós não podemos delegar nas empresas americanas a geração de linguagem relativa à nossa variante linguística, à variante falada em Portugal. Além disso, se quisermos usar os LLM, por exemplo, em domínios como a Educação, há um desafio que é a representatividade cultural.”.É um facto que, atualmente, se pedirmos a uma grande IA como o ChatGPT (o próprio ou via Copilot, da Microsoft) ou ao Gemini, da Google, para criar a imagem de um juiz de tribunal, este irá gerar a figura típica dos filmes norte-americanos. Os próprios gigantes de software, hoje, reconhecem que a multirrepresentatividade cultural é ainda um desafio para os seus sistemas..No entanto, se este tipo de dados estiverem disponíveis, os próprios gigantescos LLM e os motores de busca poderão “alimentar-se” destes dados e, como tal, apresentar melhores resultados. “É só eles quererem”, reconhece Paulo Dimas..Há ainda outra razão para investir no LLM português: “Se quisermos que a Administração Pública use este tipo de tecnologia, - e a Administração Pública lida, obviamente, com dados que são confidenciais dos cidadãos -, temos de garantir que estes dados não saem para as grandes empresas tecnológicas, que não são usados para treino, etc. Não podemos depender dessas grandes tecnológicas que veem valor económico nos nossos dados.”