Quem é dono dos dados públicos — o Estado ou os fornecedores?

Luís Vidigal

Governação eletrónica

Publicado a

A segunda reunião da Rede de Simplificação e Tecnologias do Estado, que decorreu na semana passada, apresentou duas agendas que o Governo trata como complementares. A racionalização da contratação pública de TIC e a Inteligência Artificial na Administração Pública, com o LLM Amália, os gémeos digitais e um plano de formação de 80 milhões de euros. O conjunto tem aparência de estratégia. Contudo, o que lhe falta é a interoperabilidade semântica, como condição viabilizadora de tudo o resto.

A palavra interoperabilidade surge nos documentos oficiais como promessa e nunca como princípio. E é aqui que a diferença importa, pois estamos a falar de política e não apenas de técnica. Um Estado, que centraliza a contratação de TIC sem exigir, como condição não negociável, que os sistemas adquiridos falem a mesma língua e partilhem significado, não está a ganhar poder negocial, está a hipotecar a sua margem de manobra futura num único ato de aparente racionalidade administrativa.

Há uma distinção que não é um pormenor de especialistas. Sistemas com interoperabilidade sintática conseguem trocar ficheiros. Sistemas com interoperabilidade semântica conseguem partilhar significado e substituir um fornecedor sem perder o valor acumulado nos dados. A captura tecnológica moderna não se faz pelo hardware, nem pelo software. Faz-se pela semântica, como os dados de saúde de milhões de portugueses, os registos de licenciamento, os cadastros sociais, os históricos de contratação pública, codificados em estruturas que pertencem, na prática, ao ecossistema do fornecedor que as desenhou. Mudar de fornecedor, nesse quadro de captura, é tão doloroso como se fosse uma cirurgia sem anestesia.

Os "contratos únicos com grandes fornecedores" são precisamente o momento em que este risco se torna estrutural. Um megacontrato com um oligopolista tecnológico sem cláusulas de portabilidade semântica não elimina a fragmentação anterior, transfere-a para o futuro sob a forma de dependência consolidada. A economia de escala é real e imediata. O lock-in é diferido e silencioso. Mas quando chegar, apresentar-se-á com juros que nenhuma projeção de poupança contemplou.

O LLM Amália é uma conquista genuína e seria injusto minimizá-la. Mas a soberania do modelo não garante a soberania dos dados com que opera, se esses dados estiverem aprisionados em formatos proprietários e ontologias fechadas que só o fornecedor original sabe ler. Uma ferramenta soberana alimentada por dados cativos é soberania de fachada, como seria soberana a pessoa que é dona das paredes mas não das plantas da sua casa.

Um Estado cujos dados estão aprisionados em ontologias proprietárias não precisa de ser atacado por fora, pois já foi capturado por dentro. A soberania semântica e a segurança por extração, como aconteceu recentemente no roubo da Alibaba aos dados da Anthropic, são duas faces do mesmo problema, pois em ambos os casos, o que está em jogo é saber quem controla de facto o significado dos dados públicos. Construir um LLM soberano sobre dados cativos é como instalar uma fechadura nova numa porta sem paredes.

Os gémeos digitais tornam este argumento ainda mais urgente. O ministro garantiu que estão a ser desenvolvidos sem recurso a empresas estrangeiras, o que é apresentado como garantia de soberania. Mas se forem construídos sobre ontologias proprietárias, a soberania é nominal, pois a capacidade do Estado de os interpretar, auditar ou substituir ficará permanentemente dependente de quem controlou a arquitetura semântica original. O Estado julgará ser dono e descobrirá que apenas arrendou, com cláusulas de renovação favoráveis ao senhorio.

O plano de formação enfrenta o mesmo problema por outro ângulo. Ensinar os funcionários a usar ferramentas de IA, sem literacia crítica sobre as ontologias que essas ferramentas pressupõem, é preparar utilizadores passivos de caixas negras, não agentes de uma administração que pensa. A literacia digital que o Estado precisa não é a que sabe clicar, é a que sabe perguntar de que dados vem esta resposta, quem os estruturou e em que ontologia assentam?

O que a Rede deveria discutir, a par dos contratos e da formação, é a adoção obrigatória de standards abertos para todos os sistemas que integram dados públicos, a exigência de que os fornecedores de IA entreguem ao Estado não apenas os modelos mas as ontologias sobre que operam e um regime de auditabilidade que permita substituir uma caixa negra por outra sem perda de continuidade do serviço público. Não é uma agenda contra o mercado, é a condição mínima para que o mercado não se converta em captura permanente da administração.

A narrativa oficial é sedutora na sua linearidade, pois centralizamos a contratação, poupamos trezentos milhões, implantamos IA soberana, formamos os funcionários e modernizamos o Estado. Cada passo parece lógico e esta sequência parece uma estratégia.

Falta-lhe, no entanto, a pergunta que define se a construção é sólida ou ilusória. Quando quisermos mudar de sistema, de modelo ou de fornecedor, será que os nossos dados continuarão a ser nossos e continuaremos a ser capazes de os ler?

O Estado que não garante a resposta afirmativa antes de assinar os contratos únicos não está a modernizar a administração pública. Está a subcontratá-la por prazo indeterminado. E quando esse prazo chegar, as poupanças de hoje serão a fatura de amanhã.

Diário de Notícias
www.dn.pt