- Os modelos de IA oferecem informações mais limitadas e menos rigorosas do que os profissionais de saúde
- Espanha, Alemanha e França recebem informações mais completas do que os países de Leste da Europa
- Gemini, líder indiscutível em precisão e fiabilidade
- O relatório intitulado IA y Política Pública: Hacia una nueva arquitectura de incidencia (IA e Política Pública: rumo a uma nova arquitetura de incidência), analisou quase 1500 respostas de quatro sistemas de IA
A qualidade e a incidência das informações sobre saúde que a IA oferece variam drasticamente dependendo de quem faz a pergunta, da regulamentação em vigor e em que país é feita a consulta. Os grandes modelos de linguagem (LLM) oferecem uma clara desigualdade ao responder a consultas sobre as regulamentações sanitárias europeias. As respostas que os doentes recebem são mais limitadas e com menos rigor do que as recebidas pelos profissionais do setor. Além disso, se as perguntas forem feitas a partir de países como Espanha, Alemanha ou França, o resultado é mais completo e com maior qualidade das fontes. São algumas das conclusões retiradas do relatório IA y Política Pública: Hacia una nueva arquitectura de incidencia elaborado pela LLYC no âmbito da European Health Summit. Para a sua elaboração foram analisadas 1484 respostas de quatro sistemas de IA (OpenAI, Anthropic, Perplexity e Gemini) sobre quatro normas comunitárias fundamentais.
“A IA tornou-se um interveniente com capacidade para influenciar a opinião pública, a circulação de informação e a perceção de temas fundamentais como a saúde e a regulamentação. As divergências sistemáticas detetadas, especialmente a desigualdade informativa entre profissionais de saúde e doentes, e a disparidade geográfica colocam um desafio crítico de equidade. Deve ser monitorizada por reguladores e intervenientes industriais, uma vez que pode moldar as perceções públicas de forma tendenciosa, criando vantagens informativas para alguns utilizadores”, afirma Carlos Parry, Líder de Healthcare Europa na LLYC.
Desigualdade informativa
O estudo identifica uma desigualdade informativa acentuada de acordo com o perfil de quem consulta os modelos de IA
- Profissionais de saúde: este grupo recebe consistentemente as respostas “mais completas e tecnicamente rigorosas”, com maior visibilidade e maior qualidade argumentativa.
- Doentes: enfrentam as “lacunas informativas significativas”, menor visibilidade e menor rigor, recebendo informações mais limitadas.
- Meios de comunicação: obtêm as pontuações mais baixas em visibilidade, qualidade argumentativa e utilização de fontes, apesar de registarem as maiores lacunas informativas.
- Administrações Públicas: os modelos mostram uma postura “especialmente favorável” em relação aos intervenientes do setor da saúde institucional.
Disparidade geográfica
A análise geográfica revela que os modelos de IA não oferecem respostas homogéneas, mas adaptam o seu conteúdo ao contexto nacional.
- Disparidade: países como a Alemanha, França ou Espanha recebem consistentemente “informações mais completas e com maior qualidade das fontes”.
- Menor consenso: países da Europa de Leste como a Polónia e a Hungria obtêm informações mais fragmentadas e com um consenso mais baixo.
O relatório também analisa as regulamentações mais bem posicionadas: a EHDS (European Health Data Space) surge como a regulamentação “mais sólida”, com maior visibilidade e qualidade argumentativa, enquanto que a AI Act apresenta a “carga emocional mais intensa”. A HTA (Evaluación de Tecnologías Sanitarias) e a Pharma Reform apresentam maiores lacunas informativas.
O fator tecnológico
O estudo comparou o desempenho de quatro grandes modelos de linguagem (LLM):
- Gemini: posiciona-se como o “líder indiscutível” na análise de regulamentações sanitárias europeias, destacando-se pela sua precisão, pela capacidade de minimizar a desinformação e por manter uma qualidade uniforme para diferentes tipos de utilizadores. É também o modelo mais favorável às regulamentações europeias.
- Anthropic: oferece um perfil estratégico, bom para antecipar impactos regulamentares
- Perplexity: mostra o maior risco de desinformação e uma dependência muito acentuada dos meios de comunicação gerais (81,3%) para fundamentar as suas respostas, com uma utilização limitada das fontes oficiais.
- OpenAI: apresenta um perfil mais modesto, embora se destaque por uma utilização notável de fontes oficiais (19,8% UE) e literatura revista pelos pares.
Para Daniel Fernández Trejo, Diretor-Geral de Deep Learning na LLYC: “A nossa análise demonstra empiricamente que os modelos de linguagem não são meros repositórios de dados, mas intermediários ativos que interpretam e distorcem as informações de acordo com quem as solicita. Passámos de uma Web de pesquisa para uma Web de respostas sintéticas, e para qualquer organização, compreender a lógica algorítmica desta nova “arquitetura da influência” é tão importante hoje como foi compreender os meios de comunicação no passado”
Em suma, o relatório conclui que a interação entre a Inteligência Artificial (IA) e a política pública no setor da saúde confirma a existência de vieses sistemáticos nos grandes modelos de linguagem (LLM).