Como funciona, de facto, o arqmetrica AI Maturity Index.
A maioria das "pontuações de maturidade em IA" publicadas não resiste a uma análise séria. São inquéritos não-falsificáveis, sem rubrica de pontuação e sem benchmarking — e quase sempre escritos pelo próprio fornecedor que beneficia da pontuação. O Índice da Arqmetrica é construído de forma diferente. Esta página documenta como: o que medimos, porquê, como funciona a pontuação e como o comparamos face aos seus pares. Pensado para ser auditável.
Porque existe este Índice
Os cinco frameworks de referência
As seis dimensões
| Dimensão | Peso | Framework primário |
|---|---|---|
| Strategy & vision | 18% | ISO/IEC 42001:2023 §5 — Leadership |
| Data foundations | 17% | NIST AI RMF 1.0 — Map function (Data) |
| People & capability | 17% | OECD AI Principle 2.4 — Building human capacity |
| Governance & ethics | 17% | EU AI Act (Regulation (EU) 2024/1689) |
| Tooling & infrastructure | 14% | NIST AI RMF 1.0 — Map function (Infrastructure) |
| ROI & measurement | 17% | ISO/IEC 42001:2023 §9 — Performance evaluation |
Como funciona a pontuação
OPTION_SCORES no código.
A pontuação de uma dimensão é a média aritmética não ponderada das quatro pontuações de pergunta dessa dimensão. As quatro perguntas de cada dimensão são calibradas em testes-piloto para terem peso diagnóstico aproximadamente igual; ponderá-las de forma diferente introduziria uma camada de juízo que não conseguimos defender.
A pontuação geral do Índice é a média ponderada das seis pontuações de dimensão, usando os pesos da tabela acima. Tanto as pontuações de dimensão como a global são números inteiros entre 0 e 100.
O arredondamento é feito uma vez no final de cada passo, ao inteiro mais próximo; não arredondamos dentro das somas nem arrastamos casas decimais ao longo da fórmula. Isto preserva a exactidão aritmética sem inflacionar a precisão aparente. A pontuação está implementada em src/index/scoring.ts e fixada por doze testes unitários.Como uma resposta se torna numa pontuação.
Como o peso de cada dimensão é justificado.
Os pesos não são arbitrários; cada um está ancorado numa fonte publicada acompanhada de uma justificação numa linha. Os 6 pesos somam 100 por construção.
| Dimensão | Peso | Justificação | Fonte |
|---|---|---|---|
| Strategy & vision | 18% | Strongest single predictor of value capture in MIT Sloan/BCG longitudinal data. | MIT Sloan/BCG 2024 §4 |
| Data foundations | 17% | Foundational dependency: no AI value without data discipline. | NIST AI RMF GOVERN-1 + EU AI Act Art. 10 |
| People & capability | 17% | Strongest determinant of pilot-to-production rate. | MIT Sloan/BCG 2024 §6 |
| Governance & ethics | 17% | Direct EU AI Act enforcement weight (Articles 9, 10, 14). | EU Reg 2024/1689 |
| Tooling & infrastructure | 14% | Necessary but not sufficient — capped at 14 to prevent vendor-stack overweighting. | Stanford AI Index 2024 |
| ROI & measurement | 17% | Outcome dimension — closes the value loop. | ISO/IEC 42001:2023 §9 |
| Total | 100% | ||
Cada uma das 24 questões liga-se a um enquadramento publicado.
Cada item da avaliação está mapeado a uma cláusula ou capítulo específico de uma das cinco fontes-âncora, pelo que a pontuação de cada respondente pode ser rastreada até à origem do construto.
Mapa de questão para fonte (excerto).
| Dimensão | Resumo do item | Fonte / cláusula âncora |
|---|---|---|
| Estratégia e visão | O conselho ou a equipa executiva endossou formalmente uma estratégia de IA? | ISO/IEC 42001:2023 §5.1 (Leadership and commitment) |
| Estratégia e visão | Existe um único executivo responsável pelos resultados de IA em toda a organização? | ISO/IEC 42001:2023 §5.3 (Roles and responsibilities) |
| Fundações de dados | Quão bem documentada está a linhagem dos dados que alimentam os sistemas de IA em produção? | EU AI Act Art. 10 (Data and data governance) |
| Pessoas e capacidades | Quão estruturado é o seu programa de literacia em IA e de upskilling? | OECD AI Principle 2.4 (Building human capacity) |
| Governação e ética | Classificou os seus casos de uso de IA face às categorias de risco do AI Act da UE? | EU AI Act Art. 6 + Annex III (Risk classification) |
| Governação e ética | Tem um processo documentado de resposta a incidentes para falhas de IA? | NIST AI RMF MANAGE-4 (Incident response) |
| Ferramentas e infraestrutura | Qual é a maturidade do seu stack de implementação e monitorização de modelos? | ISO/IEC 42001:2023 §8 (Operation) |
| ROI e medição | Acompanha a atribuição de valor a iniciativas específicas de IA? | ISO/IEC 42001:2023 §9 (Performance evaluation) |
Excerto de 8 itens representativos; o conjunto completo de 24 questões está publicado em /the-index/start.
Quem respondeu — e durante que janela.
A edição publicada do 2T 2026 assenta em respostas recolhidas entre 1 de janeiro e 31 de março de 2026. 437 conclusões válidas em 612 inícios (taxa de conclusão de 71,4%, mediana de 11m 23s).
Por indústria
| Indústria transformadora | 89 | 20.4% |
| Serviços financeiros | 67 | 15.3% |
| Serviços profissionais | 58 | 13.3% |
| Tecnologia e software | 53 | 12.1% |
| Retalho e e-commerce | 47 | 10.8% |
| Logística | 39 | 8.9% |
| Saúde | 31 | 7.1% |
| Educação | 22 | 5.0% |
| Energia e utilities | 18 | 4.1% |
| Sector público | 13 | 3.0% |
| Total | 437 | 100% |
Por escalão de colaboradores
| 50–99 | 142 | 32.5% |
| 100–249 | 184 | 42.1% |
| 250–499 | 111 | 25.4% |
| Total | 437 | 100% |
Respondentes fora de escalão (excluídos das medianas mid-market publicadas)
O formulário do Index aceita empresas de qualquer dimensão. A coorte publicada foca no núcleo mid-market 50–499 (N=437 — as decomposições acima). Os respondentes de fora desse intervalo completaram a avaliação e receberam o respectivo relatório pessoal, mas as suas pontuações não são agregadas nas figuras mid-market publicadas. Registamo-los aqui por total transparência.
- 1–49 (PME pequena)24
- 500+ (grande empresa)16
Por país
| Portugal | 156 | 35.7% |
| Espanha | 98 | 22.4% |
| França | 64 | 14.6% |
| Alemanha | 49 | 11.2% |
| Itália | 28 | 6.4% |
| Países Baixos | 18 | 4.1% |
| Bélgica / Luxemburgo | 11 | 2.5% |
| Irlanda | 7 | 1.6% |
| Outros UE | 6 | 1.4% |
| Total | 437 | 100% |
Por função do respondente
| Direcção executiva | 87 | 19.9% |
| VP / Director | 156 | 35.7% |
| Gestor sénior | 142 | 32.5% |
| Outro | 52 | 11.9% |
| Total | 437 | 100% |
O que medimos e qual a confiança que temos.
Os intervalos de confiança sobre cada mediana são reportados pela aproximação distribuição-livre de Bonett-Price (a fórmula abaixo). Com o intervalo interquartil da coorte de 27 pontos (p25=33, p75=60), o IC a 95% sobre a mediana global N=437 é aproximadamente ±2,0 pontos; as medianas sectoriais com N>50 têm um IC de cerca de ±4–6 pontos consoante N; as medianas sectoriais com N<30 alargam-se a ±8–10 pontos e devem ser lidas como direccionais, não como precisas.
O que este índice ainda não faz.
- Viés de auto-relato: os respondentes podem sobrestimar a maturidade em dimensões socialmente deseáveis, em particular Governação e ROI.
- Viés de seleção: quem responde ao Índice auto-seleciona-se; a coorte não é uma amostra probabilística do universo do mid-market europeu.
- Cortes sectoriais com N pequeno: N<30 em Energia & Utilities e Sector Público, com intervalos de confiança correspondentemente largos.
- Sem coorte de validação externa ainda: prevista para a edição do 3T 2026, emparelhada com uma amostra estruturada de organizações-pares.
O que publicaremos a seguir, quando o N o permitir.
- α de Cronbach com N>200 por dimensão (objetivo: 3T 2026).
- Correlação teste-reteste a 90 dias, sobre coorte rotativa (objetivo: 4T 2026).
- Validade convergente face a rácios de investimento em IA publicados externamente (objetivo: 4T 2026).
- Fiabilidade entre observadores na classificação de risco do AI Act (previsto: 1T 2027).
Como funcionam os benchmarks face aos pares
O nosso compromisso de transparência
/api/data/delete; as regras completas de tratamento de dados estão na página Ética dos Dados.
Reporte público apenas em agregado. O relatório trimestral State of European Mid-Market AI é construído apenas a partir de estatísticas agregadas e anonimizadas por coorte. Nenhuma resposta individual, e nenhum campo identificador de empresa, alguma vez aparece nas publicações.
Metodologia aberta. As definições de dimensão, os pesos e as fórmulas de pontuação vivem como código TypeScript em src/index/dimensions.ts e src/index/scoring.ts, no repositório público da arqmetrica. Qualquer pessoa — auditor, regulador, concorrente, cliente céptico — pode ler a aritmética exacta que produziu uma dada pontuação. Não há ajustes ocultos nem multiplicadores proprietários.
E uma linha que não atravessamos: o Índice pontua empresas, nunca indivíduos. Não usamos IA para classificar ou avaliar as pessoas que respondem à avaliação. Não é uma política que esperemos rever.Tudo o que precisa para verificar os números.
A metodologia, a fórmula de pontuação e a derivação dos pesos são abertas sob CC BY 4.0. Os dados ao nível da coorte estão anonimizados, mas as contagens subjacentes — as tabelas de coorte desta página — são o artefacto de verificação: qualquer pessoa pode reproduzir as medianas voltando a aplicar a fórmula à mesma distribuição. As 24 questões estão listadas na íntegra em /the-index/start.