Modelos de inteligência artificial da OpenAI e Google DeepMind alcançaram pontuações equivalentes a medalhas de ouro na edição de 2025 da Olimpíada Internacional de Matemática (IMO), uma das mais antigas e desafiadoras competições de matemática para estudantes do ensino médio. As empresas fizeram os anúncios de forma independente nos últimos dias, destacando a impressionante velocidade do avanço dos sistemas de IA e a paridade aparente na corrida da IA.
A competição entre as empresas de IA para consolidar a percepção pública de liderança — uma batalha intangível de "vibrações" — pode ter grandes implicações na atração dos melhores talentos em IA. Muitos pesquisadores de IA vêm de backgrounds em matemática competitiva, o que torna benchmarks como a IMO particularmente significativos.
No ano passado, o Google conquistou uma medalha de prata na IMO com um sistema "formal", que exigia que humanos traduzissem os problemas para um formato legível por máquina. Este ano, tanto a OpenAI quanto o Google apresentaram sistemas "informais" na competição, capazes de interpretar as questões e gerar respostas baseadas em provas em linguagem natural. Ambas as empresas afirmam que seus modelos de IA responderam corretamente a cinco das seis perguntas do teste da IMO, superando a maioria dos estudantes do ensino médio e o modelo de IA do Google do ano passado, tudo sem a necessidade de tradução humana-máquina.
Em entrevistas ao TechCrunch, pesquisadores envolvidos nos esforços de IMO da OpenAI e do Google afirmaram que essas performances de medalha de ouro representam avanços significativos em modelos de raciocínio de IA em domínios não verificáveis. Enquanto modelos de raciocínio de IA tendem a se sair bem em questões com respostas diretas, como matemática simples ou tarefas de codificação, eles historicamente enfrentam dificuldades em tarefas com soluções mais ambíguas, como a compra de uma cadeira ideal ou assistência em pesquisas complexas.
No entanto, o Google levantou questões sobre a forma como a OpenAI conduziu e anunciou sua performance de medalha de ouro na IMO. Logo após o anúncio da OpenAI no sábado de manhã, o CEO e pesquisadores da Google DeepMind usaram as redes sociais para criticar a OpenAI por anunciar sua medalha de ouro prematuramente — pouco depois de a IMO ter anunciado quais estudantes do ensino médio haviam vencido a competição na noite de sexta-feira — e por não ter a avaliação oficial do seu modelo pela IMO.
Thang Luong, pesquisador sênior da Google DeepMind e líder do projeto IMO, disse ao TechCrunch que o Google esperou para anunciar seus resultados na IMO a fim de respeitar os alunos participantes da competição. Luong afirmou que o Google tem trabalhado com os organizadores da IMO desde o ano passado em preparação para o teste e buscou a aprovação do presidente da IMO e a avaliação oficial antes de anunciar seus resultados, o que fez na manhã de segunda-feira. "Os organizadores da IMO têm suas diretrizes de avaliação", disse Luong. "Então, qualquer avaliação que não seja baseada nessa diretriz não poderia fazer nenhuma alegação sobre [desempenho de] nível de medalha de ouro."
Noam Brown, pesquisador sênior da OpenAI que trabalhou no modelo IMO, disse ao TechCrunch que a IMO entrou em contato com a OpenAI há alguns meses sobre a participação em uma competição de matemática formal, mas a criadora do ChatGPT recusou porque estava trabalhando em sistemas de linguagem natural que considerava mais promissores. Brown diz que a OpenAI não sabia que a IMO estava conduzindo um teste informal com o Google. A OpenAI afirma que contratou avaliadores terceirizados — três ex-medalhistas da IMO que entenderam o sistema de classificação — para avaliar o desempenho de seu modelo de IA. Após a OpenAI saber de sua pontuação de medalha de ouro, Brown disse que a empresa entrou em contato com a IMO, que então disse à empresa para esperar para anunciar até depois da cerimônia de premiação da IMO na noite de sexta-feira. A IMO não respondeu ao pedido de comentário do TechCrunch.
Embora o Google não esteja necessariamente errado — de fato, ele passou por um processo mais oficial e rigoroso para alcançar sua pontuação de medalha de ouro —, o debate pode estar perdendo o panorama geral: os modelos de IA de vários laboratórios de IA líderes estão melhorando rapidamente. Países de todo o mundo enviaram seus estudantes mais brilhantes para competir na IMO este ano, e apenas uma pequena porcentagem deles obteve um desempenho tão bom quanto os modelos de IA da OpenAI e do Google.
Enquanto a OpenAI costumava ter uma vantagem significativa sobre a indústria, a corrida parece estar mais acirrada do que qualquer empresa gostaria de admitir. A OpenAI deve lançar o GPT-5 nos próximos meses, e a empresa certamente espera dar a impressão de que ainda lidera a indústria de IA.