IA faz 30% do trabalho humano? Estudo revela

IA não consegue fazer mais do que 30% do trabalho humano, diz estudo

A inteligência artificial está bombando por todos os lados, prometendo revolucionar o mundo do trabalho. Mas será que a realidade é tão empolgante quanto a propaganda? Um estudo recente, feito pela empresa de recrutamento Mercor, mostra que não. Os modelos de IA atuais, como os da OpenAI e do Google, ainda patinam feio na hora de realizar tarefas de profissionais especializados. Em outras palavras: a IA ainda não está pronta para substituir o seu chefe – e nem você.

A pesquisa revelou que a IA não consegue acertar mais do que 30% das tarefas propostas em testes que simulam o trabalho de consultores de gestão, analistas de investimentos e advogados. A notícia é importante porque mostra que, apesar dos avanços, a IA ainda está longe de ser uma ameaça para o emprego de muita gente. Vamos entender melhor o que rolou nesse estudo e o que isso significa para o futuro da tecnologia.

Os testes e seus resultados decepcionantes

O estudo da Mercor criou um novo benchmark, chamado AI Productivity Index for Agents (APEX-Agents), para avaliar o desempenho da IA em tarefas profissionais. O teste envolveu modelos de IA como o GPT-5.2 da OpenAI e o Gemini 3 Flash do Google. Os resultados foram, no mínimo, modestos. No cenário de analista de investimentos, o GPT-5.2 foi o que chegou mais perto, com 27,3% de acerto. Já em consultoria de gestão, o mesmo modelo liderou, com 22,7%. E, no caso dos advogados, o Gemini 3 Flash se destacou, com 25,9%.

O que todos esses números mostram é que, embora a IA seja boa em algumas coisas, ela ainda tem muita dificuldade em lidar com as nuances e complexidades do trabalho humano. Nenhuma das ferramentas testadas conseguiu atingir a marca de 30% de acerto em qualquer uma das três áreas avaliadas.

Por que a IA está tropeçando?

Uma das principais razões para os resultados decepcionantes é a complexidade dos testes. Diferentemente de outros benchmarks, o APEX-Agents utilizou prompts enviados por profissionais de verdade, simulando situações reais do dia a dia. Isso exige que a IA reúna informações de diferentes fontes, como Slack, Google Drive e outras ferramentas, algo que ela ainda não faz muito bem.

Os modelos de IA se perdem na hora de juntar todas as peças e oferecer uma resposta completa e precisa. O estudo também usou cenários complexos, como analisar um caso envolvendo dados pessoais de cidadãos europeus, o que exige um conhecimento profundo de leis e políticas de privacidade. Para colocar em perspectiva, até mesmo humanos especializados teriam dificuldades em responder a essas questões.

O que isso significa para o futuro?

Apesar dos resultados frustrantes, o estudo não é totalmente negativo. Ele mostra que a IA está evoluindo e que os pesquisadores estão trabalhando para aprimorar os modelos. A questão é que a substituição de trabalhadores por IA ainda parece distante, pelo menos em profissões que exigem um alto nível de raciocínio, análise e julgamento.

Os agentes de IA podem ser ferramentas úteis para auxiliar profissionais em algumas tarefas, mas ainda não estão prontos para tomar decisões importantes ou substituir completamente os humanos. O CEO da Mercor ressalta que o benchmark reflete o trabalho real que as pessoas fazem, o que é crucial para entender o potencial e as limitações da IA no mercado de trabalho.

Ainda falta muito para a Skynet

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *