No início deste ano, a orientação das empresas de tecnologia para seus colaboradores era clara: utilizem o máximo possível de inteligência artificial no trabalho.
Os funcionários chamavam essa prática de “tokenmaxxing”, em que “token” designava uma unidade de consumo de IA, aproximadamente equivalente a um fragmento de palavra. Na Meta e na Amazon, alguns chegaram a competir em rankings que monitoravam a quantidade de tokens utilizados.
Então chegaram as contas de fornecedoras como Anthropic e OpenAI — e elas não eram nada baratas. Agora, a era do tokenmaxxing parece ter chegado ao fim.
Custos em alta e novas regras
A Meta comunicou a seus funcionários na semana passada que em breve imporia limites ao uso de IA, depois de observar um “aumento exponencial” nos gastos. Em maio, a Uber revelou que havia consumido em apenas quatro meses todo o orçamento previsto para despesas com IA no ano, passando a estabelecer tetos mensais para ferramentas de programação com IA. O Walmart também adotou limites para diferentes soluções de IA. Amazon e Meta, por sua vez, desativaram os rankings de tokenmaxxing.
Em outras palavras, o “tokenminning” — abreviação de “token minimizing” — agora está em alta.
Essa reversão em apenas alguns meses evidencia como o uso de IA ainda está em evolução, enquanto pessoas e organizações tentam descobrir a melhor maneira de empregar essas ferramentas.
“O maior problema é que tudo está mudando tão rápido que as pessoas e as empresas não sabem o que fazer”, afirmou Rob May, CEO da Neurometric, startup que auxilia companhias a utilizar IA de forma mais eficiente e autor de “The Tokenminning Manifesto”.
“CEOs que não sabiam como mensurar o grau de familiaridade de seus funcionários com IA pensaram: ‘Bem, quem está usando mais tokens?’”, disse ele, acrescentando que essa abordagem acabou incentivando volume em vez de eficiência.
OpenAI e Anthropic oferecem assinaturas que variam de US$ 10 a US$ 200 por mês para uso de seus modelos de IA; quando os assinantes atingem o limite, o acesso é interrompido. No entanto, a maior parte da receita vem do fornecimento de ferramentas para empresas como Meta, Shopify e Amazon, que pagam não apenas taxas de assinatura, mas também pelos tokens consumidos por suas dezenas de milhares de colaboradores. Assim, quanto mais tokens são utilizados, mais cara a IA se torna.
Uma tarefa simples, como solicitar à IA que resuma a transcrição de uma reunião corporativa, pode consumir algumas centenas de tokens. Pedidos mais complexos, como escrever código para criar um novo produto ou funcionalidade, podem usar dezenas de milhares.
Os custos de uso dos modelos de IA dispararam à medida que eles se tornaram mais potentes e passaram a exigir mais tokens. O modelo mais recente da Anthropic, Fable, é duas vezes mais caro que o anterior, Opus. Embora existam modelos mais baratos, muitos funcionários adquiriram o hábito de utilizar os mais poderosos para tudo, observou May.
As formas de emprego da IA também mudaram. Em vez de apenas conversar com chatbots, engenheiros passaram a usar “agentes” de IA, capazes de trabalhar em tarefas complexas por horas seguidas. Como resultado, um engenheiro pode consumir dezenas de milhares de dólares em tokens por mês.
Estratégias de redução e métricas de valor
Muitas empresas afirmaram que estavam tentando ser mais estratégicas com os gastos em IA, depois de não enxergarem retornos claros sobre esse investimento.
“Se você não consegue traçar uma linha direta entre isso e a quantidade de funcionalidades úteis que está entregando, essa troca fica mais difícil de justificar”, declarou Andrew Macdonald, diretor de operações da Uber, em entrevista recente para um podcast. “Essa ligação ainda não existe.”
Isso não significa que as empresas vão parar de investir pesado em IA. A Meta comunicou a seus funcionários que estava a caminho de gastar bilhões com o uso de IA neste ano, mas queria “encontrar áreas em que possamos gastar menos obtendo resultados de negócio semelhantes ou melhores”. Marc Benioff, CEO da Salesforce, afirmou que sua companhia planejava gastar centenas de milhões com IA neste ano, mas agora monitora “unidades de trabalho agentic” em vez de tokens. A nova métrica busca medir produção, e não apenas uso.
Os limites da Meta e do Walmart para o uso de IA por funcionários haviam sido noticiados anteriormente pelo The Information e pela Bloomberg.
Ainda não está claro como o tokenminning pode impactar os resultados financeiros da Anthropic e da OpenAI. No auge da era do tokenmaxxing neste ano, as empresas de IA relataram receitas recordes impulsionadas pelo uso de ferramentas de programação. Na semana passada, a Meta orientou seus engenheiros a utilizarem seu assistente interno de programação, o MetaCode, em vez de ferramentas de terceiros, sempre que possível.
A Meta se recusou a comentar, a Anthropic não forneceu declaração, e a OpenAI não respondeu a um pedido de comentário. (O New York Times processou a OpenAI e a Microsoft, alegando violação de direitos autorais de conteúdo jornalístico relacionado a sistemas de IA. As empresas negaram as acusações.)
O caminho mais claro para as empresas daqui para frente, segundo May, é usar IA de ponta apenas em tarefas complexas que realmente exijam isso, substituindo por modelos mais baratos nos demais casos.
As companhias podem economizar até 90% ao optar por modelos de IA menos avançados, afirmou Andy Markus, diretor de IA da AT&T. Segundo ele, seus engenheiros utilizam os modelos mais potentes em algumas tarefas e os menos potentes na maior parte das demais atividades.
“Há um vai e vem”, disse ele. “O que percebemos é que, para a maioria dos casos de uso, o modelo de fronteira mais novo e mais avançado não é necessário.”







