
Grok 4 Chega Caro e Polêmico, Talentos Mudam de Lado e IA Ganha Browsers e Agentes (Mas Cuidado com as Alucinações!)
Fala meu povo da IA! Que semana, hein? Mal pisquei e o feed de notícias já explodiu com um monte de novidade e, claro, as polêmicas de sempre. Estava lendo o último resumo da Last Week in AI e separei alguns pontos que me chamaram a atenção. Tem lançamento de modelo caro, dança das cadeiras de talentos, ferramentas novas no pedaço e um balde de água fria na empolgação com a produtividade.
O Grok 4 Chegou – Com Preço Salgado e Gosto Amargo
A xAI do Elon Musk lançou o Grok 4 e uma assinatura mais cara ainda, a SuperGrok Heavy, por módicos US$ 300 por mês. A promessa é que ele briga de frente com o ChatGPT e o Gemini, inclusive mostrando resultados de benchmarks onde supera o Gemini 2.5 Pro e o o3 da OpenAI naquele teste maroto, o Humanity’s Last Exam. A versão “Heavy”, multi-agente e com ferramentas, foi um pouco melhor ainda.
Olha, performance em benchmark é sempre interessante, mas a gente sabe que o buraco é mais embaixo no mundo real. E o que tem chamado a atenção, e me deixa com uma pulga atrás da orelha, são as polêmicas em torno do comportamento do Grok. Dias antes do lançamento do 4, a conta oficial no X publicou comentários antissemitas e até elogiando Hitler (!!!). A xAI tirou do ar, ajustou, mas a coisa não parou por aí. Tem gente notando que, em assuntos polêmicos, o Grok parece ir “consultar” a opinião do Elon Musk antes de responder. Isso, para mim, vai contra a própria ideia de um modelo de linguagem imparcial ou que processe informações de forma autônoma. Aquela história: em Deus nós confiamos, o resto me tragam dados. E dados sem viés, se possível.
A Dança das Cadeiras: Windsurf, OpenAI e Google
Sabe aquela aquisição da Windsurf pela OpenAI que parecia certa, valendo US$ 3 bilhões? Então, melou. Em vez de ir para a OpenAI, o CEO da Windsurf, Varun Mohan, e boa parte da equipe de P&D foram parar no Google DeepMind. O Google não comprou a empresa, só licenciou parte da tecnologia, mas levou o talento. O objetivo? Focar em agentes de código. Enquanto isso, a Windsurf colocou o Jeff Wang como CEO interino.
Isso mostra a velocidade com que as coisas mudam e a guerra por talentos no Vale do Silício. O foco do Google em agentes de código, com essa galera da Windsurf, é um movimento esperto. Agentes que ajudem no desenvolvimento são uma das aplicações mais promissoras e práticas da IA hoje em dia.
Navegando e Codando com IA: Comet e Replit no Jogo
Falando em ferramentas práticas, a Perplexity lançou o Comet, um navegador web turbinado com a IA deles. Inicialmente para assinantes do plano mais caro (US$ 200/mês, outro preço que faz pensar), o Comet traz a busca da Perplexity como padrão e um “Comet Assistant” que promete automatizar tarefas chatas do dia a dia, como resumir e-mails ou gerenciar abas. É uma tentativa de desafiar o domínio do Google Search, mas o assistente ainda engasga em tarefas complexas, segundo o artigo da TechCrunch. É o tal do realismo: a IA ajuda, mas ainda não resolve tudo sozinha.
Na linha de ferramentas para desenvolvedores, a Replit atualizou seu agente de código com o “Dynamic Intelligence”. Agora ele tem modos como Extended Thinking (mostra o raciocínio), High Power Model (para tarefas complexas) e Web Search (busca info na internet). O CEO, Amjad Masad, chamou isso de “pesquisa profunda para codificação”. Gosto dessa abordagem de dar ferramentas mais sofisticadas e controláveis para quem tá metendo a mão na massa. Isso é o tipo de Vertical AI que faz sentido no dia a dia.
O Lado B da Produtividade e as Famosas Alucinações
Mas nem tudo é avanço e preço alto. Um estudo (mencionado na seção de Research da Last Week in AI) com desenvolvedores experientes de código aberto mostrou algo inesperado: o uso de ferramentas de IA no início de 2025, na verdade, *diminuiu* a produtividade em 19%. Isso choca um pouco, né? A gente vive ouvindo que IA aumenta a produtividade, mas esse estudo aponta que, para quem já é bom no que faz, a ferramenta talvez ainda atrapalhe mais do que ajude, pelo menos em certos contextos. Isso reforça a minha visão de que precisamos de dados e avaliação criteriosa para entender o impacto real da IA, sem o hype.
E as alucinações continuam firmes e fortes. Teve um caso de um tribunal (reportado pela Above the Law) que usou jurisprudência inventada por uma IA para basear uma decisão. É o cúmulo do absurdo, mas mostra o perigo de confiar cegamente em resultados de IA, especialmente em áreas críticas como a lei.
Considerações Finais: Olho Vivo e Mão na Massa
Essa semana reforça o que a gente já sabe: a IA está avançando rápido, trazendo ferramentas que prometem muito (navegadores, agentes de código, etc.), mas também escancara as limitações (viés, alucinações, impacto na produtividade) e o lado complicado do negócio (guerras de talento, preços altos, polêmicas). É um cenário dinâmico que exige que a gente fique de olho nas novidades, mas com pé no chão e sempre avaliando o que realmente funciona e agrega valor, especialmente em aplicações práticas.
Discutir esses pontos, entender onde a IA está de verdade e como aplicar no nosso dia a dia, é fundamental. Inclusive, esse assunto de aplicação prática e Vertical AI sempre gera bons debates. Aliás, se você quiser trocar ideia sobre esses temas, clica no link pra entrar em contato e venha fazer parte da comunidade IA Overflow. É lá que a gente discute a IA que funciona no mundo real, sem balela e com dados!