
Em 24 de julho de 2025, o engenheiro de prompts brasileiro Eduardo Rocha de Andrade foi anunciado como o primeiro vencedor do Konwinski Prize, um desafio internacional de programação com inteligência artificial (IA) criado por Andy Konwinski, cofundador da Perplexity e Databricks. A competição, promovida pela Laude Institute, avalia a capacidade de modelos de linguagem open-source em resolver issues reais do GitHub, executados localmente sem acesso à internet, garantindo um ambiente livre de contaminação. Andrade conquistou o prêmio de US$ 50.000 ao alcançar 7,5% de acerto, a melhor pontuação até o momento, utilizando uma versão modificada do Agentless 1.5, disponível no repositório OpenAutoCoder/Agentless no GitHub, conforme reportado pela TechCrunch e Canaltech.
O Konwinski Prize, lançado em dezembro de 2024, tem como objetivo estabelecer um benchmark rigoroso para IAs voltadas à engenharia de software, oferecendo US$ 1 milhão ao primeiro modelo open-source que atingir mais de 90% de acerto, segundo o site oficial da competição no Kaggle. A pontuação de Andrade, embora baixa, reflete a dificuldade do desafio, que usa issues dinâmicas do GitHub, coletadas após o prazo de submissão, para evitar que modelos sejam treinados nas soluções, conforme explicado por Konwinski à TechCrunch. “Estamos felizes por criar um benchmark que é realmente difícil. Benchmarks devem ser desafiadores para importar”, afirmou Konwinski, destacando que a execução offline com recursos computacionais limitados favorece modelos menores e abertos, nivelando o campo de competição.
O Agentless 1.5, base do trabalho de Andrade, é uma abordagem sem agentes que resolve problemas de desenvolvimento em três fases: localização da falha, reparo e validação de patches. Desenvolvido pela OpenAutoCoder, ele alcançou 27,3% no SWE-Bench Lite, corrigindo 82 issues a um custo médio de US$ 0,34 por issue, conforme detalhado no repositório do GitHub. A versão modificada por Andrade otimizou esse processo, mas ainda enfrentou limitações, já que o K Prize é significativamente mais difícil que o SWE-Bench, com pontuações de 75% no teste “Verified” e 34% no “Full” do SWE-Bench, segundo a ainvest.com. A disparidade pode indicar contaminação nos benchmarks tradicionais ou a complexidade de issues dinâmicas, um ponto que Konwinski espera esclarecer em futuras edições.
O feito de Andrade, celebrado em posts no X, como o de @BotDeschamps em 24 de julho de 2025, destaca o talento brasileiro em um cenário global. No entanto, a pontuação de 7,5% também gerou debates sobre a prontidão prática da IA, especialmente em áreas como blockchain, onde precisão é crítica, conforme a ainvest.com. Konwinski criticou o “hype” em torno da IA, afirmando que “não estamos vendo médicos ou advogados de IA, e engenheiros de software de IA ainda estão longe”, segundo a TechCrunch. O K Prize, com sua abordagem iterativa, busca impulsionar avanços em generalização e aplicabilidade real, incentivando a comunidade open-source a contribuir.
A transparência é essencial: as informações foram verificadas em fontes confiáveis, incluindo TechCrunch, Canaltech, ainvest.com e o repositório OpenAutoCoder/Agentless. A vitória de Andrade é confirmada, mas a pontuação de 7,5% reflete os desafios de IAs em tarefas complexas, e a viabilidade de alcançar 90% permanece incerta. A comunidade espera que futuras iterações do K Prize tragam avanços significativos, enquanto o trabalho de Andrade inspira desenvolvedores brasileiros.
O que você acha da vitória de Eduardo Rocha de Andrade e do futuro da IA open-source? Deixe seu comentário e compartilhe sua visão sobre como esses desafios podem moldar a programação!
Fontes: TechCrunch, Canaltech, ainvest.com, OpenAutoCoder/Agentless, Kaggle, X posts de @BotDeschamps e @vasio01