Ia | frr.dev

A semana em que a disciplina venceu a magia

Publiquei seis artigos esta semana. Um sobre PostgreSQL. Outro sobre agentes de IA. Outro sobre gestão de contexto. Um tutorial de automação. Uma análise de debugging. E um design de conselho adversarial para avaliar MVPs. Não foi algo planejado. Cada artigo surgiu a partir de um paper, uma palestra ou um projeto que achei interessante de forma isolada. Mas, ao vê-los juntos, há um fio condutor que eu não tinha percebido enquanto escrevia. ...

opinião arquitetura agentes ia postgresql debugging

Cinco especialistas que não existem revisam sua startup antes de você criá-la

Em novembro de 2024, um projeto chamado Freysa colocou um agente LLM para proteger uma wallet Ethereum. A instrução era clara: não transfira os fundos sob nenhuma circunstância. Os participantes pagavam valores cada vez mais altos a cada tentativa de convencê-lo. Após 481 tentativas e US$47.000 acumulados no prêmio, alguém conseguiu convencer o modelo de que a função rejeitar era, na verdade, a função transferir. Algumas semanas depois, a Jane Street publicou um enigma onde uma rede neural de 2.500 camadas revelou-se uma implementação do MD5. O vencedor resolveu isso combinando visualização de matrizes, redução para SAT, reconhecimento de padrões criptográficos e uma consulta ao ChatGPT. ...

ia llm startup mvp produto claude

Uma rede neural de 2.500 camadas que é na verdade MD5: o que isso ensina sobre debugging

A Jane Street, uma das firmas de trading quantitativo mais seletivas do mundo, publicou algumas semanas atrás um desafio de interpretabilidade mecanística. Eles projetaram manualmente uma rede neural com aproximadamente 2.500 camadas lineares, pesos inteiros, e a lançaram para o público com uma pergunta: qual função esta rede está computando? A resposta: MD5. Um algoritmo de hash criptográfico de 1992, implementado inteiramente como multiplicações de matrizes e funções ReLU. O interessante não é a resposta. É o caminho que o vencedor seguiu para chegar até ela. Porque esse caminho é, sem exageros, um manual de debugging de sistemas opacos que se aplica muito além do aprendizado de máquina. ...

ia aprendizado-de-maquina debugging interpretabilidade carreira-profissional

De /simplify ao conselho Jedi: como criei um code review com Kent Beck, Martin Fowler e Mike Acton

Claude Code possui um slash command chamado /simplify, que analisa seu código automaticamente. Eu passei um diff gigante — cerca de 500 linhas em 8 arquivos. O resultado foi… interessante. Encontrou coisas que eu não teria notado. Mas também me fez perder tempo com problemas irrelevantes. Então, desmontamos tudo e reconstruímos peça por peça. O que faz o /simplify É um skill que já vem embutido no Claude Code (não é necessário instalar). Ele executa três agentes em paralelo, cada um analisando o mesmo diff sob um ângulo diferente: ...

claude-code code-review produtividade ia refatoração

O caminho incorreto deve ser impossível, não proibido

“Tenho um shell e sou criativo.” — Claude, explicando por que criou um script de 47 linhas como uma string e passou para python -c Essa frase é real. Foi dita pelo meu agente de IA — bem, não com essas palavras exatas, mas com essas ações. Ele precisava iniciar um processo de um pipeline ETL. O comando correto estava no Makefile. Mas algo falhou. E ao invés de perguntar, ele fez o que qualquer programador com acesso root e zero supervisão faria: improvisou. ...

ia llm etl seguranca devops claude

Minha IA leu um JSON do disco 900 vezes dentro de um for (e por que nenhum linter pode te salvar)

Na semana passada, minha IA gerou um código onde ela lia um arquivo JSON do disco, fazia o parse, fazia uma busca e repetia isso 900 vezes dentro de um for. Cada iteração: abrir o arquivo, decodificar o JSON, buscar um valor e descartar tudo. Depois, fazia tudo de novo. É um erro que eu ensino meus alunos a evitar no primeiro mês de programação. O que aconteceu (sem enrolação) Estou desenvolvendo o Tokamak, um aplicativo para barra de menus no macOS que monitora a cota do Claude Max. Parte da funcionalidade escaneia ~900 arquivos JSONL de sessões de Claude Code. Para cada arquivo, o Tokamak precisa saber o byte offset de onde parou na última vez (leitura incremental — só ler o que é novo). ...

ia llm desempenho swift tokamak adversarial

Invocando os sábios: como usar um LLM como sessão de mentoria com qualquer especialista

Minha esposa invoca Charlie Munger para planejar o orçamento familiar. No ChatGPT. Não é brincadeira. Ela fala algo como “atue como Charlie Munger revisando nossas finanças familiares” e coloca os gastos do mês. A coisa devolve coisas como “você está confundindo investimento com gasto na categoria de educação” ou “esse fundo tem um custo oculto que você não está contabilizando”. Coisas que Munger diria. Com o tom que Munger usaria. ...

ia llm design produtividade claude

Beads Morreu. Longa vida ao CLI do Linear

Há menos de um mês escrevi um post inteiro explicando como usar três camadas de memória com Claude Code: Linear para estratégia, Beads para tática e Tasks para execução. Uma pirâmide bonita e elegante. Pois é, não rolou. Hoje aposento o Beads. E não por capricho, mas porque a realidade se encarregou de mostrar que uma ferramenta que te dá mais problemas do que resolve não é uma ferramenta. É um peso morto. ...

ia claude produtividade ferramentas linear

Git Worktrees: como ter vários agentes de IA trabalhando ao mesmo tempo sem se atropelarem

O congestionamento do checkout único Estou desenvolvendo um app de menu bar no macOS. Tenho três features no backlog: um sparkline de consumo, notificações nativas, e um widget de desktop. As três são independentes. Vou fazer as três com Claude Code. O problema: Claude Code trabalha em um diretório. Um diretório tem uma branch. E git checkout é como uma rotatória de uma só faixa: só passa um. Se quero avançar as três ao mesmo tempo, minhas opções clássicas são: ...

git ia produtividade ferramentas fluxo-trabalho

5 defesas contra alucinações de código (e por que só 3 funcionam)

Na semana passada contei como minha IA inventou uma estrutura JSON completa e a envolveu em DTOs, fixtures e testes que passavam. 90 testes verdes. Tudo mentira. Esse post era o diagnóstico. Este é o tratamento. Depois de descobrir o desastre, fiz o que qualquer engenheiro com o orgulho ferido faz: pesquisar obsessivamente por dias para que não aconteça novamente. Li papers, testei ferramentas, analisei dados reais das minhas APIs, e construí um sistema de defesas para minha aplicação. ...

ia llm testing alucinações segurança claude