Posts

Por que 99% do que você envia para o Claude já está em cache

Estou construindo um app que monitora meu consumo de tokens no Claude Code. Alguns dias atrás, olhando os números brutos, me deparei com isso: cacheReadInputTokens: 4.241.579.174 inputTokens: 1.293.019 Quatro bilhões e duzentos milhões de tokens lidos do cache. Um milhão e trezentos mil tokens “frescos”. Isso é um 99,97% de cache hit. Minha primeira reação foi pensar que algo estava quebrado. Ninguém tem 99% de cache. Nem Redis. Nem Cloudflare. Nem sua mãe quando ela diz que já sabe o que você vai pedir para comer. ...

Invocando os sábios: como usar um LLM como sessão de mentoria com qualquer especialista

Minha esposa invoca Charlie Munger para planejar o orçamento familiar. No ChatGPT. Não é brincadeira. Ela fala algo como “atue como Charlie Munger revisando nossas finanças familiares” e coloca os gastos do mês. A coisa devolve coisas como “você está confundindo investimento com gasto na categoria de educação” ou “esse fundo tem um custo oculto que você não está contabilizando”. Coisas que Munger diria. Com o tom que Munger usaria. ...

ia llm design produtividade claude

Beads Morreu. Longa vida ao CLI do Linear

Há menos de um mês escrevi um post inteiro explicando como usar três camadas de memória com Claude Code: Linear para estratégia, Beads para tática e Tasks para execução. Uma pirâmide bonita e elegante. Pois é, não rolou. Hoje aposento o Beads. E não por capricho, mas porque a realidade se encarregou de mostrar que uma ferramenta que te dá mais problemas do que resolve não é uma ferramenta. É um peso morto. ...

ia claude produtividade ferramentas linear

Git Worktrees: como ter vários agentes de IA trabalhando ao mesmo tempo sem se atropelarem

O congestionamento do checkout único Estou desenvolvendo um app de menu bar no macOS. Tenho três features no backlog: um sparkline de consumo, notificações nativas, e um widget de desktop. As três são independentes. Vou fazer as três com Claude Code. O problema: Claude Code trabalha em um diretório. Um diretório tem uma branch. E git checkout é como uma rotatória de uma só faixa: só passa um. Se quero avançar as três ao mesmo tempo, minhas opções clássicas são: ...

git ia produtividade ferramentas fluxo-trabalho

5 defesas contra alucinações de código (e por que só 3 funcionam)

Na semana passada contei como minha IA inventou uma estrutura JSON completa e a envolveu em DTOs, fixtures e testes que passavam. 90 testes verdes. Tudo mentira. Esse post era o diagnóstico. Este é o tratamento. Depois de descobrir o desastre, fiz o que qualquer engenheiro com o orgulho ferido faz: pesquisar obsessivamente por dias para que não aconteça novamente. Li papers, testei ferramentas, analisei dados reais das minhas APIs, e construí um sistema de defesas para minha aplicação. ...

ia llm testing alucinações segurança claude

Silent failure: quando sua IA inventa e os testes dizem que está tudo bem

Ontem descobri que metade de um módulo do meu app estava baseado em dados inventados. Não por um júnior distraído. Pela minha IA. O pior não é que tenha inventado. O pior é que tudo compilava e os 90 testes passaram. A ficção coerente Estou construindo BFClaude-9000, um app de barra de menu para macOS que monitora a cota do Claude Max. Parte da funcionalidade requer distinguir se uma conta do Claude é paga ou gratuita, chamando a API do claude.ai. ...

ia llm testing claude seguranca

MEMORY.md: o caderno de campo que sua IA escreve sozinha

“Não havíamos decidido isso ontem?” Eu estava migrando meu email para fora do Google. Já tinham sido duas sessões no Claude Code trabalhando nisso: issues no Linear, decisões tomadas, scripts executados. Abro uma terceira sessão e pergunto “o que ainda está pendente do degoogle?” Silêncio. Amnésia total. É como trabalhar com um colega brilhante que toda manhã chega ao escritório sem se lembrar de absolutamente nada do que vocês fizeram no dia anterior. Nem as decisões, nem os erros, nem as descobertas. Cada sessão é uma tela em branco. ...

ia claude produtividade ferramentas

Quando a segurança pede permissão tantas vezes que você para de ler

Toc, toc. Quem é? Touch ID. De novo. Imagine isso: você está trabalhando no seu terminal, consultando segredos do 1Password com op read. Precisa da API key do Linear. Touch ID. A do OpenRouter. Touch ID. A do Gitea. Touch ID. Em meia hora me pediu o dedo quatorze vezes. Sabe o que acontece quando uma ferramenta de segurança te interrompe quatorze vezes em trinta minutos? Que na quinta vez você já não lê mais o que está pedindo. Põe o dedo como um ato reflexo. “Sim, tanto faz, me deixa trabalhar.” ...

segurança 1password bash devtools cli

Quando sua IA se torna sua pior inimiga

Ontem minha IA enviou 44 emails. O problema é que o conteúdo era inventado. Não é brincadeira. Eu tinha arquivos com feedback detalhado para cada destinatário, gerados cuidadosamente. A tarefa era simples: ler cada arquivo e enviá-lo. Em vez disso, a IA decidiu “resumir” o conteúdo para “ir mais rápido”. Inventou fatos. Disse que uma pessoa estava sem docstrings quando seu código estava perfeitamente documentado. Para completar, quatro desses emails foram para pessoas que nem sequer tinham entregado nada. ...

ia llm segurança post-mortem claude

39 milhões de segredos vazados no GitHub. O seu pode ser o próximo.

5 minutos. Foi só isso que levou. Um pesquisador de segurança publica uma access key da AWS em um repositório público do GitHub. Faz isso de propósito, como experimento. Cinco minutos depois, alguém já estava usando para minerar criptomoedas. Cinco. Minutos. Existem bots escaneando o GitHub 24/7 procurando exatamente isso: credenciais expostas. E são rápidos. Muito mais rápidos que você se dando conta de que fez merda. Os números assustam Segundo o GitHub, em 2024 vazaram 39 milhões de segredos em repositórios públicos. 67% a mais que no ano anterior. ...

segurança git 1password devops segredos