Enquanto Washington obsessivamente restringe processadores, Pequim avança no open source e um colapso silencioso no suprimento de memória ameaça paralisar o Ocidente.
Há algo de teatral na obsessão de Washington em bloquear o acesso da China aos chips de processamento de ponta. É a geopolítica como esporte espetáculo: embargos de exportação, restrições de fabricação, a NVIDIA como peça de xadrez. Mas enquanto os EUA jogam damas com os processadores, a China está reescrevendo as regras do tabuleiro inteiro. A tese que ninguém está conectando é simples: o verdadeiro gargalo da inteligência artificial não é a computação bruta, é a memória. E a escassez dela é o que vai parar o Ocidente.
O fato é que a China alcançou o Ocidente em IA de forma mais rápida do que o previsto, e o fez ignorando a necessidade de ter os melhores chips fechados. Segundo discussões recentes no All-In Podcast, o avanço chinês se baseia em duas pernas: modelos open source e destilação de conhecimento. Em vez de treinar modelos gigantescos do zero com hardware de ponta que eles não conseguem comprar, eles destilam a inteligência de modelos ocidentais já treinados. É um atalho engenhoso. Você não precisa do processador mais caro do mundo se consegue extrair o suco daquilo que já foi processado por outro. A corrida armamentista de processadores, por si só, nunca foi uma muralha defensiva sustentável.
Mas aqui está o ponto de inflexão que torna a estratégia ocidental quase irrelevante: a crise de memória. Enquanto todo mundo discute TDP e teraflops, o sistema está sufocando na banda de memória. A Micron Technology acaba de reportar um trimestre financeiro explosivo, e o motivo não é exatamente um mistério. A demanda por memória de alta largura de banda (HBM) explodiu porque a inferência em larga escala — o que move a economia real da IA hoje — é um problema de transferência de dados, não apenas de cálculo. Os processadores estão ociosos esperando a memória alimentá-los. É como ter um motor Ferrari com um tubo de combustível de palito de dente.
Na minha leitura, isso expõe uma falha estrutural profunda na doutrina tecnológica americana. O complexo de segurança nacional dos EUA continua operando sob a premissa de que restringir ferramentas de fabricação de processadores manterá a hegemonia. Mas a geopolítica real da IA está acontecendo na cadeia de suprimento de memória, que é concentrada, frágil e sofrendo um choque de demanda que afeta desde os gigantescos datacenters até o hardware de consumo da Apple. A escassez de memória é o gargalo físico da era da IA, e a política industrial ocidental simplesmente não tem uma resposta para isso.
O resultado provável é uma inversão irônica de fortunas. A China, forçada a operar com hardware inferior, investiu em eficiência de software e arquiteturas distribuídas que a tornaram imune à guerra de embargos de processadores. O Ocidente, por sua vez, garantiu seu acesso aos melhores chips do mundo, mas pode descobrir que não tem memória suficiente para fazê-los rodar em escala. A hegemonia tecnológica do século XXI não será definida por quem fabrica o silício mais rápido, mas por quem consegue lembrar de mais coisas ao mesmo tempo.
A inferência em larga escala, que move a economia da IA, é um problema de transferência de dados. Os processadores de ponta ficam ociosos esperando a memória de alta largura de banda (HBM) alimentá-los, funcionando como um motor potente com um tubo de combustível estreito.
A China usou modelos open source e destilação de conhecimento. Em vez de treinar modelos do zero com hardware restrito, eles extraem a inteligência de modelos ocidentais já treinados, investindo em eficiência de software para contornar os embargos.
Os EUA focam em restringir o acesso a processadores de ponta, mas ignoram que a cadeia de suprimento de memória é concentrada e sofre um choque de demanda. O Ocidente pode ter os melhores chips, mas corre o risco de não ter memória suficiente para operá-los em escala.