Imagine um mundo onde processar um milhão de páginas de código custa o mesmo que um café, em vez de exigir o orçamento de uma pequena nação. Esse é o futuro prometido pela Subquadratic, uma startup de Miami que acaba de sair das sombras com uma afirmação audaciosa: eles quebraram a lei matemática que limita todos os modelos de IA desde 2017.
Desde que o Google publicou o artigo "Attention Is All You Need", a arquitetura Transformer dominou o mundo. Mas ela veio com um custo oculto: a escalabilidade quadrática. Se você dobrar o texto de entrada, o custo computacional quadruplica. A Subquadratic afirma ter resolvido isso com o primeiro Large Language Model (LLM) totalmente subquadrático.
O Fim do 'Imposto Quadrático' na Inteligência Artificial
Para entender por que isso é um marco — ou uma fraude monumental — precisamos entender o problema fundamental da computação de IA hoje. Cada modelo moderno (ChatGPT, Claude, Gemini) usa uma operação chamada "Atenção".
Nesse sistema, cada palavra (token) é comparada com todas as outras palavras no texto. Se você tem 1.000 palavras, a IA faz 1.000 x 1.000 comparações. Se você pula para 1 milhão de palavras, o número de interações explode exponencialmente. Isso é o que chamamos de escalabilidade quadrática.
"O custo de processar entradas longas tornou-se punitivo. Construímos uma pilha elaborada de gambiarras, como o RAG, apenas para contornar o fato de que o modelo não consegue processar tudo de uma vez de forma eficiente." — Alexander Whedon, CTO da Subquadratic.
A promessa do modelo SubQ 1M-Preview é que o poder computacional cresce de forma linear. Em 12 milhões de tokens, a arquitetura reduziria a computação de atenção em quase 1.000 vezes em comparação com os modelos de fronteira atuais.
Como a Tecnologia SSA Funciona?
A abordagem da empresa, chamada de Subquadratic Sparse Attention (SSA), baseia-se em uma premissa simples: a maioria das comparações de token para token é desperdício. O SSA aprende a identificar quais partes do texto realmente importam e calcula a atenção apenas sobre esses pontos.
- Dependência de Conteúdo: O modelo decide onde olhar com base no significado, não em padrões fixos.
- Velocidade de Prefill: Atinge um ganho de 7,2x em 128 mil tokens, saltando para 52,2x em 1 milhão de tokens.
- Eficiência de Custo: A startup afirma que o processamento no benchmark RULER custou $8, enquanto o Claude Opus exigiria $2.600 para a mesma tarefa.
Comparativo de Performance: SubQ vs. Gigantes
A Subquadratic não apenas lançou um modelo; ela apresentou números que fazem os investidores de risco salivarem. Veja como ela se compara em benchmarks específicos de codificação e contexto longo:
| Benchmark | SubQ 1M-Preview | Claude Opus 4.6 | GPT-5.5 (Proj) |
|---|---|---|---|
| SWE-Bench Verified | 81.8% | 80.8% | N/A |
| RULER (128K) | 95.0% | 94.8% | 96.0% |
| MRCR v2 (Retrieval) | 65.9% | 32.2% | 74.0% |
Embora esses números sejam impressionantes, eles vêm acompanhados de asteriscos. A seleção de benchmarks é estreita, focando apenas no que o modelo faz de melhor. Avaliações de raciocínio lógico geral, matemática e segurança ainda não foram publicadas, deixando muitos especialistas céticos sobre a versatilidade do modelo. Se você quiser entender mais sobre as tendências do mercado, confira mais artigos em nosso portal.
Ceticismo na Comunidade: 'AI Theranos' ou Revolução?
A recepção no X (antigo Twitter) e em fóruns de pesquisa foi explosiva. Dan McAteer resumiu o sentimento geral ao dizer que a SubQ é "ou o maior avanço desde o Transformer... ou a Theranos da IA".
Os críticos apontam três problemas principais:
- Origem dos Pesos: O CTO confirmou que o modelo utiliza pesos de modelos open-source (como DeepSeek ou Kimi) como ponto de partida, o que levanta questões sobre o quanto da inovação é arquitetura pura e o quanto é apenas um finetune inteligente.
- O Fantasma da Magic.dev: Em 2024, a Magic.dev prometeu 100 milhões de tokens de contexto com eficiência semelhante e levantou $500 milhões. Até agora, o produto real permanece invisível para o público.
- Gap Lab-to-Prod: No benchmark MRCR v2, o resultado de laboratório da SubQ foi 83, mas a versão de produção verificada por terceiros caiu para 65,9. Uma queda de 17 pontos que ainda não foi explicada.
Apesar das críticas, a equipe por trás do projeto é de peso. Com 11 PhDs vindos de gigantes como Meta e Google, há uma base intelectual sólida tentando provar que os detratores estão errados.
Sugestão de Produto Relacionado
Para desenvolvedores e entusiastas de IA que precisam de poder de processamento local para testar modelos de fronteira e bibliotecas como as da Subquadratic, um hardware robusto é indispensável.
NVIDIA GeForce RTX 4090: A placa de vídeo definitiva para quem deseja rodar LLMs locais, realizar finetuning e acelerar fluxos de trabalho de Deep Learning com a arquitetura Ada Lovelace.
Ver na AmazonO Que Está em Jogo para o Futuro do Marketing e Tech
Se a Subquadratic estiver certa, a economia da IA mudará para sempre. Hoje, as empresas gastam milhões em infraestrutura de RAG (Retrieval-Augmented Generation) para gerenciar contextos longos. Se o modelo puder ler todo o seu codebase ou histórico de clientes em um único passo, de forma barata, essas infraestruturas tornam-se obsoletas.
Para o profissional de marketing digital, isso significa uma hiper-personalização sem precedentes. Imagine alimentar uma IA com cada interação de suporte, cada e-mail enviado e cada clique de um usuário nos últimos 5 anos, e obter uma estratégia de conversão instantânea baseada em 100% dos dados, e não apenas em uma amostra.
Se você representa uma empresa que deseja implementar soluções de IA de ponta, fale conosco para uma consultoria estratégica.
Conclusão
A Subquadratic está jogando um jogo de alto risco. Com $29 milhões em financiamento inicial e uma avaliação de $500 milhões, a pressão para entregar resultados independentemente verificáveis é imensa. A história da computação nos ensina que toda barreira fundamental acaba caindo; a questão é se foi esta pequena equipe de Miami que encontrou a marreta certa.
Por enquanto, o SubQ 1M-Preview permanece em beta privado. O mundo da tecnologia observa, dividido entre o desejo por um milagre de engenharia e o medo de mais uma promessa vazia do Vale do Silício.
FAQ - Perguntas Frequentes
1. O que significa uma arquitetura subquadrática?
Significa que a necessidade de processamento aumenta de forma linear (ou quase linear) à medida que o texto cresce. Em modelos tradicionais, se você dobra o texto, o custo quadruplica (quadrático). No subquadrático, se você dobra o texto, o custo apenas dobra.
2. O modelo SubQ está disponível para o público?
Atualmente, o modelo está em beta privado. A empresa lançou três produtos iniciais: uma API de contexto total, um agente de codificação (SubQ Code) e uma ferramenta de busca (SubQ Search).
3. Por que os pesquisadores estão céticos?
Principalmente devido à falta de revisões por pares, benchmarks selecionados a dedo e o fato de o modelo ser construído sobre bases de código aberto existentes, o que dificulta isolar o que é inovação real da arquitetura.
4. Qual é a principal vantagem do SubQ sobre o ChatGPT?
A promessa é a eficiência extrema em contextos gigantescos. Enquanto processar milhões de tokens no GPT-4 ou Claude é caríssimo e lento, o SubQ afirma fazer o mesmo 1.000 vezes mais barato e muito mais rápido.
5. Quem investiu na Subquadratic?
A rodada de $29 milhões incluiu o cofundador do Tinder, Justin Mateen, e investidores iniciais de gigantes como OpenAI, Anthropic e Stripe.




