← Voltar ao blog
Data Engineering · Comparativo

Apify vs Xooriq 2026: por que data engineers brasileiros estão migrando

Apify factura US$ 21M ARR raspando 50k+ websites por dia. Mas se você é data engineer brasileiro precisando de CNPJs + decisores B2B, o ROI é catastrófico. Este post mostra os números — compute units, cache, MCP, manutenção — que justificam migração para Xooriq.

Por Central Fox Tecnologia · 18 mai 2026 · 10 min de leitura

1. Apify pricing model: o problema do compute unit

O Apify opera em modelo compute-units-based. 1 CU = 1 GB-hora de processamento. O plano Starter ($49/mês) inclui 19 CU. Cada CU adicional custa $0.4. Fonte: Apify Pricing.

Para escalar B2B brasileiro, os números ficam ruins. Um actor médio consome:

  • Receita Federal CNPJ: ~1.5 CU por 1.000 CNPJs (parsing HTML + retry rate-limit).
  • LinkedIn (community actor): ~3 CU por 1.000 perfis + proxy residencial ($50/mês extra).
  • Site institucional + email decisor: ~2 CU por 1.000 páginas.

Para a base completa de 13.3M CNPJs brasileiros, você precisaria de ~26.000 CU. Sem desconto bulk: US$ 10.400 apenas em compute. Mais $50 proxy, $100 storage, e 40 horas/mês de engenheiro corrigindo actors quebrados.

2. Por que actors community quebram tanto

Apify tem ~50.000 actors no Apify Store. ~80% são community-built. Em testes que fizemos em 2026-04:

Auditoria 12 actors CNPJ (abr/2026)

  • 7 quebrados — Receita Federal mudou HTML em mar/2026, actors não atualizados.
  • 3 parciais — retornam só Razão Social + CNPJ, sem capital social ou sócios.
  • 2 funcionais — mas com erro 30%+ em CNPJ de MEI.

3. Xooriq FoxScraper: cache compartilhado é unfair advantage

Xooriq usa FoxScraper — engine proprietária Central Fox Tecnologia com cache PostgreSQL compartilhado entre clientes. O design fundamental:

# Apify: cada cliente paga pelo mesmo crawl
Cliente A roda actor → consome CU → recebe dados
Cliente B roda actor → consome CU → recebe dados (IGUAIS)
Cliente C roda actor → consome CU → recebe dados (IGUAIS)
Custo total Apify = 3× compute

# Xooriq: 1 crawl, N consultas
FoxScraper roda 1× → PostgreSQL cache (Fernet AES-128)
Cliente A query → hit cache → R$ 0,003 latência
Cliente B query → hit cache → R$ 0,003 latência
Cliente C query → hit cache → R$ 0,003 latência
Custo marginal = O(1) por query

4. Comparativo lado-a-lado

DimensãoApifyXooriq
Modelo de cobrançaCompute units ($/CU)Flat R$ 597/mês
Custo 10k leads/mês~US$ 1.799 (com dev)R$ 597 (sem dev)
Base CNPJ pré-curada❌ Você crawla✅ 13.3M CNPJs
MCP server nativo❌ Wrapper terceiro✅ mcp.xooriq.com
Manutenção quando site muda❌ Você arruma✅ Central Fox Tecnologia (SLA 24h)
LGPD compliance❌ Cliente é controlador✅ Xooriq é operador + DPA
Formatos fiscais⚠️ Actors fragmentados✅ CNPJ/GSTIN/EIN/VAT
Cache compartilhado❌ Cada cliente paga sozinho✅ R$ 0,003/query

5. Quando Apify ainda faz sentido

Não somos absolutistas. Apify é melhor escolha quando:

  • Você precisa raspar site único e exótico que Xooriq não cobre.
  • Você é agência de growth com data engineers dedicados que mantêm actors.
  • Volume baixo (< 1.000 leads/mês) onde plano Starter $49 não estoura CU.

6. Fontes verificadas

Pare de pagar compute. Xooriq é flat R$ 597/mês.

13.3M CNPJs · MCP nativo · cache compartilhado · LGPD-by-design · sem dev-time.

Ver stack comparison Apify → Xooriq