Apify vs Xooriq 2026: por que data engineers brasileiros estão migrando
Apify factura US$ 21M ARR raspando 50k+ websites por dia. Mas se você é data engineer brasileiro precisando de CNPJs + decisores B2B, o ROI é catastrófico. Este post mostra os números — compute units, cache, MCP, manutenção — que justificam migração para Xooriq.
1. Apify pricing model: o problema do compute unit
O Apify opera em modelo compute-units-based. 1 CU = 1 GB-hora de processamento. O plano Starter ($49/mês) inclui 19 CU. Cada CU adicional custa $0.4. Fonte: Apify Pricing.
Para escalar B2B brasileiro, os números ficam ruins. Um actor médio consome:
- Receita Federal CNPJ: ~1.5 CU por 1.000 CNPJs (parsing HTML + retry rate-limit).
- LinkedIn (community actor): ~3 CU por 1.000 perfis + proxy residencial ($50/mês extra).
- Site institucional + email decisor: ~2 CU por 1.000 páginas.
Para a base completa de 13.3M CNPJs brasileiros, você precisaria de ~26.000 CU. Sem desconto bulk: US$ 10.400 apenas em compute. Mais $50 proxy, $100 storage, e 40 horas/mês de engenheiro corrigindo actors quebrados.
2. Por que actors community quebram tanto
Apify tem ~50.000 actors no Apify Store. ~80% são community-built. Em testes que fizemos em 2026-04:
Auditoria 12 actors CNPJ (abr/2026)
- 7 quebrados — Receita Federal mudou HTML em mar/2026, actors não atualizados.
- 3 parciais — retornam só Razão Social + CNPJ, sem capital social ou sócios.
- 2 funcionais — mas com erro 30%+ em CNPJ de MEI.
3. Xooriq FoxScraper: cache compartilhado é unfair advantage
Xooriq usa FoxScraper — engine proprietária Central Fox Tecnologia com cache PostgreSQL compartilhado entre clientes. O design fundamental:
# Apify: cada cliente paga pelo mesmo crawl
Cliente A roda actor → consome CU → recebe dados
Cliente B roda actor → consome CU → recebe dados (IGUAIS)
Cliente C roda actor → consome CU → recebe dados (IGUAIS)
Custo total Apify = 3× compute
# Xooriq: 1 crawl, N consultas
FoxScraper roda 1× → PostgreSQL cache (Fernet AES-128)
Cliente A query → hit cache → R$ 0,003 latência
Cliente B query → hit cache → R$ 0,003 latência
Cliente C query → hit cache → R$ 0,003 latência
Custo marginal = O(1) por query4. Comparativo lado-a-lado
| Dimensão | Apify | Xooriq |
|---|---|---|
| Modelo de cobrança | Compute units ($/CU) | Flat R$ 597/mês |
| Custo 10k leads/mês | ~US$ 1.799 (com dev) | R$ 597 (sem dev) |
| Base CNPJ pré-curada | ❌ Você crawla | ✅ 13.3M CNPJs |
| MCP server nativo | ❌ Wrapper terceiro | ✅ mcp.xooriq.com |
| Manutenção quando site muda | ❌ Você arruma | ✅ Central Fox Tecnologia (SLA 24h) |
| LGPD compliance | ❌ Cliente é controlador | ✅ Xooriq é operador + DPA |
| Formatos fiscais | ⚠️ Actors fragmentados | ✅ CNPJ/GSTIN/EIN/VAT |
| Cache compartilhado | ❌ Cada cliente paga sozinho | ✅ R$ 0,003/query |
5. Quando Apify ainda faz sentido
Não somos absolutistas. Apify é melhor escolha quando:
- Você precisa raspar site único e exótico que Xooriq não cobre.
- Você é agência de growth com data engineers dedicados que mantêm actors.
- Volume baixo (< 1.000 leads/mês) onde plano Starter $49 não estoura CU.
6. Fontes verificadas
Pare de pagar compute. Xooriq é flat R$ 597/mês.
13.3M CNPJs · MCP nativo · cache compartilhado · LGPD-by-design · sem dev-time.
Ver stack comparison Apify → Xooriq