Retenção é o percentual de usuários de uma coorte que retornam ao app N dias após a instalação. D1 = retenção no dia 1 (retornou no dia seguinte à instalação), D7 = 7 dias, D30 = 30 dias. É a métrica do balde furado — um produto com excelente aquisição e péssima retenção consome a audiência mais rápido do que consegue repor, enquanto um produto com aquisição razoável e excelente retenção gera efeito composto. Depois do volume de instalações, a retenção é a métrica não financeira mais importante no mobile.
Essa distribuição é a verdade que a maioria dos artigos sobre retenção omite. O app mediano do catálogo retém menos de 4% das instalações até o dia 30 — a maioria dos "bons benchmarks" divulgados em publicações do setor descreve o desempenho do decil superior ou do quartil superior, não a realidade da média. Se o seu D30 está entre 5 e 10%, você já está no quartil superior. Se estiver acima de 10%, você está no decil superior, onde vivem apps de social ao consumidor, produtividade e finanças.
Benchmarks do setor por categoria (referências aproximadas para 2026):
- Mensagens / bancos / apps de hábito: D1 50-70%, D7 30-50%, D30 25-50%. Cauda longa ancorada pela necessidade diária estrutural.
- Social ao consumidor / produtividade: D1 40-50%, D7 20-30%, D30 10-15%.
- Streaming / mídia: D1 35-45%, D7 15-25%, D30 8-15%.
- Jogos casuais: D1 35-45%, D7 12-20%, D30 5-10%.
- Jogos hyper-casuais: D1 25-35%, D7 5-10%, D30 1-3%. Projetados para monetização rápida, não para retenção.
- Utilitários: amplitude enorme — específicos para tarefas (calculadora, lanterna): D30 < 5%; recorrentes (rastreador de ciclo, previsão do tempo): D30 > 30%.
Compare com sua própria categoria e com sua própria baseline histórica. Comparações entre categorias diferentes induzem ao erro.
As curvas de retenção seguem um formato universal: queda acentuada na primeira semana (a maioria das instalações abandona rapidamente), decaimento mais lento ao longo das semanas 2 a 4, depois uma cauda longa quase plana. O formato matemático é "decaimento exponencial + assíntota" — a assíntota é a fração de usuários que se tornam usuários "permanentes", que estarão ativos meses ou anos após a instalação. A assíntota é o número que realmente gera efeito composto. Um produto que retém 10% das instalações indefinidamente escala de forma fundamentalmente diferente de um que retém 3% — ao longo do tempo, a base de usuários permanentes se acumula a partir de cada coorte, e esse efeito composto é o motor do crescimento orgânico.
A distribuição acima é fortemente assimétrica à direita: dezenas de milhares de apps do catálogo se concentram entre 1 e 5% de D30, uma longa cauda de apps fortes ultrapassa 10%, e um pequeno grupo de apps de elite cruza 20%. A implicação para equipes de produto: D30 = 5% parece medíocre frente aos benchmarks de publicações do setor, mas é na verdade o quartil superior no mercado mensurável. Compare com a mediana da sua categoria na tabela abaixo, não com números de destaque de estudos de caso de mensagens ou bancos.
Calculadora de retenção D30
Informe quantos usuários de uma coorte de instalação ainda estavam ativos no dia 30 para obter sua taxa de retenção D30 e veja em que faixa ela se enquadra.
Enter your numbers to see your result and how it compares to the catalog.
Benchmarks: dados MWM, EUA, apps com ≥1.000 downloads d30. Compare também com a mediana da sua categoria.
Três métodos de medição de retenção que você precisa conhecer:
- Retenção N-day (clássica): o usuário retornou EXATAMENTE no dia N. Critério rigoroso, número menor, fácil de calcular. Padrão para benchmarks de D1 / D7 / D30.
- Retenção contínua (mais flexível): o usuário retornou no dia N ou em qualquer dia DEPOIS do dia N. Número maior, curva mais suave, útil para produtos de baixa frequência.
- Retenção por intervalo: o usuário retornou pelo menos uma vez durante uma janela de dia N a dia N+M. Usada quando a granularidade diária é muito ruidosa.
Produtos diferentes usam padrões diferentes — o que importa é a consistência. Plataformas de analytics maduras (Amplitude, Mixpanel) expõem as três opções e permitem que você escolha.
Alavancas que movem a retenção (em ordem aproximada de impacto):
- Taxa de conclusão do onboarding — usuários que concluem o onboarding retêm 2 a 3× mais do que os que não concluem. A maior alavanca individual de D1.
- Reativação do dia 1 para o dia 2 — notificação push, e-mail, prompt in-app timed para trazer o usuário de volta em 24 horas. Eleva o D7 de forma expressiva.
- Mecânicas de loop de hábito — sequência diária, conteúdo diário novo, integração à rotina diária. Impulsiona a assíntota de longa cauda.
- Product-market fit — no nível macro, a retenção é a expressão mais fiel do fit. Se a retenção for estruturalmente fraca em todas as coortes, a resposta geralmente está no produto, não no marketing.
Benchmarks de retenção D1 / D7 / D30 por categoria (2026)
| Categoria | D1 | D7 | D30 |
|---|---|---|---|
| Mensagens / bancos / apps de hábito | 50-70% | 30-50% | 25-50% |
| Social ao consumidor / produtividade | 40-50% | 20-30% | 10-15% |
| Streaming / mídia | 35-45% | 15-25% | 8-15% |
| Jogos casuais | 35-45% | 12-20% | 5-10% |
| Jogos hyper-casuais | 25-35% | 5-10% | 1-3% |
| Utilitários (específicos para tarefas) | 15-30% | <5% | <5% |
A assíntota — taxa de retenção plana de longa cauda que persiste além do D90 — importa mais para o LTV do que qualquer número individual de D1/D7/D30. Um produto que retém 10% das instalações indefinidamente escala de forma fundamentalmente diferente de um que retém 3%.
Median D1 / D7 / D30 retention by category (US, Q3 2025, MWM)
| Category | D1 | D7 | D30 |
|---|---|---|---|
| Social & Communication | 31.9% | 12.3% | 5.9% |
| Lifestyle & Well-being | 23.6% | 9.6% | 4.8% |
| Productivity & Tools | 23.0% | 8.9% | 4.5% |
| Education & Knowledge | 24.9% | 8.6% | 3.6% |
| Media & Entertainment | 24.9% | 8.0% | 3.4% |
| Game | 36.6% | 9.3% | 2.9% |
Dois fatos que a tabela por categoria torna evidentes. Jogos têm a maior retenção D1 do catálogo, mas o menor D30 — a curva de decaimento clássica, em que um onboarding chamativo vence o dia 1, mas as mecânicas de loop de hábito falham no mês 1. Social e Comunicação lidera em todos os horizontes — a assíntota de longa cauda é onde os produtos de rede estrutural dominam. Se a sua curva de retenção se parece com a linha de Jogos (D1 alto, D30 desabando), a alavanca é o re-engajamento no meio do funil; se se parece com a linha de Educação (D1 modesto, decaimento constante), a alavanca é densidade de valor e profundidade de progressão.
A retenção varia por país?
Suposição comum: a retenção é estruturalmente menor em mercados emergentes porque os usuários têm menor intenção, mais pressão de armazenamento e abandono de apps mais agressivo. Os dados do catálogo contradizem esse mito.
Median D1 / D7 / D30 retention by country — Tier-1 vs emerging markets (Q3 2025, MWM)
| Country | D1 | D7 | D30 |
|---|---|---|---|
| United States | 27.3% | 9.2% | 3.9% |
| United Kingdom | 27.2% | 9.0% | 3.9% |
| Germany | 27.4% | 9.0% | 3.8% |
| France | 27.3% | 9.0% | 3.8% |
| Japan | 27.4% | 9.1% | 3.9% |
| South Korea | 27.4% | 9.0% | 3.8% |
| Brazil | 27.1% | 8.9% | 3.8% |
| India | 27.5% | 9.1% | 3.7% |
A retenção D1/D7/D30 mediana é essencialmente uniforme nos principais mercados. A menos de meio ponto da baseline dos EUA estão Reino Unido, Alemanha, França, Japão, Coreia do Sul, Brasil e Índia. A narrativa de que "apps em mercados emergentes abandonam mais rápido" não se sustenta — na mediana, o formato de retenção é estruturalmente similar entre geografias. A variação entre MERCADOS é muito menor do que a variação entre apps dentro de qualquer mercado único. Localização, cobertura de idioma e cadência de conteúdo movem a retenção mais do que o mix de países.
Erros comuns de retenção
A maioria dos problemas de retenção não são problemas de medição — são interpretações equivocadas previsíveis da curva. As mais recorrentes:
- Perseguir o D1 enquanto a assíntota D30 se deteriora — um onboarding chamativo pode inflar o dia 1 sem construir o loop de hábito que impulsiona a taxa de longa cauda. O D1 parece bom no dashboard; a assíntota é o que gera efeito composto no LTV.
- Tratar a retenção como problema de re-engajamento quando é problema de produto — se a retenção for estruturalmente fraca em *todas* as coortes e canais, nenhuma quantidade de push ou e-mail resolve. Retenção fraca em todos os lugares é o sinal mais fiel de ausência de product-market fit.
- Ler retenção agregada em vez de por coorte — uma única curva agregada esconde qual fonte de aquisição, plataforma ou variante de onboarding está vazando. O número agregado pode permanecer estável enquanto um canal pago colapsa silenciosamente por baixo.
- Excesso de notificações para inflar o D7 — bombardear usuários com push para trazê-los de volta aumenta a retenção de curto prazo, mas gera fadiga de notificações e desinstalações, prejudicando exatamente a assíntota que você está tentando crescer. Disciplina de frequência supera volume.
- Usar benchmarks da categoria errada — comparar o D30 de um jogo casual com o de um app de mensagens não faz sentido (o catálogo vai de 1% a 50%+). Compare com a mediana da sua categoria e, acima de tudo, com sua própria baseline histórica.
O exemplo positivo clássico é o loop de sequência + lembrete (sendo o Duolingo o caso canônico): uma mecânica de retorno diário com um custo visível para quebrá-la, apoiada por re-engajamento bem cronometrado — o que constrói a assíntota de longa cauda em vez de apenas os números da primeira semana.