Upscaling de fotos com IA explicado — quando 2× supera 4×
Tomoda HinataAutor e mantenedor da ferramentaPublicado em 26 de abr. de 20266 min de leitura
O upscaling com IA usa uma rede treinada em milhões de pares baixa/alta resolução para inventar detalhe plausível que o bicúbico não recupera. Salva miniaturas antigas, recortes de celular e escaneamentos pequenos para impressão. Não recupera detalhe nunca capturado e, em 4×, pode gerar rostos esquisitos — escolha 2× a menos que tenha motivo.
Ferramentas usadas neste guia
O que o upscaling IA realmente faz?
Reamostragem clássica (bicúbico, Lanczos) só interpola. A IA roda CNN/Transformer treinados em pares baixa/alta resolução; entrada 256×256 → saída 512×512 com pixels coerentes com o treino. Real-ESRGAN aprendeu a inverter desfoque, JPEG e downsampling.
Quando é a ferramenta certa?
Vitórias clássicas: resgatar miniatura, ampliar scan antigo, salvar recorte de celular. Derrotas clássicas: sintetizar novo ângulo, ler texto de foto borrada, escalar imagem já gerada por IA.
Por que 2× como padrão?
Em 2×, há 4 pixels de entrada por saída; em 4×, 1:16 — a rede precisa inventar 15/16, gerando rostos estranhos. Para 4×, encadeie duas passagens 2×.
Limites realistas
Rostos podem mudar sutilmente em 4×. Texto pequeno raramente fica legível. Compressão JPEG forte é amplificada. Fontes geradas por IA acumulam artefatos. Na dúvida, pare em 2×.
Passos
Cerca de 1 minSolte a imagem
JPG/PNG/WebP até 4 MP. Maior funciona, mas tempo cresce ao quadrado.
Escolha o fator
Padrão 2× para quase tudo; 4× só com motivo.
Aguarde a inferência
Modelo (~50 MB) na 1ª vez; depois cacheado. M2 ~4 s, iPhone 14 ~12 s.
Compare e baixe
Use slider antes/depois; rosto estranho? volte para 2× ou pule.
| Entrada → Saída | Apple M2 (WebGPU) | iPhone 14 (Wasm) | Tamanho saída |
|---|---|---|---|
| 256×256 → 512×512 | 0,4 s | 1,1 s | +150% bytes |
| 512×512 → 1024×1024 | 1,3 s | 3,8 s | +220% bytes |
| 1024×1024 → 2048×2048 | 4,1 s | 12,0 s | +280% bytes |
Perguntas frequentes
Acima de 4× é possível?
Duas passagens 2× = 4× efetivo. Acima disso, artefatos dominam.
Por que rostos ficam estranhos?
A rede não sabe quem é; preenche com características mais plausíveis do contexto.
Minhas fotos são enviadas?
Não. Modelo cacheado, inferência local.
Processa em lote?
Sim — fila, cold start só na primeira.
Ajuda contra artefatos JPEG?
Compressão leve sim; blocos fortes geralmente são amplificados.
Funciona em imagens geradas por IA?
Geralmente piora — artefatos somam.
Experimentar agora
ONNX Runtime Web + WebGPU 2× / 4× super-resolution
AI Upscale (Real-ESRGAN) — 100% in-browserEste artigo inclui tradução assistida por IA. Avise se encontrar erros.