Pular para o conteúdo

Upscaling de fotos com IA explicado — quando 2× supera 4×

Autor e mantenedor da ferramentaPublicado em 26 de abr. de 20266 min de leitura

O upscaling com IA usa uma rede treinada em milhões de pares baixa/alta resolução para inventar detalhe plausível que o bicúbico não recupera. Salva miniaturas antigas, recortes de celular e escaneamentos pequenos para impressão. Não recupera detalhe nunca capturado e, em 4×, pode gerar rostos esquisitos — escolha 2× a menos que tenha motivo.

O que o upscaling IA realmente faz?

Reamostragem clássica (bicúbico, Lanczos) só interpola. A IA roda CNN/Transformer treinados em pares baixa/alta resolução; entrada 256×256 → saída 512×512 com pixels coerentes com o treino. Real-ESRGAN aprendeu a inverter desfoque, JPEG e downsampling.

Quando é a ferramenta certa?

Vitórias clássicas: resgatar miniatura, ampliar scan antigo, salvar recorte de celular. Derrotas clássicas: sintetizar novo ângulo, ler texto de foto borrada, escalar imagem já gerada por IA.

Por que 2× como padrão?

Em 2×, há 4 pixels de entrada por saída; em 4×, 1:16 — a rede precisa inventar 15/16, gerando rostos estranhos. Para 4×, encadeie duas passagens 2×.

Como funciona o modelo no navegador?

Real-ESRGAN-x2 ONNX (~50 MB), baixado e cacheado na 1ª vez. Inferência ONNX Runtime Web em WebAssembly, com WebGPU quando disponível (Chrome 113+/Edge 113+/Safari 17+). M2: 1024×1024 → 2048×2048 em ~4 s; iPhone 14 ~12 s.

Limites realistas

Rostos podem mudar sutilmente em 4×. Texto pequeno raramente fica legível. Compressão JPEG forte é amplificada. Fontes geradas por IA acumulam artefatos. Na dúvida, pare em 2×.

Passos

Cerca de 1 min
  1. Solte a imagem

    JPG/PNG/WebP até 4 MP. Maior funciona, mas tempo cresce ao quadrado.

  2. Escolha o fator

    Padrão 2× para quase tudo; 4× só com motivo.

  3. Aguarde a inferência

    Modelo (~50 MB) na 1ª vez; depois cacheado. M2 ~4 s, iPhone 14 ~12 s.

  4. Compare e baixe

    Use slider antes/depois; rosto estranho? volte para 2× ou pule.

Real-ESRGAN-x2 — três tamanhos de entrada
Entrada → SaídaApple M2 (WebGPU)iPhone 14 (Wasm)Tamanho saída
256×256 → 512×5120,4 s1,1 s+150% bytes
512×512 → 1024×10241,3 s3,8 s+220% bytes
1024×1024 → 2048×20484,1 s12,0 s+280% bytes
ONNX Runtime Web 1.21, Real-ESRGAN-x2 (~50 MB), M2 Chrome 139 / iPhone 14 Safari 17, JPG Q90 (2026-04-26).

Perguntas frequentes

  • Acima de 4× é possível?

    Duas passagens 2× = 4× efetivo. Acima disso, artefatos dominam.

  • Por que rostos ficam estranhos?

    A rede não sabe quem é; preenche com características mais plausíveis do contexto.

  • Minhas fotos são enviadas?

    Não. Modelo cacheado, inferência local.

  • Processa em lote?

    Sim — fila, cold start só na primeira.

  • Ajuda contra artefatos JPEG?

    Compressão leve sim; blocos fortes geralmente são amplificados.

  • Funciona em imagens geradas por IA?

    Geralmente piora — artefatos somam.

Experimentar agora

ONNX Runtime Web + WebGPU 2× / 4× super-resolution

AI Upscale (Real-ESRGAN) — 100% in-browser

Este artigo inclui tradução assistida por IA. Avise se encontrar erros.

Medimos uso anônimo com analítica sem cookies. Veja nossa política de privacidade.