Voltar às ideias

Ranking

Ranking de Modelos UI by Sho

Meu ranking pessoal de modelos que fazem boa UI. Não estou medindo só a capacidade de código: aqui pesam o harness, o critério visual e o quanto evitam o AI Slop, ou seja, interfaces geradas por IA que parecem polidas mas falham em intenção, consistência ou uso real.

Histórico vivo

Modelos para UI, mês a mês

Maio funciona como referência inicial e Junho mostra como os modelos evoluíram. A ideia é atualizá-lo mês a mês para ver o que realmente melhora em interface, qual harness potencializa cada modelo e quais continuam gerando AI Slop demais.

Histórico do ranking pessoal de modelos para UI Gráfico histórico de Maio a Junho de 2026. Em Maio a ordem é Opus 4.6, GPT 5.5, Gemini 3 Pro, Gemini 3.5, Sonnet 4.5 e Composer 2. Em Junho a ordem evolui para GPT 5.5, Composer 2.5, Opus 4.7, Sonnet 4.6, Gemini 3 Pro e Gemini 3.5. Equivalências de evolução: Opus 4.6 vira Opus 4.7, Composer 2 vira Composer 2.5, Sonnet 4.5 vira Sonnet 4.6, e GPT 5.5, Gemini 3 Pro e Gemini 3.5 seguem como linhas comparáveis entre meses. Julho e Agosto de 2026 aparecem como expectativa visual: todos os modelos mantêm a posição de Junho, sem mudanças. Maio 2026 Junho 2026 Julho 2026 2. GPT 5.5 1. GPT 5.5 6. Composer 2 2. Composer 2.5 1. Opus 4.6 3. Opus 4.7 5. Sonnet 4.5 4. Sonnet 4.6 3. Gemini 3 Pro 5. Gemini 3 Pro 4. Gemini 3.5 6. Gemini 3.5
Posição 1 significa minha recomendação principal para conseguir boa UI com um modelo. Maio é a referência anterior; Junho mostra como as versões e o ranking evoluíram: Opus, Composer e Sonnet mudam de versão; GPT 5.5 e Gemini se comparam como continuidade direta. As linhas pontilhadas são expectativa visual até julho, sem mudanças de posição.
Harness
O ambiente onde o modelo roda muda o resultado: Figma, Codex, Cursor, Stitch ou AI Studio.
AI Slop
O quanto cai em padrões visuais genéricos, sobredecorados ou sem intenção de produto.
Critério de UI
Capacidade de decidir hierarquia, composição, densidade, clareza e acabamento.
Constraints
O quanto precisa de instruções fechadas para chegar a uma interface utilizável.

Bons modelos de UI

Os modelos que melhor convertem intenção visual em interface

Para mim, um bom modelo de UI não é o que mais cospe componentes. É o que entende hierarquia, composição e restrições, e que ainda trabalha bem dentro do harness certo.

  1. Melhor com Figma

    #1 · GPT 5.5

    Codex + Figma

    O melhor quando o objetivo é uma UI bem resolvida usando o Figma como parte do fluxo.

    GPT 5.5 fica em primeiro porque com o Figma entende melhor a intenção visual, a estrutura e o acabamento. Não só gera tela: ajuda a tomar decisões de composição, hierarquia e produto.

    FigmaCritério visualBom polishEstrutura claraMenos AI Slop

    Trade-off: Eu o uso a partir do Codex; o harness importa muito para que essa qualidade se traduza bem no produto.

  2. Menos AI Slop

    #2 · Composer 2.5

    Cursor

    O que costuma entregar resultados mais limpos e menos genéricos dentro do Cursor.

    Composer 2.5 fica em segundo porque evita bastante o AI Slop: aquele visual genérico, sobredecorado ou pouco intencional que entrega uma interface feita por IA sem direção de design.

    Menos AI SlopBom critério baseCursorLayouts limposIteração rápida

    Trade-off: Nem sempre chega ao nível de critério visual que o GPT 5.5 alcança com o Figma, mas é muito consistente.

  3. Melhor no Cursor

    #3 · Opus 4.7

    Cursor

    Potente para raciocinar a UI, mas com AI Slop intermediário se o harness não ajudar.

    Opus 4.7 funciona melhor no Cursor porque o ambiente lhe dá um harness melhor para revisar, editar e corrigir. No Claude Code tende a ir mais para interfaces com AI Slop demais.

    RaciocínioCursor como harnessRefinamentoComponentesBom contexto

    Trade-off: Precisa de direção visual clara para não cair em decisões óbvias demais ou artificiais.

  4. Rápido mas desleixado

    #4 · Sonnet 4.6

    Cursor

    Muito útil, mas com mais risco de AI Slop se a instrução visual não estiver bem fechada.

    Sonnet 4.6 fica abaixo do Opus porque compartilha parte do problema: pode produzir UI funcional, mas com um acabamento mais genérico se não receber constraints fortes.

    VelocidadeCursorBom suporteIteraçãoImplementação

    Trade-off: Assim como o Opus, precisa de um harness e de uma direção visual sólida para não virar AI Slop demais.

  5. UI complicada

    #5 · Gemini 3 Pro

    Cursor

    Nem sempre produz muito AI Slop, mas suas interfaces tendem a parecer complicadas.

    Gemini 3 Pro pode evitar parte do visual genérico, mas em troca costuma propor interfaces mais enroladas do que o necessário. Para boa UI, a simplicidade pesa muito.

    CursorMenos genéricoIdeias amplasExploraçãoCapacidade técnica

    Trade-off: Eu o vejo deficiente para UI porque complica demais a interface e exige mais correção depois.

  6. Rápido com constraints

    #6 · Gemini 3.5

    Stitch + AI Studio

    Rápido quando as instruções estão bem definidas, mas menos forte como critério autônomo de UI.

    Gemini 3.5 fica em sexto porque pode se mover rápido no Stitch e no AI Studio, mas precisa de instruções bem precisas. Se o brief fica aberto, a qualidade visual cai rápido.

    RápidoStitchAI StudioBriefs fechadosExploração

    Trade-off: Funciona melhor como executor com constraints do que como modelo principal para decidir uma boa UI.