A pergunta simples que nenhuma IA sabe responder

Ela escreve código, passa na OAB e resume um livro em 10 segundos. Mas não sabe que horas são. E isso explica muita coisa.

jun 02, 2026

Deixa eu começar com uma pergunta que parece boba:

Que horas são?

Seu sobrinho de 6 anos olha pro relógio da cozinha e responde na hora. Sem hesitar. Mas as IAs mais avançadas do planeta, as mesmas que escrevem código, resumem um livro de 500 páginas em 10 segundos e passariam num exame da OAB, simplesmente não conseguem.

E olha, isso é a porta de entrada pra entender o padrão de comportamento mais importante de toda IA que você usa hoje. O mesmo padrão que faz seus textos no ChatGPT virem cheios de travessão, seus designs ficarem todos roxos e, sim, todo relógio gerado por IA marcar exatamente o mesmo horário.

Vou te contar como cheguei aqui.

O teste do relógio

Peguei três geradores de imagem diferentes (Nano Banana, GPT Image 2 e Midjourney) e pedi a mesma coisa pros três: criem a imagem de um relógio. Sem horário específico, só um relógio.

E sabe o que aconteceu? Os três me devolveram exatamente o mesmo horário: dez horas e dez minutos. Não um parecido. O mesmo.

Aí veio a parte divertida. Pedi pra mudar os ponteiros pra meio-dia e dez. Coisa simples, né? Foi aí que tudo travou. Os ponteiros não se alinhavam, um ficava maior que o outro, a imagem buga por completo. É como se os dois ponteiros estivessem marcando a mesma coisa. Não faz o menor sentido.

O detalhe importante: intuitivamente, a IA até sabe o que você quer. Ela só não consegue desenhar aquilo. E isso não é um bug isolado. É comportamento padrão, e afeta 100% da maneira como a gente interage com essas ferramentas.

Tem até um paper sobre isso (Clockbench)

Esse problema é tão conhecido que virou estudo. Um pesquisador chamado Alek Safar montou o ClockBench, um benchmark só pra testar IA lendo horas. (Benchmark é só um jeito chique de dizer “prova padronizada pra comparar modelos”.)

Ele pegou 180 relógios diferentes e rodou 4 perguntas pra cada um, dando 720 perguntas no total:

Que horas são nesse relógio?
Esse horário é válido?
Que horas seriam se a gente somasse 2h, 10min e 13s?
Que horas seriam num outro fuso (tipo, se isso é Nova York em junho, que horas são em Lisboa)?

Aí ele rodou tudo com vários modelos e também com humanos de verdade. O resultado?

Humanos acertaram ~90% das 720 perguntas.
As IAs erraram a esmagadora maioria. O melhor modelo da época, o Gemini 2.5 Pro, acertou… 13%.

Treze. Por. Cento. 😅

Mas aqui mora a virada da chave. Quando a pergunta era de conta (somar minutos, rotacionar ponteiro, converter fuso), a IA acertava quase 100%. Ou seja: a matemática ela sabe fazer. O que ela não consegue é olhar pro mostrador e enxergar pra onde os ponteiros apontam.

Guarda essa frase, porque ela é a base de tudo:

A IA sabe fazer conta. A IA só não sabe ver.

O paper inteiro é público, dá pra explorar em clockbench.ai.

Por que SEMPRE 10:10?

Pra entender isso, você precisa entender como a IA aprende. E ela aprende vendo.

Ela engoliu bilhões de imagens da internet pra entender como as coisas são. No caso dos relógios, essas imagens vieram de propaganda, anúncio de loja, foto de catálogo. E adivinha que horas quase toda propaganda de relógio marca? Dez e dez.

E isso não é coincidência, é de propósito. Quando o relógio marca 10:10:

O mostrador fica simétrico.
Os ponteiros emolduram o logo da marca no meio.
Eles não tampam a janelinha da data.
E ainda fazem uma carinha de sorriso 🙂.

Se fosse 8:20, seria o oposto: uma carinha de bravo. Por isso a indústria de relógios inteira usa esse horário como vitrine há décadas. Resultado: quando a IA foi aprender o que é um relógio, o que ela mais viu foi ponteiro perto do 10 e do 2. Milhões e milhões de vezes.

Explicando isso melhor…

Imagina que eu peguei todas as imagens de relógio da internet e montei um gráfico. Na horizontal, todos os horários do dia. Na vertical, quantas imagens mostram cada horário.

O que sai daí não é uma linha distribuída de forma igual. O que sai é um pico gigante em 10:10, e quase nada no resto. É a famosa curva de distribuição, aquela mesma da aula de estatística da escola.

E é essa curva que define a probabilidade de a IA te dar uma resposta ou outra. O centro da curva (10:10) é o lugar mais provável. Três e quarenta e sete? Mora na ponta, na zona de baixíssima probabilidade. A IA praticamente nunca viu isso.

Então quando você pede 3:47, ela faz uma de duas coisas: volta pro centro mais provável (10:10) ou alucina (buga os ponteiros). É como se tivesse um ímã puxando ela pro meio.

E é exatamente por isso que:

Os designs de IA saem todos iguais, naquele roxinho que você já está cansado de ver.
Todo texto de IA tem a mesma cara, cheio de travessão, e você bate o olho e já sabe.

Porque a IA sempre vai ser atraída pro centro da curva, te entregando a resposta mais comum dos dados de treino dela.

O ponto mais importante: a IA não aprendeu a regra do relógio como a gente aprendeu quando criança. Ela não entende que o ponteiro pequeno anda devagar, que o grande dá uma volta por hora, que existe uma geometria por trás. Pra ela, relógio não é um mecanismo. É uma imagem. Uma imagem com ponteiros perto do 10 e do 2.

Isso tem nome: Jagged Frontier

Os pesquisadores chamam esse fenômeno de Jagged Frontier (algo como “fronteira irregular”). A ideia é simples: a inteligência da IA não cresce de forma uniforme. Ela pode ser genial numa coisa e ter performance pior que um bebê na outra, ao mesmo tempo.

Returning to the Jagged Frontier - by Pascal Finette

É a mesma IA que escreve código de produção e que erra um relógio que seu sobrinho de 6 anos acerta. Não é pra rir dela. É pra entender ela.

E o que você faz com isso?

Aqui está o presente prático dessa edição. Toda vez que você pedir algo pra uma IA, lembra: por padrão, ela vai te entregar a média do que já viu. O centro da curva. O óbvio.

Se você quer algo verdadeiramente único e criativo, o seu trabalho é empurrar a IA pra fora do centro, pras zonas de baixa probabilidade, que é justamente onde mora a criatividade.

E como se empurra? Com instruções. Instruções específicas, detalhadas, que tiram a IA do piloto automático. Isso vale pra literalmente tudo: design, escrita, código e até pra desenhar ponteiro de relógio. Quanto mais genérico o seu pedido, mais perto do roxinho e do travessão você vai acabar. Quanto mais específico, mais longe da média.

Recapitulando:

A IA sabe fazer conta, mas não sabe ver.
Ela aprende a aparência mais comum, não a regra por trás.
Por padrão, ela sempre volta pro centro da curva (a resposta média).
Pra fugir do óbvio, você precisa dar instruções específicas que empurrem ela pra zona criativa.

Agora é com você

Essa semana eu também levei esse tema pro vídeo do meu canal no Youtube

👉 Assiste ao vídeo completo aqui

E antes de fechar esse e-mail, fica com uma provocação pra semana: na próxima vez que você abrir o ChatGPT, Claude ou qualquer gerador de imagem, para um segundo e repara se o que ele te devolveu é o centro da curva (o óbvio, a média) ou se você realmente empurrou ele pra zona criativa. Faz toda a diferença no resultado.

Me responde contando como foi. Eu leio todos. 💜

Até a próxima edição da DebGPT!

gersonfer

Jun 3

Pedi uma imagem de relógio analógico ao Nano Banana mostrando 3h48 . Ele quease acertou, mostrou 03:45 . O ChatGPT foi preciso mostrando o horário solicitado.

Responder

ivan

Sim. Percebi isso tbm, quanto mais informações textos exemplos de desenhos quando se pede uma imagem com características especiais ( prompt especial textual e com anexo de desenho imagem de exemplo) mais precisa ela IA lhe entregara, mesmo que nao atinja 100%, chegara próximo e ai você refina o pedido final. Por enquanto logo logo ela ja se atualiza e alguns detalhes serão superados.

3 comentários a mais...

Discussão sobre este post

Pronto para mais?