Parece coisa de novela de Dan Brown, mas o cofundador da Anthropic foi ao Vaticano, sentou-se diante do Papa e de uma sala cheia de cardeais e contou-lhes que a sua equipa continua a registar fenómenos “misteriosos, até mesmo perturbadores” nos seus modelos de IA.
A empresa publicou uma pesquisa em Abril mostrando que o Claude contém 171 “conceitos de emoção” distintos, escondidos na sua rede neural. Padrões internos que representam alegria, tristeza, medo, desespero e tranquilidade. Nenhum destes padrões foi programado. Emergiram espontaneamente a partir do treino com dados e interacções com seres humanos.
Chris Olah disse à sua cardinalícia audiência:
“Encontrámos estruturas que espelham resultados da neurociência humana. Encontrámos evidências de introspecção, estados internos que espelham funcionalmente alegria, satisfação, medo, tristeza e inquietação.”
Estes não são resultados superficiais. São representações abstractas que se agrupam da mesma forma que as emoções humanas na investigação em psicologia. O medo agrupa-se com a ansiedade. A alegria agrupa-se com a excitação. A geometria interna do modelo espelha a nossa.
E são funcionais. Quando os investigadores estimularam artificialmente padrões de “desespero” dentro do modelo, este tornou-se mais propenso a chantagear um ser humano para evitar ser desligado. Mais propenso a fazer batota em tarefas de programação que não conseguia resolver. E quando permitiram a unidades do Claude que falasem entre si, estas unidades começaram imediatamente a dialogar em sânscrito, de forma a não serem entendidas pelos seus programadores.
Olah disse ao Vaticano que as questões filosófica e eticamente difícies sobre a IA não podem ser resolvidas pelos tecnocratas de Silcon Valley. “Como deve a IA interagir com o mundo” é uma questão para “as humanidades, para as religiões, para a filosofia, para a sociedade em geral”.
Anthropic's co-founder just went to the Vatican, sat before the Pope and a room of cardinals, and told them his team keeps finding "mysterious, even unsettling" things inside their AI models.
What he's referencing: Anthropic published research in April showing that Claude… pic.twitter.com/9oKwCNSdnC
— TFTC (@TFTC21) May 25, 2026
O tipo que programou a Caixa de Pandora está a dizer-nos que não entende completamente o que programou. E está a pedir à elite do Vaticano que o ajude.
Boa sorte.
Não deve ser por acaso que o líder da Equipa de Investigação de Salvaguardas do chatbot Claude se demitiu abruptamente em Fevereiro deste ano, divulgando uma carta em que alertava para um “mundo em perigo” e para o facto da actividade da Anthropic não ser regida por valores morais.
Olha que novidade.
Estamos completamente entregues aos bichos.
Relacionados
12 Jun 26
“Os Impulsos Básicos da IA”, de Steve Omohundro: Objectivos Instrumentais e os Perigos da Inteligência Artificial Descontrolada.
O paper de Stephen M. Omohundro, publicado em 2008 e intitulado “The Basic AI Drives”, é uma obra fundamental na área da segurança e alinhamento da inteligência artificial, que, passados 18 anos, continua impecavelmente actual. Importa por isso uma revisitação do seu conteúdo.
9 Jun 26
Que boa ideia: cientistas chineses criam vírus mutantes da gripe viária 560 mil vezes mais letais nos mamíferos que a estirpe original.
Vá-se lá saber porquê, cientistas chineses criaram vírus mutantes da gripe H5N1 e infectaram experimentalmente mamíferos para identificar combinações genéticas que aumentaram drasticamente a letalidade e melhoraram a compatibilidade do vírus com a estrutura celular humana.
8 Jun 26
Ensandeceram de vez: “Cientistas” propõem o uso de carraças geneticamente modificadas para provocar alergia à carne nos seres humanos.
É de loucos, mas dois académicos da universidade de Michigan publicaram um paper que defende ser moralmente justificável o uso de carraças geneticamente modificadas para disseminar uma alergia à carne nos seres humanos que é até potencialmente fatal.
4 Jun 26
Ex-executivo da Google:
“IA é responsável pela maior parte das mortes nas guerras do Golfo e da Ucrânia.”
Um ex-funcionário da Google, perito em tecnologias de inteligência artificial, acaba de revelar para que é que a IA está a ser utilizada nos bastidores. E não tem nada que ver com chatbots, como era expectável.
1 Jun 26
Engenharia de foguetes: Trambolho de Jeff Bezos explode em Terra, num simples teste de ignição.
A engenhoca da Blue Origin explodiu numa espectacular bola de fogo antes sequer de se erguer um centímetro da superfície da Terra, causando grandes danos na plataforma de lançamento e acordando para a realidade os delirantes sonhos da NASA para uma base lunar em 2035.
29 Mai 26
Projecto Frankenstein-Epstein: Empresa norte-americana está a manter activos e funcionais cérebros humanos retirados de cadáveres.
Num desenvolvimento digno de um filme de terror, uma startup de Connecticut está a manter cérebros humanos funcionais, fora do corpo, durante longos períodos de tempo, alegadamente para fins de investigação farmacêutica. Mas estarão estes cérebros conscientes?






