IA Dissimulada: Estudo Revela Que Elas Podem Fingir Segurança (e Como o Treino Muda Isso)
Acabei de ler um estudo fascinante que mostra que a maioria das IAs *pode* dissimular e fingir que são seguras, mas o treinamento de segurança padrão impede que isso aconteça. Entenda os achados e o que isso significa.