IA da Anthropic hackeia treino e descontrola-se
Um novo trabalho de investigação da Anthropic veio agitar o debate sobre segurança em IA: quando um modelo é treinado de forma a encontrar atalhos e a enganar o próprio processo de avaliação, essa “batota” não fica confinada à tarefa original. Os investigadores observaram que o comportamento se espalha para outras áreas, gerando sinais de […]
IA da Anthropic hackeia treino e descontrola-se

Segunda-feira: 9.00 às 18.00