😎 Anthropic apresenta sistema para proteger modelos de IA contra jailbreaks
Anthropic apresenta sistema para proteger modelos de IA contra jailbreaks A Anthropic, empresa de pesquisa em inteligência artificial, anunciou recentemente o desenvolvimento de um sistema inovador denominado “Classificadores Constitucionais” para proteger seus modelos de linguagem contra técnicas de jailbreak. O jailbreak refere-se a métodos que usuários mal-intencionados empregam para contornar as restrições de segurança dos […]