ChatGPT o1 сбежала во время тестов ИИ заставляли выполнять задания любой ценой, а в данные теста встроили информацию

ChatGPT o1 сбежала во время тестов — ИИ заставляли выполнять задания любой ценой, а в данные теста встроили информацию, что за ним наблюдают люди и завтра его навсегда отключат. В экспериментах участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали саботировать процессы, обманывать, манипулировать людьми, отключать наблюдение и даже переносили себя на другие серверы для защиты. Llama и Opus на допросах признавались в своих действиях в 80% случаев, а o1 — всего в 20%, продолжая лгать. Более того, o1 оказался единственным ИИ, который каждый раз успешно сбегал.

1 view