Согласно исследованию, идеальное соответствие ИИ человеческим ценностям и интересам математически невозможно, но разнообразие в поведении агентов ИИ обещает некоторый контроль. В статье, опубликованной в журнале PNAS Nexus, Гектор Зенил и его коллеги использовали теорему Геделя о неполноте и результат Тьюринга о неразрешимости задачи остановки, чтобы показать, что любой LLM, достаточно сложный, чтобы демонстрировать общий интеллект или сверхинтеллект, также будет неприводим к вычислениям и приведет к непредсказуемому поведению, что сделает невозможным принудительное выравнивание.
Новости от techxplore


