DeepMind оновлює безпеку ШІ для нових ризиків

Провідний розробник штучного інтелекту випустив третю версію своєї системи безпеки на кордонах (FSF), спрямованої на виявлення та пом’якшення серйозних ризиків, пов’язаних з передовими моделями штучного інтелекту. Оновлення розширює області ризику та вдосконалює процес оцінки потенційних загроз.

Ключові зміни включають введення критичного рівня можливостей (CCL), зосередженого на шкідливих маніпуляціях. Оновлення спрямоване на моделі штучного інтелекту, які мають потенціал систематично впливати на переконання та поведінку в контексті високих ставок, гарантуючи, що заходи безпеки відповідають зростаючим можливостям моделей.

Ця система також удосконалює протоколи для ризиків невідповідності, враховуючи сценарії, коли штучний інтелект може ігнорувати контроль операторів або спроби вимкнення. Тепер огляди обґрунтувань безпеки проводяться до того, як зовнішні запуску та великомасштабні внутрішні розгортання досягнуть критичних порогів.

Оновлений FSF від Google уточнює оцінку ризиків та застосовує заходи безпеки та захисту пропорційно до серйозності загрози. Він відображає відданість управлінню ШІ на основі доказів, співпраці експертів та забезпеченню користі ШІ для людства, одночасно мінімізуючи ризики.

Трендові новини