В понеделник Google обяви нова програма за възнаграждение, насочена изцяло към откриване на уязвимости в AI продукти. Компанията публикува списък с примери за т.нар. „злонамерени действия“, които търси — като например инжектиране на AI команда, която кара Google Home да отключи врата, или експортиране на лични данни, при което AI обобщава съдържанието на имейли и го изпраща на атакуващия.
Новата програма дефинира какво представлява AI уязвимост, като ги класифицира като проблеми, при които генеративна AI система или езиков модел се използва за вреда или експлоатация на пропуск в сигурността. Най-сериозни са случаите, при които се модифицира чужд акаунт или данни, както при вече известна уязвимост, позволяваща отваряне на смарт щори и изключване на осветление чрез „отровено“ събитие в Google Calendar.
През последните две години, откакто Google официално покани AI изследователи да търсят подобни уязвимости, бъг ловци са спечелили над $430 000.
Важно уточнение: генериране на дезинформация или обидно съдържание от Gemini не се счита за уязвимост. Такива случаи трябва да се докладват чрез вградените канали за обратна връзка, за да може екипите по AI безопасност да анализират поведението на модела и да приложат дългосрочно обучение за безопасност.
Паралелно с новата програма, Google представи и AI агент за поправка на уязвим код, наречен CodeMender. Според компанията, той вече е използван за 72 корекции в проекти с отворен код, след проверка от човешки изследовател.
Наградата от $20 000 се присъжда за откриване на злонамерени действия в основните продукти на Google — Search, Gemini Apps и приложенията от Workspace, като Gmail и Drive. Възможни са допълнителни бонуси за качество на доклада и оригиналност, които могат да увеличат сумата до $30 000.
За уязвимости в други продукти като Jules или NotebookLM, както и за по-нископриоритетни проблеми — например кражба на параметри на модела, възнагражденията са по-ниски.
Все още няма коментари. Бъдете първи.