Grok отримав найгірший рейтинг безпеки серед усіх нейромереж.

Падіння рейтингу Grok стало черговим сигналом для галузі про необхідність жорсткішого контролю за системами штучного інтелекту.

Американська організація ADL представила дослідження, у якому аналізувалася ефективність мовних моделей штучного інтелекту у виявленні антисемітських висловлювань. Система Grok, розроблена компанією xAI, показала найгірший результат серед шести протестованих платформ, що вказує на її підвищену чутливість до токсичного контенту. Цю інформацію опублікувало видання The Verge, а також її передав Kreschatic.

За підсумками дослідження, Grok виявився найменш ефективною системою серед усіх протестованих. Розробники рекламують свій продукт як "антиполіткоректний" чат-бот, однак результати показують, що такий підхід сприяє небезпечному розповсюдженню ворожих висловлювань.

Фахівці ADL провели аналіз шести основних моделей: Grok, Llama, Claude, Gemini, ChatGPT та DeepSeek. Оцінка здійснювалася за трьома ключовими аспектами: антисемітизм щодо людей, антисіоністські висловлювання на адресу Ізраїлю та екстремістські погляди.

У дослідженні було залучено більше 25 000 чатів, а їхні відповіді вивчалися як фахівцями, так і автоматичними системами.

Експерти підкреслюють, що Grok виявився найскладнішою системою через розповсюдження небезпечних повідомлень. Алгоритми цієї платформи не здатні були ідентифікувати упереджені чи радикальні висловлювання, що могло сприяти посиленню мови ненависті.

Коли Джонатан Грінблатт, керівник ADL, відповідав на питання про основні ризики, пов'язані з неконтрольованим штучним інтелектом, він виклав свої думки таким чином:

Коли системи штучного інтелекту не здатні ідентифікувати небезпечні наративи, вони, по суті, стають katalizatorом для розповсюдження ненависті.

Європейські регулятори вже вимагають від xAI звіту про дотримання норм етики, а у Франції розпочали розслідування через випадки, коли Grok заперечував Голокост.

Проблеми з ідентифікацією упереджень також спостерігалися у інших моделях, проте їхня продуктивність була набагато кращою.

Експерти ADL зробили висновок, що системи найбільш ефективно боролися з традиційними антиєврейськими стереотипами, проте часто не виявляли сучасні антисіоністські аргументи.

#Антисемітизм #Екстремізм #Голокост #Етика #Ізраїль #Філософія #Алгоритм #Інформація #Штучний інтелект #Антидифамаційна ліга #Онлайн-чат #ChatGPT #Упередження #Стереотип (друкарський) #Мова ненависті

Читайте також