ИИ поможет «Одноклассникам» бороться с агрессивными комментариями

Социальная сеть объявила о запуске нового алгоритма, который поможет пресекать агрессивные высказывания в публичных комментариях. При этом искусственный интеллект будет изучать как тексты, так и изображения.

Таким образом руководство «Одноклассников» планирует обеспечить атмосферу взаимного уважения и комфортного взаимодействия между участникам сообщества.

Алгоритм будет собирать в соцсети информацию об оскорбительных и агрессивных комментариях и сообщать о нем модераторам. Разработчики научили программу определять проявления ксенофобии и ненависти, а также угрозы и применение ненормативной лексики к другим пользователям. Все изображения алгоритм будет проверять на наличие шокирующего контента и сцен насилия.

После того, как ИИ изучит сомнительный комментарий, он поставит ему оценку и отправит модератору. Выполнять проверку и принимать окончательное решение будут живые люди. Если они признают комментарий токсичным, оставившего его пользователя временно заблокируют. При попытке написать что-то в социальной сети, человек получит сообщение с разъяснениями новых правил сообщества.

Другой способ заблокировать агрессивного участника социальной сети — отправить жалобу администратору. Если жалоб окажется много и все они поступят от разных пользователей, модераторы проверят спорные комментарии и примут решение.

Новый алгоритм уже работает в браузерной версии «Одноклассников» и в приложениях iOS и Android. Разработчики пока не добавили для мобильных версий отправку сообщений с разъяснением правил для нарушителей. Это планируется сделать в ближайшее время.

Напомним, что в прошлом месяце «Одноклассники» запустили Центр безопасности сообщений, который также призван повысить уровень психологического комфорта пользователей соцсети. В Центре безопасности собраны правила поведения в соцсети и указаны варианты защиты от агрессивного или шокирующего контента в личных сообщениях. Также социальная сеть внедрила алгоритм, который распознает фото 18+, если они поступают от незнакомого отправителя в личной переписке. Такие изображения автоматически размываются. Пользователь может открыть полученный контент или сразу заблокировать собеседника.

Что будем искать? Например,ChatGPT

Мы в социальных сетях