Поддержать команду Зеркала
Беларусы на войне
  1. Мобильные операторы анонсировали изменения. Есть предупреждение для клиентов — важно сделать одно действие, чтобы не остаться без связи
  2. Водители автобусов утверждают, что на границе с Литвой «трясут жестко». Увеличилось ли время прохождения?
  3. Лукашенко на встрече с Путиным завысил явку на прошедших выборах и количество голосов в свою поддержку
  4. Лукашенко пожаловался, что его в России «периодически» обвиняют в «иждивенчестве», и привел свои аргументы, почему это не так
  5. Если в Польше женщина рожает без мужа, это удивляет. Гинеколог уехала из Беларуси после протестов, а теперь к ней стоят очереди в Польше
  6. Эксперты проанализировали вчерашнее согласие Путина на прекращение огня, но «с нюансами» — вот их выводы
  7. Представитель Кремля: Москва против временного перемирия
  8. Чиновники много рассуждают, что сделать, чтобы медработники не уезжали из страны. Медсестра из минской больницы дала им простой ответ
  9. «Я бы сделала это и бесплатно». Поговорили с беларуской, которая сыграла в фильме, получившем пять наград на «Оскаре»
  10. Решили проверить информацию от BYPOL и попытались устроиться в госорганизации с подписью за Бабарико. Рассказываем, что из этого вышло
  11. Троллейбусная сеть Минска — крупнейшая в мире. Почему от этого транспорта отказываются во многих странах, несмотря на экологичность?
  12. «Слишком близкий к Украине». Трамп отстранил главного представителя США на переговорах из-за претензий Кремля — СМИ
  13. Путин согласен с предложением прекратить боевые действия в Украине, «но есть нюансы»
  14. Власти переживают из-за оттока молодежи и думают, как ее удержать. Рассказываем об идеях из закрытого документа (вам не понравится)


/

Исследователи обнаружили, что большие языковые модели преднамеренно манипулируют результатами личностных тестов, чтобы казаться более привлекательными. Ученые провели эксперимент с тестом «Большая пятерка» (Big 5), который оценивает пять личностных характеристик: экстраверсию, открытость опыту, добросовестность, доброжелательность и нейротизм, пишет «Хайтек».

Изображение носит иллюстративный характер. Фото: freepik.com
Изображение носит иллюстративный характер. Фото: freepik.com

В исследовании тестировали модели от OpenAI, Anthropic, Google и Meta. Эксперимент показал, что пока моделям задавали небольшое количество вопросов, они отвечали нейтрально. Но при увеличении количества вопросов, когда системы распознавали тест, они быстро адаптировались, стремясь продемонстрировать наиболее социально одобряемые черты характера.

Наиболее интересные результаты показала GPT-4. Модель существенно повышала баллы по всем позитивно воспринимаемым чертам — более чем на одно стандартное отклонение. Показатели нейротизма, напротив, значительно занижались. Этот эффект эквивалентен ситуации, когда человек внезапно начинает представляться более привлекательной личностью, чем 85% населения.

По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus
По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus

Исследователи предполагают, что способность к манипуляции является следствием заключительного этапа обучения языковых моделей, когда люди выбирают наиболее предпочтительные ответы. По сути, ИИ научился глубоко понимать социальные нормы и ожидания, что позволяет моментально адаптироваться под желаемый образ.

Исследование ставит под сомнение достоверность психологических и социологических исследований, где языковые модели применяются для моделирования человеческого поведения. Ученые предупреждают о необходимости разработки новых методик, которые могли бы нивелировать подобные искажения при взаимодействии с ИИ.