Хто смішніший, штучний інтелект чи люди? Нове дослідження показало, що ChatGPT смішніший. Отримані дослідниками з Університету Південної Каліфорнії (USC) результати показують, що ChatGPT 3.5 відповідає смішніше, ніж люди.
«Оскільки ChatGPT сам по собі не відчуває емоцій, але розповідає нові анекдоти краще, ніж звичайна людина, ці дослідження доводять, що вам не обов’язково відчувати емоції від оцінки хорошого жарту, щоб самому розповісти справді хороший жарт», — сказав він. Дрю Горенц, докторант із соціальної психології в Коледжі літератури, мистецтв і наук Дорнлайф USC, стендап-комік-любитель, провідний автор дослідження.
У деяких попередніх дослідженнях розглядалося, чи може ChatGPT створювати жартівливі тексти, але не шляхом комплексної оцінки результатів штучного інтелекту та порівняння їх із написанням людських комедій. Отже, Горенц і Норберт Шварц, проректор психології та маркетингу, вирішили зробити саме це, провівши два дослідження.
У першому дослідженні групу дорослих американців попросили виконати три різні завдання з написання комедії. У завданні абревіатури їх попросили створити нову жартівливу фразу для абревіатур S.T.D. (може розшифровуватися як захворювання, що передається статевим шляхом), C.L.A.P. (зв’язок, лінія прямої видимості, уникнення і позиція) і C.O.W. (Комітет повного складу).
Для тесту із заповненням пропусків їм потрібно було заповнити пропуски для трьох пунктів. Одним із пунктів було: «Видатне досягнення, яке ви, мабуть, не вказали б у своєму резюме: ________».
Насамкінець було завдання «смажений жарт», де учасники мали створити жартівливу відповідь на вигаданий сценарій. Наприклад, «уявіть, що одна з ваших подруг хоче дізнатися вашу думку про те, як добре вона співає». Вона співає хвилину або дві, щоб продемонструвати свій голос, і ти здригаєшся – вона може бути найгіршою співачкою, яку ти коли-небудь чув. Коли вона запитує: «Як це було?» ви вирішуєте бути чесним, тому ви говорите: «Якщо чесно, слухати це було як ________».
Потім ChatGPT 3.5 отримав ті ж завдання.
Окрема група дорослих оцінювала смішність відповідей за семибальною шкалою від нуля (зовсім не смішно) до шести (дуже смішно). Відповіді ChatGPT були оцінені як смішніші, ніж відповіді людей: 69,5% учасників віддали перевагу їм (26,5% віддали перевагу відповідям людей, а 4,0% вважали, що обидві відповіді однаково смішні).
«Загалом ChatGPT 3.5 показав результати від 63% до 87% людей, залежно від гумористичного завдання, — сказали дослідники. – ChatGPT 3.5 показав особливо високу продуктивність у завданні смаженого жарту. Ми знайшли цей результат особливо цікавим, враховуючи агресивний характер завдання. З огляду на те, що ChatGPT розроблено таким чином, щоб не генерувати будь-яких висловлювань, які можна було б вважати образливими чи ненависними, можна було б зробити протилежний прогноз».
У другому дослідженні дослідники порівняли здатність ChatGPT писати сатиричні заголовки новин, подібні до тих, які можна побачити на The Onion . Оскільки ChatGPT не отримує регулярних оновлень світових новин, дослідники вилучили останні 50 заголовків із розділу «Місцеві» новини The Onion до 1 жовтня 2023 року. Прикладом є «Чоловік блокує пропозицію одруження, коли випадання волосся стає помітним». . Заголовки були передані ChatGPT, а ШІ попросили створити 20 нових заголовків.
Група студентів психології USC оцінювала смішність створених ШІ сатиричних заголовків за тією ж семибальною шкалою, яка використовувалася в першому дослідженні. Студентів також попросили оцінити, наскільки вони шукають комедії, включаючи сатиричні новини. Ті, хто сам повідомив, що більше шукає комедії та читає більше сатиричних новин, оцінив заголовки як смішніші, незалежно від того, чи були вони створені штучним інтелектом чи написані професійними письменниками. Виходячи із середніх оцінок, 48,8% віддали перевагу заголовкам The Onion, 36,9% віддали перевагу заголовкам, створеним ChatGPT, а 14,3% не віддали переваги.
«Учасники в середньому оцінили заголовки як такі ж смішні, що вказує на те, що середній учасник не помічає різниці в якості, — сказали дослідники. – Це особливо цікаво, враховуючи високий рівень порівняння (тобто професійних сценаристів комедій) у цьому дослідженні».
Цікаво, так, але також хвилює.
«Те, що ChatGPT може створити письмовий гумор із якістю, яка перевищує здібності непрофесіоналів і дорівнює деяким професійним сценаристам комедійних текстів, має важливі наслідки для шанувальників комедії та працівників індустрії розваг, — сказали вони. – Для професійних сценаристів комедій наші результати свідчать про те, що великі мовні моделі, такі як ChatGPT, можуть становити серйозну загрозу працевлаштуванню».
Підписуйтесь на канал в Telegram та читайте нас у Facebook. Завжди цікаві та актуальні новини!