Новаторски изследвания за това, което тя каза

Изненадващата ефективност и дълголетие на вече легендарния това е което тя каза шега, наскоро популяризирана отново с помощта на Офиса , е направил повече от предоставяне на милиони реакция на коляното на непринуден разговор. Сега тя достигна ново ниво на социална значимост, като вдъхнови сериозни лингвистични изследвания. Той се предлага под формата на изследователска статия, наречена Това каза тя: Идентификация на Double Entender , автор на двама студенти по компютърни науки, Клои Кидън и Юрий Брун .

В своя доклад двойката очертава създаването на Double Entender чрез Noun Transfer или DEviaNT подход, който автоматично идентифицира това, което тя каза (TWSS) се шегува. Те наричат ​​своя подход метафоричен анализ, който носи двоен смисъл и се основава на претегляне на определени думи като по-секси от други. Екипът претегли няколко секси съществителни и глаголи и след това изпълни техния алгоритъм.

В своите изследвания двойката разкри и някои интересни правила за шегите на TWSS. Например рискът от неправилно извикване на TWSS шега. От тяхното проучване:

Например, в социална обстановка цената да се каже, че това, което тя е казала неподходящо, е висока, докато цената да не се каже, когато е било подходящо, е незначителна.

За да се справи с това и да постигне по-добри резултати, екипът използва алгоритъм за обучение. Наред с други неща, това създава фалшиви положителни резултати 100 пъти по-високи от фалшивите отрицателни.

След стартиране на DEviaNT чрез поредица от предварително идентифицирани TWSS шеговити материали и произволни цитати. В своя тест те използваха 1,5 еротични изречения и 57 000 нееротични изречения. Екипът казва, че са постигнали успех над 71,4%. Въпреки че това може да не изглежда много, екипът казва, че с по-голям набор от данни биха очаквали резултати, близки до 99,5%. Освен това DEviaNT върна някои интересни резултати. Отново от проучването:

DEviaNT върна 28 такива изречения (всички свързани с най-вероятно TWSS), 20 от които са истински положителни. Въпреки това, 2 от 8-те фалшиви положителни резултата всъщност са TWSS (въпреки че идват от отрицателните данни от тестовете): Да, дайте ми цялата сметана и той си отиде. и да, но дупката му наистина мирише понякога.

Някои може да отклонят това изследване, наричайки го просто чучулига и с малка стойност. Това би било атака с малък удар, тъй като дори изследователите описват работата си като твърд проблем с разбирането на естествения език. (Това е което тя каза.)

( Нов учен чрез Ескапистът )