PENELITIAN TEROBOSAN TENTANG ITU YANG DIA KATAKAN

Efektivitas dan umur panjang yang mengejutkan dari yang sekarang legendaris itu yang dia katakan lelucon, baru-baru ini dipopulerkan kembali dengan bantuan Kantor , telah melakukan lebih dari memberi jutaan tanggapan spontan terhadap percakapan biasa. Sekarang telah mencapai tingkat signifikansi sosial baru, dengan menginspirasi penelitian linguistik yang serius. Itu datang dalam bentuk makalah penelitian yang disebut Itulah yang Dia Katakan: Identifikasi Entender Ganda , ditulis oleh dua mahasiswa ilmu komputer, chloe kiddon dan Yuriy Brun .

Dalam makalah mereka, pasangan itu menguraikan kreasi mereka dari Double Entender melalui Noun Transfer atau DEviaNT pendekatan yang secara otomatis mengidentifikasi lelucon yang dia katakan (TWSS). Mereka menyebut pendekatan mereka sebagai analisis metaforis, yang membawa makna ganda tersendiri, dan didasarkan pada pembobotan kata-kata tertentu sebagai lebih seksi daripada yang lain. Tim menimbang beberapa kata benda dan kata kerja seksi, dan kemudian menjalankan algoritme mereka.

Dalam penelitian mereka, pasangan ini juga menemukan beberapa aturan menarik untuk lelucon TWSS. Misalnya, risiko melontarkan lelucon TWSS secara tidak benar. Dari studi mereka:

Misalnya, dalam lingkungan sosial, biaya untuk mengatakan apa yang dia katakan secara tidak tepat tinggi, sedangkan biaya untuk tidak mengatakannya ketika itu mungkin dapat diabaikan.

Untuk mengatasi ini, dan untuk menghasilkan hasil yang lebih baik, tim menggunakan algoritma pembelajaran. Antara lain, ini mengatur penciptaan positif palsu 100 kali lebih tinggi daripada negatif palsu.

Setelah menjalankan DEviaNT melalui serangkaian materi lelucon TWSS yang telah diidentifikasi sebelumnya dan kutipan acak. Dalam pengujian mereka, mereka menggunakan 1,5 kalimat erotis, dan 57.000 kalimat non-erotis. Tim mengatakan mereka mencapai tingkat keberhasilan lebih dari 71,4%. Meskipun itu mungkin tidak tampak banyak, tim mengatakan bahwa dengan kumpulan data yang lebih besar, mereka mengharapkan hasil yang mendekati 99,5%. Selain itu, DEviANT mengembalikan beberapa hasil yang menarik. Sekali lagi, dari studi:

DEviANT mengembalikan 28 kalimat seperti itu (semuanya terikat untuk kemungkinan besar adalah TWSS), 20 di antaranya benar-benar positif. Namun, 2 dari 8 positif palsu sebenarnya adalah TWSS (meskipun berasal dari data pengujian negatif): Ya, beri saya semua krim dan dia pergi. dan Ya, tapi lubangnya terkadang sangat bau.

Beberapa mungkin mengurangi penelitian ini, menyebutnya hanya burung dan nilai kecil. Ini akan menjadi serangan pukulan rendah, karena bahkan para peneliti menggambarkan pekerjaan mereka sebagai masalah pemahaman bahasa alami yang sulit. (Itulah yang dia katakan.)

( Ilmuwan Baru melalui Sang pelarian )