Algoritma Pendeteksi Penyalahgunaan Yahoo Bekerja 90% dari Waktu & Ini Langkah Maju Besar di Bidangnya

bantuan algoritma komputer

Artikel berita Yahoo memiliki banyak komentar buruk, sama seperti internet lainnya, sehingga tim Yahoo memutuskan untuk menggunakan bagian komentar mereka untuk mengembangkan algoritme yang berhasil mengidentifikasi pelanggar terburuk. Mereka algoritma pendeteksi penyalahgunaan baru bekerja 90 persen dari waktu, yang menurut mereka membuatnya lebih efektif daripada upaya organisasi lain untuk mengambil prestasi serupa, dan digambarkan sebagai langkah maju yang besar di lapangan. 90 persen melakukan kedengarannya cukup bagus, saya akui.

berkabel melaporkan bahwa Yahoo juga merilis database terkurasi pertama yang tersedia untuk umum tentang ujaran kebencian online sebagai bagian dari proyek mereka untuk memerangi penyalahgunaan. Ini berarti bahwa situs lain akan dapat menggunakan basis data komentar Yahoo untuk merancang algoritme mereka sendiri. Algoritme Yahoo dikembangkan berdasarkan pembelajaran mesin dan juga pada data yang dilaporkan pengguna tentang bagian komentar mereka.

Bagian tersulit dari algoritme moderasi komentar adalah menangani kesalahan positif. Banyak algoritme pendeteksi penyalahgunaan mencari kata atau frasa tertentu, seperti hinaan atau hinaan umum, dan secara otomatis menandai komentar untuk moderasi. Namun, hal ini menyebabkan komentar ditandai meskipun mereka merujuk pada cercaan dalam konteks mengatakan bahwa itu tidak pantas, misalnya, atau jika komentar tersebut merupakan tiruan sarkastis dari seorang troll. Algoritme Yahoo tampaknya dapat mendeteksi pola bicara tertentu, dan dirancang untuk dapat membedakan antara sarkasme lelucon dan penyalahgunaan yang sebenarnya. (Tentu saja, jika komentar lucu Anda tidak dapat dibedakan dari penyalahgunaan yang sebenarnya, maka saya cukup yakin algoritme akan tetap menandainya, tetapi saya tidak dapat mengatakan dengan pasti bagaimana bagian dari AI itu bekerja.)

Yahoo meminta moderator komentar terlatih untuk membantu menyempurnakan algoritme, dan mereka juga membayar beberapa moderator yang tidak terlatih, dan mereka menemukan bahwa moderator terlatih jauh lebih baik dalam menentukan komentar mana yang sesuai (agak tidak punya otak, tapi hei). Selama pembuatan AI, Yahoo menemukan bahwa pekerjaan moderator manusia yang terlatih ini sangat penting untuk menjaga kemanjuran algoritme dan menyempurnakan teknik pendeteksiannya.

Tentu saja, algoritma masih memiliki bias , yang akan membutuhkan tim moderator manusia (semoga beragam) untuk terus mengulangi metodologi yang digunakan untuk mengklasifikasikan komentar. Kedengarannya seperti pekerjaan yang sulit, tetapi setidaknya Yahoo sekarang memahami pentingnya melatih dan menghargai peran moderator manusia yang terlatih dan rekan AI baru mereka.

"satu mawar pucat"

(melalui Web Berikutnya , gambar melalui Michael Cordedda/Flickr )