Задача компьютера, прежде всего, заключается в определении предложения, содержащего потенциальный эвфемизм. Киддон и Брюн проанализировали 1,5 миллионов фраз с эротическим смыслом и оценили существительные, прилагательные и глаголы с точки зрения их «сексуальности». Наибольшее значение присвоено в частности словам «rod» (стержень), «meat» (мясо, мякоть), «hot» (горячий) и «wet» (влажный). В русском языке это могли бы быть такие слова, как «конец», «хозяйство», «стоять» и так далее.
Затем в работу включается сама система Double Entendre via Noun Transfer (DeviaNT). Её проверили на сайте фривольного содержания twssstories.com и довольно невинном сборнике цитат wikiquote.org.
Система оказалась точна примерно на 70%. Разработчики утверждают, что показатель оказался обманчиво низким из-за неравноценного объёма источников. Если их уравнять, то возможен результат в 99,5%.
Специалисты собираются представить программу на ежегодном собрании Ассоциации компьютерной лингвистики в июне. В дальнейшем DEviaNT планируется научить другим видам шуток — например, основанным на метафоре, пишет NewScientist.