Facebook

Facebook

460

Коллективный разум, подключайся. Итак есть, отзывы агентов влияния, а есть отзывы написанные настоящими людьми. Как их отличить? Часто для придания реалистичности отзывам добавляют опечатки, ошибки. Но это еще не все и так даже с ошибками зачастую не вызывает доверия. И нужно доводить тексты до состояния «написанных естественным языком». Либо наоборот — выявлять подозрительные тексты. У меня были соображения об использовании частотных словарей (у меня есть частотные словари отдельно для всего корпуса языка и разговорного языка). Изначальна идея была в том, чтобы убирать из текста имена собственные, а по остатку выделять разницу среднего показателя по 2-м словарям и в случае, если разница более 100%, то считать текст подозрительным. Какие еще есть идеи?