четверг, 6 мая 2021 г.

О Капче, о спаме на сайте и как с ним бороться

 О борьбе со спамом и о Капче на сайте. (Может быть полезно для вебмастеров.) Был у меня когда-то, довольно давно, один сайт. Работал он на CMS Drupal 6. Посетители могли оставлять комментарии, без регистрации, но с предварительной модерации.


Спам, конечно, замучил. Эта проблема знакома, наверное, всем администраторам сайтов. Спамеры забивают сайт бесполезным и вредным контентом. Модерации занимает время.


Как я пытался бороться со спамом, и даже на какое-то время справился с проблемой.

Капча. Её видели все, кто пользуется Интернет. Это набор цифр, или букв, или изображений, которые нужно распознать, чтобы зарегистрироваться на сайте (в моём случае, чтобы оставить комментарий). Теоретически, робот не может м этим справиться :))).
(От CAPTCHA — англ. Completely Automated Public Turing test to tell Computers and Humans Apart.)


Поставил и я капчу на сайт. Стандартную друпаловскую капчу. Нет эффекта. Моё (ошибочное) предположение: бот сканирует капчу, распознаёт изображение и проходит дольше. Чтобы роботу было сложнее, изображение делают размытым. От людей это действительно защищает :))), а на роботов не действует.


В ходе экспериментов совсем удалил изображение Капчи с сайта - роботы проходят. Пришёл к выводу, что ничего они не сканируют и не распознают, а используют "дыры" в коде.

Вывод: нужно сделать из стандартной Капчи нестандартную. Изменил названия переменных в коде Капчи на свои, и "О чудо", Капча заработала! Спам пропал почти полностью! Модифицированная Капча держала оборону года два, но потом спам-боты, видимо, нашли новые дыры в коде и обошли защиту. Дальнейших экспериментов я не проводил (изменились задачи), но подход может вам пригодиться - сделайте стандартный код нестандартным.


Спам на сайте это не безобидная штука. Если вам на сайт "вставят" незаконный контент или ссылку на незаконный контент это может привести к большим неприятностям.