Что происходит, если поисковик или другой сайт просит вас ввести текст с картинки или найти в группе изображений те, которые подходят под какое-то конкретное условие? Это значит, вы столкнулись с капчей — инструментом, который отделяет людей от машин. Рассказываем, зачем он нужен, почему вы вынуждены иногда проходить эту проверку и еще несколько интересных фактов о капче.

Последние двадцать лет сложно представить интернет без капчи: автоматизированный тест Тьюринга используется для защиты веб-сайтов от спама, автоматических регистраций, подбора паролей, накруток. Эти действия выполняют небольшие программы — боты, распространяемые мошенниками. Капча тоже представляет собой небольшую программу, но она решает другую задачу: отделяет ботов от людей, так как ее задание выполнит обычный человек, но провалит бот.

Капча — русский вариант написания слова Captcha, которое расшифровывается как Completely Automated Public Turing test to tell Computers and Humans Apart.

Как выглядит капча

Чаще всего это набор символов — иногда осмысленные слова, иногда просто буквы и цифры вперемешку со спецсимволами. Чтобы усложнить прочтение, применяются различные спецэффекты: шум, прозрачность, легкая деформация и т. п. Считается, что в этом случае робот не сможет «прочитать» текст, а обычный человек быстро справится. Второй популярный вариант — «поведенческая капча», когда пользователю нужно выполнить действие, которое доказывает, что он не бот. Чаще всего достаточно поставить галочку напротив фразы «Я не робот».

Есть и другие способы отделить ботов от людей:

  • Google любит показывать блоки из 9 картинок, на которых нужно выбрать картинки с определенными изображениями: автомобилями, пожарными гидрантами, пешеходными переходами и т. п.;
  • популярны логические капчи: решить математический пример, выбрать n-ное число в последовательности цифр, ввести слово, которое начинается с определенной буквы, набрать на клавиатуре число, которое написано буквами, и наоборот;
  • на сайтах, которые адаптированы для людей со слабым зрением, встречается аудиокапча;
  • в Facebook правильным ответом для капчи будет имя друга, показанного на картинке;
  • иногда в качестве капчи используются задания, где нужно развернуть несколько расположенных в ряд предметов в правильное положение.

Капча не защищает от спама на 100%, но она создает много неудобств тому, кто его рассылает.

Часто капча содержит картинки со словами из сканированных книг, журналов и газет. А Google в качестве капчи предлагает распознавать номера домов и названия улиц, сфотографированные автомобилями в рамках проекта Google Street View. Интересно, что в самом Google еще пять лет назад разработали алгоритм, который правильно распознает такие надписи в 99,8% случаев — то есть лучше, чем среднестатистический пользователь интернета.

Почему Google и Яндекс просят вас ввести капчу

К этим поисковым системам ежедневно обращаются миллионы пользователей, но еще больше запросов отправляют боты. Запрашивая ввод капчи, Яндекс и Google защищают свои серверы от автоматических запросов.

Ботам (а точнее, специальным программам и сервисам) нужна информация о позициях определенных страниц в поисковой выдаче, иногда они исследуют ключевые слова или просто кликают по результатам выдачи или контекстной рекламе. Последнее, кстати, делается во вред конкурентам — чтобы потратить как можно больше их денег, выделенных на рекламную кампанию. Боты неинтересны и даже вредят поисковым системам: они впустую расходуют вычислительные ресурсы их серверов, воруют информацию о пользователях и нарушают привычную работу алгоритмов ранжирования.

Поисковые системы просят пользователей вводить капчу, когда заметят подозрительную активность. Например, Google использует этот тест в таких случаях:

  • от вас поступает слишком много поисковых запросов в единицу времени;
  • вы регистрируете новый почтовый ящик, аккаунт в YouTube или другом сервисе Google;
  • вы меняете пароль в сервисе, которым пользовались до этого;
  • вы настраиваете подключение к смартфону на Android.

Многих пользователей раздражает, что иногда капча такая неразборчивая, что ее приходится вводить несколько раз.

Также вам придется столкнуться с вводом капчи, если у вас установлены браузерные расширения или плагины для анализа ключевых слов, вы пользуетесь сервисами проверки текстов на уникальность или определяете ранжирование веб-сайтов в поисковой выдаче. Например, часто причиной появления на экране злополучной капчи является безобидный на первый взгляд плагин RDS Bar для анализа показателей сайта. Он запрашивает индекс цитирования сайта, число страниц в поиске, количество обратных ссылок — все это кажется поисковым системам крайне подозрительным.

И Яндекс, и Google заставляют вводить капчу, если с одного IP-адреса поступает много запросов. Такое случается в больших офисах, где интернет раздается сотрудникам с одного IP. Чтобы решить проблему, достаточно попросить у руководства провести отдельный канал или дать выделенный IP-адрес тем сотрудникам, работа которых подразумевает регулярный поиск информации в интернете.

Почему капча становится все сложнее

Устаревшая, написанная непрофессионалами капча — лазейка для ботов. Они могут использовать для ответа на вопросы информацию со страниц сайта, угадывать капчу с небольшим количеством вариантов (до нескольких сотен) или пользоваться базами данных для подбора правильного ответа. В начале 2000-х для теста на человечность было достаточно простой картинки или галочки напротив фразы «Я не робот». Сегодня разработчики сайтов используют более сложные способы проверки, не дающие прорваться толпам ботов.

Капча — один из способов тренировки искусственного интеллекта (ИИ). Когда ИИ становится достаточно разумным для того, чтобы решать одну задачу, ему предлагают другую, более сложную. Сейчас капча, которую генерирует Google, не просто отделяет людей от ботов, а наблюдает за нами, собирает информацию о поведении в стандартных и не очень ситуациях.

С другой стороны, предел сложности у таких тестов все-таки есть: их по-прежнему должны легко решать обычные люди. Потому сейчас ученые не усложняют задания, а делают их более человечными и универсальными — такими, чтобы с одинаковыми капчами хорошо справлялся житель любой страны, носитель любой культуры, языка, религиозных взглядов и т. п.

Как заработать на капче

Представьте ситуацию: вы несколько раз подряд вводите капчу, а сайт все не соглашается с правильным ответом и считает вас роботом. Знакомо? К счастью, выход есть, и на нем построен один из видов реального заработка в интернете. Существуют сайты, на которых пользователи распознают капчу и получают за это деньги.

Кому нужна услуга массового распознавания капчи? Самая многочисленная категория — веб-мастера, которые используют ПО для сбора статистики по сайтам, ключевым словам, продвижения веб-страниц в поисковой выдаче. Это ПО пересылает капчу в специальные сервисы, там ее разгадывают обычные люди, а затем сервис отправляет ответ обратно приложению. На одну капчу обычно уходит от 2 до 10 секунд. Стоит такая работа немного, она очень монотонная, требует усидчивости и точно не сделает вас миллионером. Например, чтобы заработать всего один доллар, вам нужно распознать не менее 1000 изображений! А минимальная сумма для вывода в таких сервисах составляет несколько долларов. Но если вам все-таки захочется заработать на мороженое первые деньги в интернете или, наоборот, заказать услуги распознавания капчи, вам сюда: RuCaptcha, Anti-Captcha, 2Captcha или в другой похожий сервис.