Автоматический ввод капчи в браузере
OneDash Caper — инновационная программа для автоматического разгадывания капчи.
Последние технологии машинного зрения для максимально продуктивной работы.
Автоматизируйте задачи, ускоряя рост вашего бизнеса.
На решение самой популярной капчи уходит в среднем
40 сек. Работает с Recaptcha V2, Recaptcha V3, HCaptcha.
Удобный анализ всех видов данных в реальном времени. Подробные графики и логирование.
Минимум конфигураций - прокси, юзерагенты и модули. Всё остальное делает программа.
Активная база модулей. Вы также можете сделать собственный модуль распознавания, связавшись с нами.
Обновления и поддержка
Мы предлагаем все обновления бесплатно, а также поддержку от нашей команды.
После установки вы можете сразу интегрироваться с нужными ресурсами и начать работу. Удобно.
Подписывайся на нас, если хочешь быть в курсе всех последних событий о нашем проекте и об изменениях работы в Caper:А чтобы обмениваться опытом и получать тех. поддержку, присоединяйся к нашему чату:
Лучший функционал, внушительная производительность и приватная поддержка от специалиста.
Сделайте шаг к новому этапу программного обеспечения.
Robokassa, Unitpay, Tinkoff, CloudPayments, Coinbase, Cryptonator
Могу ли я использовать программу на VPS/виртуальной машине?
Да.
Что мне требуется для работы с софтом?
Ничего. Установка дополнительных компонентов не требуется. Всё внутри.
На скольких устройствах можно работать?
Не более 3 активных сессий одновременно.
Какой список поддерживаемых капч? Могу ли я добавить свой тип капчи?
Да, вы можете связаться с нами для обучения нового модуля распознавания. reCaptcha V2, reCaptcha V3, hCaptcha - самые используемые виды капч по токену, а также большинство популярных капч в виде изображения.
На чем написан софт?
На C++
Как сильно программа нагружает пк, могу ли я параллельно пользоваться компьютером?
При небольших потоках программа не дает особой нагрузки на пк, поэтому вы можете спокойно заниматься своими делами во время работы софта.
Какие API сервисов используется в софте?
rucaptcha, anti-captcha, deathbycaptcha
Есть ли логирование?
Да, есть подробный лог в реальном времени со статистическими данными.
OneDash Capper – именно такое программное обеспечение, которому можно поручить массовую имитацию действий юзера на входе в проекты, защищенные капчами. Наша разработка написана на С++, имеет подробный лог в реальном времени и может активироваться даже на VPS, виртуальной машине. Она работает с Recaptcha V2, Recaptcha V3 и HCaptcha, используя API сервисов deathbycaptcha, rucaptcha, anti-captcha, но также она открыта к расширению потенциала, в том числе – по требованию пользователей.
Безграничность. Создатели OneDash сконцентрировались на том, чтобы предоставить своим клиентам полную свободу действий. В программе нет ограничений по потокам, как в конкурирующих приложениях (Capmonster, Xevil). Нет лимитов по количеству разгадываемых системой каптч. Стоит выбрать период использования софта и на протяжении этого времени можно производить любое количество распознаваний. Нет ограничения и по совместимым программам за счет интеграции с API популярных сервисов.
Лучшая производительность. Наша captcha программа базируется на двух принципах: высокой эффективности и низкой ресурсной затратности. Допускается запускать софт параллельно с другими действиями и процессами, как на современных пк, так и на старых ноутбуках. Можно свернуть программу и заниматься другими задачами без потери производительности.
Максимальные удобства. После активирования подписки или безлимитного тарифа мы предлагаем вам скачать программу для распознавания капчи, и сразу после установки вы сможете без труда произвести интеграцию с нужным вам программным обеспечением.
Полное профессиональное сопровождение. Даже если вы никогда не имели дело с подобными платформами, разобраться с опциями OneDash Caper не составит труда. В помощь новичкам, использующим нашу программу для разгадывания капчи, мы предоставляем детальные инструкции, обучающие ролики и написанные понятным языком сопроводительные документы, предлагаем консультацию и помощь техподдержки в ходе эксплуатации. Обновления выпускаются регулярно и на 100% бесплатны для пользователей с действующей подпиской или безлимитным тарифом. Мы заинтересованы в улучшении софта и постоянно работаем над его развитием.
Продуманность деталей. Наша программа для автоматического решения капчи предлагает вам отличное юзабилити, дружественный интерфейс, интуитивно понятные настройки, возможность выбора актуальных конфигураций (прокси, модули, юзерагенты). Мы позаботились о том, чтобы потребителям было максимально комфортно работать с софтом.
Информативная статистика. Программа для ввода капчи автоматически собирает сведения обо всех данных, обработку которых она выполняет. Это помогает анализировать выполненные действия, чтобы оптимизировать работу и избежать ошибок в будущем. Пользователям предоставляется доступ к графикам и просмотру логирования в реальном времени.
Быстрый старт. Программа для обхода капчи запускается в несколько кликов и может работать даже с базовыми параметрами. Софт готов выполнять свои функции уже спустя 5 минут после установки. При необходимости возможно детализировать процессы распознавания, внести изменения в предварительный набор настроек. По желанию клиента наши программисты готовы создать любые модульные составляющие для распознавания новых видов каптч.
Программа для авто ввода капчи Caper зарекомендовала себя в качестве любимца интернет-маркетологов, рекламистов, SMM-щиков, спамеров и вебмастеров, занимающихся продвижением в Internet. К ней регулярно обращаются лица, производящие онлайн-автоматизацию в тех или иных целях. Например, авторы ботов для авто-регистрации аккаунтов в соцсетях, специалисты по массовым рассылкам и деятели, предпочитающие агрессивную веб-раскрутку.
Капча сервисы и преимущества OneDash Capper
Делать выбор ПО, позволяющего доказать, что вход на сайт производится не роботом, рекомендуется с оглядкой на его достоинства и недостатки. Существует 2 класса платформ такого типа: ручные, где над разгадыванием капчи работают сотрудники и все манипуляции делаются вручную, а значит – медленно и неточно; автоматизированные, где все функции делегированы инновационным технологиям, что минимизирует риски неудачных расшифровок, гарантирует быстроту реагирования и более высокую точность распознавания.
И программы для ручного распознавания, и автоматические системы имеют свои особенности функционирования.
Классический сервис ручного распознавания капчи (такой как Рукапча или Антикапча) представляет собой ресурс с резко ограниченными возможностями. Он характеризуется:
необходимостью оплаты за каждую распознаваемую каптчу, что при больших объемах работ оказывается совсем невыгодно пользователю;
наличием неточности выполнения поставленных задач (из-за принципа ручного ввода возрастает влияние человеческого фактора, в работе таких программ часто проскальзывают ошибки);
медленное реагирование на действия пользователя, невысокая скорость работы (оперативно разгадать все каптчи не получится, надо запасаться временем);
существенное ограничение в потоках, способное тормозить процесс распознавания.
Такой капча сервис, несмотря на то, что он стоит денег, совсем не гарантирует качественного результата и быстродействия, к тому же он часто оказывается не слишком удобным в использовании. Чтобы приноровиться к работе с ним требуется время, деньги и терпение. Если речь идет о небольшом количестве распознаваний, то к нему можно прибегнуть без особых проблем, но если предстоит большая работа с массой капч разного формата и наполнения, то могут возникать трудности и ограничение в масштабировании.
Подыскивая универсальные сервисы решения капчи, которым можно было бы доверить обработку значительного массива данных, обратите внимание на проект Capper. Он полная противоположность ручным проектам. Наша разработка обеспечивает:
разумную плату за использование программы, предусматривающую неограниченное количество операций в сутки (пользователь вносит небольшую абон. плату на тот период пользования, который ему интересен, после чего может обращаться к recaptcha с той частотой, которая для него актуальна);
гарантию результата (ввиду того, что программа использует современные технологии, она работает максимально качественно и точно, сбои в разгадывании капч сведены к минимуму);
очень высокую скорость реакции сервиса распознавания captcha на отправляемый пользователем запрос (до 40 секунд на популярные капчи), доступно многопоточное выполнение задач;
полнейшее отсутствие ограничений по потокам или ресурсам со стороны разработчиков (можно загружать приложение по максимуму, открывая до 3 сессий одновременно).
Сервис разгадывания капчи OneDash Capper удобен с пользовательской точки зрения своей высокой адаптивностью. В него можно в любой момент времени добавить уникальный тип капчи, необходимой юзеру. Для этого потребуется связаться с нашей командой разработчиков и попросить внести новый модуль распознавания в систему. Это бесплатная услуга, расширяющая потенциал софта и помогающая настроить его под решение конкретно ваших задач.
Вот уже лет десять мы видим капчи по всему интернету. Все эти волнистые линии, слова или числа, мешающие нам при попытке залогиниться, зарегистрироваться или написать где-нибудь комментарий.
Amazon’s CAPTCHA fallback
КАПЧА (от CAPTCHA англ. – полностью автоматизированный и общедоступный тест Тьюринга для различения компьютеров и людей) задумана как врата, которые пропускают людей и отсеивают роботов (программ). Волнистые линии и слова сейчас уже не так распространены –их заменила вторая версия реКАПЧИ от Google. Эта капча выдает вам зеленую галочку, если ваш «коэффициент человечности» оценивается как достаточно высокий.
Если же вы не дотянули до заданного порога «человечности», то реКАПЧА прибегает к использованию подобной паззлу картинки, которая на удивление эффективна скорее в том, чтобы еще сильнее действовать на нервы, по сравнению с расшифровкой пары слов.
При том, что людей КАПЧИ раздражают, их можно было бы и потерпеть, если бы они хотя бы выполняли свою работу, однако, зачастую гораздо проще автоматизировать их распознавание, чем постоянно доказывать, что вы человек.
Как работает 2Captcha
2Captcha решает много разных типов капчи. Для взаимодействия с 2Captcha используются два адреса: на in.php присылается задача и в ответ Вы получаете captcha_id, на res.php вы по captcha_id получаете ответ, когда он будет готов.
2Captcha решает капчи в нескольких различных стилях с помощью двух, по большей части одних и тех же, конечных точек обработки запросов. Первый запрос передает данные, необходимые для решения капчи, и возвращает ID запроса. В случае капчи на основе изображения, данные будут изображением самой капчи, закодированным в 64base.
После получения ID запроса, вам нужно будет повторно отправлять его на сервер 2капчи, пока решение не будет готово.
С Recaptcha V2 история немного другая. Вы по-прежнему имеете дело с двухступенчатым процессом, что и представленный выше, но отправляете другие данные. Теперь вам нужно отправлять публичный ключ рекапчи (reCAPTCHA sitekey), который можно найти среди атрибутов элемента-контейнера капчи, независимо от того, был ли загружен
Для капч, основанных на изображениях, результат доступен почти мгновенно. Для реКАПЧ версии 2 может потребоваться от 15 до 30 секунд.
Автоматизация через Puppeteer
Прежде чем беспокоиться о капче, нужно разобраться со всем прочим, но прежде чем мы сможем это сделать, нужно определиться с нашими инструментами. 3 причины, по которым в данном посте мы будем использовать Google’s Chrome:
- В нем все очень легко автоматизируется через Puppeteer API.
- На нем можно работать как в headless-режиме, так и с графическим интерфейсом, что очень удобно и практично.
- Это самый распространенный в мире браузер, поэтому все имеющиеся на сайтах приемы анти-автоматизации имеют меньший шанс срабатывания (например, блокировка Selenium или PhantomJS)
Использование Puppeteer
Необязательно устанавливать хром, если не хочется, в Puppeteer есть все необходимое, в том числе Chromium. Но можете использовать и локально установленный Chrome, решать вам.
Убедитесь, что все настроено, устроив предварительный тест. Для этого упражнения мы будем автоматизировать страницу регистрации Reddit, просто потому что это была первая страница с рекапчей, которая мне попалась.
В этом коде мы указываем два свойства конфигурации при запуске: headless: false, чтобы видеть то, что мы делаем, и defaultViewport: null, чтобы учесть неприятный визуальный глитч, при котором область просмотра не заполняет окно. Ни тот, ни другой не важны для работы браузера в headless-режиме, просто с ними удобней видеть и, что самое важное, делать скриншоты. Например, такой:
Это было просто! Теперь мы готовы перейти к следующему шагу – автоматизировать регистрацию так, будто капчи никогда и не было. Вот где возможность включать/ выключать headless-режим будет полезна, ведь мы можем управлять браузером от лица человека, когда нужно. Сначала следует понять, как получить доступ к элементам на странице, которые нужно поменять. Запустите браузер и просмотрите открытую страницу через инструменты разработчика Google Chrome (горячая клавиша – F12). Далее, найдите текстовые поля, которые нужно будет изменить. (горячие клавиши: ⌘+Shift+C на Mac и Ctrl+Shift+C на Windows) В случае с Reddit, нам нужно получить прямой доступ к полю ввода логина, двум полям ввода пароля и кнопке. Электронная почта необязательна, так что можем ее проигнорировать. Печать в текстовых полях через API библиотеки Puppeteer почти до смешного проста: вы просто передаете селектор, который идентифицирует элемент, и желаемую строку с помощью метода .type().
Производить операции с кнопкой так же удобно, разве что у кнопки на странице Reddit нет связанного с ней идентификатора, так что нам нужен более сложный селектор. Если вы не знакомы с селекторами CSS, то для краткого ознакомления посмотрите Mozilla Developer Network.
Вот и всё! Протестируйте скрипт, чтобы удостовериться, что отправка логина работает. Из-за КАПЧИ, конечно, ничего не получится, но зато мы можем протестировать работу хуков.
Подождите-ка! Мы ведь даже не видим капчу, и консоль JavaScript жалуется на ошибки. Что здесь происходит? Во время автоматизации веб-страниц, помимо капч, есть множество других препятствий, которые могут встать у вас на пути. И одна из них – настолько высокая скорость выполнения операций, что страница ломается. Когда браузеры автоматизированы, они работают во много-много раз быстрее, чем на то способен обычный человек, и зачастую это приводит к выполнению кода в таком порядке, в каком разработчики его не тестировали (это называется состоянием гонки или неопределённость параллелизма).
После добавления этой опции мы видим, что капча снова работает. Ради забавного эксперимента, можно попробовать пройти капчу прямо сейчас и посмотреть что будет. Поскольку мы используем вариант Chromium с настройками по умолчанию, который запускается библиотекой Puppeteer, и мы управляем им через средства автоматизации, то реКАПЧА будет изо всех сил пытаться доказать, что мы не человек. Вам, вероятно, придется пройти несколько уровней проверки, даже если вы разберетесь со всеми картинками. Когда я тестировал это, мне пришлось пройти через 10 различных повторений, прежде чем я получил зеленую галочку.
К счастью, все это можно сделать намного легче.
Настройка 2Captcha
2Captcha требует API ключ, который выдается при регистрации. Вам также потребуется какое-то количество средств, потому что, не всё в жизни бесплатно. И просто ради смеха, конечно же, вам понадобиться пройти КАПЧУ.
После того как вы сделали этот запрос и получили обратно идентификатор запроса, вам нужно запросить URL «res.php», используя ваши ключ API и идентификатор запроса, чтобы получить ответ.
Для reCaptcha V2 время нахождения решения может различаться – минимум 15 секунд, максимум – 45. Ниже показан пример механизма опроса, но в этот раз простого запроса по URL, который может быть интегрирован в ваше приложение так, как вам будет удобно.
Как только у вас есть данные ответа, вам нужно вставить результат в скрытое текстовое поле g-recaptcha-response в форме регистрации Reddit. Это не так просто, как использование метода .type() библиотеки Puppeteer, так как элемент невидим и не может получить фокус ввода. Можно сделать его видимым и затем использовать .type(), или же использовать JavaScript, чтобы внедрить значение на страницу. Для добавления JavaScript на страницу, при использовании Puppeteer, у нас есть метод .evaluate(), который принимает либо функцию, либо строку (при передаче функции она просто преобразуется в строку с помощью метода .toString()), и запускает ее в контексте страницы.
После внедрения этого значения у нас все готово для завершения регистрации. Это действительно так просто.
Полный скрипт доступен ниже, если вам захочется поэкспериментировать с Puppeteer и/или 2Captcha.
Что вы теперь можете сделать?
Этот пост был написан ради двух вещей:
1. Показать вам, насколько капчи нехорошая вещь
2. Показать вам, что капчам нет необходимости блокировать вас
Капчи существуют, как правило, чтобы блокировать нехороших субъектов, манипулирующих контентом в мошеннических или вредоносных целях в ходе спланированных атак, которые выливаются в многомиллионные запросы. Есть много легитимных причин, по которым вам может потребоваться программно управлять сайтом, и если капчи не останавливают плохих парней, то вас-то уж точно они останавливать не должны.
Тысячи изображений
После выгрузки и сортировки пробной партии изображений я стал вручную разбирать разные типы капч. Первым делом я построил md5 суммы от всех капч одного типа в надежде найти совпадения. Самый простой способ не сработал — совпадений попросту не было. А что? — Имею право!
Прогуливаясь глазами по иконкам изображений, нашлось кое-что интересное. Вот, например, 4 одинаковых лимузина:
Одинаковые, да не совсем — это заметно по размерам колеса в нижних левых углах. Почему для сравнения были выбраны именно лимузины? Их легче всего было просматривать глазами — картинки дорожных знаков или наименований улиц сливаются в одну, а искать похожие лимузины или пикапы было проще простого. Оценив глазами изображения разных типов, во многих я увидел повторяющиеся капчи с разными деформациями — растяжениями, сжатиями или смещениями. Найдя подходящую функцию похожести изображений и собрав достаточную базу, можно было надеяться на некоторый успех.
Perceptive hash
Почти все поисковые запросы ведут именно к нему. На хабре можно отыскать достаточно много статей, посвященных перцептивному хэшу (1, 2, 3, 4). Быстро нашлась и python библиотечка ImageHash, использующая пакеты NumPy и SciPy.
Как же работает Perceptive Hash? Вкратце:
- Изображение сжимается до размера hash_size.
- От значения получившихся пиксел берется дискретное фурье преобразование.
- От фурье преобразования считается медиана.
- Матрица фурье преобразования сравнивается с медианой и в качестве результата мы получаем матрицу нулей и единиц.
Десятки тысяч изображений
Перцептивный хэш хорошо определял сходство между одним и тем же лимузином, но с разными деформациями, и различие между совершенно разными изображениями. Однако, хэш подходит скорее для описания форм, изображенных на картинке: при увеличении числа капч неизбежны совпадения по форме объектов, но не по содержанию картинки (с некоторым порогом срабатывания, разумеется).
Так и случилось. С увеличением базы капч, росла необходимость в добавлении ещё одной сравнительной величины для изображений.
Объективную цветовую характеристику изображения можно описать гистограмой интенсивности цветов. Функция расстояния для двух гистограмм (она же функция разности) — сумма среднеквадратичных отклонений элементов гистограммы. Довольно неплохая связка получается.
- Имеем пороги срабатывания для разниц перцептивного хэша и гистрограмы: max phash distance и max histogram distance
- Для всех изображений одного типа строим группы похожих, где каждой капче соответствует пара чисел — расстояния до «главы» группы phash distance и histogram distance
- Открываем всю группу изображений и визуально проверяем наличие ошибок
- В случае ложных срабатываний корректируем один из порогов
С одной стороны, учитывая тот факт, что разница phash у очень близких по форме изображений будет равна нулю, и представив, что процент ложных срабатываний будет достаточно низок — можно подумать, что использование одного лишь перцептивного хэша будет быстрее, чем использование двух хэшей. Но что говорит практика?
Для сравнения я использовал две выборки капч разных типов по 4000 изображений. Один тип обладает хорошей «похожестью», а другой — наоборот. Под похожестью (она же сжимаемость) я имею в виду вероятность того, что 2 случайных изображения одного типа с заданными порогами срабатывания будут одинаковыми с точки зрения хэшей. Результаты оценки следующие:
Больше половины изображений лимузинов похожи между собой, вот это да! При использовании обоих хэшей результат все-таки лучше, но как дело обстоит с производительностью?
Удивительно, но использование обоих хэшей оказалось быстрее, чем использование только перцептивного хэша с нулевым максимальным отклонением. Разумеется, это вызванно разницей в количестве операция сравнения изображений, и это притом, что сравнение гистограм из 300 значений медленнее сравнения перцептивных хешей размером 8 байт на 28.7%!
Сотни тысяч изображений
Проблемы производительности дали о себе знать на действительно большом объеме выборок. Для самых популярных типов время поиска похожих изображений на моём ноутбуке составляло уже секунды. Требовалась оптимизация поиска с минимальными потерями точности.
Изменение точности phash не казалось мне хорошей идеей. Поэтому посмотрим внимательно на гистограмму интенсивности цветов какой-то капчи:
Если бы меня попросили кратко описать эту гистограмму, то я бы сказал так: «Резкий пик на значении абсциссы 55, затем постепенное снижение графика и два локальных минимума на значениях 170 и 220». Если мы возьмём больше графиков гистограмм от похожих капч, то заметим, что эти графики по форме повторяют друг друга с небольшими погрешностями в положении максимумов и минимумов (экстремумов). Так почему бы не использовать эти значения для того, чтобы заведомо отсекать непохожие?
Окей гугл, как найти экстремумы в графике на питоне?
Описание функции argrelextrema говорит само за себя: Calculate the relative extrema of data.
Однако, наша гистограмма слишком зубчатая и локальных экстремумов намного больше, чем нужно. Необходимо сгладить функцию:
Усредняем график алгоритмом скользящего окна. Размер окна выбирался опытным путем для того, чтобы количество минимумов или максимумов было в среднем 2, и остановился на значении 100 пиксел. Следствием работы такого алгоритма является красивый, гладкий и… удлиненный график. Удлиненный ровно на размер окна.
Соответственно смещаются позиции экстремумов:
По всем имеющимся изображениями с двумя локальными минимумами (или максимумами) я подвел статистику их позиций. На графиках встречались огромные пики (до 100х), которые для наглядности пришлось укоротить.
Графики экстремумов зрительно можно разбить на две части на отметке 101. Почему так получается? После фильтрации выяснилось, что это две совершенно разные и почти непересекающиеся группы изображений, причем слева от отметки находится около 200к изображений разных типов. Такое хитрое распределение дают темные капчи вроде тех, что справа. Похожую ситуацию, но с изображениями много светлее, можно наблюдать у минимумов.
Сопоставив многие графики похожих капч я установил, что допустимым отклонением от позиций локальных экстремумов будет 3-4 пиксела. Регулируя эту величину в меньшую сторону можно добиться большей фильтрации и ускорения алгоритма за счет ухудшения сжимаемости.
Разумеется, в капчах от RuCaptcha могут быть и были ошибки распознавания. Для борьбы с ними была введена рейтинговая система капч. Если md5 новой капчи уже содержится в базе, но с другим типом инструкции, то у старой капчи увеличивается счетчик failure, а если тип старой капчи совпадает с новым, то увеличивается счетчик popularity. Таким образом вводится естественная регулировка неправильных решений — при поиске похожих учитываются только капчи с popularity > failure.
Мой первый миллион
За все время исследовательской работы было собрано более миллиона решенных капч. Для хранения данных использовалась база данных PostgreSQL, в которой удобно было хранить хеши и массивы значений гистограмм. К слову о хранении гистограмм — для расчета растояния между двумя гистограммами не обязательно хранить все 255 + window_size значений. При использовании половины или даже трети значений массива точность расстояния падает незначительно, зато экономится дисковое пространство.
По такой выборке капч статистика будет очень точной.
Ниже приведены данные по самым «сжимаемым» и самым популярным капчам (по 3 строчки):
Закон Парето в чистом виде: 11% инструкций дают
80% всех капч (а 20% инструкций дают 91% всех капч). И статистика отнюдь не в пользу самых сжимаемых типов.
Сам же google говорит так:
reCAPTCHA uses an advanced risk analysis engine and adaptive CAPTCHAs to keep automated software from engaging in abusive activities on your site.
Every time our CAPTCHAs are solved, that human effort helps digitize text, annotate images, and build machine learning datasets. This in turn helps preserve books, improve maps, and solve hard AI problems.
Намекая на то, что, через решение капч людьми он обеспечивает их автоматическую ротацию. Google сделал ставку на небольшой набор инструкций с хорошим уровнем ротации изображений, таких, как дорожные знаки или названия улиц.
- На вход поступает капча 3x3 или 4x4 и разбивается на 9 или 16 изображений соответственно
- По описанным выше алгоритмам для всех 9 или 16 изображений подбирается похожее по ВСЕМ типам в базе данных
- Индексы изображений найденного решения сравниваются с индексами эталонного решения
- Если разница (количество различающихся индексов) между решениями 50% и больше, то капча считается нерешенной
- Для каждого изображения делать поиск по ВСЕМ типам изображений в базе и потом отбирать только те, которые соответствуют типу инструкции. Такой подход позволит узнать статистику решений и по нецелевым изображениям тоже, а также проверит влияние ложных срабатываний на верность решений.
- Для каждого изображения производить поиск только по одному типу инструкции. Такой поиск намного быстрее и не дает ложных срабатываний от первого способа впринципе.
В среднем, собранная система разгадывала гугловые капчи с вероятностью 12.5%, тем самым приводя весомый довод в пользу решений компании Google.
К моему удивлению, лидером по количеству решений стала одна из самых плохосжимаемых капч (статистика за несколько выборок):
А нецелевых капч находилось чуть больше (55%), чем целевых (45%). Целевыми капчами называются те, изображения которых при поиске среди всей БД (а не только по одному типу инструкции) успешно находятся и их тип соответствует типу инструкции капчи. Иными словами — в средней капче 3х3 про лимузины находится 3 изображения с лимузинами и ещё 3.66 изображения с любыми другими типами.
Исследование показало, что на основе перцептивного хеша и гистограмм цветов нельзя построить систему решения капч, даже используя огромные обучающие выборки. Такой результат reCapthca достигается за счет должной ротации самых популярных типов капч.
Меня не покидают мысли о машинном обучении на той же самой выборке :) А пока что делюсь исходным кодом системы на python.
Официальное Anti Captcha расширение для браузеров Chrome, Firefox и им подобных,
которое автоматически находит на странице капчу
и в фоновом режиме решает ее для вас.
Распознает как обычные капчи в виде картинки (в том числе Solvemedia), а так же решает reCAPTCHA 2.0 (включая enterprise), reCAPTCHA 3 (новинка) и FunCaptcha. А еще китайскую Geetest, а так же новая hCaptcha (Cloudfare)!
Внимание, ключ хранится только во внутреннем защищенном хранилище браузера и не передается третьей стороне.
Бесплатные капчи для всех!
Мы предоставляем 15 пробных бесплатных решений капч всем установившим плагин для Chrome, чтобы вы могли оценить качество нашего сервиса! В Firefox, к сожалению, бесплатные разгадывание не доступны.
Список поддерживаемых функций
- Максимальная поддержка самых популярных видов капч, включая reCAPTCHA v2, v3, invisible, interprise, а так же Funcaptcha, Geetest, hCaptcha и обычную картинку с цифрами.
- Поддержка браузеров на движке Chrome и Firefox.
- Интеллектуальная система решения reCAPTCHA v2. Которая включает автоматический поиск и вызов callback-функции, которая выполняется на целевом сайте при нормальном решении капчи.
- Функция предварительного кэширования reCAPTCHA v2, позволяющая ускорить решение Рекапчи вплоть до пары секунд!
- Интеграция с Selenium, а так же iMacros и Kantu с примерами рабочего кода.
- Возможность решения капчи без установки расширения, например, при использовании с Puppeteer.
- API для работы с расширением, позволяющий управлять работой расширения из вашего скрипта.
- Более 1000 постоянных пользователей и более 200000 решеных капч каждый день!
- Удобство работы для незрячих пользователей со звуковыми подсказками и клавишными сокращениями.
Видео примера решения reCAPTCHA 2
Возможна совместная работа с расширением iMacros для браузеров, так же имеется возможность решать reCAPTCHA 2.0 в устанавливаемой программе iMacros со встроенным браузером.
Прекрасная интеграция с инструментом браузерной автоматизации Kantu с примерами.
Расширение предназначено в первую очередь для людей со слабым зрением, которым тяжело или даже невозможно ввести заковыристые символы всевозможных капч, а так же тем, кого эти капчи просто раздражают. Поддерживаются звуковые оповещения (выключены по умолчанию), включаются в настройках плагина.
Присутствует функция автопоиска картинки с капчей при нажатии комбинации клавиш CTRL+SHIFT+6 на поле ввода капчи, аналогичная функционалу в WebVisum.
Сразу после этого начинается разгадывание этой капчи и затем результат будет сразу помещен в поле ввода.
Читайте также: