Официальный сайт студ.городка НГТУ
Программирование и БД » Распознавание капчи. Нейронная сеть. 

#1  10.05.13 20:16

Распознавание капчи. Нейронная сеть.

Приветствую, уважаемые коллеги! Есть задача по реализации логики для распознавания след. капчи - http://captcha.yandex.ru/
Распознавание предполагается с использованием нейронной сети. Пример - http://habrahabr.ru/post/64535/. Реализация возможна на любом языке программирования. Цена договорная.

Offline

#2  14.06.13 17:28

Re: Распознавание капчи. Нейронная сеть.

Там основная проблема отлепить знаки друг от друга. В статье относительно просто решил проблему, Разделяем изображение на 6 равных частей сейчас уже так не решается. Поэтому дешевле/проще прикрутиться к аналогу http://habrahabr.ru/post/38589/ Особенно если recaptha.

<Скрытый текст>

Offline

#3  15.06.13 12:37

Re: Распознавание капчи. Нейронная сеть.

drug_detei, ты не шаришь. Обработай своим способом за сутки сотню тысяч уникальных запросов с интервалом каждые 5 минут. Посмотри сколько тебя демократичный яндекс пошлет лесом и сколько бабла ты сольёшь индусам.

Offline

#4  17.06.13 02:13

Re: Распознавание капчи. Нейронная сеть.

ItStorm, если с одного ИП 4 запроса работают, то со 100 ИП будет работать 400, то есть масштабируется, можно обойтись без капчи. Другое дело, если нельзя без капчи, например, при регистрации. Но, думаю, 100тыщ резистраций в сутки не нужны стартопику.

Offline

#5  17.06.13 02:21

Re: Распознавание капчи. Нейронная сеть.

ItStorm, приотм старттопик не вполне владеет темой так как не указал % распознавания. Легко можно сделать примерно 1 из 1000, но она будет распознаваться примерно 8 часов.

Offline

#6  18.06.13 16:07

Re: Распознавание капчи. Нейронная сеть.

drug_detei, 100000/4 = 25000  IP - адресов. Осилишь? При этом учитывая что несмотря на всю демократичность яндекса, IP могут быть забанены. Кол-во запросов может возрасти разом на сотню тысяч другую, в теченнии дня. Ииии? Иметь еще около 100 тыс. IP про запас? ))))))
Твоя система индусами и(или) множеством IP убыточна и слабо масштабируема.
А ТС очень даже в теме.

drug_detei написал(а):

Легко можно сделать примерно 1 из 1000, но она будет распознаваться примерно 8 часов.

сделай )))
Результат данной задачи - обучаемая система (естественно не без помощи человека), которая будет нарабатывать данные по капчам. Собственно от уровня обученности она будет повышать % распознавания, ну и опять же все зависит от алгоритма поиска. Проблема только конечно всего этого  - малейшее изменение и она поломается.

Offline

#7  20.06.13 13:46

Re: Распознавание капчи. Нейронная сеть.

ItStorm написал(а):

сделай )))

http://files.mail.ru/4216186B68F9491F8DBC9B6A04D70152
Не тестировал, но часов за 6 думаю угадет. Если яндекс IP не забанит.
в папке img картинки для тренировки, их можно менять, но сохранять размер.

Offline

#8  20.06.13 13:48

Re: Распознавание капчи. Нейронная сеть.

ItStorm написал(а):

Твоя система индусами и(или) множеством IP убыточна

думаю, что не в моей системе дело. Честным поисковым роботам яндекс дает честные 10000 поисковых запросов в сутки., хватит 10 IP.

Offline

#9  20.06.13 14:19

Re: Распознавание капчи. Нейронная сеть.

drug_detei, не-не, дело в том что нужен не xml с результатами, а именно такое же по сути окно как получил бы пользователь, не буду объяснять почему. ) Яндекс после 10 таких запросов (а то и меньше) с интервалами в милисекунды забреет своей капчей.

Offline

#10  20.06.13 14:23

Re: Распознавание капчи. Нейронная сеть.

drug_detei написал(а):

http://files.mail.ru/4216186B68F9491F8DBC9B6A04D70152
Не тестировал, но часов за 6 думаю угадет. Если яндекс IP не забанит.

К сожалению идеологически не приемлю и не пользую windows. )) Не могу запустить.

Offline

#11  20.06.13 15:17

Re: Распознавание капчи. Нейронная сеть.

У меня на ноутбуке Ubuntu подвисает, win 7 шустрее. Можешь что-то посоветовать? Может, поставить Debian?

Offline

#12  20.06.13 22:13

Re: Распознавание капчи. Нейронная сеть.

drug_detei, Ну смотря что за железо, на ноуте старом (4 летнее железо) с маленькой памятью у меня Debian на порядок шустрее. На стационарном с новым железом и >8Гб памяти только Ubuntu, а Debian придется допиливать пакетами из сида. Хотя свои тестовые виртуалочки на Debian держу.

Offline

Программирование и БД » Распознавание капчи. Нейронная сеть. 

ФутЕр:)

© Hostel Web Group, 2002-2025.   Сообщить об ошибке

Сгенерировано за 0.052 сек.
Выполнено 14 запросов.