Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/21: Рейтинг темы: голосов - 21, средняя оценка - 4.95
0 / 0 / 2
Регистрация: 17.02.2016
Сообщений: 166

Обработка капчи у яндекса

17.02.2016, 22:20. Показов 4318. Ответов 1

Студворк — интернет-сервис помощи студентам
познание C# началось с написания парсера выдачи яши с первой страницы.
при обработке ошибок в работе программы, было обнаружено отсутствие повторной обработки капчи при её неправильном вводе. софт просто пропускал запрос, отправляя его в bad.
соответственно надо было запихнуть в цикл момент обработки капчи.
а вот тут самое интересное.
сам кусок кода:
Кликните здесь для просмотра всего текста
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
//Парсим страницу на наличие капчи
nodes = doc.DocumentNode.SelectNodes("//div[@class='form form_state_image form_error_no form_audio_yes i-bem']");
 
//И если капча есть переходим к её обработке
while (nodes != null)
{
    if (nodes != null)
    {
        HtmlAgilityPack.HtmlNodeCollection inputs = nodes[0].SelectNodes("//input");
        key_captcha = inputs[0].GetAttributeValue("value", "false").Replace("&amp", "");
        return_path_captcha = inputs[1].GetAttributeValue("value", "false").Replace("&", "&"); ;
 
        //Парсим страницу на получение тэга <img>, в котором прописана капча
        HtmlAgilityPack.HtmlNode image = doc.DocumentNode.SelectSingleNode("//div[@class='form form_state_image form_error_no form_audio_yes i-bem']//img");
 
        //Получаем URL капчи (путь по которому её можно скачать)
        url_captcha = image.GetAttributeValue("src", "true");
 
        //Скачиваем картинку с удаленного адреса в MemoryStream
        MemoryStream stream = request.Get(url_captcha).ToMemoryStream();
 
        //Создаем форму ввода капчи
        FormCaptcha formCaptcha = new FormCaptcha();
 
        //Отображаем в PictureBox картинку с MemoryStream
        formCaptcha.pictureBox1.Image = Image.FromStream(stream);
 
        //Отображаем форму ввода капчи для пользователя
        formCaptcha.ShowDialog();
 
        request.AddUrlParam("key", HttpUtility.UrlEncode(key_captcha));
        request.AddUrlParam("retpath", HttpUtility.UrlEncode(return_path_captcha));
        request.AddUrlParam("rep", HttpUtility.UrlEncode(formCaptcha.tbPassword.Text));
 
        response = request.Get(@"https://www.yandex.ru/checkcaptcha");
        //if (response.RedirectAddress == null)
        //    {
        //    nodes = doc.DocumentNode.SelectNodes("//div[@class='form form_state_image form_error_no form_audio_yes i-bem']");
        //    }
        //else
        //    {
        //    response = request.Get(response.RedirectAddress);
        //    }
 
        doc.LoadHtml(response.ToString());
        stream.Close();
    }
    //Парсим страницу на наличие капчи  
    nodes = doc.DocumentNode.SelectNodes("//div[@class='form form_state_image form_error_no form_audio_yes i-bem']");
}

да. тут три библиотеки. да на xNet. хотелось бы доделать уже с их использованием.
подсказали, что надо использовать response.RedirectAddress. но как его туда прикрутить, не могу понять. сыпятся ошибки и всё. по сниферу, софт доходит до второй страницы с капчей, но начинаются ошибки.
кто знает, подскажите где ошибка.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
17.02.2016, 22:20
Ответы с готовыми решениями:

Обработка капчи гугла
Парсер выдачи гугла. Перед тем, как выкинуть капчу, гугл выкидывает 503 ошибку. После чего софт вырубается. Кто его уже победил,...

Разгадыватель капчи для яндекса
Всем привет! Начал пользоваться разгадывателем капчи для яндекса, и после ввода капчи яндекс все равно не выдает результаты поиска. Что...

Обновление капчи
Как добавить ссылку для обновления капчи, на случай если она непонятную картинку выдаст, без потери введенных в форму данных!

1
2 / 2 / 1
Регистрация: 20.04.2015
Сообщений: 26
23.12.2016, 11:02
ребята, написал функцию, отправляю ответ на капчу в яндекс, а получаю ошибку 400... подскажите пожалуйста в чём дело? я и куки вроде сделал. очеь прошу помощи!
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
        public string CheckCaptcha(string s)
        {
            InvokeIfNeeded(() => this.Text = "Задержка между запросами " + searchdelay.ToString() + "c.");
            string url = "https://yandex.ru/images/search?text=" + s;
            var req = (HttpWebRequest)WebRequest.Create(url);
            req.AllowAutoRedirect = true;//Разрешаем автоматический редирект
            req.ContentType = "application/x-www-form-urlencoded";
            req.Referer = "http://google.com";//Реферер. Тут можно указать любой URL
            req.UserAgent = "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0";
 
            CookieContainer cookie_container = new CookieContainer();
            req.CookieContainer = cookie_container;
 
            var resp = (HttpWebResponse)req.GetResponse();
            CookieCollection cookie_collection = new CookieCollection();
            cookie_collection = resp.Cookies;
            cookie_container.Add(cookie_collection);
 
            StreamReader sr = new StreamReader(resp.GetResponseStream(), Encoding.GetEncoding("utf-8"));
            string html = sr.ReadToEnd();
            sr.Close();
            //Cоздаем объект класса HtmlDocument
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
            //Загружаем в doc полученный HTML
            doc.LoadHtml(html);
 
            //Парсим страницу на наличие капчи
            HtmlNodeCollection nodes = doc.DocumentNode.SelectNodes("//div[@class='form form_state_image form_error_no form_audio_yes i-bem']");
 
            //если в запросе попалась капча - увеличиваем выдержку между запросами
            if (nodes != null)
            {
                Properties.Settings.Default.searchdelay = ++searchdelay;
                Properties.Settings.Default.Save();
            }
 
            //пока капча присутствует - выполняем
            while (nodes != null)
            {
                if (nodes != null)
                {
                    HtmlAgilityPack.HtmlNodeCollection inputs = nodes[0].SelectNodes("//input");
                    string key_captcha = inputs[0].GetAttributeValue("value", "false").Replace("&amp", "");
                    string return_path_captcha = inputs[1].GetAttributeValue("value", "false").Replace("&amp;", "&");
                    //Парсим страницу на получение тэга <img>, в котором прописана капча
                    HtmlAgilityPack.HtmlNode image = doc.DocumentNode.SelectSingleNode("//div[@class='form form_state_image form_error_no form_audio_yes i-bem']//img");
                    //Получаем URL картинки капчи (путь по которому её можно скачать)
                    string url_captcha = image.GetAttributeValue("src", "true");
                    //Создаем форму ввода капчи
                    FormCaptcha formCaptcha = new FormCaptcha();
                    //Отображаем в PictureBox на форме картинку капчи
                    formCaptcha.pictureBox1.Image = UrlToImg(url_captcha,0,0);
                    //устанавливаем время автозакрытия окна ввода капчи
                    formCaptcha.captchadelay = captchadelay;
                    //Отображаем форму ввода капчи для пользователя
                    formCaptcha.ShowDialog();
 
                    //если капча была введена
                    if (formCaptcha.tbPassword.Text != "")
                    {
                        key_captcha = WebUtility.UrlEncode(key_captcha);
                        return_path_captcha = WebUtility.UrlEncode(return_path_captcha);
                        string password = WebUtility.UrlEncode(formCaptcha.tbPassword.Text);
                        //формируем URL для отправки кода капчи
                        url = @"https://www.yandex.ru/checkcaptcha";// + "?key=" + key_captcha + "&retpath=" + return_path_captcha + "&rep=" + password;
 
                        try
                        {
                            //запрашиваем составленный URL
                            req = (HttpWebRequest)WebRequest.Create(url);
                            req.CookieContainer = cookie_container;
                            req.ContentType = "application/x-www-urlencoded";
                            req.Referer = "http://google.com";//Реферер. Тут можно указать любой URL
                            req.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)";
                            resp = (HttpWebResponse)req.GetResponse();
                            resp.Cookies = cookie_collection;
                            //если капча не прошла (ответный URL не был найден)
                            if (resp.ResponseUri == null)
                            {
                                url = "https://yandex.ru/images/search?text=" + s;
                            }
                            else //если капча прошла удачно
                            {
                                url = resp.ResponseUri.ToString();
                            }
                        }
                        catch (Exception ex)
                        {
                            InvokeIfNeeded(() => LogException("Отправка кода капчи: ", ex, dt_exceptions));
                            url = "https://yandex.ru/images/search?text=" + s;
                        }
                    }
                    else //если капча не была введена, и окно закрылось по таймеру - запрашиваем
                    {
                        url = "https://yandex.ru/images/search?text=" + s;
                    }
                }
                req = (HttpWebRequest)WebRequest.Create(url);
                //запрашиваем исходный req и обновляем resp
                resp = (HttpWebResponse)req.GetResponse();
                //получаем html
                sr = new StreamReader(resp.GetResponseStream(), Encoding.GetEncoding("utf-8"));
                html = sr.ReadToEnd();
                //Загружаем в doc полученный HTML
                doc.LoadHtml(html);
                //Парсим страницу на наличие капчи 
                //если капча присутствует, то цикл продолжится 
                nodes = doc.DocumentNode.SelectNodes("//div[@class='form form_state_image form_error_no form_audio_yes i-bem']");
                //автоматически увеличиваем время задержки капчи, если капча после задержки опять вылезла, сохраняем настройки
                if (nodes != null) Properties.Settings.Default.captchadelay = ++captchadelay;
                Properties.Settings.Default.Save();
            }
            sr.Close();
            return html;
        }
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
23.12.2016, 11:02
Помогаю со студенческими работами здесь

Распознавание капчи
Необходимо распознать простую капчу где нет фона. Сайт абсолютно любой, лишь бы капча была попроще(без шумов). Способы реализации:...

Распознование капчи
Слышал что сушествуют методы научить программу распозновать капчу! немоглибы вы меня просветить на эту тему!!

Создание капчи
Помогите плз: расскажЫте логику создания капчи на пхп... или дайте ссылку на такую инфу) имею ввиду: метод ее создания)_

Распознание капчи
Здравствуйте, мне нужно сделать программу для распознания капчи такого вида (смотреть вложенный архив) всего 4 цифры (те что самые...

Распознавание капчи
Необходимо написать программу которая будет распознавать простенькую капчу, что-то типо приведённых ниже.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru