Форум программистов, компьютерный форум, киберфорум
C# Windows Forms
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.79/39: Рейтинг темы: голосов - 39, средняя оценка - 4.79
pushok.88

Парсинг web страниц, загруженных в WebBrowser

29.05.2012, 16:33. Показов 7538. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день всем. Собственно говоря у меня не вопрос, а просьба растолковать некоторые детали в приведенной теме. У меня есть написанная программка которая посредством webbrauser'a обеспечивает нажатие кнопок, заполнение форм и т.д на сайтах. Собственно вот кусок кода ответственный за заполнение полей логина и пароля и нажатия кнопки.
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
 private void button1_Click(object sender, EventArgs e)
        {
            webBrowser1.Navigate("http://www..................ru");
            // ждём конца загрузки страници
            webBrowser1.DocumentCompleted += new WebBrowserDocumentCompletedEventHandler(webBrowser1_DocumentCompleted);
            while (webBrowser1.ReadyState != WebBrowserReadyState.Complete)
            {
                Application.DoEvents();
            }// страница полностью загружена
 
            webBrowser1.Document.GetElementById("login").SetAttribute("value", "...............");
 
            // пароль  
            webBrowser1.Document.GetElementById("password").InnerText = "..................";
 
            foreach (HtmlElement input in this.webBrowser1.Document.GetElementsByTagName("input"))
            {
                if (input.Id == "submitButton" && input.GetAttribute("value") == "Войти")
                {
                    input.InvokeMember("click");
                    break;
                }
            }
        }

С этим все понятно и просто. Но допустим мне необходимо посетить на данном адресе личный кабинет и
зайдя допустим в раздел сообщения перейти на последнюю страницу и открыть последнее сообщение.
Вот здесь и начинаются у меня головные боли.

Первое что необходимо это перейти на последнюю страницу(вот код элемента отвечающего за это):
HTML5
1
<a href = "/myobjects.html?page=6">последняя</a>
Насколько я понял это линк ссылки для перехода на последнюю страницу.

И самая большая проблема это каким образом можно организовать открытие последнего сообщения и вообще возможно ли это. Напомню, главная задача заключается в том, что необходимо чтоб при нажатии на кнопку он автоматически сам все это делал.

Пробовал реализовать даже через:
C#
1
2
Regex myReg = new Regex(@"(?<=<a>).*(?=</a>)", RegexOptions.IgnoreCase | RegexOptions.Singleline
                      | RegexOptions.ExplicitCapture);
Но не получилось.Прошу привести примеры и самое главное популярно объяснить что за что отвечает.
Ну и конечно было бы интересно услышать еще какие нибудь идеи по данной теме.
И еще, не судите строго, первый раз на форумах тему создаю.
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
29.05.2012, 16:33
Ответы с готовыми решениями:

Парсинг динамически изменяющихся Web страниц
Всем привет. Пишу проект, в котором требуется выгружать в БД со страницы сайта некоторый набор динамически изменяющихся полей (т.е. их...

Парсинг web-страниц
Добрый день, форумчане. Задача заключается в следующем: 1) Грузим в компонент TWebBrowser страницу. 2) Сохраняем код страницы в...

В индексе Яндекса 1/4 загруженных страниц почему?
В чем &lt;b&gt;причина того, что в поисковом индексе Яндекса находится 1/4 от страниц загруженных?&lt;/b&gt; Загруженно 1396 страниц, в поиске...

1
 Аватар для gmmjob
2 / 2 / 1
Регистрация: 17.05.2012
Сообщений: 39
02.06.2012, 16:04
Цитата Сообщение от pushok.88 Посмотреть сообщение
C#
1
2
3
4
5
6
7
8
foreach (HtmlElement input in this.webBrowser1.Document.GetElementsByTagName("input"))
{
 if (input.Id == "submitButton" && input.GetAttribute("value") == "Войти")
 {
input.InvokeMember("click");
 break;
 }
 }
У меня возник вопрос по поводу этого кода.
У меня при обновлении браузера выскакивает окно Подтвердить или Отменить обновление. Будет ли этот код работать если его вставить после
C#
1
webBrowser1.Refresh();
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
02.06.2012, 16:04
Помогаю со студенческими работами здесь

Парсинг в WebBrowser
Как в tWebBrowser возможно спарсить текст? Даже представить себе не могу как написать код можно. Например от &lt;li&gt;Донат...

Парсинг через WebBrowser
Вопрос банальный, но все же. С рейтинговой системы ТО мне нужно спарсить значения. Например -...

загрузка страниц в webbrowser
как сделать так, чтобы во время загрузки страницы заполнялась шкала progressbar'a? и чтобы после того, как страница загружена шкала...

Парсинг страниц
Доброго времени суток. Столкнулся с проблемой при парсинге страниц. На сайте информация отображается после действия js скрипта...

Парсинг страниц
нужно спарсить страницу Как пользоваться preg_match?, не понимаю этих иероглифов &quot;|&lt;+&gt;(.*)&lt;/+&gt;|U&quot; Как например...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
PowerShell Snippets
iNNOKENTIY21 11.11.2025
Модуль PowerShell 5. 1+ : Snippets. psm1 У меня модуль расположен в пользовательской папке модулей, по умолчанию: \Documents\WindowsPowerShell\Modules\Snippets\ А в самом низу файла-профиля. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru