Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
1 / 1 / 0
Регистрация: 07.11.2015
Сообщений: 57
1

Парсинг html

02.05.2016, 19:04. Показов 867. Ответов 1
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Здравствуйте, нужно парсить логины и сообщения с определенного сайта

Код с логином
HTML5
1
class="username" dir="auto">ЛОГИН</a>
Функция с посощью которой парсю
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
private void getBetween(string strSource, string strStart, string strEnd)
        {
strStart = class="username author" dir="auto">;
strEnd = </a>;
            int nom = 1;
            string TextToParse = strSource;
            MatchCollection matches = Regex.Matches(TextToParse, strStart + "(.*?)" + strEnd, RegexOptions.Multiline);
            foreach (Match match in matches)
            {
                richTextBox1.Text += match.Groups[1].Value + Environment.NewLine;
                name[nom] = match.Groups[1].Value;
                nom++;
                colstrok += 1;
                label9.Text = Convert.ToString(Convert.ToInt32(label9.Text)+1);
            }
        }
Код с сообщением
HTML5
1
2
3
4
5
6
7
8
<div class="messageContent">        
            <article>
                <blockquote class="messageText SelectQuoteContainer ugc baseHtml">
                    
                    ЭТО НАДО СПАРСИТЬ
                    <div class="messageTextEndMarker">&nbsp;</div>
                </blockquote>
            </article>
Функция с посощью которой парсю
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
private void getBetweenmess(string strSource, string strStart, string strEnd)
        {
strStart = baseHtml">;
strEnd = <div class="messageTextEndMarker;
            int chet = 1;
            string TextToParse = strSource;
            MatchCollection matches = Regex.Matches(TextToParse, strStart + "(.*?)" + strEnd, RegexOptions.Multiline);
            foreach (Match match in matches)
            {
                st = Regex.Replace(match.Groups[1].Value, "<[^>]+>", string.Empty);
                richTextBox2.Text += st + Environment.NewLine;
                message[chet] = st;
                chet++;
                MessageBox.Show(message[chet]);//
 
            }
            MessageBox.Show(message[chet]);
 
        }
Логины парсит нормально, а сообщения почему то вообще не парсит
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
02.05.2016, 19:04
Ответы с готовыми решениями:

Парсинг делают одновременно со скачиванием html, или в конце со скачанным html
Представим что html байт за байтом записывается в файл, Как правильнее сделать парсинг , после того...

Парсинг HTML
подскажите как вообще парсить HTML? не имел дела с этим вообще пока что... надо спарсить небольшую...

Парсинг html
Доброе время суток. Есть html и мне не удается его полностью пропарсить, привожу код ...

HTML парсинг
Здравствуйте. Столкнулся со следующей проблемой: Нужно сделать программу, которая парсит сайты...

1
979 / 874 / 350
Регистрация: 26.04.2012
Сообщений: 2,647
02.05.2016, 23:28 2
sp70, HtmlAgilityPack для этого есть, примеров море по форуму.
0
02.05.2016, 23:28
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
02.05.2016, 23:28
Помогаю со студенческими работами здесь

Парсинг html
Добрый вечер, необходима помощь в парсинге. Необходимо спарсить все значения...

Парсинг html
:&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td&gt;111 string pattern1 =...

Парсинг HTML
Как ни пробовал, ничего не получается. Есть переменная string с текстом такого типа: ...

HTML парсинг
Привет всем! Мне сказали код можно в 2 строки написать. Как правильно парсить HTML со страницы в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru