|
33 / 3 / 0
Регистрация: 19.10.2013
Сообщений: 53
|
|
.NET 4.x Парсинг текста с сайта05.01.2014, 21:30. Показов 15384. Ответов 47
Метки нет (Все метки)
Привет!
Всех с праздниками! ![]() Ребят, помогите разобраться с парсингом. Суть вот в чем. Делаю запрос на сайт, получаю ответ и сохраняю его в TextBox. Далее хотелось бы сперва спарсить что-то простое, к примеру информацию между тегами <title>. Как это сделать? Знаю, что многие сейчас налетят и скажут, мол пользуйся регулярками, поэтому сразу скажу, мне далеко еще до регулярок и я до них еще не дорос ![]() И еще такой вопрос, правильно ли я делаю, что сохраняю результат в TextBox? Может, если сохранить во что-то другое, то работать будет легче? Буду рад любым советам и примерам. Спасибо!
0
|
|
| 05.01.2014, 21:30 | |
|
Ответы с готовыми решениями:
47
Парсинг текста с запрещенного сайта через прокси |
|
1569 / 1448 / 303
Регистрация: 01.10.2011
Сообщений: 2,636
|
|
| 05.01.2014, 21:32 | |
|
1
|
|
| 05.01.2014, 21:49 | ||||||
1
|
||||||
|
33 / 3 / 0
Регистрация: 19.10.2013
Сообщений: 53
|
||||||
| 05.01.2014, 21:51 [ТС] | ||||||
|
Как я понял, для новичков самый лучший вариант пользоваться функцией:
Можно конечно тупо перекопировать код, но хотелось бы именно понять каждую строку.
0
|
||||||
|
|
|
| 05.01.2014, 21:54 | |
|
Обычная функция поиска в строке определенного набора символов. Просматривается весть текст на предмет наличия двух строк, и если найдено-текст между ними возвращается.
1
|
|
|
33 / 3 / 0
Регистрация: 19.10.2013
Сообщений: 53
|
||
| 05.01.2014, 21:57 [ТС] | ||
|
P.S. Ребят, если кто-то может это сделать, то закомментируйте пожалуйста код функции.
0
|
||
|
|
||
| 05.01.2014, 22:01 | ||
|
Не по теме: Я уже не раз говорил и повторю - Мэтью Макдональд, "Рецепты программирования" - эта книга просто обязана быть у каждого, кто пишет на VB.NET. Есть ответы на большинство вопросов. Кстати, и именно такой (почти) пример там есть.:)
0
|
||
|
33 / 3 / 0
Регистрация: 19.10.2013
Сообщений: 53
|
|
| 05.01.2014, 22:07 [ТС] | |
|
Парни, спасибо и на этом!
Пойду разбираться сам тогда Если уж будет что-то никак не понять, то спрошу у вас.
0
|
|
|
|
||||||
| 05.01.2014, 22:08 | ||||||
|
Вот упрощенная функция, ищет количество совпадений. Думаю, с ней разберетесь, и ту поймете.
1
|
||||||
|
6721 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
|
| 05.01.2014, 22:17 | |
|
Везет VB-эшникам, так крепко отметили Новый год, что собрались парсить HTML через IndexOf и Substring.
По теме - HAP, SgmlReader
1
|
|
|
33 / 3 / 0
Регистрация: 19.10.2013
Сообщений: 53
|
||
| 05.01.2014, 22:19 [ТС] | ||
|
0
|
||
|
6721 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
|
| 05.01.2014, 22:34 | |
|
Release, именно, друг мой, ТС начинающий программист, как вы метко заметили, и учить его парсить HTML через IndexOf/Substring - плохо. HTML-парсеры не пишутся в один присест. И лучше ему доказать, что нужно использовать готовый парсер, чем писать свой костыль, который придется переписывать, едва появится какая новая проблема.
1
|
|
| 05.01.2014, 22:39 | |
|
Петррр, соглашусь. этот костыль не гибок, но все же, для начала нужно образно видеть, как это реализовано, а потом переходить к готовым вариант парсинга (внутрь, которых не заглянешь и не посмотришь, как осуществляется сам процесс). Это мое ИМХО, по мне так я всегда начинал с самого простого, да и пока все сижу на этом костыле, так как с парсингом инфы я вообще не работаю, а за ссылки спасибо, пригодятся на будущие
0
|
|
|
6721 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
|
| 05.01.2014, 22:44 | |
|
dimOk7, обычно парсеры предназначены для обработки большого количества информации, и делается это в многопоточном режиме. Сделайте обычное консольное приложение, GUI для таких целей не нужен (если вы конечно не для секретарш пишите программу).
1
|
|
|
33 / 3 / 0
Регистрация: 19.10.2013
Сообщений: 53
|
||
| 05.01.2014, 23:40 [ТС] | ||
Я хорошо представляю для чего нужны парсеры, т.к. у меня не один интернет магазин, который доводилось в свое время наполнять тысячами товаров, поэтому о парсерах знаю не по наслышке.Пишу не для секретарш, а для себя, просто саморазвитие так сказать ![]() Что касается IndexOf/Substring и HAP, я никуда не спешу и рассмотрю оба варианта. В любом случае, всем спасибо помогли и дали пищу для ума.
0
|
||
|
|
||||||
| 06.01.2014, 00:11 | ||||||
|
Вот, нашел в сети пример и dll-ку на шарпе. Переделал пример на VB.NET, dll-ку скомпилировал. Вроде работает, правда я с html не особо еще разбирался... Кто часто сталкивается, попробуйте. Вот мой тестовый текст и в архиве сама готовая dll.
1
|
||||||
| 06.01.2014, 00:11 | |
|
Помогаю со студенческими работами здесь
20
Парсинг русского текста с сайта. Неизвестные символы вместо кириллицы Парсинг данных с сайта или страницы сайта
Парсинг сайта Парсинг сайта Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|
Фото: Daniel Greenwood
kumehtar 13.11.2025
|
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга,
Ты же видел моря и метели.
Как сменялись короны и стяги,
Как эпохи стрелою летели.
- Этот мир — это крылья и горы,
Снег и пламя, любовь и тревоги,
И бескрайние. . .
|