Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.71/7: Рейтинг темы: голосов - 7, средняя оценка - 4.71
SiFu

[Помогите]Автоматизация извлечения данных из HTML страницы

17.08.2011, 21:11. Показов 1456. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте ув. программисты.
Помогите пожалуйста решить следующую задачу:
Требуется из нескольких HTML страниц (находятся в интернете) вытащить всего одно слово.(на каждой странице разное)
Адрес страницы вида example.ex/u=****, где вместо **** число - ID.

Требуется написать программу в которое вводится два числа - от какого ID и до какого собирать эти слова. И при нажатии кнопки эти слова выводятся списком.

Если не ошибаюсь такие программы называются парсерами.(или грабберами?)

Как это можно сделать? Заранее спасибо. Если что-то не понятно-отписывайте, напишу подробней.
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.08.2011, 21:11
Ответы с готовыми решениями:

Помогите советом с встраиванием Html страницы
Необходимо формировать html страницу и встраивать ее в форму. Можете подсказать какими способами вообще это можно сделать или в каком...

Получение данных с html страницы
Подскажите в какую сторону капать Есть html страница с таблицей Из нее нужно получить цифорки С помощью чего их от туда извлекать грубо...

Парсинг данных с html-страницы
доброго времени суток! Есть страница. Часть. <script> var member_10000035184353 = new bsoftMember("10000035184353", ...

5
 Аватар для CLEO_ROCK
71 / 71 / 23
Регистрация: 22.05.2011
Сообщений: 528
17.08.2011, 22:12
а в каких тегах или елементах HTML находятся эти слова?
0
 Аватар для atomohod
20 / 20 / 3
Регистрация: 01.04.2010
Сообщений: 57
17.08.2011, 22:15
ну во первых по какому принципу выбираются слова?

Если в общем: скачиваете страницу, переводите в текст, находите по заданым критериям нужно слово и выводите
0
SiFu
17.08.2011, 22:31
Цитата Сообщение от CLEO_ROCK Посмотреть сообщение
а в каких тегах или елементах HTML находятся эти слова?
Между <li class="navbit lastnavbit"><span> и </span></li>

У меня получается извлекать слово только с первой страницы. Как сделать так что бы бы перебор. То есть если пользователь ввел ID 1000, то после вывода слова с этой страницы, следующая страница будет с ID 1001 и так далее

ув. atomohod, у Вас есть скайп?
 Аватар для atomohod
20 / 20 / 3
Регистрация: 01.04.2010
Сообщений: 57
17.08.2011, 23:00
SiFu, https://www.cyberforum.ru/members/90577.html в разделе "связь"
0
 Аватар для Петррр
6721 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
17.08.2011, 23:01
Цитата Сообщение от SiFu Посмотреть сообщение
ув. atomohod, у Вас есть скайп?
Для подобных вопросов есть личные сообщения.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
17.08.2011, 23:01
Помогаю со студенческими работами здесь

Считывание данных с сохраненной страницы HTML
Прошу помочь в следующей ситуации. Суть проблемы : Отдельная программа считывает интернет страницу и с периодичностью в 1 сек и...

Хранить html страницы в базе данных
Здравствуйте, подскажите пожалуйста как сделать следующее дело. Я хочу сделать на подобии конструктора страниц на сайте и соответственно...

Передача данных в параметры функции из html-страницы
Добрый вечер. Не могу понять, как мне передать из input-поля данные в параметр функции. &lt;input type=&quot;text&quot;...

Запись данных из формы с HTML страницы в файл
Подскажите плиз, совсем клинить стало, как можно без использования всяческих скриптов и языков, типа ASP, PHP и т.д. записать данные из...

Загрузка данных с html страницы, которая загружается не моментально
Предмет вопроса такой: требуется получить html-код страницы, чтобы в дальнейшем выдернуть из него необходимые мне данные. Но проблема в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru