Форум программистов, компьютерный форум, киберфорум
Софт: Интернет и сеть, браузеры
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.92/13: Рейтинг темы: голосов - 13, средняя оценка - 4.92
0 / 0 / 0
Регистрация: 06.07.2009
Сообщений: 27

Как быстро скопировать части текста, имеющие одно и то же местоположение с большого кол-ва web-страниц?

10.02.2010, 22:27. Показов 2736. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Допустим, у меня есть огромное количество однотипных web-страниц, т. е., например, страницы одного сайта, отличающиеся только средней частью, шапка и боковые колонки одинаковые. Существуют ли какие-нибудь программы, с помощью которых можно легко вытащить со всех этих страниц только часть текста, находящегося в среднем поле (может быть, из шапки и колонок тоже что-то) и имеющего одинаковое местоположение и вставить, например, в Word? Разумеется, сначала где-то задав параметры нужных строк, а потом чтобы из всех страниц автоматически копировались только нужные фрагменты текста.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
10.02.2010, 22:27
Ответы с готовыми решениями:

Excel-2003: Как быстро задать параметры печати для большого кол-ва страниц?
Здравствуйте! Модет быть, кто-нибудь подскажет? Проблема такая: в Excel-2003 мой макрос создает много (50-200) страниц. При выводе на...

Копирование части текста из большого лог-файла
Всем форумчанам привет. Кодить на питоне начал недавно, и вот появилась проблемка. Надо чтобы программа из большого лог файла вывела всю...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
0 / 0 / 0
Регистрация: 06.07.2009
Сообщений: 27
22.02.2010, 19:01  [ТС]
Продолжаю тему.

Может быть, можно как-то заставить Firefox или другой обозреватель загружать только определенные (заданные мной) теги с каждой web-страницы? Можно ли заставить обозреватель грузить страницы без ссылок, то есть чтобы текст ссылки оставался, но сама ссылка не работала?
0
Режиссер
 Аватар для Ursulla
294 / 29 / 2
Регистрация: 18.02.2010
Сообщений: 197
22.02.2010, 19:32
Впервый раз встречаюсь с таким странным запросом... хотя все вполне логично, но.. вроде бы нет таких программ... по сему ручками, парень ручками...(может я и ошибаюсь), но таких браузеров я не встречала
0
0 / 0 / 0
Регистрация: 06.07.2009
Сообщений: 27
24.03.2010, 00:01  [ТС]
Добрый день! Хочу еще раз повторить свой вопрос, немного по-другому сформулировав.

У меня есть много однотипных web-страниц с одинаковым составом тегов, отличающихся только текстом, заключенным в теги. Мне нужно только вытащить текст из одинаковых тегов со всех этих страниц и сохранить его в Блокнот или Ворд.

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<?php
 
$files = array(
 'test1.html',
 'test2.html'
);
$text = array();
foreach( $files as $filename) {
 $html = file_get_contents( $filename );
 if (preg_match('~<ul>(.*?)</ul>~s', $html, $match))
   $text[ $filename ] = $match[1];
}
echo implode('<br/>', $text);
 
?>
Но я не имею понятия, что делать с тем набором символов, который предлагается в ответе. Что это? Что с этим делать? Вроде бы, это какая-то программа, но как она работает? Извините за дилетантский вопрос, но если это программа, то это же просто текст (ну, вообще-то, программы и есть текст, да, понятно), только не понятно, что в таком случае будет служить диалоговым окном? Т. е. где указывать путь к своим файлам, из которых будет извлекаться фрагмент текста?
0
0 / 0 / 0
Регистрация: 06.07.2009
Сообщений: 27
05.01.2011, 02:19  [ТС]
Объясню поконкретнее и попроще. Короче, есть сайт (торрент-трекер), где есть множество фильмов, игр и другого софта. Мне нужно выдрать со всего сайта только одни названия этих фильмов, игр и др. и поместить их в вордовский файл, чтобы получить текстовый список имеющегося контента.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Ответ Создать тему
Новые блоги и статьи
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2. Данный документ берёт данные из другого нетипового документа. . .
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать программный контроль на предмет проведения документа. . .
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: 1. Реализовать контроль заполнения реквизита. . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru