Форум программистов, компьютерный форум, киберфорум
PHP
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.82/22: Рейтинг темы: голосов - 22, средняя оценка - 4.82
0 / 0 / 0
Регистрация: 06.12.2012
Сообщений: 7

Удаление из HTML страницы ненужных тегов вместе с содержимым

12.01.2014, 01:12. Показов 4667. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток.
Нужна функция или регулярное выражение, которое из HTML страницы удалит ненужные теги вместе с содержимым. К примеру все картинки, ссылки, формы ввода. Заранее благодарен.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
12.01.2014, 01:12
Ответы с готовыми решениями:

Удаление рекламы и ненужных тегов
Как удалить рекламу появляющуюся при выборе стандартных шаблона rhuk_milkyway. Через Firebug нашёл теги в которые вложена реклама ...

Удаление ненужных тегов в richedit (цикл для строк)
Доброго времени суток! Помогите пожалуйста написать процедуру, которая бы удаляла для каждой строки лишние теги, пример для строки ...

Удаление из строки скобок вместе со всем их содержимым
надо удалить то что в скобках вместе со скобками . составил прогу но она не пашет . помогите исправить ошибки. program laba72; uses ...

5
Автор FAQ
 Аватар для insideone
3687 / 964 / 114
Регистрация: 10.01.2010
Сообщений: 2,550
12.01.2014, 01:35
У меня получилось так:
PHP
1
2
3
4
5
6
7
8
$arRemovedTags = array(
    'a', 'iframe', 'b',
);
$removedTags = implode('|', $arRemovedTags);
 
$html = '<p>a <a>b</a> <strong>c</strong> <iframe>d</iframe></p><div><b>e</b>f</div>';
 
echo htmlspecialchars(preg_replace('~(<('.$removedTags.')>.*</('.$removedTags.')>)~U', '', $html));
0
0 / 0 / 0
Регистрация: 06.12.2012
Сообщений: 7
12.01.2014, 02:27  [ТС]
Возможно Вы что-то не поняли в задании, но если запустить код, то он просто делает выводимыми все теги. А мне нужно что бы на новой странице было все с обрабатываемой, кроме картинок, ссылок, видео, и форм(регистрации и чего-то подобного).
0
Автор FAQ
 Аватар для insideone
3687 / 964 / 114
Регистрация: 10.01.2010
Сообщений: 2,550
12.01.2014, 17:54
А если на примере? Какие входные данные и какие должны быть выходные данные?
С картинками правда данная регулярка не справится
0
0 / 0 / 0
Регистрация: 06.12.2012
Сообщений: 7
13.01.2014, 03:34  [ТС]
к примеру, если взять сайт http://habrahabr.ru/ то должно остаться только название постов и сам текст. Больше ничего быть не должно.
А вообще есть начальная форма куда ввожу ссылку на сайт и оно должно так обрабатывать любой сайт. Но это в идеале.
0
Автор FAQ
 Аватар для insideone
3687 / 964 / 114
Регистрация: 10.01.2010
Сообщений: 2,550
14.01.2014, 02:29
Каждый сайт имеет свою HTML-структуру и универсального механизма реализовать не получится.
Из коробки PHP умеет простое strip_tags
А проанализировать данные страницы и выбрать нужное можно многими способами, например SimpleXML
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
14.01.2014, 02:29
Помогаю со студенческими работами здесь

Удаление тегов из ХТМЛ-страницы
Добрый день есть код: var Form1: TForm1; HTML : ustring; ////////////////////////////////// procedure...

Удаление HTML-тегов из текста
Здравствуйте помогите сделать пожалуйста программу с помощью WindowsForm. Очистка текста от html-тегов. Разработанная система должна...

Вырезание всех тегов со страницы html
Добрый вечер У меня есть функция которая вырезает всё между символами &lt; &gt; но не вырезает ничего между &lt;script&gt;&lt;/script&gt; и...

Регулярные выражения: удаление html-тегов
Как с помощью регулярных выражений избавиться от вывода в текст HTML-тегов? т.е. в программу на данном этапе выводится текст типа...

Удаление выбранных тегов (html-страница)
В текстовом файле хранится сохраненная html страница. нужно проверить её и удалить теги, выбранные пользователем имеется код программы...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru