Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.55/11: Рейтинг темы: голосов - 11, средняя оценка - 4.55
0 / 0 / 0
Регистрация: 14.11.2012
Сообщений: 60

Simple HTML DOM Parser. Что-то не совсем "Simple"

29.07.2015, 19:34. Показов 2492. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Структура RSS такая:
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<item>
<title>Batman is our hero</title>
<link>
http://site.ru/123
</link>
<pubDate>Fri, 24 Jul 2015 21:28:19 PDT</pubDate>
<media:title type="plain">Batman</media:title>
<media:rating>nonadult</media:rating>
<media:description type="html">
I'm sorry for my resent absence, I have had a lots of...
</media:description>
<media:content url="https://site.jpg" height="1107" width="722" medium="image"/>
<description>
I'm sorry for my resent absence, I have had a lots of...
</description>
</item>
Есть рабочий парсер, главное в котором:
PHP
1
2
3
4
 
foreach($html->find('media:content[medium=image]') as $el) { #Тут просто берутся все ссылки из тега media:content в котором medium="image".
    echo $el->url;
    }
Вопрос вот в чем: как комбинировать теги, то есть если мне нужно вывести ссылку, где сочетаются все эти условия:
1. Где у <media:rating> - nonadult
2. Где у <media:content> задан атрибут medium="image" (как в рабочем примере) и высота не больше 1500.

Признаюсь, голову уже сломал, пробовал как-то шаманить с media:content[medium=image][тут что-нибудь еще][и тут], но никак не получалось. В сети ответа не нашел на свой вопрос.. Поделитесь решением, пожалуйста, или просто направьте в нужную сторону..
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.07.2015, 19:34
Ответы с готовыми решениями:

Simple HTML DOM Parser
Здравствуйте.Пытаюсь освоить данную беду.И вот такой вопрос. Как спарсить страницу по url понятно. А если нужно получить данные с данной...

PHP Simple HTML DOM Parser загрузка
Добрый вечер Подскажите есть сайт и там есть div с ид tab-3 Проблема в том что содержимое подгружается после загрузки страницы...

Simple HTML DOM Parser выводит иероглифы
Помогите пожалуйста, я использую вот такой код: include_once(&quot;simple_html_dom.php&quot;); $temp =...

4
Эксперт PHP
5755 / 4134 / 1508
Регистрация: 06.01.2011
Сообщений: 11,276
30.07.2015, 12:04
Зачем Вы работаете с XML при помощи SimpleHtmlDom? Используйте DOMDocument. Или же SimpleXML.
0
0 / 0 / 0
Регистрация: 14.11.2012
Сообщений: 60
31.07.2015, 00:48  [ТС]
Цитата Сообщение от Para bellum Посмотреть сообщение
Зачем Вы работаете с XML при помощи SimpleHtmlDom? Используйте DOMDocument. Или же SimpleXML.
Спасибо за предложение, но хочется научиться именно тем способом.
Это вообще реализуемо (те условия, что я описал)?
Или в любом случае пользоваться другими способами?
0
Эксперт PHP
4925 / 3920 / 1620
Регистрация: 24.04.2014
Сообщений: 11,441
31.07.2015, 02:10
Цитата Сообщение от Dooks Посмотреть сообщение
но хочется научиться именно тем способом.
SimpleHtmlDom
а это
Кликните здесь для просмотра всего текста
Цитата Сообщение от Dooks Посмотреть сообщение
<item> <title>Batman is our hero</title> <link> http://site.ru/123 </link> <pubDate>Fri, 24 Jul 2015 21:28:19 PDT</pubDate> <media:title type="plain">Batman</media:title> <media:rating>nonadult</media:rating> <media:description type="html"> I'm sorry for my resent absence, I have had a lots of... </media:description> <media:content url="https://site.jpg" height="1107" width="722" medium="image"/> <description> I'm sorry for my resent absence, I have had a lots of... </description> </item>

не html
0
0 / 0 / 0
Регистрация: 14.11.2012
Сообщений: 60
31.07.2015, 18:49  [ТС]
Цитата Сообщение от Jewbacabra Посмотреть сообщение
не html
Я это понимаю и признаю, что лучше было бы изначально использовать SimpleXML, но на данный момент с помощью SimpleHtmlDom сделано много скриптов (писать заново придется долго), и интересует только один вопрос от знающих людей: можно ли выполнить мои условия с помощью SimpleHtmlDom или же это невозможно и нужно заново всё писать?

Добавлено через 2 часа 54 минуты
Решил всё-таки перейти на SimpleXML. Столкнулся с новой проблемой.
В SimpleHtmlDom я использовал эту строку, чтобы проверить, есть ли "следующая страница" (чтобы рекурсивно вызывать функцию):
PHP
1
2
3
4
5
6
7
8
9
10
............................
............................
............................
if(is_object($next = $html->find('atom:link[rel=next]',0))) {
$URL = $next->href;
echo $URL;
............................
............................
............................
}
А как с помощью SimpleXML проверить, существует ли строка с "atom:link[rel=next]"?

RSS такая:
Кликните здесь для просмотра всего текста
XML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
<rss xmlns:media="http://search.yahoo.com/mrss/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule" version="2.0">
<channel>
<title>
De
</title>
<link>
[url]http://www.de.com/[/url]
</link>
<description>
RSS
</description>
<atom:link type="application/rss+xml" rel="self" href="eta-stranitsa.xml"/>
<atom:link rel="next" href="sled-stranitsa.xml"/>
<item>
<title>Alexandria</title>
<link>
[url]http://de.com/[/url]
</link>
<media:title type="plain">Alexandria</media:title>
<media:rating>nonadult</media:rating>
<media:description type="html">
Painting
</media:description>
<media:content url="linktoimage.jpg" height="229" width="400" medium="image"/>
<description>
Painting
</description>
</item>


Пробую как-то так, но не получается:
PHP
1
2
3
4
5
6
foreach ($html->channel->item as $item) {
$atom =  $item->children("http://www.w3.org/2005/Atom");
if(isset($atom->link)) {
echo  $atom->link->attributes()->href;
}
}
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
31.07.2015, 18:49
Помогаю со студенческими работами здесь

Парсинг ссылок через PHP Simple HTML DOM Parser
Здравствуйте. Возникла проблема с работой данного скрипта. &lt;?php require_once 'simple_html_dom.php'; $data =...

PHP Simple HTML DOM Parser как заставить парсер работать из под каталога?
Добрый день ! Подскажите такую штуку - как их подключить этот плагин из другой директории? Необходимо перенести парсер на вп. Если я...

Не парсит. Я в отчаянии. Simple dom parser
Пчему все работает с этим url, но если беру другой 172.20.0.3:5000 сразу говорит бед и Call to a member function find() on a non-object?...

Simple dom parser. Новая версия не парсит с локального хоста
Почему на версии 1.10 Simple dom parser даный код работает, а на версии 1.5 file_get_html возвращает null? Проблема в валидности адреса? ...

PHP Simple DOM Parser Ошибка при использовании функции find
Падает скрипт на этом месте. Что можно сделать? не могу понять в чем ошибка foreach ($links as $link) { $html =...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru