Форум программистов, компьютерный форум, киберфорум
PHP
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
1 / 1 / 1
Регистрация: 21.12.2014
Сообщений: 195

Запар с парсингом

17.04.2015, 17:57. Показов 563. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет. Такой вопрос..написал парсер, все работает, но вот проблема в том, что в таблице он парсит только верхнюю строчку, а все остальное оставляет будто бы без внимания. вот код
PHP/HTML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
<!DOCTYPE html>
<html>
<head>
    <title>Test</title>
</head>
<body>
<?php
require_once 'simple_html_dom.php';
set_time_limit(0);
 
   $avtor = file_get_html('http://rupoem.ru/');
   $collection = $avtor->find('#ctl00_ContentPlaceHolder1_DataList1', 0);
        foreach($collection->find('a') as $link){
   
   $links = $link->href;
   $array_links[] = $links;
   $name_avtor = strip_tags($link);
   $array_name[] = $name_avtor;//массивы получены
}
     }
 
     function links ($links){
   $avtor_page = file_get_html("http://rupoem.ru/$links");
   $versi = $avtor_page->find('#ctl00_ctl00_ContentPlaceHolder1_ContentPlaceHolder2_DataList3', 0);
         foreach($versi->find('a') as $vers){
   $link_vers = $vers->href;
   $array_vers_link[] = $link_vers;
   $name_vers = strip_tags($link_vers);
   $array_name_vers[] = $name_vers;
   }
         for($i = 0; $i < count($array_vers_link); $i++){
      echo $array_vers_link[$i].'<br>';
     }
}   
   $size = count($array_links);
         for($i = 0; $i < $size; $i++){
     links($array_links[$i]);
}
 
   $array_links->clear(); 
     unset($array_links);
   $array_name->clear(); 
     unset($array_name);
   $array_vers_link->clear(); 
     unset($array_vers_link);
   $array_name_vers->clear(); 
     unset($array_name_vers);
 
?>
 
<br>
</body>
</html>
вот исходный код таблицы, той что на сайте
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
<table id="ctl00_ContentPlaceHolder1_DataList1" class="menuAuthor" cellspacing="0" border="0" width="100%">
    <tr>
        <td>&raquo; <a href='/aliger/' title='Стихи Алигер Маргарита'>Алигер Маргарита</a></td><td>&raquo; <a href='/gudzenko/' title='Стихи Гудзенко Семен'>Гудзенко Семен</a></td><td>&raquo; <a href='/loxvickaya/' title='Стихи Лохвицкая Мирра'>Лохвицкая Мирра</a></td><td>&raquo; <a href='/rubcov/' title='Стихи Рубцов Николай'>Рубцов Николай</a></td>
    </tr><tr>
        <td>&raquo; <a href='/annenskij/' title='Стихи Анненский Иннокентий'>Анненский Иннокентий</a></td><td>&raquo; <a href='/gumilev/' title='Стихи Гумилев Николай'>Гумилев Николай</a></td><td>&raquo; <a href='/lugovskoj/' title='Стихи Луговской Владимир'>Луговской Владимир</a></td><td>&raquo; <a href='/ryleev/' title='Стихи Рылеев Кондратий'>Рылеев Кондратий</a></td>
    </tr><tr>
        <td>&raquo; <a href='/antokolskij/' title='Стихи Антокольский Павел'>Антокольский Павел</a></td><td>&raquo; <a href='/davydov/' title='Стихи Давыдов Денис'>Давыдов Денис</a></td><td>&raquo; <a href='/majkov/' title='Стихи Майков Аполлон'>Майков Аполлон</a></td><td>&raquo; <a href='/samojlov/' title='Стихи Самойлов Давид'>Самойлов Давид</a></td>
    </tr><tr>
        <td>&raquo; <a href='/ancharov/' title='Стихи Анчаров Михаил'>Анчаров Михаил</a></td><td>&raquo; <a href='/delvig/' title='Стихи Дельвиг Антон'>Дельвиг Антон</a></td><td>&raquo; <a href='/mandelshtam/' title='Стихи Мандельштам Осип'>Мандельштам Осип</a></td><td>&raquo; <a href='/svetlov/' title='Стихи Светлов Михаил'>Светлов Михаил</a></td>
    </tr><tr>
        <td>&raquo; <a href='/apuxtin/' title='Стихи Апухтин Алексей'>Апухтин Алексей</a></td><td>&raquo; <a href='/dementev/' title='Стихи Дементьев Андрей'>Дементьев Андрей</a></td><td>&raquo; <a href='/martynov/' title='Стихи Мартынов Леонид'>Мартынов Леонид</a></td><td>&raquo; <a href='/severyanin/' title='Стихи Северянин Игорь'>Северянин Игорь</a></td>
    </tr><tr>
        <td>&raquo; <a href='/asadov/' title='Стихи Асадов Эдуард'>Асадов Эдуард</a></td><td>&raquo; <a href='/derzhavin/' title='Стихи Державин Гаврила'>Державин Гаврила</a></td><td>&raquo; <a href='/marshak/' title='Стихи Маршак Самуил'>Маршак Самуил</a></td><td>&raquo; <a href='/selvinskij/' title='Стихи Сельвинский Илья'>Сельвинский Илья</a></td>
    </tr><tr>
        <td>&raquo; <a href='/aseev/' title='Стихи Асеев Николай'>Асеев Николай</a></td><td>&raquo; <a href='/dolmatovskij/' title='Стихи Долматовский Евгений'>Долматовский Евгений</a></td><td>&raquo; <a href='/matveeva/' title='Стихи Матвеева Новелла'>Матвеева Новелла</a></td><td>&raquo; <a href='/simonov/' title='Стихи Симонов Константин'>Симонов Константин</a></td>
    </tr><tr>
        <td>&raquo; <a href='/axmadulina/' title='Стихи Ахмадулина Белла'>Ахмадулина Белла</a></td><td>&raquo; <a href='/drunina/' title='Стихи Друнина Юлия'>Друнина Юлия</a></td><td>&raquo; <a href='/mayakovskij/' title='Стихи Маяковский Владимир'>Маяковский Владимир</a></td><td>&raquo; <a href='/sluckij/' title='Стихи Слуцкий Борис'>Слуцкий Борис</a></td>
    </tr><tr>
        <td>&raquo; <a href='/axmatova/' title='Стихи Ахматова Анна'>Ахматова Анна</a></td><td>&raquo; <a href='/dudin/' title='Стихи Дудин Михаил'>Дудин Михаил</a></td><td>&raquo; <a href='/mezhirov/' title='Стихи Межиров Александр'>Межиров Александр</a></td><td>&raquo; <a href='/sluchevskij/' title='Стихи Случевский Константин'>Случевский Константин</a></td>
    </tr><tr>
        <td>&raquo; <a href='/bagrickijV/' title='Стихи Багрицкий Всеволод'>Багрицкий Всеволод</a></td><td>&raquo; <a href='/evtushenko/' title='Стихи Евтушенко Евгений'>Евтушенко Евгений</a></td><td>&raquo; <a href='/mej/' title='Стихи Мей Лев'>Мей Лев</a></td><td>&raquo; <a href='/smelyakov/' title='Стихи Смеляков Ярослав'>Смеляков Ярослав</a></td>
    </tr><tr>
        <td>&raquo; <a href='/gorkij/' title='Стихи Горький Максим'>Горький Максим</a></td><td>&raquo; <a href='/lermontov/' title='Стихи Лермонтов Михаил'>Лермонтов Михаил</a></td><td>&raquo; <a href='/rzhevskij/' title='Стихи Ржевский Алексей'>Ржевский Алексей</a></td><td>&raquo; <a href='/schipachev/' title='Стихи Щипачев Степан'>Щипачев Степан</a></td>
    </tr><tr>
        <td>&raquo; <a href='/grebenka/' title='Стихи Гребенка Евгений'>Гребенка Евгений</a></td><td>&raquo; <a href='/livshic/' title='Стихи Лившиц Владимир'>Лившиц Владимир</a></td><td>&raquo; <a href='/rozhdestvenskijV/' title='Стихи Рождественский Всеволод'>Рождественский Всеволод</a></td><td>&raquo; <a href='/erenburg/' title='Стихи Эренбург Илья'>Эренбург Илья</a></td>
    </tr><tr>
        <td>&raquo; <a href='/griboedov/' title='Стихи Грибоедов Александр'>Грибоедов Александр</a></td><td>&raquo; <a href='/lomonosov/' title='Стихи Ломоносов Михаил'>Ломоносов Михаил</a></td><td>&raquo; <a href='/rozhdestvenskij/' title='Стихи Рождественский Роберт'>Рождественский Роберт</a></td><td>&raquo; <a href='/yazykov/' title='Стихи Языков Николай'>Языков Николай</a></td>
    </tr><tr>
        <td>&raquo; <a href='/grigorev/' title='Стихи Григорьев Аполлон'>Григорьев Аполлон</a></td><td>&raquo; <a href='/lorka/' title='Стихи Лорка Федерико'>Лорка Федерико</a></td><td>&raquo; <a href='/rostopchina/' title='Стихи Ростопчина Евдокия'>Ростопчина Евдокия</a></td><td>&raquo; <a href='/yashin/' title='Стихи Яшин Александр'>Яшин Александр</a></td>
    </tr>
</table>
Т е он забирает имена и ссылки на стихи, после функция переходит по всем ссылкам, по крайней мере должна, но она проходит только по первой строчке и на этом останавливливается...
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.04.2015, 17:57
Ответы с готовыми решениями:

Непонятки с парсингом
Когда скрипт на вывод такой адрес: http://hotline.ua/knigi-kompyuter/izuchaem-python-izd4-55262/ceni/ - все происходит так как и...

Беда с парсингом
Суть проблемы, и непонятка вот в чем, есть сайт риа-новости, необходимо вытащить некоторые эл-ты. Если в браузере просмотреть код страницы,...

Невыходит с парсингом
Всем доброй ночи, прошу помощи. Не пойму почему file_get_contents говорит - &quot;не удалось открыть поток&quot; Ведь ссылка такая есть и...

2
Эксперт PHP
5755 / 4134 / 1508
Регистрация: 06.01.2011
Сообщений: 11,276
18.04.2015, 07:30
Цитата Сообщение от Лукаа Посмотреть сообщение
она проходит только по первой строчке и на этом останавливливается...
В смысле? Да причин может быть море просто. Тут отлаживать надо.
http://phpfaq.ru/debug
0
1 / 1 / 1
Регистрация: 21.12.2014
Сообщений: 195
18.04.2015, 19:44  [ТС]
Вот наши авторы, по которым он должен пробежаться

Он проберает алигер, затем Гудзенко, Мирра и Рубцов, что примечательно - он проходит по первой строке. может проблема в том, что они в таблице, хотя это должно быть все равно, я же взял ссылки и засовывал их массив..блин, не знаю, буду продолжать ковыряться
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.04.2015, 19:44
Помогаю со студенческими работами здесь

Помогите с парсингом
Есть страничка &lt;!DOCTYPE html&gt; &lt;html&gt; &lt;head&gt; &lt;meta http-equiv=&quot;X-UA-Compatible&quot; content=&quot;IE=edge,chrome=1&quot;/&gt; &lt;title&gt;Андер...

Помогите с парсингом С++!!!
Народ помогите с парсингом я в этом деле жесткий нуб скиньте ссылки на книжки какие-нибудь где есть что то на эту тему буду благодарен!!!

Беда с парсингом
в приложении при запуске в onCreate, должны динамически создаваться кнопки исходя из количества эл-то String , этот массив возвращается в...

Проблема с парсингом
Добрый день. Пытаюсь спарсить архив тендеров. https://www.nornickel.ru/suppliers/tenders/central/?archive=Y Вот фрагмент...

Калькулятор с парсингом строки
Добрый день, дорогие программисты помогите написать калькулятор. Я ввожу строку например 5+8/7*10 и он должен посчитать. Нужно числа...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Загрузка PNG-файла с альфа-каналом с помощью библиотеки SDL3_image на Android
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru