Форум программистов, компьютерный форум, киберфорум
PHP
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/3: Рейтинг темы: голосов - 3, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 01.05.2018
Сообщений: 1

Правильное составление парсера с регулярками

19.02.2020, 14:02. Показов 637. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет!

Я задумался написать парсер и нашел в сети образец именно того, что мне нужно, но как оказалось он и как пример сейчас не работает и в принципе у меня не получается подстроить. Подскажите как правильно переделать, чтобы можно было получить массивы из таблиц. Таблиц может быть множество, но в основном все они однотипны. Из названий столбцов мне нужно только значение такого типа:
<div class="r-table-liga">США. ECHL</div>

Хотя, если получим все, то выводить смогу в нужном порядке.

Вот так будет выглядеть донор: http://torres90.tmweb.ru/donor.php

Вот так сам исходник парсера, который надо адаптировать и может быть у меня что-то не подключено на хосте:
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
$str = file_get_contents('http://torres90.tmweb.ru/donor.php');
 
$trName = array(); // массив имен столбцов таблиц
$haystack = array(); // массив данных таблиц
 
if (preg_match_all("~<table[^>]*>\s*<caption>\s*([a-z]+)\s*</caption>(.+?)<tbody>(.+?)</tbody>.*?</table>~is", $str, $matches)) {
 
  /* найдены таблицы */
  foreach ($matches[3] as $k => $table) {
 
    // имена столбцов таблиц (если нужно)
    if (preg_match_all("~(<div class=['\"]D-ib[^'\"]*['\"]>([^<]*)</div>|<th[^>]*>([a-z\s]+)</th>)~is", $matches[2][$k], $th)) {
      foreach ($th[2] as $k2 => $name) {
        $thName[$matches[1][$k]][$k2] = $name ? $name : $th[3][$k2];
      }
    }
 
    /* разбор таблиц */
    if (preg_match_all("~<tr[^>]*>(.+?)</tr>~is", $table, $tr)) {
      foreach ($tr[1] as $k2 => $td) {
        if (preg_match_all("~<td[^>]*>.+?>([a-z0-9\.%]+)</[^>]+>.+?</td>~is", $td, $data)) {
          // добавляем разобранную в массив строку в общий массив данных
          $haystack[$matches[1][$k]][$k2] = $data[1];
        }
      }
    }
  }
}
print_r($haystack);
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
19.02.2020, 14:02
Ответы с готовыми решениями:

Правильное составление кода
Здравствуйте! У меня есть определенный вопрос. В данный момент я пишу сайт, на котором пользователь выполняет определенные действия. И в...

Правильное составление запроса к БД
Добрый день! Передо мной стал такой вопрос. Есть две таблицы course и course_section. В первой есть поле id, name, a во второй id,...

Правильное составление объявлений
Эффективное объявление в Бегуне будет же настолько эффективно в Я.д ?

1
9 / 8 / 2
Регистрация: 03.12.2009
Сообщений: 64
20.02.2020, 12:55
Цитата Сообщение от Torres90 Посмотреть сообщение
мне нужно только значение такого типа:
<div class="r-table-liga">США. ECHL</div>
не совсем ясно что вы хотите получить на выходе, но допустим вам надо:
<div class="r-table-liga">значение</div>

PHP
1
2
preg_match_all('/<div class="r\-table\-liga">(.+?)<\/div>/', $str, $arr);
var_dump($arr[1]); // массив искомого
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
20.02.2020, 12:55
Помогаю со студенческими работами здесь

Правильное составление функции
Помогите разобраться с функцией) простые я более менее понял ) а вот с более сложными проблема, вот код , тут меняется только кол-во...

Правильное составление резюме
Всем привет! Хочу найти работу разработчика на c# Вот думаю, надо ли в резюме указывать ссылка на гитхаб? если да то какие проекты...

Правильное составление программы
Здравствуйте, форумчане! Представляю вашему вниманию свою первую программулину на gpss...я ее вроде решил, но не пойму правильно ли?=) ...

Правильное составление ключевых слов
Добрый день, вот на одном сайте посмотрел как у них записаны ключевые слова в теге keywords и увидел вот такое: &lt;meta...

Правильное составление форматирующей строки
В общем нубский вопрос, есть класс такого вида и его метод ToString() public struct ResultData { public readonly...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru