|
0 / 0 / 0
Регистрация: 23.10.2012
Сообщений: 5
|
|
Вытаскивание информации с другого сайта02.03.2016, 18:29. Показов 22586. Ответов 41
Метки нет (Все метки)
Доброго времени суток!
Есть сторонний сайт, на котором выводится актуальные расписания предстоящих матчей. Хочу забрать себе информацию из таблицы, но не могу понять, как это сделать. сURL'ом забрал всю страницу, а как дальше из неё выбрать нужную информацию, не могу понять. Таблица обладает уникальным ID("<table id="gb-matches" class="simple gamelist "> "). Натолкните на правильный путь новичка, всю голову уже сломал :'(
0
|
|
| 02.03.2016, 18:29 | |
|
Ответы с готовыми решениями:
41
Перенос информации с другого сайта Сбор информации с другого сайта Вставка информации с другого сайта |
|
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
|
||
| 02.03.2016, 19:17 | ||
|
Прочитать все пункты по ссылке от корки до корки в хронологическом порядке, желательно 3 раза.
0
|
||
|
Hello Kitty
|
|
| 02.03.2016, 19:41 | |
|
0
|
|
|
3687 / 964 / 114
Регистрация: 10.01.2010
Сообщений: 2,550
|
|
| 02.03.2016, 20:27 | |
|
Не по теме: pav1uxa, регулярки это хорошо, но для новичка жестоко. Неплохой вариант: https://github.com/olamedia/nokogiri
0
|
|
|
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
|
||
| 02.03.2016, 20:33 | ||
|
Не по теме: Ну как посмотреть :) По мне так для новичка как раз будет полезнее узнать про регулярные выражения сначала. Нежели сразу в лоб применять классы для работы с DOM-документами, при этом не понимая ни DOM, ни ООП...
0
|
||
| 02.03.2016, 20:44 | |
|
Не по теме: Я про то что регулярки это хорошо и изучить их конечно нужно, но для парсинга - не лучший вариант. Ну в конце концов можно и XML распарсить ими, но неудобно же, что мучаться-то
0
|
|
|
1943 / 1768 / 825
Регистрация: 23.01.2014
Сообщений: 6,230
|
||
| 02.03.2016, 20:52 | ||
|
Не по теме: Ну и я не спорю что для таких вещей использовать регулярные выражения - не правильно. Кстати в PHP есть встроенные классы для работы с DOM-документами - DOMDocument и SimpleXMLElement (хотя практика показывает что сторонние библиотеки удобнее, ну да не важно).
0
|
||
|
Фрилансер
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
|
|||||||
| 02.03.2016, 21:30 | |||||||
Сообщение было отмечено Олеша как решение
Решение
5
|
|||||||
| 02.03.2016, 21:53 | |
|
Не по теме: И работать такая штука будет в разы быстрее чем регулярные выражения, DOMDocument с SimpleXML, и тем более всякие сторонние библиотеки :D
0
|
|
|
2 / 2 / 0
Регистрация: 27.01.2013
Сообщений: 106
|
|
| 08.03.2016, 21:47 | |
|
Кто-нибудь помогите решить проблему кодировки для кода в посте #8
0
|
|
|
Фрилансер
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
|
|
| 08.03.2016, 22:17 | |
|
0
|
|
|
2 / 2 / 0
Регистрация: 27.01.2013
Сообщений: 106
|
|
| 09.03.2016, 05:23 | |
|
Мой сайт в кодировке win-1251. Большинство сайтов с которых буду парсить в UTF-8.
Что такое bom - не знаю...
0
|
|
|
2 / 2 / 0
Регистрация: 27.01.2013
Сообщений: 106
|
||||||
| 12.03.2016, 15:06 | ||||||
|
Попытался использовать код из поста #8 для вывода подряд содержимого нескольких сайтов (см. ниже мой код), но при этом, как только в коде появляется четвёртый URL (строка 21), скрипт, отрабатывая второй URL, выводит ноль. Как исправить код, чтобы ноль не выводился?
0
|
||||||
|
Фрилансер
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
|
|
| 12.03.2016, 15:35 | |
|
1
|
|
|
2 / 2 / 0
Регистрация: 27.01.2013
Сообщений: 106
|
|
| 12.03.2016, 19:59 | |
|
Тег <table> там есть, что и удивляет!
Добавлено через 9 минут Хотя, проверю ещё раз и отпишусь. Добавлено через 4 часа 1 минуту Да, действительно, дело было в <table>, но при указании дивов - появляется сообщение об ошибке. Получается с дивами в начальном и конечном тегах данный скрипт не работает?
0
|
|
|
Фрилансер
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
|
|||||
| 12.03.2016, 21:29 | |||||
|
Добавлено через 46 секунд
1
|
|||||
|
2 / 2 / 0
Регистрация: 27.01.2013
Сообщений: 106
|
|
| 13.03.2016, 20:14 | |
|
Не могу спарсить, т.к. одинаковое сочетание тегов встречается несколько раз на одной странице. Что посоветуете?
0
|
|
|
Фрилансер
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
|
|
| 13.03.2016, 20:18 | |
|
0
|
|
|
85 / 78 / 32
Регистрация: 26.11.2015
Сообщений: 481
|
||||||
| 13.03.2016, 22:59 | ||||||
|
Не пойму в чем "жесткость" для новичка освоить регулярные выражения. Прочитать придется меньше чем будет написано нерабочих костылей из str_pos или domDocument.
конкретно по вопросу:
0
|
||||||
|
Software Engineer
328 / 328 / 54
Регистрация: 23.09.2014
Сообщений: 976
|
|
| 14.03.2016, 07:21 | |
|
Олеша, гуглишь phpQuery, делаешь по примерам парсер, радуешься.
0
|
|
| 14.03.2016, 07:21 | |
|
Помогаю со студенческими работами здесь
20
Чтение информации с другого сайта Шаблон получения информации с другого сайта Вытаскивание информации из базы Вытаскивание информации из другой базы данных вытаскивание информации из программы и запись на фтп в файл Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|