31 / 31 / 4
Регистрация: 31.10.2013
Сообщений: 155
|
|
1 | |
Парсер страниц03.12.2013, 11:42. Показов 887. Ответов 2
Метки нет (Все метки)
Здравствуйте, хочу распарсить несколько страниц, но парсить их хочу в 3 Этапа,
1. Вытащить нужный фрагмет с сайта(Большая таблица) 2. Перевести ее, и сохранить во временный файл, или даже базу 3. Оставшийся кусок допарсить полностью Планирую сделать это PHPHTMLDOM парсер Но умеет ли он работать с куском кода из фийла? Или может есть менее ресурсоемкий и надежный способ? Добавлено через 29 минут Вопрос в догонку, не могу понять как через PHPHTMLDOM выводить элемент полностью
0
|
03.12.2013, 11:42 | |
Ответы с готовыми решениями:
2
Парсер страниц Вывести содержимое 5 000 000 страниц, а парсер останавливается на 400 Не срабатывает условие при смене страниц(пагинация страниц) Разбиение на страницы с переходом по номерам страниц, с отображением полного количества страниц |
PHP developer
259 / 157 / 26
Регистрация: 20.03.2013
Сообщений: 1,018
|
|
03.12.2013, 12:11 | 2 |
Почитайте про phpQuery. (http://code.google.com/p/phpquery/)
Добавлено через 1 минуту Вы подразумеваете парсинг информации в файле? Если да то думаю может, а вообще предлагаю вариант выше.
0
|
31 / 31 / 4
Регистрация: 31.10.2013
Сообщений: 155
|
||||||
03.12.2013, 14:18 [ТС] | 3 | |||||
Сообщение было отмечено dmirtyi как решение
Решение
С данной библиотекой получилось сделать то, что я хотел, но возникла проблема с кодировкой
Добавлено через 7 минут чтоб файл отображался корректно надо выставить кодировку euc-kr(сайт на корейском) Но в данном случае не правильно отображаются Латинские символы, как можно решить проблему с 2мя кодировками на странице сразу? Добавлено через 1 час 19 минут
0
|
03.12.2013, 14:18 | |
03.12.2013, 14:18 | |
Помогаю со студенческими работами здесь
3
Пагинация страниц без добавления разрыв страниц Парсер страниц Парсер страниц VK парсер на 1000 страниц Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |