|
2 / 2 / 3
Регистрация: 17.12.2014
Сообщений: 43
|
||||||
Парсер на php не совсем корректно работает07.07.2015, 13:26. Показов 1240. Ответов 9
Метки нет (Все метки)
Написал парсер на php. но столкнулся с некоторыми сложностями.
Есть сайт с которого я подтягивая ссылки разделов. По которым потом перехожу и подтягивая ссылки пагинатора, с которых потом уже непосредственно вытаскивая данные. В чем непосредственно сложность: сам пагинатор выглядит вот так: <<В начало <Предыдущая 1 2 3 4 5 6 7 8 9 10 Следующая> В конц>> Таким образом когда мы токо переходим по ссылке раздела мы попадаем на первую страничку, в этот момент рабочих ссылок 11 но поскольку 2 ссылка имеет такой же адрес как и Следующая> то мы перебираем массив и удаляем одинаковые элементы массива. что бы перейти к следующим 10 ссылкам нам необходимо попасть на 10 ссылку и тогда Следующая> будет иметь адрес для перехода на следующие странички (как то так объяснить тяжело работает limit=20&limitstart=20 каждая ссылка увеличение на 20 вот). и активных ссылок становиться больше потому что теперь активной становиться и ссылка <Предыдущая, а когда перейдем к слудующим 10 страничкам то активна будет и ссылка В начало. Переходы эти все я сделал, но при каждом "сканировании" подхватываются ссылки <<В начало и В конц>>, таким образом при выводе или добавлении данных в БД. данные дублируются. что не есть хорошо. В этом и заключается сложность как избежать ненужного дублирования данных?
0
|
||||||
| 07.07.2015, 13:26 | |
|
Ответы с готовыми решениями:
9
Не совсем корректно работает Like не совсем корректно работает Не совсем корректно работает программа |
|
68 / 68 / 23
Регистрация: 17.02.2015
Сообщений: 397
|
|
| 07.07.2015, 13:54 | |
|
Получи значение последней страницы (10) и парси 10 страниц
0
|
|
|
2 / 2 / 3
Регистрация: 17.12.2014
Сообщений: 43
|
||||||||||||||||
| 07.07.2015, 16:08 [ТС] | ||||||||||||||||
|
А как мне это прописать что б парсить только 10 страничек?
Добавлено через 1 час 57 минут
Эта часть добавляет в конечный массив которые потом выводит!
0
|
||||||||||||||||
|
172 / 167 / 75
Регистрация: 21.11.2014
Сообщений: 1,490
|
|
| 07.07.2015, 23:47 | |
Сообщение было отмечено kisenko как решение
Решение
блин, так много буков.. сорри - не стал раскуривать все, но мысль такая: ссылки 1 2 3 4 и т.д. скорее всего имеют какой-нить единый вид типа http://site.ru/blabla/page.php?id=1, http://site.ru/blabla/page.php?id=2, ну и т.д.
Так же? Чего бы не пойти "В конц>>", понять скриптом, сколько всего страниц и циклом их перебрать?
0
|
|
|
2 / 2 / 3
Регистрация: 17.12.2014
Сообщений: 43
|
|||||||||||
| 08.07.2015, 11:08 [ТС] | |||||||||||
|
Мысль неплохая, сейчас попытаюсь это реализовать это реализовать!
Добавлено через 1 час 13 минут Вот когда мы вытащили ссылки пагинатора, ищем последнюю ссылку узнаем сколько их всего и потом при обработке цыкла.
0
|
|||||||||||
|
172 / 167 / 75
Регистрация: 21.11.2014
Сообщений: 1,490
|
|
| 08.07.2015, 11:46 | |
|
а зачем бить по 20 ссылок? Чего бы все не обработать сразу?
0
|
|
|
2 / 2 / 3
Регистрация: 17.12.2014
Сообщений: 43
|
||||||
| 08.07.2015, 12:34 [ТС] | ||||||
0
|
||||||
|
172 / 167 / 75
Регистрация: 21.11.2014
Сообщений: 1,490
|
||||||
| 08.07.2015, 12:39 | ||||||
Сообщение было отмечено kisenko как решение
Решение
пройдите циклом в 1140 шагов по ссылкам
index.php/wipers1.html?category_id=89&page=shop.br owse&limit=1&limitstart=1 index.php/wipers1.html?category_id=89&page=shop.br owse&limit=1&limitstart=2 index.php/wipers1.html?category_id=89&page=shop.br owse&limit=1&limitstart=3 и т.д. что-то типа
0
|
||||||
|
2 / 2 / 3
Регистрация: 17.12.2014
Сообщений: 43
|
||||||
| 08.07.2015, 13:11 [ТС] | ||||||
|
Laroux - ты гений!
я конечно немного переделал под себя потому что мне не под одну ссылку а под все разделы нужно подганять но ты меня подтолкнул в нужную сторону спасибо!!! Вот код может кому то интересно будет:
0
|
||||||
| 08.07.2015, 13:12 | |
|
0
|
|
| 08.07.2015, 13:12 | |
|
Помогаю со студенческими работами здесь
10
Код работает не совсем корректно со строками Программа не завершается и не совсем корректно работает Реестр, вроде и работает но не совсем корректно Написал програму, но она не совсем корректно работает Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|