|
10 / 10 / 5
Регистрация: 31.01.2015
Сообщений: 120
|
|||||||||||
Парсинг HTML01.02.2017, 17:48. Показов 2139. Ответов 4
Метки нет (Все метки)
Ну в общем, довольно заезженная тема, проведя на просторах интернета несколько часов, я это понял. Но вопросы все же остались. Суть проблемы, нужно пропарсить сайт - вытащить фотки и названия их соответственно (имя файла == имя продукта). Проблема в том, что сайт табличный и чтобы не перепутать пункт (имя файла == имя продукта) я вытаскиваю целые элементы посредством grab
![]() З.Ы. Я не тупой, мне просто нужен пинок в правильном направлении
0
|
|||||||||||
| 01.02.2017, 17:48 | |
|
Ответы с готовыми решениями:
4
Парсинг html Парсинг html страницы |
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 01.02.2017, 18:40 | |
|
Вы или код дайте или сайт, чтобы нам было с чем работать.
0
|
|
|
10 / 10 / 5
Регистрация: 31.01.2015
Сообщений: 120
|
|||||||||||||||||
| 01.02.2017, 19:21 [ТС] | |||||||||||||||||
|
http://complexpro.ru/category_3.html имеется подобный сайт, мне нужна информация о товарах, конкретнее - его имя и ссылку на изображение. Все эти данные хранятся в таблице, блок
Если я неправильно выбрал направление - я с Питоном на Вы
0
|
|||||||||||||||||
|
|
|||||||||||
| 01.02.2017, 20:49 | |||||||||||
Сообщение было отмечено Golden Jack как решение
Решение
Не помню как это делается в grab, а в православном lxml так:
Собственно, результат парсинга:
1
|
|||||||||||
|
10 / 10 / 5
Регистрация: 31.01.2015
Сообщений: 120
|
|
| 01.02.2017, 20:53 [ТС] | |
|
Благодарю, это именно то, что было нужно. Просто по lxml мало толковых примеров на русском, а с инглишом у меня проблемы, два пишем три в уме. Спасибо
0
|
|
| 01.02.2017, 20:53 | |
|
Помогаю со студенческими работами здесь
5
Парсинг и замена текста в html (python3) Парсинг html
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|