|
22 / 16 / 7
Регистрация: 20.07.2010
Сообщений: 264
|
|||||||
Почему не парсит конкретный сайт?08.04.2020, 23:45. Показов 4370. Ответов 4
Метки нет (Все метки)
Учусь. Для практики сделал анализатор тайтлов.
открывается файл, запускается функция, которая парсит метатеги сайтов по урлам из файла, затем их анализирует и выдает в csv файл результат Парсится таким образом:
около 9 сайтов пропарсило как надо, а вот на 1 сайте выдает следующее: Это какая-то защита от парсинга? Или не хватает чего-то? или что это?
0
|
|||||||
| 08.04.2020, 23:45 | |
|
Ответы с готовыми решениями:
4
Парсит сайт не полностью |
|
Заклинатель змей
705 / 560 / 219
Регистрация: 30.04.2016
Сообщений: 2,605
|
|
| 08.04.2020, 23:49 | |
|
nikki4, какой сайт хоть? Больше всего похоже на неправильный SSL certificate
0
|
|
|
693 / 471 / 204
Регистрация: 22.03.2020
Сообщений: 1,051
|
|||
| 09.04.2020, 01:32 | |||
|
Как я понял, такая ошибка возникает, когда ты пытаешься отправить запрос на сайт http://somesite.com,
а тот, в свою очередь, редиректит на https://somesite.com. И тут возникает трабл. https://github.com/urllib3/urllib3/issues/869 Добавлено через 1 минуту
0
|
|||
|
35 / 32 / 16
Регистрация: 21.01.2014
Сообщений: 102
|
||||||
| 09.04.2020, 18:12 | ||||||
Сообщение было отмечено nikki4 как решение
Решение
Да, попробуйте отключить проверку сертификата. Вот так:
1
|
||||||
| 09.04.2020, 18:12 | |
|
Помогаю со студенческими работами здесь
5
Почему bs4 неверно парсит страницу? Программа, которая заходит на сайт, авторизуется и парсит информацию с сайта Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора
Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2.
Задача: уведомлять пользователя, если. . .
|
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
|