|
1 / 1 / 0
Регистрация: 06.09.2023
Сообщений: 7
|
|
Почему на некоторых сайтах, при их парсинге с помощью selenium, извлекаемые код html не полный?06.09.2023, 12:05. Показов 709. Ответов 2
Метки нет (Все метки)
Здравствуйте уважаемые форумчане! В программировании недавно и до сих пор всё трудности удавалось решить Гуглом и GPT. До этого случая)
Пытался вчера спарсить Яндекс Карты. Начиналось всё как обычно - чтобы не прибегать сразу к селениуму попробовал сделать как-то через АПИ. Апишка нужной информации мне не выдала ![]() Пришлось открывать терминал и устанавливать Selenium. Накидал по быстрому привычный код, вот алгоритм: нашёл по xPath элемент поля ввода, ввёл свой запрос и веб драйвер успешно его загрузил. На странице появился список организаций. Далее алгоритм должен снять html код с текущей страницы, сделать этот html объектом BeautifulSoup, извлечь из него интересующие меня данные и перейти по ссылке на первую в этом списке организацию (кликнув по ссылке опять же найдя её по хpath). Ошибка вылезла на строке кода с BeautifulSoup. Питон заругался на то, что нельзя применять методы прекрасного супа к объекту NoneType. Первым делом естественно проверил правильность указанных аргументов в .find() - всё было верно! Попробовал выждать время time.sleep() - тоже не помогло((. Дождаться появление на странице элемента с таким-то xPath - ошибка тайм-аута. Повторил предыдущий шаг, его уже с css селектором - опять таже ошибка. На последок извлёк этот html код, и вставил его в блокнот. Попытка поиска нужных мне участков кода в блокноте через "контрол+эф" привели к 0 найденных элементов. Какая-то бесовщина, не иначе)) Может кто уже сталкивался и подскажет. Очень на это надеюсь))
0
|
|
| 06.09.2023, 12:05 | |
|
Ответы с готовыми решениями:
2
Почему в некоторых сайтах первая строка html документа пустая? На некоторых сайтах, при нажатиях ЛКМ (каждый 3-4 клик) перекидывает на сайты с рекламой, на 2 пк на техже сайтах всё ок Почему на некоторых сайтах нельзя скопировать текст? |
|
3601 / 2742 / 355
Регистрация: 11.03.2009
Сообщений: 6,300
|
|||
| 06.09.2023, 14:14 | |||
На словах все красиво, как на практике это выглядит нужно посмотреть.
0
|
|||
|
Автоматизируй это!
|
||
| 06.09.2023, 14:16 | ||
|
0
|
||
| 06.09.2023, 14:16 | |
|
Помогаю со студенческими работами здесь
3
Почему на некоторых сайтах есть иконка, но нет файла favicon.ico (или т.п.)? При серфинге в браузерах на некоторых сайтах пропадает изображение (нет сигнала) При парсинге с помощью XDocument данные не выводятся Появляются лишние символы при сохранении страниц html при парсинге с Селениум
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|