Как в селениуме из яндекса взять домен? Ошибся в xpath?

@nikki4 · Регистрация: 20.07.2010

Студворк — интернет-сервис помощи студентам

Учусь, написал следующее, но результат пустой.

задача: через селениум вытащить список всех доменов по запросу в топ10.

Code
1
2
3
4
5
<div class="organic__path">
<a class="path__item">
<b>sait.ru</b>
</a>
</div>

для этого такой запрос сделал:

Python
1
serp=driver.find_elements_by_xpath("//div[@class='organic__path']/a/b/text()")

но выдает пусто.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from time import sleep
import os
 
path=os.getcwd()
firefox_driver_path=os.path.join(path, 'geckodriver.exe')
 
chrome_options = webdriver.FirefoxOptions()
#chrome_options.add_argument("--headless")
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--ignore-certificate-errors")
 
 
key='купить стол'
url='https://yandex.ru/search/?lr=10&text='
 
driver = webdriver.Firefox(executable_path=firefox_driver_path, options=chrome_options)
driver.get(f"{url}{key}")
 
 
links=[]
serp=driver.find_elements_by_xpath("//div[@class='organic__path']/a/b/text()")
for el in serp:
    links.append(el)
    print(el)
driver.close()
print(links)

@Welemir1 · 16.05.2020, 22:44

Сообщение от nikki4

driver.close()

driver.quit()

я так и не понял задачу, первые 10 ссылок надо?

@nikki4 · 16.05.2020, 22:46 **[ТС]**

Сообщение от Welemir1

я так и не понял задачу, первые 10 ссылок надо?

надо проверить позицию сайта по запросу.
а для этого сперва собрать список доменов в топе органической выдачи (без рекламы, карт, картинок)
Вот только начал -как чет не работает, а почему не понял.
Может хпас не верный

@nikki4 · 17.05.2020, 17:16 **[ТС]**

Я понял свою ошибку. Оказывается если несколько классов, то надо указывать containts и запятую вместо знака равно. либо все классы указывать

вот так работает

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from time import sleep
import os
 
path=os.getcwd()
firefox_driver_path=os.path.join(path, 'geckodriver.exe')
 
chrome_options = webdriver.FirefoxOptions()
chrome_options.add_argument("--headless")
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--ignore-certificate-errors")
 
 
key='купить стол'
url='https://yandex.ru/search/?lr=10&text='
 
driver = webdriver.Firefox(executable_path=firefox_driver_path, options=chrome_options)
driver.get(f"{url}{key}")
 
 
links=[]
serp=driver.find_elements_by_xpath("//a[@class='link link_theme_outer path__item i-bem']")
for el in serp:
    links.append(el.get_attribute('text'))
driver.quit()
print(links)

Новые блоги и статьи Все статьи Все блоги /
Настройки VS Code Loafer 13.04.2026 { "cmake. configureOnOpen": false, "diffEditor. ignoreTrimWhitespace": true, "editor. guides. bracketPairs": "active", "extensions. ignoreRecommendations": true, . . .	Оптимизация кода на разграничение прав доступа к элементам формы Maks 13.04.2026 Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2. Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива. Было так:. . .	Контроль заполнения и очистка дат в зависимости от значения перечислений Maks 12.04.2026 Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .	Архитектура слоя интернета для сервера-слоя. Hrethgir 11.04.2026 В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа Maks 10.04.2026 Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .	Очистка реквизитов документа при копировании Maks 09.04.2026 Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .	модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий anaschu 08.04.2026 https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI	Блокировка документа от изменений, если он открыт у другого пользователя Maks 08.04.2026 Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .