|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||||||||||||||||||||||||||
Поиск нужных мне данных в html коде01.02.2025, 18:30. Показов 2414. Ответов 18
Метки нет (Все метки)
Добрый вечер!
скрипт питона получает такой хтмл код, мне из него нужно достать ссылку yasaka.nyc
как мне править регулярку в скрипте, ищу по названию класса y-css-14ckas3 но не получается вытащить ссылку , что не так с регулякрой поиска?
То же самое и с номером телефона ищу по классу y-css-19xonnr не получается достать данные
0
|
|||||||||||||||||||||||||||||||
| 01.02.2025, 18:30 | |
|
Ответы с готовыми решениями:
18
Как пропустить некоторое количество html кода в битах при передаче данных из интернета? Сканер штрих-кодов: поиск актуальной базы данных со штрихкодами товаров; проблемы с cv2.cv.CV_32F и параметром --image Не пойму для чего нужна данная строчка кода key = list.count в следующем коде |
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||
| 01.02.2025, 20:07 | ||||||
0
|
||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
||||||||||||
| 01.02.2025, 21:05 [ТС] | ||||||||||||
|
Спасибо, но мне нужно чтобы в моей конструкции работало
первые три регулярки отрабатывают отлично вот эти
0
|
||||||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|
| 02.02.2025, 12:46 [ТС] | |
|
ну как исправить мне правила поиска в моем примере?
0
|
|
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
|||
| 02.02.2025, 13:01 | |||
|
2. Ссылка на сайт из Вашего кода - не работает. 3. Правильный разбор всех элементов, которые могут присутствовать в html-коде, показан выше. Добавлено через 1 минуту
0
|
|||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
||||||||||||
| 02.02.2025, 14:45 [ТС] | ||||||||||||
|
чтобы регуляркой дергнуть текст yasaka.nyc которые будет находится между тегами
Полный хтмл код ссылки на странице с которой парсю данные
а вот именно такой код если вбить в поиске, то он один именно в таком виде class="y-css-14ckas3" target="_blank" rel="noopener">yasaka.nyc</a> нужно правильно написать регулярку, не знаю как на питоне Добавлено через 2 минуты имею ввиду если искать даже по начальному тегу ... открывающему то он один такой в коде странице в таком виде class="y-css-14ckas3" target="_blank" rel="noopener"> а закрывающий тег </a> все что между этими двумя тегами нужно спарсить
0
|
||||||||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||||||
| 02.02.2025, 15:08 | ||||||||||
Чтобы написать правильно парсер, необходимо видеть весь код страницы и иметь представление о задаче в целом, т.е. что в итоге требуется получить.
0
|
||||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
||||||||||||
| 02.02.2025, 21:23 [ТС] | ||||||||||||
|
есть в коде такая строка и она одна во всем коде страницы
но есть и другие строки с таким же класом class="y-css-14ckas3" но именно такой кусок кода только у этой ссылки что нужно спарсить class="y-css-14ckas3" target="_blank" rel="noopener"> как сделать поиск именно по этому куску кода, он будет означать начало поиска парсера, а конец поиска закрывающий тег а class="y-css-14ckas3" target="_blank" rel="noopener"> такое правило возможно на питоне сделать, на пхп можно такое сделать, а как тут? Добавлено через 5 минут хотите на весь код страницы глянуть вот
можете в поиске исходного кода найти class="y-css-14ckas3" target="_blank" rel="noopener"> и там будет только одно такое совпадение
0
|
||||||||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||||
| 03.02.2025, 09:10 | ||||||||
|
В общем: Там много однотипных элементов с одинаковыми классами... как вариант, выделять необходимые блоки и уже внутри искать то, что требуется. Например:
Как поместить полученные данные в словарь, Вы ведь знаете?
0
|
||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||
| 03.02.2025, 12:14 [ТС] | |||||||
|
ошибка выполнения вашего примера NameError: name 'p' is not defined я вас несколько раз просил показать изменения в моем примере что я дал, мне нужен именно мой код, та все работает кроме вывода сайта и телефона Добавлено через 3 минуты мне нужна правка именно в моем примере в этих строках
если невозможно сделать то так и скажите, то хреновый питон тогда, в пхп можно именно искать нужный код и выгребать данные которые там будут, у пхп только одна проблема время выполнения скрипта
0
|
|||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
|||||||||||||||||||||||||
| 03.02.2025, 12:44 | |||||||||||||||||||||||||
Скачайте страницу на комп и тестируйте локально...
Методом "научного тыка" - тоже можно, но менее эффективно ![]() Добавлено через 8 минут Только вот здесь, код надо поправить, чтобы смотреть код ответа от сервера:
Вот полный код, с проверкой ответа от сервера:
0
|
|||||||||||||||||||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||
| 03.02.2025, 13:42 [ТС] | |||||||
|
если не можете или не получается в моем примере сделать правку то зачем тогда кидаете свой пример который не работает... непонятно... мой пример работает, только там я получаю запрос через апи, потому что напрямую к сайту который парсю не обратишся он банит уже на втором запросе и список прокси тоже не особо помогает, не знаю как вы там смогли подключится и парсануть его напрямую, передача headers ему до лампочки, сайс не пальцем делан и парсить его очень сложно и дорого Добавлено через 14 минут увидел в этот раз работает, у меня не получалось более одного раза вызывать сайт донор ранее потом банил меня Добавлено через 11 минут дополнил ваш код вроде работает, я ранее тоже добавлял в запрос requests.get headers=headers но первый раз подгружало данные вторай раз уже банит сайт и все, пришлось через апи работать
0
|
|||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
|||||||||||||||
| 03.02.2025, 14:51 | |||||||||||||||
![]() Теперь понятно? ![]() Браузеры умеют сохранять страницы, как .html
0
|
|||||||||||||||
|
3602 / 2743 / 355
Регистрация: 11.03.2009
Сообщений: 6,305
|
||
| 03.02.2025, 19:18 | ||
|
0
|
||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||
| 03.02.2025, 19:46 | ||
0
|
||
|
3602 / 2743 / 355
Регистрация: 11.03.2009
Сообщений: 6,305
|
|
| 03.02.2025, 21:29 | |
|
0
|
|
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||||||||
| 04.02.2025, 02:34 | ||||||||||||
![]() Понятно ведь, что это то же самое, только вид сбоку... так что "автоматизирует" - это малопривлекательное, в данном случае, преимущество. Практический бы пример для сравнения, какое именно удобство дает этот видеомагнитофон на 4 режима записи, ну кроме того, что в коде будет чуть меньше символов. ![]() чтение-запись, одновременно:
видимо, просто удобство для меньшего числа нажатий кнопок, при составлении кода записи в файл... типа, для совсем ленивых... имхо
0
|
||||||||||||
|
3602 / 2743 / 355
Регистрация: 11.03.2009
Сообщений: 6,305
|
||
| 07.02.2025, 22:20 | ||
|
Формально это инструмент тестировщиков, но и для целей отладки отлично подходит, представляет из себя HTTP-stub. Принцип работы таков, VCR перехватывает все HTTP-запросы, вополняемые под ним. Новые запросы пробрасывает целевому адресату и скурпулезно записывает в специальный файл ("кассету") запрос/ответ (url, параметры, хидеры, тело). Если запрос с такими же параметрами уже записан в кассету, заворачивает запрос обратно, возвращая содержимое записаное на кассете - имитируя удаленный сервис.
0
|
||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||||||
| 08.02.2025, 13:01 [ТС] | |||||||||||
|
на странице есть код
но ссылку на карринку не выдергует из хтмл
0
|
|||||||||||
| 08.02.2025, 13:01 | |
|
Помогаю со студенческими работами здесь
19
Ссылка на файл Excel в коде, поиск в данных документа Нужно сократить данный код Написать код, который считывает файл и находит строку с нужными данными
Как зациклить While в данном коде, для подбора нужного пароля Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога
Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
|
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование
. \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json>
Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом.
# Check if. . .
|
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так:
https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347
Основана на STM32F303RBT6.
На борту пять. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|