|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||||||||||||||||||||||||||
Поиск нужных мне данных в html коде01.02.2025, 18:30. Показов 2410. Ответов 18
Метки нет (Все метки)
Добрый вечер!
скрипт питона получает такой хтмл код, мне из него нужно достать ссылку yasaka.nyc
как мне править регулярку в скрипте, ищу по названию класса y-css-14ckas3 но не получается вытащить ссылку , что не так с регулякрой поиска?
То же самое и с номером телефона ищу по классу y-css-19xonnr не получается достать данные
0
|
|||||||||||||||||||||||||||||||
| 01.02.2025, 18:30 | |
|
Ответы с готовыми решениями:
18
Как пропустить некоторое количество html кода в битах при передаче данных из интернета? Сканер штрих-кодов: поиск актуальной базы данных со штрихкодами товаров; проблемы с cv2.cv.CV_32F и параметром --image Не пойму для чего нужна данная строчка кода key = list.count в следующем коде |
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||
| 01.02.2025, 20:07 | ||||||
0
|
||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
||||||||||||
| 01.02.2025, 21:05 [ТС] | ||||||||||||
|
Спасибо, но мне нужно чтобы в моей конструкции работало
первые три регулярки отрабатывают отлично вот эти
0
|
||||||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|
| 02.02.2025, 12:46 [ТС] | |
|
ну как исправить мне правила поиска в моем примере?
0
|
|
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
|||
| 02.02.2025, 13:01 | |||
|
2. Ссылка на сайт из Вашего кода - не работает. 3. Правильный разбор всех элементов, которые могут присутствовать в html-коде, показан выше. Добавлено через 1 минуту
0
|
|||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
||||||||||||
| 02.02.2025, 14:45 [ТС] | ||||||||||||
|
чтобы регуляркой дергнуть текст yasaka.nyc которые будет находится между тегами
Полный хтмл код ссылки на странице с которой парсю данные
а вот именно такой код если вбить в поиске, то он один именно в таком виде class="y-css-14ckas3" target="_blank" rel="noopener">yasaka.nyc</a> нужно правильно написать регулярку, не знаю как на питоне Добавлено через 2 минуты имею ввиду если искать даже по начальному тегу ... открывающему то он один такой в коде странице в таком виде class="y-css-14ckas3" target="_blank" rel="noopener"> а закрывающий тег </a> все что между этими двумя тегами нужно спарсить
0
|
||||||||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||||||
| 02.02.2025, 15:08 | ||||||||||
Чтобы написать правильно парсер, необходимо видеть весь код страницы и иметь представление о задаче в целом, т.е. что в итоге требуется получить.
0
|
||||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
||||||||||||
| 02.02.2025, 21:23 [ТС] | ||||||||||||
|
есть в коде такая строка и она одна во всем коде страницы
но есть и другие строки с таким же класом class="y-css-14ckas3" но именно такой кусок кода только у этой ссылки что нужно спарсить class="y-css-14ckas3" target="_blank" rel="noopener"> как сделать поиск именно по этому куску кода, он будет означать начало поиска парсера, а конец поиска закрывающий тег а class="y-css-14ckas3" target="_blank" rel="noopener"> такое правило возможно на питоне сделать, на пхп можно такое сделать, а как тут? Добавлено через 5 минут хотите на весь код страницы глянуть вот
можете в поиске исходного кода найти class="y-css-14ckas3" target="_blank" rel="noopener"> и там будет только одно такое совпадение
0
|
||||||||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||||
| 03.02.2025, 09:10 | ||||||||
|
В общем: Там много однотипных элементов с одинаковыми классами... как вариант, выделять необходимые блоки и уже внутри искать то, что требуется. Например:
Как поместить полученные данные в словарь, Вы ведь знаете?
0
|
||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||
| 03.02.2025, 12:14 [ТС] | |||||||
|
ошибка выполнения вашего примера NameError: name 'p' is not defined я вас несколько раз просил показать изменения в моем примере что я дал, мне нужен именно мой код, та все работает кроме вывода сайта и телефона Добавлено через 3 минуты мне нужна правка именно в моем примере в этих строках
если невозможно сделать то так и скажите, то хреновый питон тогда, в пхп можно именно искать нужный код и выгребать данные которые там будут, у пхп только одна проблема время выполнения скрипта
0
|
|||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
|||||||||||||||||||||||||
| 03.02.2025, 12:44 | |||||||||||||||||||||||||
Скачайте страницу на комп и тестируйте локально...
Методом "научного тыка" - тоже можно, но менее эффективно ![]() Добавлено через 8 минут Только вот здесь, код надо поправить, чтобы смотреть код ответа от сервера:
Вот полный код, с проверкой ответа от сервера:
0
|
|||||||||||||||||||||||||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||
| 03.02.2025, 13:42 [ТС] | |||||||
|
если не можете или не получается в моем примере сделать правку то зачем тогда кидаете свой пример который не работает... непонятно... мой пример работает, только там я получаю запрос через апи, потому что напрямую к сайту который парсю не обратишся он банит уже на втором запросе и список прокси тоже не особо помогает, не знаю как вы там смогли подключится и парсануть его напрямую, передача headers ему до лампочки, сайс не пальцем делан и парсить его очень сложно и дорого Добавлено через 14 минут увидел в этот раз работает, у меня не получалось более одного раза вызывать сайт донор ранее потом банил меня Добавлено через 11 минут дополнил ваш код вроде работает, я ранее тоже добавлял в запрос requests.get headers=headers но первый раз подгружало данные вторай раз уже банит сайт и все, пришлось через апи работать
0
|
|||||||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
|||||||||||||||
| 03.02.2025, 14:51 | |||||||||||||||
![]() Теперь понятно? ![]() Браузеры умеют сохранять страницы, как .html
0
|
|||||||||||||||
|
3602 / 2743 / 355
Регистрация: 11.03.2009
Сообщений: 6,304
|
||
| 03.02.2025, 19:18 | ||
|
0
|
||
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||
| 03.02.2025, 19:46 | ||
0
|
||
|
3602 / 2743 / 355
Регистрация: 11.03.2009
Сообщений: 6,304
|
|
| 03.02.2025, 21:29 | |
|
0
|
|
|
Любознательный
7405 / 2255 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
|
||||||||||||
| 04.02.2025, 02:34 | ||||||||||||
![]() Понятно ведь, что это то же самое, только вид сбоку... так что "автоматизирует" - это малопривлекательное, в данном случае, преимущество. Практический бы пример для сравнения, какое именно удобство дает этот видеомагнитофон на 4 режима записи, ну кроме того, что в коде будет чуть меньше символов. ![]() чтение-запись, одновременно:
видимо, просто удобство для меньшего числа нажатий кнопок, при составлении кода записи в файл... типа, для совсем ленивых... имхо
0
|
||||||||||||
|
3602 / 2743 / 355
Регистрация: 11.03.2009
Сообщений: 6,304
|
||
| 07.02.2025, 22:20 | ||
|
Формально это инструмент тестировщиков, но и для целей отладки отлично подходит, представляет из себя HTTP-stub. Принцип работы таков, VCR перехватывает все HTTP-запросы, вополняемые под ним. Новые запросы пробрасывает целевому адресату и скурпулезно записывает в специальный файл ("кассету") запрос/ответ (url, параметры, хидеры, тело). Если запрос с такими же параметрами уже записан в кассету, заворачивает запрос обратно, возвращая содержимое записаное на кассете - имитируя удаленный сервис.
0
|
||
|
21 / 10 / 4
Регистрация: 02.04.2015
Сообщений: 779
|
|||||||||||
| 08.02.2025, 13:01 [ТС] | |||||||||||
|
на странице есть код
но ссылку на карринку не выдергует из хтмл
0
|
|||||||||||
| 08.02.2025, 13:01 | |
|
Помогаю со студенческими работами здесь
19
Ссылка на файл Excel в коде, поиск в данных документа Нужно сократить данный код Написать код, который считывает файл и находит строку с нужными данными
Как зациклить While в данном коде, для подбора нужного пароля Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога
Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
|
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога
Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
|
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога
Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога
Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
|
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|