0 / 0 / 0
Регистрация: 27.07.2021
Сообщений: 2
|
||||||
1 | ||||||
Из полученного списка ссылок вывести результаты только тех, которые начинаются с 24hours01.08.2021, 05:48. Показов 2518. Ответов 1
Доброго времени суток.
все еще пишу парсер для livinternet и поскольку границу парсинга указать я не смог (точнее смог после долгих мучений, но это не имеет смысла, так как там есть лишние значения). Я решил зайти с другой стороны, выделить нужные мне значения через общий признак. Теперь процесс выглядит так. 1. Собираем с веб страницы все значения тэга <a>, то есть все ссылки ( сделано ) 2. Выбрать только те ссылки, в которых url начинается на 24hours.html, ведь именно их анкоры и являются поисковыми фразами, которые я и хочу собрать. ( именно эту операцию в данный момент я не знаю как сделать) 3. Из выбранных ссылок вывести список анкоров, они же и поисковые фразы, которые мне нужны ( в целом с этим тоже нет проблем, ведь список анкоров я смог вывести, однако учитывая то, что я не смог выбрать только те ссылки, url которых начинается с 24hours.html, у меня выводятся анкоры всех ссылок со страницы, элементов меню и др. Собственно вот мой код сейчас
По сути нужно оставить только те строки, в которых встречается значение 24hours.html , пытался через регулярные выражения сделать, но так и не смог. Прошу помочь, буду очень благодарен. Добавлено через 1 час 7 минут Вообще через программу я выделил вот такое регулярное выражение (?<=0=1">).*?(?=<), которое на раз два парсит нужный мне результат, но вот как его прописать в питоне я так и не могу понять, вроде столько библиотек, уже целые сутки гуглю и прочитал все возможные варианты и через регулярки и через селект и через еще кучу способов использование и совмещения и выделения. Ну почему нету простой функции спарсить все ссылки с таким то признаком и просто прописать признак в скобках, ну почему просто нельзя задать регулярку и указать в ней что идет перед текстом и что после него. Все селекты и регулярки и задания границ парсинга что я нашел на бесчисленных сайтах которые сегодня пересмотрел не дали результата. Прошу помогите! Что я делаю не так...
0
|
01.08.2021, 05:48 | |
Ответы с готовыми решениями:
1
Найти сумму тех элементов списка, которые начинаются на заданную цифру Сформировать результирующий массив В, элементами которого являются суммы элементов только тех строк матрицы А, которые начинаются с К положительных чи Вывести только те слова, которые начинаются с прописной буквы Вывести только те слова, которые начинаются на гласную букву |
Am I evil? Yes, I am!
17573 / 10326 / 2820
Регистрация: 21.10.2017
Сообщений: 22,388
|
|||||||||||
01.08.2021, 09:55 | 2 | ||||||||||
Сообщение было отмечено Ruskrol как решение
Решение
Ruskrol, да че тут мудрить-то?
Да и зачем тут регулярки?
1
|
01.08.2021, 09:55 | |
01.08.2021, 09:55 | |
Помогаю со студенческими работами здесь
2
Вывести только те слова сообщения, которые начинаются с прописной буквы Вывести только те слова сообщения, которые начинаются с прописной буквы Вывести только те строки текста, которые начинаются с латинского символа A Файл: вывести только слова, которые начинаются с гласных букв Вывести в richTextBox только слова, которые начинаются с гласной буквы Вывести только те слова сообщения, которые начинаются и заканчиваются на заданную букву Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |