|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
|
Ссылки при парсинге11.02.2023, 09:33. Показов 760. Ответов 6
Метки нет (Все метки)
Всем привет, при парсинге ссылок если в ссылке присутствуют не латинские символы то ссылка выводится в виде ссылки только до того места с которого начинается не латинский шрифт ну например вот так
https://bios.ge/images/detaile... 1200_4.jpg Ссылка получается https://bios.ge/images/detailed/22/, а всё остальное идёт в виде текста. В json такая ссылка попадает в виде: Ссылка фото": "https://bios.ge/images/detailed/22/Untitled-1_56bc-rt.jpg текст который не латинский заменяется на строку Untitled-1_56bc-rt Подскажите пожалуйста как решить эту проблему? Заранее благодарю.
0
|
|
| 11.02.2023, 09:33 | |
|
Ответы с готовыми решениями:
6
Как добавить ссылки страниц в парсинге? Ошибка при парсинге Проблема с кодировкой при парсинге |
|
Автоматизируй это!
|
|
| 11.02.2023, 10:26 | |
|
Gruzin01, мало подробностей, откуда ты берешь эту ссылку? что за жсон, в котором она "превращается"? что значит "ссылка выводится", где, как?
ТЗ от программиста: я вот с такого сайта вот таким кодом получаю вот такие данные, когда я вот так вывожу их вот там, то получаю вот это. А мне хочется вот так (пример).
0
|
|
|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
||||||
| 11.02.2023, 12:18 [ТС] | ||||||
0
|
||||||
|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
|
| 11.02.2023, 13:43 [ТС] | |
|
Фото из pycharm
0
|
|
|
Автоматизируй это!
|
||||||
| 11.02.2023, 14:08 | ||||||
|
Gruzin01, функции умеют слишком много, зачем используешь весь путь в get_all_links, если его надо компоновать из URL?
почему сложно дать конкретику, о которой просил в первом посте? предлагаешь мне перебрать 30 страниц и найти где кривая ссылка? то что пичарм не может их верно парсить, не означает что они не валидные, они работают и в браузере ив реквестс, но если хочется верный вид, то сделай енкоде
1
|
||||||
|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
|
| 11.02.2023, 14:36 [ТС] | |
|
Спасибо большое за помощь, честно говоря думал, что я далеко не первый кто столкнулся с такой проблемой и, что спецы сразу поймут о чём речь и что ответ уже давно известен ) Я и не говорю, что ссылки не валидные, просто pychrm её воспринимает некорректно и далее при записи в json каким то образом её преобразует, правда и она (преобразованная ссылка) тоже валидна , по поводу первого поста "ТЗ от программиста:" я думал это какой то сарказм типа хочу то не знаю что, ну не понял я )))
Я не программист, во всяком случае пока, только начал учиться. Ещё раз спасибо. Удачи.
0
|
|
|
Автоматизируй это!
|
||
| 11.02.2023, 19:07 | ||
![]() Кстати, ВСкоде нормально такие ссылки показывает и кликает
0
|
||
| 11.02.2023, 19:07 | |
|
Помогаю со студенческими работами здесь
7
Появляются лишние символы при сохранении страниц html при парсинге с Селениум Ошибка при парсинге
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Программа принимает математическое выражение в виде строки и выдаёт его производную в виде строки и вычисляет
значение производной при заданном х
Логарифм записывается как: (x-2)log(x^2+2) -. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|