|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
|
Ссылки при парсинге11.02.2023, 09:33. Показов 777. Ответов 6
Метки нет (Все метки)
Всем привет, при парсинге ссылок если в ссылке присутствуют не латинские символы то ссылка выводится в виде ссылки только до того места с которого начинается не латинский шрифт ну например вот так
https://bios.ge/images/detaile... 1200_4.jpg Ссылка получается https://bios.ge/images/detailed/22/, а всё остальное идёт в виде текста. В json такая ссылка попадает в виде: Ссылка фото": "https://bios.ge/images/detailed/22/Untitled-1_56bc-rt.jpg текст который не латинский заменяется на строку Untitled-1_56bc-rt Подскажите пожалуйста как решить эту проблему? Заранее благодарю.
0
|
|
| 11.02.2023, 09:33 | |
|
Ответы с готовыми решениями:
6
Как добавить ссылки страниц в парсинге? Ошибка при парсинге Проблема с кодировкой при парсинге |
|
Автоматизируй это!
|
|
| 11.02.2023, 10:26 | |
|
Gruzin01, мало подробностей, откуда ты берешь эту ссылку? что за жсон, в котором она "превращается"? что значит "ссылка выводится", где, как?
ТЗ от программиста: я вот с такого сайта вот таким кодом получаю вот такие данные, когда я вот так вывожу их вот там, то получаю вот это. А мне хочется вот так (пример).
0
|
|
|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
||||||
| 11.02.2023, 12:18 [ТС] | ||||||
0
|
||||||
|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
|
| 11.02.2023, 13:43 [ТС] | |
|
Фото из pycharm
0
|
|
|
Автоматизируй это!
|
||||||
| 11.02.2023, 14:08 | ||||||
|
Gruzin01, функции умеют слишком много, зачем используешь весь путь в get_all_links, если его надо компоновать из URL?
почему сложно дать конкретику, о которой просил в первом посте? предлагаешь мне перебрать 30 страниц и найти где кривая ссылка? то что пичарм не может их верно парсить, не означает что они не валидные, они работают и в браузере ив реквестс, но если хочется верный вид, то сделай енкоде
1
|
||||||
|
2 / 2 / 0
Регистрация: 24.01.2021
Сообщений: 29
|
|
| 11.02.2023, 14:36 [ТС] | |
|
Спасибо большое за помощь, честно говоря думал, что я далеко не первый кто столкнулся с такой проблемой и, что спецы сразу поймут о чём речь и что ответ уже давно известен ) Я и не говорю, что ссылки не валидные, просто pychrm её воспринимает некорректно и далее при записи в json каким то образом её преобразует, правда и она (преобразованная ссылка) тоже валидна , по поводу первого поста "ТЗ от программиста:" я думал это какой то сарказм типа хочу то не знаю что, ну не понял я )))
Я не программист, во всяком случае пока, только начал учиться. Ещё раз спасибо. Удачи.
0
|
|
|
Автоматизируй это!
|
||
| 11.02.2023, 19:07 | ||
![]() Кстати, ВСкоде нормально такие ссылки показывает и кликает
0
|
||
| 11.02.2023, 19:07 | |
|
Помогаю со студенческими работами здесь
7
Появляются лишние символы при сохранении страниц html при парсинге с Селениум Ошибка при парсинге
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Настройки VS Code
Loafer 13.04.2026
{
"cmake. configureOnOpen": false,
"diffEditor. ignoreTrimWhitespace": true,
"editor. guides. bracketPairs": "active",
"extensions. ignoreRecommendations": true,
. . .
|
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2.
Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива.
Было так:. . .
|
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: реализовать контроль корректности заполнения дат назначения. . .
|
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html
Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
|
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|