383 / 23 / 2
Регистрация: 12.06.2021
Сообщений: 211
Записей в блоге: 2

Как в парсере сделать проверку существует картинка на сайте или нет?

08.04.2022, 01:36. Показов 1244. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте сделала парсер для извлечения новостей, там кроме новостей в отдельную папку сохраняется и картинки с помощью этих строк.
with open(f'news/img/{image_number}.jpg','wb') as file:
file.write(image_bytes)
Во время парсинга я обнаружила, что создаются все картинки даже битые ссылки на изображения, как сделать проверку на существование картинки. Те которые существуют сохранять в папку, а если их нет то ничего не делать. Кроме того я использую массив news_info куда записываю данные соответственно те картинки которые существуют должны записывать их ссылки, если они не существуют то записываться no_photo.jpg. Потом данные из массива загружаются в json документ. Как можно реализовать проверку на существование картинки и записать в массив ссылки,а также nophoto на случай отсутствия фото? Вот часть кода:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
for item in find_all_news:
 
 link = "http://site.ru/" + item.find("a").get("href")
        img = item.find("td",{"class":"newsleft"}).find("img").get("src")
        text = item.find("td",{"class":"newshright"}).text
        
         image_bytes=requests.get(f'{img}').content
         imgsrc = f"/news/img/{image_number}.jpg"
         
         if <файл существует>:
          continue
         else <файл не существует:
           imgsrc = "/news/img/nophoto.jpg"
         
         
          news_info.append(
              {
                "link":link,
                "img":imgsrc,
                "text":text
              }
        )
        with open(f'image1/{image_number}.jpg','wb') as file:
          file.write(image_bytes)
        image_number += 1
        
         with open(f"data1/test3.json","a",encoding="utf-8") as file:
        json.dump(news_info, file, ensure_ascii=False)
Я добавила выше псевдокод условий, вот он.
if <файл существует>:
continue
else <файл не существует:
imgsrc = "/news/img/nophoto.jpg"
Просто я не знаю как правильно, переписать это условие.

P.S. Извлечение происходит с помощью find_all. Отступы здесь возможно нарушены использовала “копипаст”, чтобы вставить код, но в python код работает.
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
08.04.2022, 01:36
Ответы с готовыми решениями:

Подскажите, как сделать проверку, к примеру, существует ли такая компания уже или нет?
Подскажите пожалуйста, как сделать проверку к примеру существует ли такая компания уже или нет? Пример: 1) МБА - МБА = Ошибка,...

Как осуществлять проверку на то, картинка это или нет ?
Как осуществлять проверку на то, картинка это или нет, и если не картинка то вывести ошибку (допустимые форматы - jpg, gif, png).

Проверка, существует ли картинка с заданным именем, или нет
Всем привет! Помогите, пожалуйста! Есть следующий фрагмент кода: if then begin ...

1
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
08.04.2022, 07:07
Лучший ответ Сообщение было отмечено Olga28 как решение

Решение

Python
1
2
3
4
5
6
image = requests.get(image_url)
 
if image.status_code == 200:
    <файл существует>
else:
    <файл не существует>
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
08.04.2022, 07:07
Помогаю со студенческими работами здесь

QSerialPort Как сделать проверку на то подсоединился ли я по к com-порту или нет?
Всем привет. Подскажите как сделать проверку на то подсоединился ли я по к com-порту или нет? т.е. при запуске программы я послал стартовую...

Возможно ли сделать как-то проверку было ли изменение экрана или нет?
Подскажите возможно ли сделать как то проверку было ли изменение экрана или нет $(window).resize() то есть если загрузить только...

Как сделать проверку на то, открыт ли документ Word (Excel) или нет?
всем привет. как мне сделать проверку на то открыт ли документ(любой не конкретный) Word(Exel) или нет. Если открыт, то скопировать его...

Как сделать проверку было ли уже такое имя или нет?
есть textbox и по вводу в него имени он проверяет есть ли такое имя в словаре если есть он выводит сообщение и просит переписать имя но...

Как сделать проверку было ли уже такое имя или нет?
есть textbox и по вводу в него имени он проверяет есть ли такое имя в словаре если есть он выводит сообщение и просит переписать имя но...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! */ #include <iostream> #include <stack> #include <cctype>. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru