Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 18.11.2019
Сообщений: 5

Выдает ошибку IndexError: list index out of range в 106 строке в чем ошибка?

31.07.2020, 04:01. Показов 733. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
import logging
import collections
import urllib.parse
import csv
import bs4
import requests
 
 
 
logging.basicConfig(level=logging.DEBUG)
logger = logging.getLogger('Avito')
 
ParseResult = collections.namedtuple(
    'ParseResult', (
        'Name',
        'Price',
        'Url',
    )
)
 
HEADERS = (
    'Название',
    'Цена',
    'Ссылка'
)
 
class AvitoParser:
 
    def __init__(self):
        self.session = requests.Session()
        self.session.headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.2 Safari/605.1.15',
            'Accept-Language': 'ru',
        }
        self.result = []
 
 
    def get_page(self, page: int = None):
        params = {
            'radius': 0,
            'user': 1,
        }
        if page and page > 1:
            params['p'] = page
        url = 'https://www.avito.ru/moskva/odezhda_obuv_aksessuary/zhenskaya_odezhda'
        r = self.session.get(url, params=params)
        return r.text
 
    def get_blocks(self, page: int = None):
        text = self.get_page(page=page)
        soup = bs4.BeautifulSoup(text, 'lxml')
        container = soup.select('div.description')
        for item in container:
            self.parse_block(item=item)
 
 
    def parse_block(self, item):
        # logger.info(item)
        # logger.info('=' * 100)
        url_block = item.select_one('a.snippet-link')
        if not url_block:
            logger.error('no url_block')
            return
 
        url = url_block.get('href')
        if not url:
            logger.error('no href')
            return
 
        name = url_block.get('title')
        if not url:
            logger.error('no name')
            return
 
        price_block = item.select_one('span.snippet-price')
        if not price_block:
            logger.error('no price')
            return
 
        name = name.replace('/', '')
 
        price_block = price_block.text
        price_block = price_block.replace(
            '<span class="snippet-price" data-marker="item-price" data-shape="default" itemprop="offers" itemscope="" itemtype="http://schema.org/Offer"><meta content="RUB" itemprop="priceCurrency"/><meta content="2000" itemprop="price"/><meta content="https://schema.org/LimitedAvailability" itemprop="availability"/>',
            'span')
        logger.info('%s', 'www.avito.ru' + url)
        logger.info('%s', str(name))
        logger.info('%s', str(price_block))
 
 
        self.result.append(
            ParseResult(
            Name=str(name),
            Price=str(price_block),
            Url=str('www.avito.ru' + url))
        )
 
 
 
 
    def get_pagination_limit(self):
        text = self.get_page()
        soup = bs4.BeautifulSoup(text, 'lxml')
 
        container = soup.select('a.pagination-page')
        last_button = container[-1]
        href ='www.avito.ru' + last_button.get('href')
        if not href:
            logger.error('Проблемма с ссылкой на последнюю страницу')
            return
 
 
        r = urllib.parse.urlparse(href)
        params = urllib.parse.parse_qs(r.query)
        return int(params['p'][0])
 
    def save_result(self):
        path = '/Users/moddy/PycharmProjects/avito_parser2/venv/parse_res.csv'
        with open(path, 'w') as f:
            writer = csv.writer(f, quoting=csv.QUOTE_MINIMAL)
            writer.writerow(HEADERS)
            for item in self.result:
                writer.writerow(item)
 
    def parse_all(self):
        self.save_result()
        limit = self.get_pagination_limit()
        print(f'Всего страниц: {limit}')
 
        for i in range(1, limit + 1):
            self.get_blocks(page=i)
 
 
def main():
    p = AvitoParser()
    p.parse_all()
 
 
if __name__ == '__main__':
    main()
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
31.07.2020, 04:01
Ответы с готовыми решениями:

Компилятор выдает ошибку IndexError: list index out of range
a = b = 0 for i in a: print(a) b += a print(b)

Как обойти ошибку IndexError: list index out of range
При парсинге данных со страницы (https://maxline.by/mstat.php?p=170838:663876:17831:11223321) выпадает ошибка:IndexError: list index out of...

Ошибка: IndexError: list index out of range
file = open('info.txt', mode='r', encoding='utf-8') peoples = nums = for row in file.readlines(): n = int(row.split()) ...

1
1303 / 843 / 409
Регистрация: 12.03.2018
Сообщений: 2,305
31.07.2020, 08:12
Python
1
2
3
4
5
6
7
8
lst = []  # ПУСТОЙ!
lst[-1]
Traceback (most recent call last):
  File "C:\Python37-32\lib\site-packages\IPython\core\interactiveshell.py", line 3326, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-15-ddfbc0e33a35>", line 1, in <module>
    lst[-1]
IndexError: list index out of range
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
31.07.2020, 08:12
Помогаю со студенческими работами здесь

Ошибка IndexError: list index out of range
Traceback (most recent call last): File &quot;C:/Users/Андрей/Desktop/х02.py&quot;, line 116, in &lt;module&gt; step = AI() File...

Ошибка IndexError: list index out of range
При выполнении кода: string = input().split() for i in range(len(string)): if string != max(string): del string ...

Ошибка IndexError: list index out of range
Traceback (most recent call last): File &quot;E:\Mortal\my_game_V.3.0\myfirstgame.py&quot;, line 275, in &lt;module&gt; windraw() File...

Как показать программе, что список действительно пуст, и чтобы она не писала ошибку IndexError: list index out of range
делаю игру в города, пропарсил сайт, вот нужная часть кода: data = s.find('div',class_='clearfix').text data_2.extend(data.split()) ...

IndexError: list index out of range
Задача : определить, какое слово зашифровано(состоит из тех же букв, количество символов то же). a= a=raw_input() b=raw_input() ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru