Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/9: Рейтинг темы: голосов - 9, средняя оценка - 5.00
13 / 10 / 5
Регистрация: 04.01.2013
Сообщений: 205

Ошибка при парсинге xml с BeautifulSoup

11.06.2020, 22:42. Показов 2027. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Небходимо спарсить страницу http://econym.org.uk/gmap/states.xml

Что-то делаю не так. Объект BS создается и выводится. А вот пройтись по нему не могу. При этом html тем же способом спарсить удается.


Фрагмент:

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
<states>
<state name="Alaska" colour="#ff0000">
<point lat="70.0187" lng="-141.0205"/>
<point lat="70.1292" lng="-141.7291"/>
<point lat="70.4515" lng="-144.8163"/>
<point lat="70.7471" lng="-148.4583"/>
...
</state>
<state name="Arkansas" colour="#ff0000">
<point lat="33.0225" lng="-94.0416"/>
<point lat="33.0075" lng="-91.2057"/>
<point lat="33.1180" lng="-91.1989"/>
<point lat="33.1824" lng="-91.1041"/>
<point lat="33.3053" lng="-91.1343"/>
<point lat="33.4211" lng="-91.1646"/>
<point lat="33.4337" lng="-91.2263"/>
....
</state>
Что делаю я:

Python
1
2
3
4
5
6
7
8
import requests
from bs4 import BeautifulSoup
 
html = requests.get('http://econym.org.uk/gmap/states.xml').text
soup = BeautifulSoup(html, 'lxml')
 
for r in soup.states:
    print(r.state) # this works
Однако вытащить оттуда point-ы и names тем же путем у меня не получается. Задача - сделать именно это.

Есть идеи?

Благодарю за помощь.
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
11.06.2020, 22:42
Ответы с готовыми решениями:

Ошибка при парсинге XML
День добрый имеется вот такой xml: &lt;?xml version=&quot;1.0&quot;?&gt; &lt;urlset xmlns=&quot;http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt; ...

Ошибка при парсинге XML
Досталась XML'ка с ошибкой, каждое случайно число строк (зависимость не искали), появляется какой то не понятный символ с кодом 0xc (так...

Ошибка при парсинге xml файла
Добрый день! При парсинге xml файла возникает ошибка, при чем возникает по середине процесса Часть файла разбирает, а по середине...

2
Эксперт Python
 Аватар для АмигоСП
295 / 108 / 57
Регистрация: 07.12.2016
Сообщений: 209
11.06.2020, 23:46
Лучший ответ Сообщение было отмечено luigration как решение

Решение

Например вот так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import requests
from bs4 import BeautifulSoup
 
html = requests.get('http://econym.org.uk/gmap/states.xml')
soup = BeautifulSoup(html.text, 'lxml')
states = soup.find_all('state', attrs={'name': True, 'colour':True})
 
resultat = {}
for r in states:
    points = [(x['lat'], x['lng']) for x in r.find_all('point')] # this works
    resultat[r['name']] = points
 
for data in resultat:
    print('{}: {}'.format(data, resultat[data]))
1
13 / 10 / 5
Регистрация: 04.01.2013
Сообщений: 205
12.06.2020, 15:12  [ТС]
Цитата Сообщение от АмигоСП Посмотреть сообщение
Например вот так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import requests
from bs4 import BeautifulSoup
 
html = requests.get('http://econym.org.uk/gmap/states.xml')
soup = BeautifulSoup(html.text, 'lxml')
states = soup.find_all('state', attrs={'name': True, 'colour':True})
 
resultat = {}
for r in states:
    points = [(x['lat'], x['lng']) for x in r.find_all('point')] # this works
    resultat[r['name']] = points
 
for data in resultat:
    print('{}: {}'.format(data, resultat[data]))
Спасибо за ответ.
Поэтому у меня find_all и не работал, - надо было правильно атрибуты указать. Теперь буду знать.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
12.06.2020, 15:12
Помогаю со студенческими работами здесь

Ошибка при парсинге большого XML (190МБ)
Здравствуйте. При переносе магазина на другой vps сервер столкнулся с ошибкой в парсере xml файла прайса: Fatal error: Uncaught exception...

Android, XML ошибка при парсинге, универсальный парсер
У меня возникла проблема при парсинге (xmlPullParser), выдает ошибку, лог: 12-17 17:10:08.355: W/System.err(28761):...

Кириллица при парсинге XML
Приветствую всех! Пишу программу на Android. В программе закачиваю из интернета XML: &lt;trk&gt; &lt;trkseg&gt; &lt;rtept...

Вытащить атрибут при парсинге xml
День добрый, надо распарсить xml документ и все получилось, кроме одного: не могу вытащить атрибут у одного из тегов тег такой ...

неверная кодировка при парсинге xml
доброго времени суток сделал парсинг xml допустим есть 2 сайта domain.com - где лежит некий news.xml(данные зашифрованы Base64) и...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru