Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/9: Рейтинг темы: голосов - 9, средняя оценка - 5.00
13 / 10 / 5
Регистрация: 04.01.2013
Сообщений: 205

Ошибка при парсинге xml с BeautifulSoup

11.06.2020, 22:42. Показов 1996. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Небходимо спарсить страницу http://econym.org.uk/gmap/states.xml

Что-то делаю не так. Объект BS создается и выводится. А вот пройтись по нему не могу. При этом html тем же способом спарсить удается.


Фрагмент:

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
<states>
<state name="Alaska" colour="#ff0000">
<point lat="70.0187" lng="-141.0205"/>
<point lat="70.1292" lng="-141.7291"/>
<point lat="70.4515" lng="-144.8163"/>
<point lat="70.7471" lng="-148.4583"/>
...
</state>
<state name="Arkansas" colour="#ff0000">
<point lat="33.0225" lng="-94.0416"/>
<point lat="33.0075" lng="-91.2057"/>
<point lat="33.1180" lng="-91.1989"/>
<point lat="33.1824" lng="-91.1041"/>
<point lat="33.3053" lng="-91.1343"/>
<point lat="33.4211" lng="-91.1646"/>
<point lat="33.4337" lng="-91.2263"/>
....
</state>
Что делаю я:

Python
1
2
3
4
5
6
7
8
import requests
from bs4 import BeautifulSoup
 
html = requests.get('http://econym.org.uk/gmap/states.xml').text
soup = BeautifulSoup(html, 'lxml')
 
for r in soup.states:
    print(r.state) # this works
Однако вытащить оттуда point-ы и names тем же путем у меня не получается. Задача - сделать именно это.

Есть идеи?

Благодарю за помощь.
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
11.06.2020, 22:42
Ответы с готовыми решениями:

Ошибка при парсинге XML
День добрый имеется вот такой xml: &lt;?xml version=&quot;1.0&quot;?&gt; &lt;urlset xmlns=&quot;http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt; ...

Ошибка при парсинге XML
Досталась XML'ка с ошибкой, каждое случайно число строк (зависимость не искали), появляется какой то не понятный символ с кодом 0xc (так...

Ошибка при парсинге xml файла
Добрый день! При парсинге xml файла возникает ошибка, при чем возникает по середине процесса Часть файла разбирает, а по середине...

2
Эксперт Python
 Аватар для АмигоСП
295 / 108 / 57
Регистрация: 07.12.2016
Сообщений: 209
11.06.2020, 23:46
Лучший ответ Сообщение было отмечено luigration как решение

Решение

Например вот так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import requests
from bs4 import BeautifulSoup
 
html = requests.get('http://econym.org.uk/gmap/states.xml')
soup = BeautifulSoup(html.text, 'lxml')
states = soup.find_all('state', attrs={'name': True, 'colour':True})
 
resultat = {}
for r in states:
    points = [(x['lat'], x['lng']) for x in r.find_all('point')] # this works
    resultat[r['name']] = points
 
for data in resultat:
    print('{}: {}'.format(data, resultat[data]))
1
13 / 10 / 5
Регистрация: 04.01.2013
Сообщений: 205
12.06.2020, 15:12  [ТС]
Цитата Сообщение от АмигоСП Посмотреть сообщение
Например вот так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import requests
from bs4 import BeautifulSoup
 
html = requests.get('http://econym.org.uk/gmap/states.xml')
soup = BeautifulSoup(html.text, 'lxml')
states = soup.find_all('state', attrs={'name': True, 'colour':True})
 
resultat = {}
for r in states:
    points = [(x['lat'], x['lng']) for x in r.find_all('point')] # this works
    resultat[r['name']] = points
 
for data in resultat:
    print('{}: {}'.format(data, resultat[data]))
Спасибо за ответ.
Поэтому у меня find_all и не работал, - надо было правильно атрибуты указать. Теперь буду знать.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
12.06.2020, 15:12
Помогаю со студенческими работами здесь

Ошибка при парсинге большого XML (190МБ)
Здравствуйте. При переносе магазина на другой vps сервер столкнулся с ошибкой в парсере xml файла прайса: Fatal error: Uncaught exception...

Android, XML ошибка при парсинге, универсальный парсер
У меня возникла проблема при парсинге (xmlPullParser), выдает ошибку, лог: 12-17 17:10:08.355: W/System.err(28761):...

Кириллица при парсинге XML
Приветствую всех! Пишу программу на Android. В программе закачиваю из интернета XML: &lt;trk&gt; &lt;trkseg&gt; &lt;rtept...

Вытащить атрибут при парсинге xml
День добрый, надо распарсить xml документ и все получилось, кроме одного: не могу вытащить атрибут у одного из тегов тег такой ...

неверная кодировка при парсинге xml
доброго времени суток сделал парсинг xml допустим есть 2 сайта domain.com - где лежит некий news.xml(данные зашифрованы Base64) и...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
Модель сукцессии микоризы
anaschu 24.01.2026
Решили писать научную статью с неким РОманом
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru