0 / 0 / 0
Регистрация: 13.02.2017
Сообщений: 2

Парсер xml

13.02.2017, 11:59. Показов 826. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Прошу помочь с парсером xml. Есть XML с такой структурой:

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
<root>
    <Result RC="0" />
    <GetInvoiceInfo>
        <Invoice ContractNumber="somedata" Action="R" ShipmentNumber="somedata" ShipRefNum="somedata" PickUpType="C" ProductCode="somedata" InsuranceSum="somedata" DeclaredSum="0.00" CODGoodsSum="0.00" CODDeliverySum="0.00" SBits="somedata" OrderNumber="somedata" CurState="Обработка" CenterPay="" InsuranceType="INS" Description="22">
            <Shipper PostCode="somedata" Country="somedata" Region="somedata" City="somedata" Address="somedata" CompanyName="somedata" ContactName="somedata" Phone=""/>
            <Receiver PostCode="somedata" Country="somedata" Region="somedata" City="somedata" Address="somedata" CompanyName="somedata" ContactName="somedata" Phone="somedata" ConsigneeCollect=""/>
            <SMS SMSNumberShipper=""/>
            <Pieces>
                <Piece Description="somedata" PieceID="somedata" ClientBarcode="" Weight="0.22" Length="0.20" Width="0.10" Depth="0.10" ClientWeight="0.40" Quantity="1">
                    <SubPieces>
                        <SubPiece Description="somedata" Cost="somedata"/>
                    </SubPieces>
                </Piece>
            </Pieces>
        </Invoice>
    </GetInvoiceInfo>
</root>
Парсер:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
 import xml.etree.ElementTree as etree
import MySQLdb
INFile = 'xml/monitoring.xml'
SQLtable = "invoice"
MyHost="localhost"
MyUser="root"
MyPasswd="pass"
MyDb="invoices"
try:
    db = MySQLdb.connect(host=MyHost, user=MyUser,passwd=MyPasswd, db=MyDb, charset='utf8')
    cursor = db.cursor()
    tree = etree.parse(INFile)
    root = tree.getroot()
    getinvoiceinfos = root.find('GetInvoiceInfo')
    for getinvoiceinfo in getinvoiceinfos:
        dic = dict(getinvoiceinfo.attrib)
        dic.update(getinvoiceinfo.find('Shipper').attrib)
        Receiver = getinvoiceinfo.find('Receiver').attrib
        dic.update({
            #'postcode10': Receiver['PostCode'],
            'country10': Receiver['Country'],
            'region10': Receiver['Region'],
            'city10': Receiver['City'],
            'address10': Receiver['Address'],
            'companyname10': Receiver['CompanyName'],
            'contactname10': Receiver['ContactName'],
            'phone10': Receiver['Phone'],
            'consigneecollect10': Receiver['ConsigneeCollect'],
        })
        pieceses = getinvoiceinfo.find('Pieces')
        Piece = pieceses.find('Piece').attrib
        dic.update({
            'description10': Piece['Description'],
            #'pieceid': Piece['PieceID'],
            'clientbarcode': Piece['ClientBarcode'],
            'weight': Piece['Weight'],
            'length': Piece['Length'],
            'width': Piece['Width'],
            'depth': Piece['Depth'],
            'clientweight': Piece['ClientWeight'],
            'quantity': Piece['Quantity'],
        })
        for subpiece in root.iter('SubPiece'):
            SubPiece = subpiece.attrib
            dic.update({
                'description20': SubPiece['Description'],
                'cost': SubPiece['Cost'],
            })
        if dic.get('ShipRefNum') != None:
            dic.update({'shiprefnum':dic['ShipRefNum']})
            del(dic['ShipRefNum'])
        if dic.get('FullDescription') != None:
            dic.update({'fulldescription':dic['FullDescription']})
            del(dic['FullDescription'])
        if dic.get('DeliveryDT') != None:
            dic.update({'deliverydt':dic['DeliveryDT']})
            del(dic['DeliveryDT'])
        if dic.get('PostCode') != None:
            dic.update({'postcode':dic['PostCode']})
            del(dic['PostCode'])
        if dic.get('PostCode') != None:
            dic.update({'postcode10':dic['PostCode']})
            del(dic['PostCode'])
        if dic.get('AgreedDate') != None:
            dic.update({'agreeddate':dic['AgreedDate']})
            del(dic['AgreedDate'])
        if dic.get('CenterPay') != None:
            dic.update({'centerpay':dic['CenterPay']})
            del(dic['CenterPay'])
        if dic.get('ConsigneeCollect') != None:
            dic.update({'consigneecollect10':dic['ConsigneeCollect']})
            del(dic['ConsigneeCollect'])
        if dic.get('ClientBarcode') != None:
            dic.update({'clientbarcode':dic['ClientBarcode']})
            del(dic['ClientBarcode'])
        if dic.get('Cost') != None:
            dic.update({'cost':dic['Cost']})
            del(dic['Cost'])
        sql = """REPLACE INTO {tab} ({col}) VALUES ({val});""".format(
            tab=SQLtable
            col='`'+'`, `'.join(dic.keys()).lower()+'`',
            val="'"+"', '".join(dic.values()).replace('\\','/')+"' ")
        cursor.execute(sql)
        db.commit()
finally:
    db.close()
Проблема вот этой частью:

Python
1
2
3
4
5
6
for subpiece in root.iter('SubPiece'):
            SubPiece = subpiece.attrib
            dic.update({
                'description20': SubPiece['Description'],
                'cost': SubPiece['Cost'],
            })
При добавлении в базу, дублируется одно и тоже значение во все записи.
Подскажите как исправить?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
13.02.2017, 11:59
Ответы с готовыми решениями:

Создать файл xml schema на основе корректного xml
Вообщем есть следующая задача. Корректный XML файл results.xml содержит результаты прохождения теста студентами в виде: &lt;?xml...

Парсер xml
Здравствуйте, форумчане! Столкнулся с такой проблемой, получаю на сайте xml и пытаюсь его распарсить получаю такую ошибку. ...

Python 3.8 заголовок xml <?xml version=“1.0” encoding=“utf-8”?>
Прошу помощи. Необходимо создать xml файл с заголовком &lt;?xml version=“1.0” encoding=“utf-8”?&gt;?.Код уже написан, но проблема с заголовком...

2
11 / 11 / 7
Регистрация: 09.02.2017
Сообщений: 20
13.02.2017, 13:10
тут у тебя косяк root.iter('SubPiece') замени на
Python
1
2
piece_element = pieceses.find('Piece')
for subpiece in piece_element.iter('SubPiece')
посмотри ниже код:

Python
1
2
3
4
5
6
7
for getinvoiceinfo in getinvoiceinfos:
    pieceses = getinvoiceinfo.find('Pieces')
    piece_element = pieceses.find('Piece')
    for subpiece in piece_element.iter('SubPiece'):
        SubPiece = subpiece.attrib
        print(SubPiece['Description'])
        print(SubPiece['Cost'])
0
0 / 0 / 0
Регистрация: 13.02.2017
Сообщений: 2
13.02.2017, 22:10  [ТС]
Спасибо большое, очень помогли. Я что-то запутался совсем с этим xml.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
13.02.2017, 22:10
Помогаю со студенческими работами здесь

Подскажите, как парсить все xml файлы, вложенные в дочерние директории с исп. xml.dom.minidom?
Всем привет. Есть следующая структура папок: &lt;img src=&quot;https://habrastorage.org/webt/5d/0b/8f/5d0b8f031f86c050844094.png&quot;...

Найти XML-парсер / редактор XML с сохранением пользовательского форматирования
Привет. Передо мной стоит довольно интересная задача. Изначально есть пользовательский XML-файл. XML заведомо валидный, но может быть...

Запись XML-дерева сразу в xml-файл (парсер JAXP)
Народ!Программеры!Помогите человеку,плиз! Парсерю я xml-файл,через DOM-модель,использую JAXP.После модификации надо все дерево записать в...

Парсер XML
Привет. Почему-то не работает парсер, если использовать переменные. Не работает: $qid= $_GET; $parse =...

XML парсер
Есть .xml файлик: &lt;?xml version=&quot;1.0&quot;?&gt; &lt;Bible&gt; &lt;XMLBIBLE biblename=&quot;Russian&quot;&gt; &lt;BIBLEBOOK bname=&quot;Genesis&quot;&gt; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

Новые блоги и статьи
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11680&amp;d=1772460536 Одним из. . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru