С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# Windows Forms
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/15: Рейтинг темы: голосов - 15, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 07.02.2019
Сообщений: 2

Парсер для xml таблицы

07.02.2019, 00:44. Показов 3102. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Нужно создать парсер для xml таблицы.
Грубо говоря программа должна читать XML-файл. Разбирать элементы не используя встроенные
средства работы с XML!
В результате на экран или в файл должна выводится таблица с данными из распознанного XMLфайла.
Думаю самый надежный подход будет если искать теги мол <...> вот это должно выводиться в таблицу </а вот это оно не должно видеть>, но не могу понять алгоритм.
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
07.02.2019, 00:44
Ответы с готовыми решениями:

Универсальный парсер xml
Добрый день! Нужен универсальный парсер для xml. Что-то вроде pars(&quot;&lt;tag&gt;&quot;,&quot;&lt;/tag&gt;&quot;) , чтобы он выдавал то,что написано между открывающимся...

Парсер XML файла по тегам
Друзья подскажите как реализовать,сам в этом вопросе пока не понимаю: string yandex_url = &quot;https://news.yandex.ru/index.rss&quot;; ...

Прогноз погоды xml парсер
Здравствуйте. Хочу создать программу &quot;Прогноз погоды&quot;. Для разработки использую VS 2012, приложение на c#, windows forms. Немного...

3
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18245 / 14169 / 5366
Регистрация: 17.03.2014
Сообщений: 28,849
Записей в блоге: 1
07.02.2019, 01:27
Цитата Сообщение от NatalyMint Посмотреть сообщение
Разбирать элементы не используя встроенные
средства работы с XML!
Это глупое самограничение, если только речь не об учебном задании.
0
0 / 0 / 0
Регистрация: 07.02.2019
Сообщений: 2
07.02.2019, 13:20  [ТС]
Это конкретно учебное задание
0
Эксперт .NETАвтор FAQ
 Аватар для Storm23
10425 / 5155 / 1825
Регистрация: 11.01.2015
Сообщений: 6,226
Записей в блоге: 34
08.02.2019, 12:28
Лучший ответ Сообщение было отмечено OwenGlendower как решение

Решение

Цитата Сообщение от NatalyMint Посмотреть сообщение
Разбирать элементы не используя встроенные
средства работы с XML
Разобьем анализ на две части - лексический анализ и синтаксический.

Для лексического анализа будем использовать конечный автомат:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
    static class LexemAnalyser
    {
        public static IEnumerable<Lexem> ParseLexems(string xml)
        {
            return ParseLexemsRaw(xml).Where(lexem => lexem.Type != LexemType.Content || lexem.Text.Trim() != "");//ignore empty content lexems
        }
 
        private static IEnumerable<Lexem> ParseLexemsRaw(string xml)
        {
            LexemType type = LexemType.Content;
            string text = "";
 
            foreach (var c in xml)
            switch (c)
            {
                case '<':
                    yield return new Lexem(type, text);
                    type = LexemType.OpenTag; text = "";
                    break;
                case '/':
                    if (type == LexemType.OpenTag && text == "")
                        type = LexemType.CloseTag;
                    else
                        goto default;
                    break;
                case '>':
                    if (type == LexemType.Content)
                        goto default;
                    yield return new Lexem(type, text);
                    type = LexemType.Content; text = "";
                    break;
                default:
                    text += c;
                    break;
            }
 
            yield return new Lexem(type, text);
        }
    }
 
    enum LexemType
    {
        OpenTag, CloseTag, Content
    }
 
    class Lexem
    {
        public LexemType Type { get; set; }
        public string Text { get; set; }
 
        public Lexem(LexemType type, string text)
        {
            Type = type;
            Text = text;
        }
 
        public override string ToString()
        {
            return Type + ": " + Text;
        }
    }
Лексический анализатор выделяет только теги (атрибуты - не распознает).

Для такого XML:

XML
1
2
3
4
5
6
<note>
   <to>Tove</to>
   <from>Jani</from>
   <heading>Reminder</heading>
   <body>Don't forget me this weekend!</body>
</note>
Выводится следующий список лексем:
Code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
OpenTag: note
OpenTag: to
Content: Tove
CloseTag: to
OpenTag: from
Content: Jani
CloseTag: from
OpenTag: heading
Content: Reminder
CloseTag: heading
OpenTag: body
Content: Don't forget me this weekend!
CloseTag: body
CloseTag: note
Далее, для синтаксического анализа будем использовать стековый автомат:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
    static class XmlParser
    {
        public static XmlNode Parse(string xml)
        {
            //get lexems
            var lexems = LexemAnalyser.ParseLexems(xml).ToList();
            //check
            if (lexems.Count < 2) throw new Exception("Empty XML");
            if (lexems[0].Type != LexemType.OpenTag) throw new Exception("XML should start with tag");
            //build node tree
            var stack = new Stack<XmlNode>();
            foreach (var lexem in lexems)
            switch (lexem.Type)
            {
                case LexemType.OpenTag:
                    var node = new XmlNode() {Type = lexem.Type, Content = lexem.Text};
                    if (stack.Count > 0)
                        stack.Peek().Children.Add(node);
                    stack.Push(node);
                    break;
                case LexemType.CloseTag:
                    var open = stack.Pop();
                    if (open.Content != lexem.Text)
                        throw new Exception("Close tag does not correspond to open tag");
                    if (stack.Count == 0)
                        return open;
                    break;
                case LexemType.Content:
                    var textNode = new XmlNode() { Type = lexem.Type, Content = lexem.Text };
                    stack.Peek().Children.Add(textNode);
                    break;
            }
 
            throw new Exception("No close tag");
        }
    }
 
    class XmlNode
    {
        public List<XmlNode> Children = new List<XmlNode>();
        public LexemType Type;
        public string Content;
    }
Синтаксический анализатор на выходе формирует дерево, каждый элемент дерева содержится в классе XmlNode.

Результат разбора:
Code
1
2
3
4
5
6
7
8
9
note
        to
                Tove
        from
                Jani
        heading
                Reminder
        body
                Don't forget me this weekend!
Полный код:
Кликните здесь для просмотра всего текста
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
using System;
using System.Collections.Generic;
using System.Linq;
 
namespace ConsoleApplication239
{
    public class Program
    {
        static void Main(string[] args)
        {
            var xml = 
@"<note>
   <to>Tove</to>
   <from>Jani</from>
   <heading>Reminder</heading>
   <body>Don't forget me this weekend!</body>
</note>";
 
            Console.WriteLine("== LEXEMS ==");
 
            foreach (var lexem in LexemAnalyser.ParseLexems(xml))
                Console.WriteLine(lexem);
 
            Console.WriteLine();
            Console.WriteLine("== XML TREE ==");
 
            var root = XmlParser.Parse(xml);
            TypeXmlTree(root);
 
            Console.ReadLine();
        }
 
        static void TypeXmlTree(XmlNode node, string prefix = "")
        {
            Console.WriteLine(prefix + node.Content);
            foreach (var child in node.Children)
                TypeXmlTree(child, prefix + "\t");
        }
    }
 
    static class XmlParser
    {
        public static XmlNode Parse(string xml)
        {
            //get lexems
            var lexems = LexemAnalyser.ParseLexems(xml).ToList();
            //check
            if (lexems.Count < 2) throw new Exception("Empty XML");
            if (lexems[0].Type != LexemType.OpenTag) throw new Exception("XML should start with tag");
            //build node tree
            var stack = new Stack<XmlNode>();
            foreach (var lexem in lexems)
            switch (lexem.Type)
            {
                case LexemType.OpenTag:
                    var node = new XmlNode() {Type = lexem.Type, Content = lexem.Text};
                    if (stack.Count > 0)
                        stack.Peek().Children.Add(node);
                    stack.Push(node);
                    break;
                case LexemType.CloseTag:
                    var open = stack.Pop();
                    if (open.Content != lexem.Text)
                        throw new Exception("Close tag does not correspond to open tag");
                    if (stack.Count == 0)
                        return open;
                    break;
                case LexemType.Content:
                    var textNode = new XmlNode() { Type = lexem.Type, Content = lexem.Text };
                    stack.Peek().Children.Add(textNode);
                    break;
            }
 
            throw new Exception("No close tag");
        }
    }
 
    class XmlNode
    {
        public List<XmlNode> Children = new List<XmlNode>();
        public LexemType Type;
        public string Content;
    }
 
    static class LexemAnalyser
    {
        public static IEnumerable<Lexem> ParseLexems(string xml)
        {
            return ParseLexemsRaw(xml).Where(lexem => lexem.Type != LexemType.Content || lexem.Text.Trim() != "");//ignore empty content lexems
        }
 
        private static IEnumerable<Lexem> ParseLexemsRaw(string xml)
        {
            LexemType type = LexemType.Content;
            string text = "";
 
            foreach (var c in xml)
            switch (c)
            {
                case '<':
                    yield return new Lexem(type, text);
                    type = LexemType.OpenTag; text = "";
                    break;
                case '/':
                    if (type == LexemType.OpenTag && text == "")
                        type = LexemType.CloseTag;
                    else
                        goto default;
                    break;
                case '>':
                    if (type == LexemType.Content)
                        goto default;
                    yield return new Lexem(type, text);
                    type = LexemType.Content; text = "";
                    break;
                default:
                    text += c;
                    break;
            }
 
            yield return new Lexem(type, text);
        }
    }
 
    enum LexemType
    {
        OpenTag, CloseTag, Content
    }
 
    class Lexem
    {
        public LexemType Type { get; set; }
        public string Text { get; set; }
 
        public Lexem(LexemType type, string text)
        {
            Type = type;
            Text = text;
        }
 
        public override string ToString()
        {
            return Type + ": " + Text;
        }
    }
}


2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
08.02.2019, 12:28
Помогаю со студенческими работами здесь

Как лучше реализовать парсер HTML/XML, CSS, JavaScript?
Пишу свою интегрированную среду разработки для HTML, CSS и JavaScript. Считаю необходимым реализовать опциональную валидацию кода в...

XML парсер для объектов String
Есть сокетное соединение Server-Client. Client отсылает строчки xml-кода примерно следующего содержания: ...

Парсер для строк в XML-файле
Есть обычный xml файл, в котором хранятся 30 обычных строк, в тегах. Посоветуйте парсер, чтоб я мог легко и просто записать их в коллекцию.

Не получается сделать парсер для xml
mainwindow.cpp #include &quot;mainwindow.h&quot; #include &quot;ui_mainwindow.h&quot; MainWindow::MainWindow(QWidget *parent) : ...

XML или JSON парсер для STM32F407
Здравствуйте! Посоветуйте, пожалуйста, парсер xml или json форматов(нужен именно древовидный формат) для STM32F407. Парсер должен...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru