Форум программистов, компьютерный форум, киберфорум
Наши страницы
Алгоритмы
Войти
Регистрация
Восстановить пароль
Другие темы раздела
Алгоритмы Задача упаковки предметов https://www.cyberforum.ru/algorithms/thread2083278.html
Задача формулируется следующим образом. Исходные данные: есть контейнеры разной вместимости, есть предметы различного веса и габаритов. Необходимо, таким образом, упаковать предметы в контейнеры,...
Алгоритмы Создание блок-схемы
Ребята, нужна ваша помощь, нужно создать блок-схему за таким условием: Определить, пересекает ли математическая функция y = f (x) ось x на заданном интервале . Для этого разбить заданный интервал на...
Создание следа "трассирующие пули" Алгоритмы
Снова всем здравствуйте. Подскажите как можно сделать след от пули типа трассера? Я пробовал делать анимированной текстурой, но не то получается. В принципе неплохо но не то. Неуправляемый...
Алгоритмы Улучшение алгоритма сортировки слиянием, алгоритмом сортировки вставкой Изучаю алгоритмизацию по книге Томаса Кормена. Немного не понимаю что от меня хотят при решении подобных упражнений. Нужно придумать свой псевдокод с уже встроенной сортировкой вставкой? Или нужно... https://www.cyberforum.ru/algorithms/thread2080701.html
Алгоритмы Необходимо преобразовать формулу из инфиксной формы в префиксную https://www.cyberforum.ru/algorithms/thread2080514.html
Помогите пожалуйста на C++ реализовать алгоритм перехода от инфиксной формы записи к префиксной
Циклический алгоритм Алгоритмы
Доброго дня! Помогите нарисовать алгоритмом. Есть ряд чисел от 2 до 5 с шагом 0.6, собственно шагов получается 6. Нужно посчитать сумму чисел начиная начиная с 2 до 5 с шагом 0.6, умноженную на...
Алгоритм сортировки полигонов трёхмерного объекта Алгоритмы
Нужно закрасить невыпуклый трёхмерный объект, состоящий из полигонов. Для этого определяю расстояние от точки обзора до каждого полигона, и сортирую их по близости. Расстояние до полигона...
Алгоритмы Теория вероятности(задачи) Помогите пожалуйста решить задачи,очень надо.(Знаю только что решаются они по теореме сложения и умножения вероятностей). 1.С урны,в которой лежать 3 белых и два черных шарика достают два шарика,не... https://www.cyberforum.ru/algorithms/thread2079342.html
Алгоритмы Цвета графиков и бэкграунд https://www.cyberforum.ru/algorithms/thread2079211.html
Товарищи. А как правильно выбирать цвета для отображения семейства графиков при условии, что цвет бэкграунда может меняться? Есть ли какой-то алгоритм, который создаст набор цвет, которые будут...
Алгоритмы Блок-схема к коду на С++ Написал код на с++, но не могу создать к нему блох-схему : #include "stdafx.h" #include "windows.h" #include "iostream" #include <conio.h> using namespace std; int main() { int n; https://www.cyberforum.ru/algorithms/thread2079099.html
vrm2
353 / 243 / 65
Регистрация: 03.12.2015
Сообщений: 531
Завершенные тесты: 2
20.10.2017, 00:53 0

Математические алгоритмы для парсинга текста из word и xml

20.10.2017, 00:53. Просмотров 1169. Ответов 3
Метки (Все метки)

Ответ

Математики там мало. Вернее, она немного другая, нечисленная. Хотя да, в основе всего лежат формальные языки, которые изучает математика (в отличие от естественных языков).

Парсер берет последовательность символов и "расшифровывает текст" на основе определенных правил, или выдает ошибку. Эти правила придумывает разработчик языка (или разработчик формата файла). Эти правила называются грамматикой.

Например, придумаем "язык сложения натуральных чисел". Он описывается (упрощенно) как "число + число".
Парсер принимает на вход строку "5 + 8" и выдает результат "хотят сложить 5 и 8".
Парсер принимает на вход строку "5 8 *" и выдает результат "ничего не понимаю, первое число 5 вижу, а дальше белиберда какая-то".

Парсер превращает набор входных символов в некую структуру с которой удобно работать. Например, парсер XML превращает XML-текст (теги, тексты, комментарии) в дерево (DOM). Парсер трактует последовательность букв на основе грамматики XML. Грамматика определяет как записаны теги, как записаны комментарии, как записан текст и т.п. И для Word есть своя грамматика (язык для описания файлов word) и для XPath (язык для описания выбора элементов в DOM).


У Вас цель-то какая? Научиться парсить сайты? Создать свой компилятор/интерпретатор/язык программирования? Создавать библиотеки для работы с файлами (word, xml и т.п.)? Вычленять тексты из разных источников?


Теория у них у всех одна (парсеры, грамматика и пр.). Но дело в том, что для этих задач алгоритмы и подходы будут совсем разные. И теория парсеров и формальных языков не сильно и нужна, достаточно уже готовых библиотек (с которыми Вы уже столкнулись).

Вернуться к обсуждению:
Математические алгоритмы для парсинга текста из word и xml
0
QA
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
20.10.2017, 00:53
Готовые ответы и решения:

Математические алгоритмы для парсинга текста из word и xml или подобных
Здравствуйте, какие есть математические алгоритмы для парсинга текста из word или xml или похожих....

Библиотека для xml парсинга
Доброго времени суток. У меня появилась необходимость чтения xml из потока (файлы будут...

Выбор для xml парсинга
Приветствую всех. Помогите пожалуйста советом, что лучше взять для парса xml файла. Что есть у...

Посоветуйте библиотеку для парсинга XML (xdxf)
Здравствуйте. Есть словари в формате xdxf. Кто не знаком xdxf - это, как по мне, сильно неудачная...

Нет нужного класса в библиотеке для парсинга XML
Всем привет! Вчера начал изучать C# для написания логики под среду playerIO. Столкнулся вот с...

3
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2020, vBulletin Solutions, Inc.