MindHunter

Как сделать парсинг файла?

27.08.2010, 19:28. Показов 1986. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
У меня есть входной текстовый поток, который может содержать модификаторы стилей, которые опредиляют изменение стиля текста.
Следующая таблица демонстрирует какие теги могут быть использованы во входном файле:
\ - символ ' '
B - показывает начало 'Bold' стиля текста или его конец (если он уже опредилён)
I - показывает начало 'Italic' стиля текста или его конец (если он уже опредилён)
COLOR=RGB(red,green,blue) - определяет цвет последующего текста
COLOR - возвращает к предыдущему цвету текста

Тогда содержимое входного файла может быть к примеру такое:
TheB quickI brownB fox COLOR=RGB(255,0,0)jumpsCOLOR=RGB(0,255,0 ) overCOLOR theCOLOR lazy dog.

Как мне сделать нормальный парсинг этого файла?
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
27.08.2010, 19:28
Ответы с готовыми решениями:

GWT как осуществить парсинг файла и отобразить в таблице
Доброго времени суток комрады! Возникла проблема с Google Web Toolkit необходимо сделать так чтобы пользователь загружал текстовый файл и...

Парсинг txt файла, как лучше сделать?
Задача следующая есть стандартный txt файл, его размерность может достигать до 1-2 Мб Его структура примерно такая... Например вот...

Как сделать парсинг страницы
Имеется код: private void button1_Click(object sender, EventArgs e) { string urik =...

2
3 / 3 / 0
Регистрация: 25.08.2010
Сообщений: 213
29.08.2010, 12:22
Чтобы долго не гемориться попробуй поискать утилитку типа lex или flex под Java - они предназначены для генерации луксических анализаторов - что тебе собственно и надо и есть для C/C++ скорее всего есть и для Java. - Искать лучше в разделах компиляторы.
Можно в принципе покрутить через java.util.StringTokenizer - он парсит строку но там надо будет тогда делать большой case хранить много флагов состояния и он будет очень чувствительным к напианию - нехватка одного пробела и он так тебе распарсит, что за голову возьмешься.
Поэтому лучше поищи - быстрее и качественнее будет
0
4 / 4 / 1
Регистрация: 13.08.2008
Сообщений: 931
30.08.2010, 11:36
в сфере ява отличным решением будет ANTLR. наберите в гугле просто и получите массу ссылок на описание, туториалы и уже готовые базы парсеров (например, для ХТМЛ, для Java sources, etc.)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
30.08.2010, 11:36
Помогаю со студенческими работами здесь

Парсинг постов с группы вк - как сделать?
Мне нужно сделать парсер постов с группы вк. Но проблема в том что там посты подгружаются по javascript'y по мере прокрутки страницы...

Как сделать парсинг fb2 книги?
Срочно нужно узнать как можно парсить fb2 формат. Знаю что можно с помощью Linq, но как? Напишите хотя кусок кода ) Добавлено...

Как сделать парсинг сайта (сформировать запросы)
Сразу замечу, что я лишь прошу помощи в формировании структуры кода, т.е как это дучше сделать. 1 - Что у нас имеется ? Ссылка на...

Авторизация на сайте, а затем парсинг, как сделать?
Здравствуйте Столкнулся с такой проблемой, пишу парсер товаров с сайта, но цены на нем отображаются лишь только при авторизации на...

Как сделать парсинг картинки из таблицы Word
Здравствуйте! Делаю стандартную анкету (для последующей автоматической обработки) и все реализовал с помощью форм word. Осталась одна...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru