Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
Padawan
 Аватар для Johnny_D
473 / 323 / 30
Регистрация: 30.01.2010
Сообщений: 1,841

Регулярка для парсинга

06.09.2010, 14:19. Показов 1118. Ответов 7

Студворк — интернет-сервис помощи студентам
стал писать регулярку для парсинга данных, но запутался, просьба помочь

Code
1
2
3
111-213-65-12        TS FILTER I     1     2.11      9.11 74123N      01/02/2010
DF654687         PISTON,RR BRAKE     1    39.23     39.68 85546N      01/02/2010
6-975234-123-2 LAMP; SIDE COMB       1    12.06     72.06 93453N      01/02/2010
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
06.09.2010, 14:19
Ответы с готовыми решениями:

Регулярка для парсинга #2
Помогите пожалуйста составить регулярку для парсинга этого значения и получения количество онлайна т.е "7". <li>Общий...

Регулярка для парсинга
Подскажите пожалуйста регулярку для парсинга этой строки <li><a href="http://xxx.ddd.com/ASDDSS">Мой...

Нужна регулярка для парсинга HTML
<tr> <td id="request_fix"> <a href="javascript:void(0)" onclick="return false;"><b>Проведение сервисного...

7
137 / 133 / 20
Регистрация: 03.02.2009
Сообщений: 608
06.09.2010, 16:27
Цитата Сообщение от Johny_D Посмотреть сообщение
стал писать регулярку для парсинга данных, но запутался, просьба помочь

Code
1
2
3
111-213-65-12        TS FILTER I     1     2.11      9.11 74123N      01/02/2010
DF654687         PISTON,RR BRAKE     1    39.23     39.68 85546N      01/02/2010
6-975234-123-2 LAMP; SIDE COMB       1    12.06     72.06 93453N      01/02/2010
в чем помочь то?
0
Padawan
 Аватар для Johnny_D
473 / 323 / 30
Регистрация: 30.01.2010
Сообщений: 1,841
06.09.2010, 17:52  [ТС]
virus_system, лично у меня проблема возникла с первыми двумя столбцами. Ясно видно, что первый из них артикул, второй название, но в названии присутствую и пробелы и левые символы вроде ';', проблема именно с ними, остальные распарсить не сложно.
0
 Аватар для s-kvv
76 / 73 / 9
Регистрация: 09.06.2010
Сообщений: 206
07.09.2010, 04:35
Может так?

C#
1
@"([^\s]+)\s+([^\d]+?)\s+(\d+)\s+([\.\d]+)\s+([\.\d]+)\s+([\d\w]+)\s+(\d{2}\/\d{2}\/\d{4})"
1
Padawan
 Аватар для Johnny_D
473 / 323 / 30
Регистрация: 30.01.2010
Сообщений: 1,841
07.09.2010, 10:30  [ТС]
Да уже сделал в обход, первую половину вырезаю через находя первый пробел, а остальную часть сбрасываю в регулярку. А вот что здесь значит '?'
Code
1
([^\d]+[COLOR="Red"]?[/COLOR])
0
 Аватар для s-kvv
76 / 73 / 9
Регистрация: 09.06.2010
Сообщений: 206
12.09.2010, 14:54
Цитата Сообщение от Johny_D Посмотреть сообщение
Да уже сделал в обход, первую половину вырезаю через находя первый пробел, а остальную часть сбрасываю в регулярку. А вот что здесь значит '?'
Code
1
([^\d]+[COLOR="Red"]?[/COLOR])
? - значит: предшествующий символ, группа или класс символов может быть, а может и не быть в разбираемом тексте

а вот это - [COLOR="Red"]? - в разбираемом тексте соответствует только одному из символов строки COLOR="Red"(кавычки дублируются, но смысла не меняет), или отсутствие символа из этой группы
[/CODE] - аналогично
1
Padawan
 Аватар для Johnny_D
473 / 323 / 30
Регистрация: 30.01.2010
Сообщений: 1,841
13.09.2010, 00:35  [ТС]
s-kvv, да это просто тег форума не отобразился )
0
 Аватар для s-kvv
76 / 73 / 9
Регистрация: 09.06.2010
Сообщений: 206
13.09.2010, 02:26
Ясно)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
13.09.2010, 02:26
Помогаю со студенческими работами здесь

Регулярка для парсинга прокси с сайта
Учусь писать регулярки, первое знакомство, решил спарсить с сайта прокси. Удивился результату 151.200.170.146:80 01:11:14 16:00 ...

Калькулятор - регулярка для парсинга строки
Всем привет. Пишу строковый калькулятор. Вводится строка вида 31+4*2/(1-5)^2 и калькулятор должен выдать результат. Хочу сделать перевод...

Регулярка для \\\n\r
Добрый день, я в регулярных выражениях не силен. Нужно заменить: Если предыдущий символ не "\\"(один слеш), тогда этот и...

Регулярка для rv
Здравствуйте, Как написать регулярку для выделения версии IE? rv:11.0 приведя ее к шаблону browserSplit = //i, как в...

Запросы для парсинга
Продаю базу запросов для парсинга Google-Yahoo-MSN. Всего 3500 уникальных признаков. Без повторов. Без подстановок site:.com и т.д. База...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru