|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
|||||||
Составить регулярку для замены тэгов01.04.2016, 12:20. Показов 1324. Ответов 17
Метки нет (Все метки)
Есть файл в кодировке UTF-8. Хочу сделать некоторые замены в строках вида <английский текст> (<русский текст>. Например:
0
|
|||||||
| 01.04.2016, 12:20 | |
|
Ответы с готовыми решениями:
17
Составить регулярку для поиска символов |
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 01.04.2016, 12:27 | |
|
Можете привести полноценный пример, например,
входная строка: ХХХ выходная строка: ZZZ
0
|
|
|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
||||||||||||||||
| 01.04.2016, 12:39 [ТС] | ||||||||||||||||
0
|
||||||||||||||||
|
2796 / 2039 / 682
Регистрация: 02.03.2015
Сообщений: 6,509
|
|
| 01.04.2016, 12:54 | |
|
Метод .match работает с начала строки, а у Вас как я вижу, строки начинаются с «<р>»
1
|
|
|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
|
| 01.04.2016, 13:09 [ТС] | |
|
Чёрт, конечно, нужен search. Какая глупая ошибка.
0
|
|
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|||||||||||
| 01.04.2016, 14:07 | |||||||||||
|
Как вариант:
1
|
|||||||||||
|
2796 / 2039 / 682
Регистрация: 02.03.2015
Сообщений: 6,509
|
||||||
| 01.04.2016, 17:00 | ||||||
|
Jabbson, Зачем усложнять?
1
|
||||||
|
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 01.04.2016, 17:07 | |
|
0
|
|
|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
|
| 01.04.2016, 18:32 [ТС] | |
|
Блин, только я закрыл доки по питону, доки по регэкспам, две статьи на хабре и собрался идти домой (пятница же ж!), как тут... Злыдни
![]() Добавлено через 56 минут Marinero, у вас одна точка лишняя. Из-за неё регэксп неправильно обработает такую, например, строку: <p>Not me (Не я)</p> На самом деле спасибо за ответы, очень красивые варианты. Правда, описанная задача была только первым приближением к нужному результату, а на данный момент файл обработан уже в третьем приближении к идеалу
0
|
|
|
2796 / 2039 / 682
Регистрация: 02.03.2015
Сообщений: 6,509
|
|
| 01.04.2016, 21:35 | |
|
arada_s, Если Вы уверены что там не будет знаков препинания…
0
|
|
|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
||||||||
| 02.04.2016, 01:54 [ТС] | ||||||||
|
Ну, это смотря где они там будут... В моём файле они вообще проставлены так: <p>Not me (Не я).</p>
Кликните здесь для просмотра всего текста
Кажется, начал более-менее понимать эти ваши регэкспы... Исходник:
0
|
||||||||
|
2796 / 2039 / 682
Регистрация: 02.03.2015
Сообщений: 6,509
|
||||||||||||
| 02.04.2016, 12:11 | ||||||||||||
![]()
И вообще, бросайте заниматься фигней. Парсить html регулярками — дурной тон, когда есть lxml
0
|
||||||||||||
|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
|||||||
| 02.04.2016, 12:24 [ТС] | |||||||
0
|
|||||||
|
2796 / 2039 / 682
Регистрация: 02.03.2015
Сообщений: 6,509
|
||||||
| 02.04.2016, 12:47 | ||||||
|
Не хотите забирать пробелы внутрь тэга?
0
|
||||||
|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
|
| 02.04.2016, 15:01 [ТС] | |
|
Проблемка... апостроф считается разделителем.
<p>“There’s no hurry (некуда торопиться: «нет спешки»), we have all the day before us (у нас впереди целый день)! We don’t want any adventures here, thank you (не нужны нам здесь никакие приключения, спасибо)!”</p> Кручу по-всякому, но что-то не получается... Сейчас посмотрю, что этот lxml собой представляет. Добавлено через 17 минут Вроде бы lxml тут не поможет... Когда я получу абзац, оборачивать английский текст тегами <strong> мне всё равно придётся регулярками... Или я не прав? Добавлено через 8 минут Кстати, мой корявый вариант из-под спойлера работает
0
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 02.04.2016, 15:04 | |
|
0
|
|
|
2796 / 2039 / 682
Регистрация: 02.03.2015
Сообщений: 6,509
|
||
| 02.04.2016, 17:24 | ||
|
В чем проблема добавить апостроф в класс символов [a-z’ -]?
0
|
||
|
14 / 11 / 4
Регистрация: 24.05.2013
Сообщений: 36
|
||
| 02.04.2016, 18:33 [ТС] | ||
![]() В regex101.com не работает модификатор i для русского языка (а сначала я вообще забыл его поставить), и дефис надо экранировать
0
|
||
| 02.04.2016, 18:33 | |
|
Помогаю со студенческими работами здесь
18
Не могу составить регулярку для поиска текста Составить регулярку для получения всех ссылок на файлы и на папки, которые есть на сервере
Как составить регулярку? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога
Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
|
|
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога
SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
|