Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/8: Рейтинг темы: голосов - 8, средняя оценка - 4.63
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23

Работа с регулярными выражениями в Python

18.03.2020, 17:54. Показов 1872. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Написать регулярное выражение на Python!
Для простоты будем считать, что:
- каждое предложение начинается с заглавной русской или латинской буквы;
- каждое предложение заканчивается одним из знаков препинания!?;
между предложениями может быть любой непустой набор пробельных символов;
- внутри предложений нет заглавных и точек (нет пакостей в духе «Мы любим творчество А. С. Пушкина)».
Разделите текст на предложения так, чтобы каждое предложение занимало одну строку.
Пустых строк в выводе быть не должно. Любые наборы из более одного пробельного символа замените на один пробел.

На ввод подаём:

В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это

не должно мешать.

На выходе получаем:

В этом предложении разрывы строки...
Но это не так важно!
Совсем?
Да, совсем!
И это не должно мешать.
Помогите пожалуйста реализовать , буду очень благодарен.

Добавлено через 36 минут
result = ('В этом предложении разрывы строки... Но это не так важно! Совсем? Да, совсем! И это не должно мешать. ')
print(result)
если я правильно понял нужно реализовать условия для этой строки
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
18.03.2020, 17:54
Ответы с готовыми решениями:

Форматирование текста с регулярными выражениями
Уважаемые специалисты пайтон, столкнулся с интересной задачей: нужно изменить все подстроки в тексте с 'US$ХХХ' на 'XXX долл. США'....

Усечение строк регулярными выражениями
привет, нужна помощь, не могу нагуглить ответ, всё не то попадается к примеру есть строки: Boy George, Culture Club - Life.mp3 ...

Работа с регулярными выражениями
Всем привет! У меня огромный код, который я хочу раскодировать регулярными выражениями. Подскажите как мне его разбить на части, иначе...

12
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5973 / 3735 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
18.03.2020, 18:40
Цитата Сообщение от Dmitry_SA Посмотреть сообщение
если я правильно понял нужно реализовать условия для этой строки
Нет. Вот строка:
Python
1
2
3
4
5
result = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
1
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23
18.03.2020, 18:54  [ТС]
а , понял спасибо .
как удалить пустые строки не подскажете ?
0
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5973 / 3735 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
18.03.2020, 19:00
Python
1
result = re.sub(r'\s+', '', result)
Добавлено через 37 секунд
Или
Python
1
result = re.sub(r'\n+', '\n', result)
0
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23
18.03.2020, 22:59  [ТС]
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
Нет. Вот строка:
Python
1
2
3
4
5
result = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
result = re.sub(r'\n+', '\n', result)
второй вариант подошёл первый помещал их в одну строку целиком
теперь я так понимаю нужно сделать что бы каждая строка начиналась именно со слова в котором находиться заглавная буква

Добавлено через 3 часа 54 минуты
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
Python
1
result = re.sub(r'\s+', '', result)
Добавлено через 37 секунд
Или
Python
1
result = re.sub(r'\n+', '\n', result)
всё же не могу понять как дальше реализовать выше перечисленные условия , не могли бы помочь ?
буду благодарен вам если у вас найдётся время.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
19.03.2020, 00:21
Лучший ответ Сообщение было отмечено Dmitry_SA как решение

Решение

Регулярных выражений должно быть сколько? Одно? Или можно два?
За одно пока не придумал...
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>> result = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
>>> blank = re.compile(r'[\s]+')
>>> print(re.sub(r'(.+?[?!.]+\x20*)', r'\1\n', blank.sub(' ',result)))
В этом предложении разрывы строки... 
Но это не так важно! 
Совсем? 
Да, совсем! 
И это не должно мешать.
 
>>>
2
2 / 2 / 0
Регистрация: 20.04.2015
Сообщений: 15
19.03.2020, 00:29
Кликните здесь для просмотра всего текста
Вот чего сочинил:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import re
 
regex = r"(^.+)$"
test_str = '''
В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.
'''
matches = re.findall(regex, test_str, re.MULTILINE)
string = ''.join(map(lambda x: x + ' ', matches)).strip()
print(string)
>>>В этом предложении разрывы строки... Но это не так важно! Совсем? Да, совсем! И это не должно мешать.

или

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import re
 
regex = r"(^.+)$"
test_str = '''
В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.
'''
matches = re.findall(regex, test_str, re.MULTILINE)
string = ''
for x in matches:
    string += x + ' '
string = string.strip()
print(string)
>>>В этом предложении разрывы строки... Но это не так важно! Совсем? Да, совсем! И это не должно мешать.

Добавлено через 7 минут
P.s. Ой...
Кажется, даже так работает.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import re
 
regex = r"(.+)"
test_str = '''
В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.
'''
matches = re.findall(regex, test_str)
string = ''
for x in matches:
    string += x + ' '
string = string.strip()
print(string)

Тьфу, невнимательно смотрел на требуемый результат. Виноват. Не то.
0
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23
19.03.2020, 01:25  [ТС]
ничего страшного )
0
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5973 / 3735 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
19.03.2020, 09:21
Python
1
2
3
4
5
6
7
8
9
10
11
import re
 
s = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
 
s = re.sub(r'\s+', ' ', s)
print(s)
print(re.findall(r'[А-ЯЁ].*?[\.\!\?]', s))
Добавлено через 40 секунд
Цитата Сообщение от phaggi Посмотреть сообщение
string += x + ' '
Python
1
' '.join(['1', '2', '3'])
1
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
19.03.2020, 13:59
[\.\!\?]
В квадратных скобках экранировать метасимволы не надо.
1
Модератор
Эксперт Python
 Аватар для Fudthhh
2696 / 1602 / 513
Регистрация: 21.02.2017
Сообщений: 4,210
Записей в блоге: 1
19.03.2020, 14:11
Garry Galler, за одну регулярку и не получится, т.к. операции нужно провести две, убрать лишние переходы и вставить новые.
0
2 / 2 / 0
Регистрация: 20.04.2015
Сообщений: 15
19.03.2020, 14:52
Прошу прощения за оффтопик.
Рыжий Лис, я пробовал так, но у меня что-то не сработало, и я не стал разбираться - что именно.
Это топорно и не тру-пайтон, но есть ли объективные основания (например, приводит к ошибке при определенных условиях; а join не приводит) не применять такой способ?
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
19.03.2020, 15:26
Цитата Сообщение от phaggi Посмотреть сообщение
но есть ли объективные основания
Есть. join работает в 100 раз быстрее.
На полумиллионе слов:
Code
1
2
%timeit -n 10 -r 1 test_for_concat(words)
4.79 s ± 0 ns per loop (mean ± std. dev. of 1 run, 10 loops each)
Code
1
2
%timeit -n 10 -r 1 test_join(words)
41.3 ms ± 0 ns per loop (mean ± std. dev. of 1 run, 10 loops each)
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
19.03.2020, 15:26
Помогаю со студенческими работами здесь

Работа с регулярными выражениями на c#
помогите написать шаблон для поиска в регулярном выражении на C# "description":"(любой текст с знаками препинания)",

Работа с регулярными выражениями
Имеется html-страница в которой мне нужно найти строки: style="color: #2A5DB0!important;">Word</a></div></td> ...

Работа с регулярными выражениями
Мне нужно получить из страницы определенные куски текста. т.е. надо найти такой кусок <TR class=norm2> <TD...

Работа с регулярными выражениями С++
Опишите функцию анализа номера, обработайте ошибку указания номера у недопустимом формате (допустимий формат (095)224-43-24)

Работа с регулярными выражениями
Привет всем. Имеются куча сотен ссылок с таким шаблоном ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2. Данный документ берёт данные из другого нетипового документа. . .
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать программный контроль на предмет проведения документа. . .
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: 1. Реализовать контроль заполнения реквизита. . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru