С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.63/8: Рейтинг темы: голосов - 8, средняя оценка - 4.63
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23

Работа с регулярными выражениями в Python

18.03.2020, 17:54. Показов 1837. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Написать регулярное выражение на Python!
Для простоты будем считать, что:
- каждое предложение начинается с заглавной русской или латинской буквы;
- каждое предложение заканчивается одним из знаков препинания!?;
между предложениями может быть любой непустой набор пробельных символов;
- внутри предложений нет заглавных и точек (нет пакостей в духе «Мы любим творчество А. С. Пушкина)».
Разделите текст на предложения так, чтобы каждое предложение занимало одну строку.
Пустых строк в выводе быть не должно. Любые наборы из более одного пробельного символа замените на один пробел.

На ввод подаём:

В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это

не должно мешать.

На выходе получаем:

В этом предложении разрывы строки...
Но это не так важно!
Совсем?
Да, совсем!
И это не должно мешать.
Помогите пожалуйста реализовать , буду очень благодарен.

Добавлено через 36 минут
result = ('В этом предложении разрывы строки... Но это не так важно! Совсем? Да, совсем! И это не должно мешать. ')
print(result)
если я правильно понял нужно реализовать условия для этой строки
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
18.03.2020, 17:54
Ответы с готовыми решениями:

Форматирование текста с регулярными выражениями
Уважаемые специалисты пайтон, столкнулся с интересной задачей: нужно изменить все подстроки в тексте с 'US$ХХХ' на 'XXX долл. США'....

Усечение строк регулярными выражениями
привет, нужна помощь, не могу нагуглить ответ, всё не то попадается к примеру есть строки: Boy George, Culture Club - Life.mp3 ...

Работа с регулярными выражениями
Всем привет! У меня огромный код, который я хочу раскодировать регулярными выражениями. Подскажите как мне его разбить на части, иначе...

12
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
18.03.2020, 18:40
Цитата Сообщение от Dmitry_SA Посмотреть сообщение
если я правильно понял нужно реализовать условия для этой строки
Нет. Вот строка:
Python
1
2
3
4
5
result = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
1
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23
18.03.2020, 18:54  [ТС]
а , понял спасибо .
как удалить пустые строки не подскажете ?
0
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
18.03.2020, 19:00
Python
1
result = re.sub(r'\s+', '', result)
Добавлено через 37 секунд
Или
Python
1
result = re.sub(r'\n+', '\n', result)
0
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23
18.03.2020, 22:59  [ТС]
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
Нет. Вот строка:
Python
1
2
3
4
5
result = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
result = re.sub(r'\n+', '\n', result)
второй вариант подошёл первый помещал их в одну строку целиком
теперь я так понимаю нужно сделать что бы каждая строка начиналась именно со слова в котором находиться заглавная буква

Добавлено через 3 часа 54 минуты
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
Python
1
result = re.sub(r'\s+', '', result)
Добавлено через 37 секунд
Или
Python
1
result = re.sub(r'\n+', '\n', result)
всё же не могу понять как дальше реализовать выше перечисленные условия , не могли бы помочь ?
буду благодарен вам если у вас найдётся время.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
19.03.2020, 00:21
Лучший ответ Сообщение было отмечено Dmitry_SA как решение

Решение

Регулярных выражений должно быть сколько? Одно? Или можно два?
За одно пока не придумал...
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>> result = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
>>> blank = re.compile(r'[\s]+')
>>> print(re.sub(r'(.+?[?!.]+\x20*)', r'\1\n', blank.sub(' ',result)))
В этом предложении разрывы строки... 
Но это не так важно! 
Совсем? 
Да, совсем! 
И это не должно мешать.
 
>>>
2
2 / 2 / 0
Регистрация: 20.04.2015
Сообщений: 15
19.03.2020, 00:29
Кликните здесь для просмотра всего текста
Вот чего сочинил:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import re
 
regex = r"(^.+)$"
test_str = '''
В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.
'''
matches = re.findall(regex, test_str, re.MULTILINE)
string = ''.join(map(lambda x: x + ' ', matches)).strip()
print(string)
>>>В этом предложении разрывы строки... Но это не так важно! Совсем? Да, совсем! И это не должно мешать.

или

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import re
 
regex = r"(^.+)$"
test_str = '''
В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.
'''
matches = re.findall(regex, test_str, re.MULTILINE)
string = ''
for x in matches:
    string += x + ' '
string = string.strip()
print(string)
>>>В этом предложении разрывы строки... Но это не так важно! Совсем? Да, совсем! И это не должно мешать.

Добавлено через 7 минут
P.s. Ой...
Кажется, даже так работает.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import re
 
regex = r"(.+)"
test_str = '''
В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.
'''
matches = re.findall(regex, test_str)
string = ''
for x in matches:
    string += x + ' '
string = string.strip()
print(string)

Тьфу, невнимательно смотрел на требуемый результат. Виноват. Не то.
0
0 / 0 / 0
Регистрация: 18.03.2020
Сообщений: 23
19.03.2020, 01:25  [ТС]
ничего страшного )
0
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5972 / 3734 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
19.03.2020, 09:21
Python
1
2
3
4
5
6
7
8
9
10
11
import re
 
s = '''В этом
предложении разрывы строки... Но это
не так важно! Совсем? Да, совсем! И это
 
не должно мешать.'''
 
s = re.sub(r'\s+', ' ', s)
print(s)
print(re.findall(r'[А-ЯЁ].*?[\.\!\?]', s))
Добавлено через 40 секунд
Цитата Сообщение от phaggi Посмотреть сообщение
string += x + ' '
Python
1
' '.join(['1', '2', '3'])
1
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
19.03.2020, 13:59
[\.\!\?]
В квадратных скобках экранировать метасимволы не надо.
1
Модератор
Эксперт Python
 Аватар для Fudthhh
2695 / 1601 / 513
Регистрация: 21.02.2017
Сообщений: 4,210
Записей в блоге: 1
19.03.2020, 14:11
Garry Galler, за одну регулярку и не получится, т.к. операции нужно провести две, убрать лишние переходы и вставить новые.
0
2 / 2 / 0
Регистрация: 20.04.2015
Сообщений: 15
19.03.2020, 14:52
Прошу прощения за оффтопик.
Рыжий Лис, я пробовал так, но у меня что-то не сработало, и я не стал разбираться - что именно.
Это топорно и не тру-пайтон, но есть ли объективные основания (например, приводит к ошибке при определенных условиях; а join не приводит) не применять такой способ?
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
19.03.2020, 15:26
Цитата Сообщение от phaggi Посмотреть сообщение
но есть ли объективные основания
Есть. join работает в 100 раз быстрее.
На полумиллионе слов:
Code
1
2
%timeit -n 10 -r 1 test_for_concat(words)
4.79 s ± 0 ns per loop (mean ± std. dev. of 1 run, 10 loops each)
Code
1
2
%timeit -n 10 -r 1 test_join(words)
41.3 ms ± 0 ns per loop (mean ± std. dev. of 1 run, 10 loops each)
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
19.03.2020, 15:26
Помогаю со студенческими работами здесь

Работа с регулярными выражениями на c#
помогите написать шаблон для поиска в регулярном выражении на C# "description":"(любой текст с знаками препинания)",

Работа с регулярными выражениями
Имеется html-страница в которой мне нужно найти строки: style="color: #2A5DB0!important;">Word</a></div></td> ...

Работа с регулярными выражениями
Мне нужно получить из страницы определенные куски текста. т.е. надо найти такой кусок <TR class=norm2> <TD...

Работа с регулярными выражениями С++
Опишите функцию анализа номера, обработайте ошибку указания номера у недопустимом формате (допустимий формат (095)224-43-24)

Работа с регулярными выражениями
Привет всем. Имеются куча сотен ссылок с таким шаблоном ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и источниками (напряжения, ЭДС и тока). Найти токи и напряжения во всех элементах. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru