Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
1711 / 578 / 76
Регистрация: 10.04.2009
Сообщений: 9,306

Текст разбить на слова

17.11.2023, 10:39. Показов 517. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
здравствуйте, по сабжу, делаю это так:
Python
1
2
3
4
5
6
7
import re
from re import findall
 
text = "кожно-венерологический диспансер"
# \w - любая буква (то, что может быть частью слова), а также цифры и знак нижнего подчёркивания _
words = re.findall(r'\w+', text)
print(words)
ответ
['кожно', 'венерологический', 'диспансер']
не есть гут, как получить такой ответ
['кожно-венерологический', 'диспансер']
в подобных случаях?, спасибо
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.11.2023, 10:39
Ответы с готовыми решениями:

Словарь: разбить строку на слова и сохранить слова и места, где они встречаются
Доброго времени суток,форумчане. Формулирую задачу. Разбить строку на слова и сохранить слова и места, где они встречаются ...

Разбить текст на слова и потом снова собрать в текст
Здравствуйте! Подскажите пример разбиения текста на слова и потом сборка их снова в текст. Суть в следующем: 1. Разбить текст на...

Разбить текст на слова и все слова взять в кавычки
Подскажите пожалуйста с кодом , в программу надо ввести текст/переложения, затем программа должна текст разбить на отдельное слово и...

8
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
17.11.2023, 11:16
Лучший ответ Сообщение было отмечено Usaga как решение

Решение

Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
как получить такой ответ
Внести в диапазон нужные символы.
Ваш кэп
2
1711 / 578 / 76
Регистрация: 10.04.2009
Сообщений: 9,306
18.11.2023, 11:13  [ТС]
Python
1
2
3
4
5
6
import re
from re import findall
 
text = "кожно-венерологический диспансер"
print(re.findall(r'\w+', text))
print(re.findall(r'[a-zA-Zа-яА-Я\-]+', text))
остановился на втором варианте
вроде гут
['кожно', 'венерологический', 'диспансер']
['кожно-венерологический', 'диспансер']
0
Любознательный
 Аватар для YuS_2
7404 / 2254 / 360
Регистрация: 10.03.2016
Сообщений: 5,213
18.11.2023, 11:53
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
вроде гут
Вряд ли...
1. Зачем у Вас присутствует эта строка:
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
from re import findall
?

2. Попробуйте Ваш шаблон на такой строке:
"кожно - венёрологический диспансер"
0
1711 / 578 / 76
Регистрация: 10.04.2009
Сообщений: 9,306
18.11.2023, 12:00  [ТС]
Цитата Сообщение от YuS_2 Посмотреть сообщение
венёрологический
как пишут в сети - у буквы ё история окружена легендами и домыслами, предложите свой вариант))
0
Любознательный
 Аватар для YuS_2
7404 / 2254 / 360
Регистрация: 10.03.2016
Сообщений: 5,213
18.11.2023, 12:31
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
предложите свой вариант
Варианты можно предлагать только тогда, когда есть полное представление об исходных данных...
А на конкретный образец исходных данных, можно предложить только один вариантик:
Python
1
2
3
...
words = re.findall(r'(?i)[-a-zа-яё]+(?: *- *[-a-zа-яё]+)?', text)
...
1
1711 / 578 / 76
Регистрация: 10.04.2009
Сообщений: 9,306
18.11.2023, 14:11  [ТС]
Цитата Сообщение от YuS_2 Посмотреть сообщение
Варианты можно предлагать только тогда, когда есть полное представление об исходных данных...
ктобы спорил..............
что такое слова в русском языке - секретная информация))
Python
1
2
3
4
5
6
import re
text = "II - III и COVID-19,"
lst_words = re.findall(r'[a-zA-Zа-яА-Я\-]+', text) # текст разбить на слова
print(lst_words)
lst_words = re.findall(r'(?i)[-a-zа-яё]+(?: *- *[-a-zа-яё]+)?', text) # текст разбить на слова
print(lst_words)
['II', '-', 'III', 'и', 'COVID-']
['II - III', 'и', 'COVID-'] НЕ гут
и оба варианта пролетают с COVID-19, такие дела

Добавлено через 32 минуты
YuS_2, сорри пока не столкнулся не понял прикола с ё, поправил
re.findall(r'[a-zA-Zа-яёА-ЯЁ\-]+', text)
0
Любознательный
 Аватар для YuS_2
7404 / 2254 / 360
Регистрация: 10.03.2016
Сообщений: 5,213
18.11.2023, 14:36
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
['II - III', 'и', 'COVID-'] НЕ гут
Чойта? А как должно быть?

Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
и оба варианта пролетают с COVID-19, такие дела
Ну, а чего Вы хотели, ведь в своем шаблоне Вы цифры исключили...
0
8 / 8 / 0
Регистрация: 17.09.2023
Сообщений: 58
18.11.2023, 20:57
у строк в пайтоне есть функция split()
что то вроде

Python
1
2
3
txt = "welcome to the jungle"
 
x = txt.split()
по умолчанию делит строку по пробелам. передайте любой символ поделит по этому символу

так делать сначала по пробелу потом по дефису
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.11.2023, 20:57
Помогаю со студенческими работами здесь

Разбить текст на слова, найти все слова оканчивающиеся на "my", записать в файл с именем output.txt слова, в записи которых есть одинаковые буквы
Водится текст из файла input.txt. Слова могут быть разделены одним или несколькими пробелами. Разбить текст на слова, найти все слова...

Разбить Текст На Слова
Цель в выловленном из файла тексте посчитать количество слов. Текст вылавливаю и делаю стринговой величиной.. дальше тупик и лишь...

Разбить текст на слова
Всем Привет, у меня задание в лабороторной, необходимо разбить текст из файла на слова и найти анаграммы (с этим проблем нет), текст...

разбить текст на слова
Добрый День ! Подскадите пожалуйста программу ( желательно бесплатную) или скрипт, чтобы можно было текст автоматически разбить на слова .

разбить текст на слова
Помогите вывести текст из файла и разбить его на слова


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes. А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит токи на L и напряжения на C в установ. режимах до и. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru