Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,328

Текст разбить на слова

17.11.2023, 10:39. Показов 541. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
здравствуйте, по сабжу, делаю это так:
Python
1
2
3
4
5
6
7
import re
from re import findall
 
text = "кожно-венерологический диспансер"
# \w - любая буква (то, что может быть частью слова), а также цифры и знак нижнего подчёркивания _
words = re.findall(r'\w+', text)
print(words)
ответ
['кожно', 'венерологический', 'диспансер']
не есть гут, как получить такой ответ
['кожно-венерологический', 'диспансер']
в подобных случаях?, спасибо
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.11.2023, 10:39
Ответы с готовыми решениями:

Словарь: разбить строку на слова и сохранить слова и места, где они встречаются
Доброго времени суток,форумчане. Формулирую задачу. Разбить строку на слова и сохранить слова и места, где они встречаются ...

Разбить текст на слова и потом снова собрать в текст
Здравствуйте! Подскажите пример разбиения текста на слова и потом сборка их снова в текст. Суть в следующем: 1. Разбить текст на...

Разбить текст на слова и все слова взять в кавычки
Подскажите пожалуйста с кодом , в программу надо ввести текст/переложения, затем программа должна текст разбить на отдельное слово и...

8
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
17.11.2023, 11:16
Лучший ответ Сообщение было отмечено Usaga как решение

Решение

Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
как получить такой ответ
Внести в диапазон нужные символы.
Ваш кэп
2
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,328
18.11.2023, 11:13  [ТС]
Python
1
2
3
4
5
6
import re
from re import findall
 
text = "кожно-венерологический диспансер"
print(re.findall(r'\w+', text))
print(re.findall(r'[a-zA-Zа-яА-Я\-]+', text))
остановился на втором варианте
вроде гут
['кожно', 'венерологический', 'диспансер']
['кожно-венерологический', 'диспансер']
0
Любознательный
 Аватар для YuS_2
7406 / 2256 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
18.11.2023, 11:53
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
вроде гут
Вряд ли...
1. Зачем у Вас присутствует эта строка:
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
from re import findall
?

2. Попробуйте Ваш шаблон на такой строке:
"кожно - венёрологический диспансер"
0
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,328
18.11.2023, 12:00  [ТС]
Цитата Сообщение от YuS_2 Посмотреть сообщение
венёрологический
как пишут в сети - у буквы ё история окружена легендами и домыслами, предложите свой вариант))
0
Любознательный
 Аватар для YuS_2
7406 / 2256 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
18.11.2023, 12:31
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
предложите свой вариант
Варианты можно предлагать только тогда, когда есть полное представление об исходных данных...
А на конкретный образец исходных данных, можно предложить только один вариантик:
Python
1
2
3
...
words = re.findall(r'(?i)[-a-zа-яё]+(?: *- *[-a-zа-яё]+)?', text)
...
1
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,328
18.11.2023, 14:11  [ТС]
Цитата Сообщение от YuS_2 Посмотреть сообщение
Варианты можно предлагать только тогда, когда есть полное представление об исходных данных...
ктобы спорил..............
что такое слова в русском языке - секретная информация))
Python
1
2
3
4
5
6
import re
text = "II - III и COVID-19,"
lst_words = re.findall(r'[a-zA-Zа-яА-Я\-]+', text) # текст разбить на слова
print(lst_words)
lst_words = re.findall(r'(?i)[-a-zа-яё]+(?: *- *[-a-zа-яё]+)?', text) # текст разбить на слова
print(lst_words)
['II', '-', 'III', 'и', 'COVID-']
['II - III', 'и', 'COVID-'] НЕ гут
и оба варианта пролетают с COVID-19, такие дела

Добавлено через 32 минуты
YuS_2, сорри пока не столкнулся не понял прикола с ё, поправил
re.findall(r'[a-zA-Zа-яёА-ЯЁ\-]+', text)
0
Любознательный
 Аватар для YuS_2
7406 / 2256 / 360
Регистрация: 10.03.2016
Сообщений: 5,216
18.11.2023, 14:36
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
['II - III', 'и', 'COVID-'] НЕ гут
Чойта? А как должно быть?

Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
и оба варианта пролетают с COVID-19, такие дела
Ну, а чего Вы хотели, ведь в своем шаблоне Вы цифры исключили...
0
8 / 8 / 0
Регистрация: 17.09.2023
Сообщений: 58
18.11.2023, 20:57
у строк в пайтоне есть функция split()
что то вроде

Python
1
2
3
txt = "welcome to the jungle"
 
x = txt.split()
по умолчанию делит строку по пробелам. передайте любой символ поделит по этому символу

так делать сначала по пробелу потом по дефису
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.11.2023, 20:57
Помогаю со студенческими работами здесь

Разбить текст на слова, найти все слова оканчивающиеся на "my", записать в файл с именем output.txt слова, в записи которых есть одинаковые буквы
Водится текст из файла input.txt. Слова могут быть разделены одним или несколькими пробелами. Разбить текст на слова, найти все слова...

Разбить Текст На Слова
Цель в выловленном из файла тексте посчитать количество слов. Текст вылавливаю и делаю стринговой величиной.. дальше тупик и лишь...

Разбить текст на слова
Всем Привет, у меня задание в лабороторной, необходимо разбить текст из файла на слова и найти анаграммы (с этим проблем нет), текст...

разбить текст на слова
Добрый День ! Подскадите пожалуйста программу ( желательно бесплатную) или скрипт, чтобы можно было текст автоматически разбить на слова .

разбить текст на слова
Помогите вывести текст из файла и разбить его на слова


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2. Данный документ берёт данные из другого нетипового документа. . .
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать программный контроль на предмет проведения документа. . .
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: 1. Реализовать контроль заполнения реквизита. . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru