Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.92/13: Рейтинг темы: голосов - 13, средняя оценка - 4.92
34 / 20 / 9
Регистрация: 29.08.2015
Сообщений: 87

Кодировки, регулярные выражения

04.09.2015, 14:05. Показов 2579. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Вопрос, наверное, глупый, но уже надоело бороться с кодировками. Почему при выполнении регулярного выражения нарушается кириллица? Как это исправить?

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
#!/usr/bin/python
# -*- coding: utf-8 -*-
 
import re
 
txt = """&Какой-то текст, и еще текст!?"""
txt = txt.lower()
txt = re.sub('[^0-9а-яa-z\s]*', '', txt)
 
print txt
f = open("res.txt","w")
f.write(txt)
f.close()
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
04.09.2015, 14:05
Ответы с готовыми решениями:

Регулярные выражения
Читал статью на хабре про регулярные выражение и не могу понять одну вещь, обьясните на пальцах. Цитирую: "Скажем, вы хотите...

Регулярные выражения
Всем здравствуйте. Помогите решить проблему. Есть текстовый файл, в нем мне нужно отобрать среди списка вот такой структуры: 10....

Регулярные выражения
Подскажите как найти в строке последовательность символов: "nanananana". Мне нужна исключительно такая последовательность, то есть мне...

4
Эксперт Python
 Аватар для dondublon
4653 / 2073 / 366
Регистрация: 17.03.2012
Сообщений: 10,183
Записей в блоге: 6
04.09.2015, 14:22
А у вас там честно utf-8?
0
34 / 20 / 9
Регистрация: 29.08.2015
Сообщений: 87
04.09.2015, 14:30  [ТС]
Честно
Миниатюры
Кодировки, регулярные выражения  
0
0 / 0 / 1
Регистрация: 02.09.2015
Сообщений: 2
04.09.2015, 16:17
Лучший ответ Сообщение было отмечено ivitaliy как решение

Решение

Добавьте u перед строками:
txt = u"""&Какой-то текст, и еще текст!?"""
и
txt = re.sub(u'[^0-9а-яa-z\s]*', '', txt)

или используйте unicode:
txt = unicode("""&Какой-то текст, и еще текст!?""", "UTF-8")
и
txt = re.sub(unicode('[^0-9а-яa-z\s]*', "UTF-8"), '', txt)
0
34 / 20 / 9
Регистрация: 29.08.2015
Сообщений: 87
04.09.2015, 16:34  [ТС]
hda1, благодарю, догадывался, что все должно быть просто, но "методом тыка" уже голову сломал.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
04.09.2015, 16:34
Помогаю со студенческими работами здесь

Регулярные выражения
1. как с помощью регулярных выражений вытащить текст из тегов <td></td>: <td>text1</td> 2. После редактирования и вернуть назад: ...

Регулярные выражения
Здравствуйте. Нужно написать регулярное выражение одной строкой для ссылки, в которой после http:// не может быть символов /. Пример...

Регулярные выражения
Как с помощью регулярок найти в заданном тексте фамилии и отсортировать их по алфавиту? Проблема в том , что фамилией считается слово с...

Регулярные выражения
Напишите пожалуйста код для решения задачи У Софии был очень напряженный месяц и она решила взять отпуск на неделю. Чтобы избежать...

регулярные выражения
подскажите пожалуйста, можно-ли с помощью спецсимволов найти слова в строке, в которых данный символ встречается определенное количество...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Программный отбор элементов справочника Номенклатура по группе 1С
Maks 22.03.2026
Установка программного отбора элементов справочника "Номенклатура" из модуля формы документа. В качестве фильтра для отбора справочника служит группа номенклатуры. Отбор под наименованию группы (на. . .
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс. Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
Программный отбор элементов справочника Сотрудники по перечислениям 1С
Maks 21.03.2026
Установка программного отбора элементов справочника "Сотрудники" из модуля формы документа. В качестве фильтра для отбора служит предопределенное значение перечислений. Процедура. . .
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru