С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/8: Рейтинг темы: голосов - 8, средняя оценка - 4.50
 Аватар для VistaSV30
986 / 330 / 79
Регистрация: 10.04.2012
Сообщений: 1,239
Записей в блоге: 4

Заменить название улицы на стандартное

20.09.2021, 00:43. Показов 1636. Ответов 10

Студворк — интернет-сервис помощи студентам
Добрый день!
Нужно заменить различные названия улиц на стандартное, типа:
Мкр. Никольский, Улица 12-й Просек, д.14

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import regex as re
 
Nm1 = ['Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18',
            'Мкр. Никольский, Улица 122-ой Просек д.14',
            'Мкр. Никольский, Улица 20-ый Просек, д.14',
            'Мкр. Никольский, Улица 123-Просек, домовладение 2', 
            'Мкр. Никольский, Проспект Ленина двлд3',
            'Мкр. Никольский, Улица 124 - й Просек',
            'Мкр. Никольский, Улица 14-й ПРОСЕК']
Nm2 = ['Микрорайон Никольско-Архангельский, Улица просек 123-й, дом 18',
            'Мкр. Никольский, Улица Просек 122-ой д.14',
            'Мкр. Никольский, Улица Просек 20-ый, д.14',
            'Мкр. Никольский, Улица Просек-534, домовладение 2', 
            'Мкр. Никольский, Улица  Просек 124-й',
            'Мкр. Никольский, Улица ПРОСЕК 14-й']
 
Nm = Nm1 + Nm2
 
for item in Nm:
    print(item)
Все выходные хожу кругами. Вроде бы уже начинает получаться, но потом оказывается, что неправильно

Спасибо!
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
20.09.2021, 00:43
Ответы с готовыми решениями:

Форматирование название улицы
Добрый день! В почтовых адресах бывает элемент - "просек" Проблема в том, что номер просека может записываться в двух вариантах,...

Создать структуру, содержащую название улицы и количество жильцов
Список содержит число жителей, проживающих в каждом доме на пяти улицах села. 1. Создать структуру, содержащую название улицы, номер...

Создать структуру, содержащую название улицы, номер дома, количество жильцов
Добрый вечер! У меня небольшая проблемка) Если кто нибудь подскажет решение,буду рада! Вот задача: Список содержит число жителей,...

10
 Аватар для Пытливый
3763 / 2267 / 705
Регистрация: 29.05.2013
Сообщений: 9,622
20.09.2021, 01:46
Нужно заменить различные названия улиц на стандартное
А что значит стандартное? Где этот стандарт описан? Можно конечно считать ФИАС за стандарт, но там тоже ошибок много.
Вот когда вы хотя-бы для себя определите все правила написания, тогда и решение появится, а пока это невразумительная хотелка.
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 09:19
Имеется ввиду "привести к общему виду", как я понимаю.
0
 Аватар для VistaSV30
986 / 330 / 79
Регистрация: 10.04.2012
Сообщений: 1,239
Записей в блоге: 4
20.09.2021, 10:01  [ТС]
Пытливый, это в КЛАДР такой порядок написания адреса. А информация об объектах собирается из нескольких баз и поэтому надо привести к какому-то единому образцу.

Здесь у меня проблема в том, что номер просека может писаться впереди (1-й просек) или после (просек 1-й). Вот я бы и хотел, чтобы по всей базе было - 1-й просек.

Сейчас сам еще раз попробую сделать это регулярными выражениями.

Добавлено через 1 минуту
iSmokeJC да, Вы правильно понимаете. Вам отдельное спасибо! Вы мне уже давно с этим вопросом помогаете. У меня даже есть некоторый прогресс.
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 10:03
VistaSV30, если не получится - помогу как время будет
0
 Аватар для Пытливый
3763 / 2267 / 705
Регистрация: 29.05.2013
Сообщений: 9,622
20.09.2021, 10:19
Цитата Сообщение от iSmokeJC Посмотреть сообщение
Имеется ввиду "привести к общему виду", как я понимаю.
Я тоже это понимаю, но в отличии от нас, которые "понимают", компьютеру надо дать точный алгоритм действий.

Добавлено через 7 минут
Цитата Сообщение от VistaSV30 Посмотреть сообщение
это в КЛАДР такой порядок написания адреса
КЛАДР уже давно заменен на ФИАС.
Цитата Сообщение от VistaSV30 Посмотреть сообщение
информация об объектах собирается из нескольких баз и поэтому надо привести к какому-то единому образцу
Знакомая задача. О каком объеме в штуках мы говорим?
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 10:19
Пытливый, ну так ТС и указал нужный ему вид
0
 Аватар для VistaSV30
986 / 330 / 79
Регистрация: 10.04.2012
Сообщений: 1,239
Записей в блоге: 4
20.09.2021, 10:27  [ТС]
Пытливый сейчас занимаемся г. Балашиха Московской области, сейчас есть порядка 17 тыс. адресов. по 835 улицам (переулкам, бульварам, микрорайонам и прочим просекам )
0
 Аватар для Пытливый
3763 / 2267 / 705
Регистрация: 29.05.2013
Сообщений: 9,622
20.09.2021, 10:31
Цитата Сообщение от VistaSV30 Посмотреть сообщение
сейчас занимаемся г. Балашиха Московской области, сейчас есть порядка 17 тыс. адресов. по 835 улицам
Какая мелочь. Это даже руками можно обработать в течении часа.
0
 Аватар для VistaSV30
986 / 330 / 79
Регистрация: 10.04.2012
Сообщений: 1,239
Записей в блоге: 4
20.09.2021, 14:23  [ТС]
Кажется начало получаться
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
import regex as re
 
Nm1 = ['Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18',
            'Мкр. Никольский, Улица 122-ой Просек д.14',
            'Мкр. Никольский, Улица 20-ый Просек, д.14',
            'Мкр. Никольский, Улица 123-Просек, домовладение 2', 
            'Мкр. Никольский, Проспект Ленина двлд3',
            'Мкр. Никольский, Улица 124 - й Просек',
            'Мкр. Никольский, Улица 14-й ПРОСЕК']
Nm2 = ['Микрорайон Никольско-Архангельский, Улица просек 123-й, дом 18',
            'Мкр. Никольский, Улица Просек 122-ой д.14',
            'Мкр. Никольский, Улица Просек 20-ый, д.14',
            'Мкр. Никольский, Улица Просек-534, домовладение 2', 
            'Мкр. Никольский, Улица  Просек 124-й',
            'Мкр. Никольский, Улица ПРОСЕК 14-й']
 
Nm = Nm1 + Nm2
 
def Просек(Nm): # Форатирование элемента "Просек"
    Nm = ' '.join(Nm.split())  # удаление лишних пробелов
    Nm = ' ' + Nm + ' '
    nm = Nm.lower()
 
    if ('нарвский' not in nm): # Нарвский просек без номера
        regex = "\s*\d+.{,5}просек|просек\s+\d+[-ыой]+|просек\s?-\s?\d+"
        if re.search(regex, nm):
            rl = re.search(regex, nm).start()
            rr = re.search(regex, nm).end()
            N = re.search('\d+', Nm[rl:rr]).group()
            Nm = Nm.replace(Nm[rl:rr], str(N) + '-й Просек')
 
    return(Nm)
 
for item in Nm:
    print(Просек(item))
Добавлено через 2 минуты
Пока только в случае если номер был сначала удаляет пробел.

Добавлено через 22 минуты
Ну вроде бы всё
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def Просек(Nm): # Форатирование элемента "Просек"
    Nm = ' '.join(Nm.split())  # удаление лишних пробелов
    Nm = ' ' + Nm + ' '
    nm = Nm.lower()
 
    if ('нарвский' not in nm): # Нарвский просек без номера
        regex = "\s*\d+.{,5}просек|\s*просек\s+\d+[-ыой]+|\s*просек\s?-\s?\d+"
        if re.search(regex, nm):
            rl = re.search(regex, nm).start()
            rr = re.search(regex, nm).end()
            if (Nm[rl] == ' '): rl += 1  # если номер впереди, то удалялся пробел
            N = re.search('\d+', Nm[rl:rr]).group()
            Nm = Nm.replace(Nm[rl:rr], str(N) + '-й Просек')
            if ('улица' not in nm): Nm = Nm[:rl] + 'Улица ' + Nm[rl:]
 
    return(Nm)
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 14:40
Лучший ответ Сообщение было отмечено VistaSV30 как решение

Решение

Python
1
2
3
4
5
6
Nm = Nm1 + Nm2
for line in Nm:
    line = re.sub(r'(?i)(?<=улица\s+)(\d+)([^,]*?[- ]просек)', lambda x: f'{x.group(1)}-й просек', line)
    line = re.sub(r'(?i)(?<=улица )(\s*просек[- ])(\d+)([^,]*)', lambda x: f'{x.group(2)}-й просек', line)
    line = re.sub(r'(?i)(?<=просек) (?=д)', ', ', line)
    print(line)
Bash
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
"C:\Program Files\Python38\python.exe" C:/Users/User/IdeaProjects/p_forum/test.py
Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18
Мкр. Никольский, Улица 122-й просек, д.14
Мкр. Никольский, Улица 20-й просек, д.14
Мкр. Никольский, Улица 123-й просек, домовладение 2
Мкр. Никольский, Проспект Ленина двлд3
Мкр. Никольский, Улица 124-й просек
Мкр. Никольский, Улица 14-й просек
Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18
Мкр. Никольский, Улица 122-й просек
Мкр. Никольский, Улица 20-й просек, д.14
Мкр. Никольский, Улица 534-й просек, домовладение 2
Мкр. Никольский, Улица 124-й просек
Мкр. Никольский, Улица 14-й просек
 
Process finished with exit code 0
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
20.09.2021, 14:40
Помогаю со студенческими работами здесь

Составить базу данных, которая позволяет вводить ФИО человека, название улицы
Составить базу данных, которая позволяет вводить ФИО человека, название улицы. С помощью названия улицы вывести ФИО (название улицы...

Название улицы и номер дома в ячейке написаны слитно. Как вставить пробел между ними?
Часть адресов написаны правильно &quot;улица дом&quot; (например, Мира 72), а часть - нет (Мира72), т.е. отсутствует пробел. Как добавить...

Выдать для каждого адреса имя улицы, не включая тип улицы
Кто может перевести код с С++ на паскаль? пожалуйста. #include &lt;string&gt; #include &lt;vector&gt; #include &lt;algorithm&gt; typedef...

Название улицы и номер дома в ячейке написаны слитно. Как вставить пробел между ними макросом
Часть адресов написаны правильно &quot;улица дом&quot; (например, Мира 72), а часть - нет (Мира72), т.е. отсутствует пробел. Как добавить...

Вывести название улицы которая имеет больше всего домов и общее количество квартир для каждой из улиц
Хелп) Условие В файле записано: название улицы, номер дома, количество квартир. Вывести название улицы которая имеет больше всего...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru