Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/8: Рейтинг темы: голосов - 8, средняя оценка - 4.50
 Аватар для VistaSV30
987 / 331 / 79
Регистрация: 10.04.2012
Сообщений: 1,241
Записей в блоге: 4

Заменить название улицы на стандартное

20.09.2021, 00:43. Показов 1652. Ответов 10

Студворк — интернет-сервис помощи студентам
Добрый день!
Нужно заменить различные названия улиц на стандартное, типа:
Мкр. Никольский, Улица 12-й Просек, д.14

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import regex as re
 
Nm1 = ['Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18',
            'Мкр. Никольский, Улица 122-ой Просек д.14',
            'Мкр. Никольский, Улица 20-ый Просек, д.14',
            'Мкр. Никольский, Улица 123-Просек, домовладение 2', 
            'Мкр. Никольский, Проспект Ленина двлд3',
            'Мкр. Никольский, Улица 124 - й Просек',
            'Мкр. Никольский, Улица 14-й ПРОСЕК']
Nm2 = ['Микрорайон Никольско-Архангельский, Улица просек 123-й, дом 18',
            'Мкр. Никольский, Улица Просек 122-ой д.14',
            'Мкр. Никольский, Улица Просек 20-ый, д.14',
            'Мкр. Никольский, Улица Просек-534, домовладение 2', 
            'Мкр. Никольский, Улица  Просек 124-й',
            'Мкр. Никольский, Улица ПРОСЕК 14-й']
 
Nm = Nm1 + Nm2
 
for item in Nm:
    print(item)
Все выходные хожу кругами. Вроде бы уже начинает получаться, но потом оказывается, что неправильно

Спасибо!
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
20.09.2021, 00:43
Ответы с готовыми решениями:

Форматирование название улицы
Добрый день! В почтовых адресах бывает элемент - "просек" Проблема в том, что номер просека может записываться в двух вариантах,...

Создать структуру, содержащую название улицы и количество жильцов
Список содержит число жителей, проживающих в каждом доме на пяти улицах села. 1. Создать структуру, содержащую название улицы, номер...

Создать структуру, содержащую название улицы, номер дома, количество жильцов
Добрый вечер! У меня небольшая проблемка) Если кто нибудь подскажет решение,буду рада! Вот задача: Список содержит число жителей,...

10
 Аватар для Пытливый
3763 / 2267 / 705
Регистрация: 29.05.2013
Сообщений: 9,622
20.09.2021, 01:46
Нужно заменить различные названия улиц на стандартное
А что значит стандартное? Где этот стандарт описан? Можно конечно считать ФИАС за стандарт, но там тоже ошибок много.
Вот когда вы хотя-бы для себя определите все правила написания, тогда и решение появится, а пока это невразумительная хотелка.
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 09:19
Имеется ввиду "привести к общему виду", как я понимаю.
0
 Аватар для VistaSV30
987 / 331 / 79
Регистрация: 10.04.2012
Сообщений: 1,241
Записей в блоге: 4
20.09.2021, 10:01  [ТС]
Пытливый, это в КЛАДР такой порядок написания адреса. А информация об объектах собирается из нескольких баз и поэтому надо привести к какому-то единому образцу.

Здесь у меня проблема в том, что номер просека может писаться впереди (1-й просек) или после (просек 1-й). Вот я бы и хотел, чтобы по всей базе было - 1-й просек.

Сейчас сам еще раз попробую сделать это регулярными выражениями.

Добавлено через 1 минуту
iSmokeJC да, Вы правильно понимаете. Вам отдельное спасибо! Вы мне уже давно с этим вопросом помогаете. У меня даже есть некоторый прогресс.
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 10:03
VistaSV30, если не получится - помогу как время будет
0
 Аватар для Пытливый
3763 / 2267 / 705
Регистрация: 29.05.2013
Сообщений: 9,622
20.09.2021, 10:19
Цитата Сообщение от iSmokeJC Посмотреть сообщение
Имеется ввиду "привести к общему виду", как я понимаю.
Я тоже это понимаю, но в отличии от нас, которые "понимают", компьютеру надо дать точный алгоритм действий.

Добавлено через 7 минут
Цитата Сообщение от VistaSV30 Посмотреть сообщение
это в КЛАДР такой порядок написания адреса
КЛАДР уже давно заменен на ФИАС.
Цитата Сообщение от VistaSV30 Посмотреть сообщение
информация об объектах собирается из нескольких баз и поэтому надо привести к какому-то единому образцу
Знакомая задача. О каком объеме в штуках мы говорим?
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 10:19
Пытливый, ну так ТС и указал нужный ему вид
0
 Аватар для VistaSV30
987 / 331 / 79
Регистрация: 10.04.2012
Сообщений: 1,241
Записей в блоге: 4
20.09.2021, 10:27  [ТС]
Пытливый сейчас занимаемся г. Балашиха Московской области, сейчас есть порядка 17 тыс. адресов. по 835 улицам (переулкам, бульварам, микрорайонам и прочим просекам )
0
 Аватар для Пытливый
3763 / 2267 / 705
Регистрация: 29.05.2013
Сообщений: 9,622
20.09.2021, 10:31
Цитата Сообщение от VistaSV30 Посмотреть сообщение
сейчас занимаемся г. Балашиха Московской области, сейчас есть порядка 17 тыс. адресов. по 835 улицам
Какая мелочь. Это даже руками можно обработать в течении часа.
0
 Аватар для VistaSV30
987 / 331 / 79
Регистрация: 10.04.2012
Сообщений: 1,241
Записей в блоге: 4
20.09.2021, 14:23  [ТС]
Кажется начало получаться
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
import regex as re
 
Nm1 = ['Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18',
            'Мкр. Никольский, Улица 122-ой Просек д.14',
            'Мкр. Никольский, Улица 20-ый Просек, д.14',
            'Мкр. Никольский, Улица 123-Просек, домовладение 2', 
            'Мкр. Никольский, Проспект Ленина двлд3',
            'Мкр. Никольский, Улица 124 - й Просек',
            'Мкр. Никольский, Улица 14-й ПРОСЕК']
Nm2 = ['Микрорайон Никольско-Архангельский, Улица просек 123-й, дом 18',
            'Мкр. Никольский, Улица Просек 122-ой д.14',
            'Мкр. Никольский, Улица Просек 20-ый, д.14',
            'Мкр. Никольский, Улица Просек-534, домовладение 2', 
            'Мкр. Никольский, Улица  Просек 124-й',
            'Мкр. Никольский, Улица ПРОСЕК 14-й']
 
Nm = Nm1 + Nm2
 
def Просек(Nm): # Форатирование элемента "Просек"
    Nm = ' '.join(Nm.split())  # удаление лишних пробелов
    Nm = ' ' + Nm + ' '
    nm = Nm.lower()
 
    if ('нарвский' not in nm): # Нарвский просек без номера
        regex = "\s*\d+.{,5}просек|просек\s+\d+[-ыой]+|просек\s?-\s?\d+"
        if re.search(regex, nm):
            rl = re.search(regex, nm).start()
            rr = re.search(regex, nm).end()
            N = re.search('\d+', Nm[rl:rr]).group()
            Nm = Nm.replace(Nm[rl:rr], str(N) + '-й Просек')
 
    return(Nm)
 
for item in Nm:
    print(Просек(item))
Добавлено через 2 минуты
Пока только в случае если номер был сначала удаляет пробел.

Добавлено через 22 минуты
Ну вроде бы всё
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def Просек(Nm): # Форатирование элемента "Просек"
    Nm = ' '.join(Nm.split())  # удаление лишних пробелов
    Nm = ' ' + Nm + ' '
    nm = Nm.lower()
 
    if ('нарвский' not in nm): # Нарвский просек без номера
        regex = "\s*\d+.{,5}просек|\s*просек\s+\d+[-ыой]+|\s*просек\s?-\s?\d+"
        if re.search(regex, nm):
            rl = re.search(regex, nm).start()
            rr = re.search(regex, nm).end()
            if (Nm[rl] == ' '): rl += 1  # если номер впереди, то удалялся пробел
            N = re.search('\d+', Nm[rl:rr]).group()
            Nm = Nm.replace(Nm[rl:rr], str(N) + '-й Просек')
            if ('улица' not in nm): Nm = Nm[:rl] + 'Улица ' + Nm[rl:]
 
    return(Nm)
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
20.09.2021, 14:40
Лучший ответ Сообщение было отмечено VistaSV30 как решение

Решение

Python
1
2
3
4
5
6
Nm = Nm1 + Nm2
for line in Nm:
    line = re.sub(r'(?i)(?<=улица\s+)(\d+)([^,]*?[- ]просек)', lambda x: f'{x.group(1)}-й просек', line)
    line = re.sub(r'(?i)(?<=улица )(\s*просек[- ])(\d+)([^,]*)', lambda x: f'{x.group(2)}-й просек', line)
    line = re.sub(r'(?i)(?<=просек) (?=д)', ', ', line)
    print(line)
Bash
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
"C:\Program Files\Python38\python.exe" C:/Users/User/IdeaProjects/p_forum/test.py
Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18
Мкр. Никольский, Улица 122-й просек, д.14
Мкр. Никольский, Улица 20-й просек, д.14
Мкр. Никольский, Улица 123-й просек, домовладение 2
Мкр. Никольский, Проспект Ленина двлд3
Мкр. Никольский, Улица 124-й просек
Мкр. Никольский, Улица 14-й просек
Микрорайон Никольско-Архангельский, Улица 123-й просек, дом 18
Мкр. Никольский, Улица 122-й просек
Мкр. Никольский, Улица 20-й просек, д.14
Мкр. Никольский, Улица 534-й просек, домовладение 2
Мкр. Никольский, Улица 124-й просек
Мкр. Никольский, Улица 14-й просек
 
Process finished with exit code 0
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
20.09.2021, 14:40
Помогаю со студенческими работами здесь

Составить базу данных, которая позволяет вводить ФИО человека, название улицы
Составить базу данных, которая позволяет вводить ФИО человека, название улицы. С помощью названия улицы вывести ФИО (название улицы...

Название улицы и номер дома в ячейке написаны слитно. Как вставить пробел между ними?
Часть адресов написаны правильно &quot;улица дом&quot; (например, Мира 72), а часть - нет (Мира72), т.е. отсутствует пробел. Как добавить...

Выдать для каждого адреса имя улицы, не включая тип улицы
Кто может перевести код с С++ на паскаль? пожалуйста. #include &lt;string&gt; #include &lt;vector&gt; #include &lt;algorithm&gt; typedef...

Название улицы и номер дома в ячейке написаны слитно. Как вставить пробел между ними макросом
Часть адресов написаны правильно &quot;улица дом&quot; (например, Мира 72), а часть - нет (Мира72), т.е. отсутствует пробел. Как добавить...

Вывести название улицы которая имеет больше всего домов и общее количество квартир для каждой из улиц
Хелп) Условие В файле записано: название улицы, номер дома, количество квартир. Вывести название улицы которая имеет больше всего...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru