Аватар для borockov
4 / 4 / 3
Регистрация: 05.11.2012
Сообщений: 245

Найти по заданному шаблону данные в тхт

14.03.2021, 23:02. Показов 1475. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброй ночи друзья! Подскажите пожалуйста, есть тхт файл, в котором огромное количество всякого мусора, из которого мне нужно достать определенные ссылки, пример тхт во вложенном файле, весь тхт не стал грузить, так как он довольно большой. Оттуда мне нужно достать все, что подходит под это:
href=\u0022\/app\/portrait\/923732eee9273538\/start\u0022\u003ESRH
href=\u0022\/app\/portrait\/83023374b74c6959\/start\u0022\u003EKreiskrankenhaus
href=\u0022\/app\/portrait\/d231565d6bfbe472\/start\u0022\u003EFranziskus
Каким образом можно создать шаблон, для поиска? Я пытался использовать модуль re, и даже удалось найти все 'href', но не понимаю, как можно сделать так, что бы из всего этого безобразия, выбрать именно то, что нужно
Вложения
Тип файла: txt new.txt (17.1 Кб, 5 просмотров)
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
14.03.2021, 23:02
Ответы с готовыми решениями:

Найти слово в текстовом файле по заданному шаблону
Здравствуйте! Помогите пожалуйста... Умоляю!!! Уже несколько дней бьюсь над задачкой! Нужно ввести слово, неизвестные буквы помечать...

Сравнение 2 файлов тхт, и приведение их к одному шаблону
Доброй ночи всем, подскажите пожалуйста, как в питоне можно сравнить два файла, и дописать недостающие строки? Пример. Содержание файлов ...

Редактировать ячейки по заданному шаблону
доброго дня. мне нужно отредактировать столбец со значениями по заданному шаблону. на картинке красным цветом выделено что надо получить. а...

6
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
15.03.2021, 00:23
Лучший ответ Сообщение было отмечено borockov как решение

Решение

Цитата Сообщение от borockov Посмотреть сообщение
огромное количество всякого мусора
В точку! Что-то ты не так делаешь изначально.
Python
1
2
3
4
5
6
7
import re
 
with open('new.txt', 'r') as f:
    text = f.read()
 
for i in re.findall(r'\s(href.+?)\s', text):
    print(i)
Bash
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
href=\u0022#\u0022
href=\u0022https:\/\/www.google.de\/maps\/dir\/\/Spellerstra\u00dfe,+16,+59302,+Oelde\u0022
href=\u0022tel:02522
href=\u0022\/app\/portrait\/923732eee9273538\/start\u0022\u003ESRH
href=\u0022#\u0022
href=\u0022https:\/\/www.google.de\/maps\/dir\/\/Reinhardsbrunner
href=\u0022tel:03623
href=\u0022\/app\/portrait\/83023374b74c6959\/start\u0022\u003EKreiskrankenhaus
href=\u0022#\u0022
href=\u0022https:\/\/www.google.de\/maps\/dir\/\/Schwabenr\u00f6der
href=\u0022tel:06631
href=\u0022\/app\/portrait\/dd61bcb19a9cc2f0\/start\u0022\u003EKrankenhaus
href=\u0022#\u0022
href=\u0022https:\/\/www.google.de\/maps\/dir\/\/Krankenhausstra\u00dfe,+2,+84137,+Vilsbiburg\u0022
href=\u0022tel:0871
href=\u0022\/app\/portrait\/d231565d6bfbe472\/start\u0022\u003EFranziskus
href=\u0022#\u0022
href=\u0022https:\/\/www.google.de\/maps\/dir\/\/Budapester
href=\u0022tel:030
0
3582 / 2182 / 571
Регистрация: 02.09.2015
Сообщений: 5,510
15.03.2021, 08:35
Цитата Сообщение от borockov Посмотреть сообщение
Каким образом можно создать шаблон, для поиска? Я пытался использовать модуль re, и даже удалось найти все 'href', но не понимаю, как можно сделать так, что бы из всего этого безобразия, выбрать именно то, что нужно
Я конечно не эксперт, но если ты парсишь html/xml-like, то лучше забыть про регулярки и использовать, например, xpath.
0
 Аватар для borockov
4 / 4 / 3
Регистрация: 05.11.2012
Сообщений: 245
15.03.2021, 08:56  [ТС]
iSmokeJC, Спасибо большое =) единственное, объясни пожалуйста, как это работает?
r'\s(href.+?)\s'
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
15.03.2021, 09:10
\s - после пробельного символа идет href, за ним сколь угодно много + любых других символов, но опять же до первого пробельного. И в скобки убираем что именно нужно захватить (т.е. без пробельных символов).

ЗЫ: пробельные символы - это не только пробелы
0
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,321
15.03.2021, 12:23
Цитата Сообщение от iSmokeJC Посмотреть сообщение
за ним сколь угодно много + любых других символов
это как я понимаю
Цитата Сообщение от borockov Посмотреть сообщение
.+
так?
а знак вопроса
Цитата Сообщение от borockov Посмотреть сообщение
?
это что? спс
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
15.03.2021, 12:46
Это знак вопроса.

Добавлено через 7 минут
Делает стоящий перед ним квантификатор ленивым.
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
15.03.2021, 12:46
Помогаю со студенческими работами здесь

Создать матрицу по заданному шаблону
Ребят кому не тяжело, помогите пожалуйста написать программу В общем нужно задать размер матрицы, что бы в ней главная и побочная...

Написать макрос по заданному шаблону!
написать макрос по заданному шаблону (тесть по вложенному рисунку!) 1. Создать пользовательскую форму с приведёнными на рисунке...

Реализация интерфейса по заданному шаблону
Добрый день. Прошу Вас дать мне совет в реализации одного из моих будущих проектов. Появилась необходимость реализовать интерфейс схожий с...

Поиск в тексте по заданному шаблону
Здравствуйте! Возник вопрос - как организован поиск в винде по шаблону? (*? с этими знаками) как можно в делфи так сделать но чтоб по...

Заполнить матрицу по заданному шаблону
Заполнить двумерный массив размером 7*7 следующим образом. Для формирования строки использовать функцию. Ребят, ну помогите кто...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Опции темы

Новые блоги и статьи
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru