Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.79/34: Рейтинг темы: голосов - 34, средняя оценка - 4.79
3 / 2 / 1
Регистрация: 07.09.2017
Сообщений: 27

Вырезать определенный кусок текста

26.01.2020, 23:17. Показов 7311. Ответов 4

Студворк — интернет-сервис помощи студентам
Здравствуйте! Есть такой текст, имя файла 1.html (вводится в enter source file):
HTML5
1
2
3
4
5
6
7
8
9
10
11
<!DOCTYPE html>
<html lang="en" dir="ltr">
  <head>
    <meta charset="utf-8">
    <title>p1</title>
  </head>
  <body>
    <a href="2.html">2</a>
    <a href="3.html">3</a>
  </body>
</html>
Из него нужно вырезать ссылки, которые находятся после href=" до следующих кавычек и поместить в словарь
Я сделала так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
def parser(file):
    open_file = open(file, "r")
    content = open_file.read()
    href_indexes = [i for i in range(len(content)) if content.startswith('href="', i)]
    names = []
    for x in href_indexes:
        names.append(content[x + 6:x + 12])
    memorization[file] = names
    print(memorization)
 
memorization = {}
enter = input("enter source file:\n")
parser(enter)
Код работает, но хотелось бы строчку names.append(content[x + 6:x + 12]) поменять так, чтобы текст вырезался не по индексам как я подобрала для этого текста, а до следующих кавычек в названиях файлов(т.е. "2.html" или "3.html" вторые кавычки в каждом), чтобы если название ссылки будет другое, можно было бы определить по кавычкам
Учитель сказал, что можно обойтись без re
Спасибо заранее!
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
26.01.2020, 23:17
Ответы с готовыми решениями:

Как вырезать кусок строки из текстовой переменной?
Уважаемые профи, подскажите: Есть переменная: Subject = 'Voice Message From Conversation by Ext **** Sent Wed 8/6/2014 12:39 PM' ****...

Библиотека itextsharp: вырезать определенный кусок текста из PDF и поместить на форму
Использую данную библиотеку для работы с PDF файлами! Создавать файлы и объединять получается, а вот как вырезать определенный кусок текста...

Вырезать из файла кусок текста
Здравствуйте, помогите пожалуйста. Мне нужно вырезать из php файла, который я заранее считал в виде строки в переменную, вырезать кусок...

4
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
26.01.2020, 23:29
Лучший ответ Сообщение было отмечено Riita как решение

Решение

Цитата Сообщение от Riita Посмотреть сообщение
обойтись без re
ну например
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
text = '''
<!DOCTYPE html>
<html lang="en" dir="ltr">
  <head>
    <meta charset="utf-8">
    <title>p1</title>
  </head>
  <body>
    <a href="2.html">2</a>
    <a href="3256.html">3</a>
  </body>
</html>
'''
 
for word in text.split():
    if 'href' in word:
        i = word.index('href') + 6
        print(word[i: word.index('"', i)])
Добавлено через 1 минуту
Bash
1
2
2.html
3256.html
1
3 / 2 / 1
Регистрация: 07.09.2017
Сообщений: 27
26.01.2020, 23:34  [ТС]
iSmokeJC, спасибо большое!
0
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
26.01.2020, 23:47
Riita, да не за что.
В условиях наверно лучше указывать целиком 'href="', а то попадется какой-нибудь текст ссылки типа "это ahrefительная ссылка!"
0
3 / 2 / 1
Регистрация: 07.09.2017
Сообщений: 27
26.01.2020, 23:49  [ТС]
iSmokeJC, не на русском точно не будет, но я поправила
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
26.01.2020, 23:49
Помогаю со студенческими работами здесь

Как из текста вырезать кусок?
Понимаю, что достал всех элементарщиной, просто я все собираюсь завязать с ASP, поэтому книг не покупаю, но все время приходиться что-то...

Вырезать кусок текста по маске
Помогите пожалуйста нужно обрезать текст весь который идёт после символа &quot;;&quot;/ например: Привет мир!;пока мне нужно вырезать слово пока и...

Найти и вырезать кусок текста
Добрый вечер форумчане. Столкнулся с такой задачей: имеется текст в котором периодически появляются ссылки, которые необходимо из него...

Вырезать динамичный кусок текста и вывести его
Доброго дня, столкнулся с такой вот проблемой, суть в общем-то в шапке. После обращения к api вк получаю ответ вида: ...

Вырезать регуляркой кусок текста с разными условиями
Здравствуйте. Есть определенный кусок текста. Необходимо начиная с определенных слов (особенности репака, особенности repack и т.д.)...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru