Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/6: Рейтинг темы: голосов - 6, средняя оценка - 4.67
1 / 1 / 1
Регистрация: 12.11.2017
Сообщений: 82

Извлечь текст из html документа и поместить в массив

05.06.2023, 09:47. Показов 1365. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть код из html документа, я сохранил его в переменную.
теперь хочу применить функцию get_text(), чтобы извлечь текст из этого документа и поместить в новый массив каждый элемент отдельно как это сделать
вот пробую и постоянно ошибка
Python
1
2
3
4
5
6
7
8
9
10
11
12
from bs4 import BeautifulSoup
import re
f = open('D:/d/1.html', 'r', encoding='utf-8')
soup = BeautifulSoup(f, 'html.parser')
f.close()
q = soup.find_all("span", title=re.compile("[0-9]+"))
s=[]
i=int(0)
for element in q:
    element.get_text()
    s[i]=element
    i+= int(1)
что я делаю не правильно. Если выбрать print (element.get_text()), то все отлично идет. как это загнать в массив
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
05.06.2023, 09:47
Ответы с готовыми решениями:

Извлечь текст из div'а HTML-документа
Привет всем! Прошу помочь разобраться в проблеме: Парсится страница, нужный HTML-блок находится внутри тега ДИВа с конкретным именем. ...

Как извлечь текст с сайта, отформатировать и поместить в текстовый файл?
Приветствую уважаемые разработчики, поскольку я новичок, требование "не использовать сторонние библиотеки" только усложняют задачу....

Извлечь все числа из строки и поместить в массив
Нужен код, который извлекает из строки вида "1+9-5/4|3\5" все числа, и записывает их в int массив. Числа - любые int, в том числе...

1
 Аватар для TimutGin
515 / 339 / 146
Регистрация: 16.02.2021
Сообщений: 626
05.06.2023, 10:27
Лучший ответ Сообщение было отмечено Ivan2117 как решение

Решение

Попробуйте 10-11 строку заменить на
Python
1
s.append(element.get_text())
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
05.06.2023, 10:27
Помогаю со студенческими работами здесь

html как взять текст из другого html документа
Каким образом возможно как взять текст из другого html документа и импортировать в другой? Пробовал через <link rel="import"...

Регулярные выражения. Извлечь из html текст между двумя тегами
Ломаю голову с регулярными выражениями, не получается корректно решить простую задачу: Нужно извлечь из html текст между двумя тегами, но...

как поместить html текст в items listview ?
Имеется ArrayList my_list, состоящий из строк, размеченных Html. С помощью адаптера my_adapter = new ArrayAdapter<>(this,...

Получить текст из документа HTML
Всем добрый день!!! Подскажите как получить текст из документа html. В документе он начинается с тега <p>. Допустим если на входе...

Считать из документа имя, адрес, телефон и поместить в массив, и отсортировать по номерам
День добрый! Задача считывать из документа данные Имя, адрес, телефон поместить в массив, потом отсортировать по номерам. Я решил все...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru