Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.93/98: Рейтинг темы: голосов - 98, средняя оценка - 4.93
7 / 7 / 2
Регистрация: 05.11.2009
Сообщений: 55

Чтение и парсинг файла

27.08.2011, 01:56. Показов 18129. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Пару часов назад начал учить питон. Дело такое: есть файл, в нем есть строка <title>Текст</title>...как вытащить слово "Текст"?
Python
1
2
3
4
5
f = open("test.txt", "r+")
r = f.read()
s = r.compile(ur"<title>(.*?)</title>", r).finditer(r)
print s
f.close()
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
27.08.2011, 01:56
Ответы с готовыми решениями:

Чтение из файла, парсинг и вывод результата
Доброе время суток. Подскажите пожалуйста, как, чем каким методом, можно следить\синхронизировать\ передавать данные или вообще...

Чтение юникодного файла и парсинг строки
Не удается нормально считать файл. значения читаются с нуль пробелом, как их распарсить и сконвертировать в обычные типы данных?? вот...

Парсинг файла и попарное чтение - параметра и его значения
Загружаю файл в string, строка в файле только одна, так что масив ненужен. В чем задача стоит? Содержимое файла такое: ...

4
Эксперт С++
 Аватар для CyBOSSeR
2348 / 1721 / 149
Регистрация: 06.03.2009
Сообщений: 3,675
27.08.2011, 02:28
Refandler,
Python
1
2
3
4
5
import re
 
m = re.search('<title>(.*)</title>', '<title>Текст</title>')
 
print(m.group(1))
2
7 / 7 / 2
Регистрация: 05.11.2009
Сообщений: 55
27.08.2011, 14:24  [ТС]
А как при открытии файла сменить его кодировку?
По примеру инета делал так:
Python
1
2
3
4
5
f = open("test.txt", "r+")
r = unicode(f.read(), 'utf-8')
m = re.search('<title>(.*)</title>', r)
print (m.group(1))
f.close()
При запуске консоль ругается:
Bash
1
2
3
  File "test.py", line 13, in <module>
    r = unicode(f.read(), 'utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd0 in position 507: invalid continuation byte
0
Эксперт С++
 Аватар для CyBOSSeR
2348 / 1721 / 149
Регистрация: 06.03.2009
Сообщений: 3,675
27.08.2011, 16:52
Refandler, сдается мне, что в функцию unicode нужно вторым параметром передавать исходную кодировку (файла), а не целевую.
1
7 / 7 / 2
Регистрация: 05.11.2009
Сообщений: 55
27.08.2011, 19:35  [ТС]
CyBOSSeR, плин, а я бы не догалася..уже и decode использовал неизвестно зачем а оказалось все так просто
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
27.08.2011, 19:35
Помогаю со студенческими работами здесь

Чтение и парсинг одного файла, запись данных во второй. Исправить код
Задание. Есть текстовый файл, он имеет структуру: Имя1 время1 время2. То есть примерно в файле это выглядит так: Файл1 23:34 23:35 ...

Чтение XML файла и его парсинг для получения всех URL
Добрый день! Из интернета получаю XML данные - &lt;response list=&quot;true&quot;&gt; - &lt;audio&gt; &lt;aid&gt;150993468&lt;/aid&gt; ...

Чтение текстового файла. Парсинг его данных. Создание исключений для данных. Запись свойств объектов в файл
Проблема такая. Есть файл data.txt. В нем например какие-то данные. Landon Donovan, 150, A Hulk Hogan , 100, M Duke Nukem, 50,...

Чтение и парсинг xml
Господа, помогите сообразить. начал знакомиться с php+xml, и появился такой вопрос: вот код (я его скопировал, чтобы поразбираться): ...

Чтение и парсинг файлов: Qt или С++?
Что лучше использовать для чтения и парсинга файлов: средства Qt или С++?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru