Форум программистов, компьютерный форум CyberForum.ru
Наши страницы

Python

Войти
Регистрация
Восстановить пароль
 
Рейтинг: Рейтинг темы: голосов - 51, средняя оценка - 4.63
Refandler
7 / 7 / 0
Регистрация: 05.11.2009
Сообщений: 55
#1

Чтение и парсинг файла - Python

27.08.2011, 01:56. Просмотров 7086. Ответов 4
Метки нет (Все метки)

Пару часов назад начал учить питон. Дело такое: есть файл, в нем есть строка <title>Текст</title>...как вытащить слово "Текст"?
Python
1
2
3
4
5
f = open("test.txt", "r+")
r = f.read()
s = r.compile(ur"<title>(.*?)</title>", r).finditer(r)
print s
f.close()
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
27.08.2011, 01:56
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Чтение и парсинг файла (Python):

Парсинг файла - Python
Привет всем! Создаю файл со списком изображений *.png (часть этого списка под спойлером) 01-01.png 01-02.png 01-03.png 01-04.png ...

Парсинг xml-файла(размером в 14,6 млн строк) lxml парсером - Python
в общем вот здесь выкладываю архивированную базу данных в xml формате google.drive вот питоновский код, все очень примитивно, если...

Чтение из файла - Python
Народ, помогите, пожалуйста. Мне надо разобрать программку на питоне, которая считывает некоторые данные из одного файла, а результат...

Чтение из файла - Python
Есть такое вот задание: Create a text file that contains names (e.g. “Joe Abernathy”) and salaries. Write a program that: Prompts...

Чтение из файла - Python
Пишу я значит программу по генерированию дорок. Считываю из файла с ссылками параметр &quot;name of page&quot;. При выполнении Visual Studio выдаёт...

Чтение из файла - Python
Имеется некий файл, в котором построчно записана некая информация. Эту информацию я считываю построчно методом readline(). Но вот как...

4
CyBOSSeR
Эксперт С++
2303 / 1673 / 86
Регистрация: 06.03.2009
Сообщений: 3,675
27.08.2011, 02:28 #2
Refandler,
Python
1
2
3
4
5
import re
 
m = re.search('<title>(.*)</title>', '<title>Текст</title>')
 
print(m.group(1))
2
Refandler
7 / 7 / 0
Регистрация: 05.11.2009
Сообщений: 55
27.08.2011, 14:24  [ТС] #3
А как при открытии файла сменить его кодировку?
По примеру инета делал так:
Python
1
2
3
4
5
f = open("test.txt", "r+")
r = unicode(f.read(), 'utf-8')
m = re.search('<title>(.*)</title>', r)
print (m.group(1))
f.close()
При запуске консоль ругается:
Bash
1
2
3
  File "test.py", line 13, in <module>
    r = unicode(f.read(), 'utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd0 in position 507: invalid continuation byte
0
CyBOSSeR
Эксперт С++
2303 / 1673 / 86
Регистрация: 06.03.2009
Сообщений: 3,675
27.08.2011, 16:52 #4
Refandler, сдается мне, что в функцию unicode нужно вторым параметром передавать исходную кодировку (файла), а не целевую.
1
Refandler
7 / 7 / 0
Регистрация: 05.11.2009
Сообщений: 55
27.08.2011, 19:35  [ТС] #5
CyBOSSeR, плин, а я бы не догалася..уже и decode использовал неизвестно зачем а оказалось все так просто
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
27.08.2011, 19:35
Привет! Вот еще темы с ответами:

Чтение из файла в список - Python
имеется такой файл (1.txt) 1 21 2.21 маша !!№21 как считать данные из этого файла в список(массив)? Вот что за бяка у меня ...

Чтение из файла и 3D график - Python
f=open('primer2.dat','rb') def funk(): data=f.readline() while data: print(data) data=f.readline() ...

Чтение из файла с числами - Python
Есть файл вида 1 5 10 15 20 25 Необходимо прочитать файл так, чтобы на выходе получить a == . Гарантируется, что файл...

Чтение html файла - Python
помогите пожалуйста с программой на питоне, которая читает файл html и выводит след информацию на экран: название html-ки из тэга title,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Yandex
Объявления
27.08.2011, 19:35
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru