Форум программистов, компьютерный форум CyberForum.ru
CyberForum.ru - форум программистов и сисадминов > >
Восстановить пароль Регистрация

Ответ Создать новую тему
 
Refandler
Форумчанин
7 / 7 / 0
Регистрация: 05.11.2009
Сообщений: 55
27.08.2011, 01:56     Чтение и парсинг файла
  #1
Пару часов назад начал учить питон. Дело такое: есть файл, в нем есть строка <title>Текст</title>...как вытащить слово "Текст"?
Код Python
1
2
3
4
5
f = open("test.txt", "r+")
r = f.read()
s = r.compile(ur"<title>(.*?)</title>", r).finditer(r)
print s
f.close()
AdAgent
Объявления
27.08.2011, 01:56
CyBOSSeR
Форумчанин
Эксперт C++
2263 / 1633 / 55
Регистрация: 06.03.2009
Сообщений: 3,676
27.08.2011, 02:28
  #2
Refandler,
Код Python
1
2
3
4
5
import re
 
m = re.search('<title>(.*)</title>', '<title>Текст</title>')
 
print(m.group(1))
Refandler
Форумчанин
7 / 7 / 0
Регистрация: 05.11.2009
Сообщений: 55
27.08.2011, 14:24  [ТС]
  #3
А как при открытии файла сменить его кодировку?
По примеру инета делал так:
Код Python
1
2
3
4
5
f = open("test.txt", "r+")
r = unicode(f.read(), 'utf-8')
m = re.search('<title>(.*)</title>', r)
print (m.group(1))
f.close()
При запуске консоль ругается:
Код Bash
1
2
3
  File "test.py", line 13, in <module>
    r = unicode(f.read(), 'utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd0 in position 507: invalid continuation byte
CyBOSSeR
Форумчанин
Эксперт C++
2263 / 1633 / 55
Регистрация: 06.03.2009
Сообщений: 3,676
27.08.2011, 16:52
  #4
Refandler, сдается мне, что в функцию unicode нужно вторым параметром передавать исходную кодировку (файла), а не целевую.
Refandler
Форумчанин
7 / 7 / 0
Регистрация: 05.11.2009
Сообщений: 55
27.08.2011, 19:35  [ТС]     Чтение и парсинг файла
  #5
CyBOSSeR, плин, а я бы не догалася..уже и decode использовал неизвестно зачем а оказалось все так просто
Yandex
Объявления
27.08.2011, 19:35
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Ответ Создать новую тему

Похожие темы
Тема Раздел Ответов Автор Дата
Python Чтение из txt файла
Имеется txt файл. В нем написан текст, а между текстами знаки "=========". То есть нужно читать текст между знаками "===", а затем сделать отступ в 2 строчки и читать новый текст. Для теста можно...
Python 5 AndreySeVeN 10.07.2014 00:50
Python Чтение из файла csv
Здравствуйте! Читаю из файла csv данные, представленные в виде Поле1 Поле2 Поле3 Поле1 Поле2 Поле3 ... ... ... считываю по строкам, и переформирую считанную таблицу в...
Python 3 Uksus 25.02.2014 08:58
Python Парсинг файла
Привет всем! Создаю файл со списком изображений *.png (часть этого списка под спойлером) 01-01.png 01-02.png 01-03.png 01-04.png 01-05.png 01-06.png 01-1-01.png 01-1-02.png
Python 17 Badger 22.06.2013 07:48
Python Чтение в бинарном режиме из файла
Python 3.2 sourcedata=open(srcfile, 'rb').read() print sourcedata Чтение из файла в бинарном режиме, читаться вроде должны байты и отображаться в hex. Файл srcfile реально существует где ему...
Python 1 XoFfiCEr 09.11.2012 01:49
Python Чтение из файла в список
имеется такой файл (1.txt) 1 21 2.21 маша !!№21 как считать данные из этого файла в список(массив)? Вот что за бяка у меня i = 1
Python 6 k_nek 04.10.2012 08:42
Python чтение из файла питон
здравствуйте нужна помощь! поручили написать программу на питоне, которая будет считывать данные с файла, при этом по строкам! никаких идей, вижу питона в 1 раз... так что в панике, жду...
Python 26 v panike =( 02.09.2011 14:57
Python Чтение из файла
Народ, помогите, пожалуйста. Мне надо разобрать программку на питоне, которая считывает некоторые данные из одного файла, а результат записывает в другой. Но почему-то файлы он не находит. Может,...
Python 6 Olchik 08.02.2011 19:52
Python Чтение html файла
помогите пожалуйста с программой на питоне, которая читает файл html и выводит след информацию на экран: название html-ки из тэга title, список изображений, список ссылок. Вся эта информация...
Python 2 victoria7 14.01.2011 22:13
Опции темы

Текущее время: 07:30. Часовой пояс GMT +4.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.7 PL3
Copyright ©2000 - 2014, vBulletin Solutions, Inc.