Форум программистов и сисадминов CyberForum.ru
Вернуться   Форум программистов и сисадминов CyberForum.ru > Форум Форум программистов > Форум Python
Восстановить пароль Регистрация

Ответ Создать новую тему
 
Старый 27.08.2011, 01:56   #1
Refandler
Форумчанин
 
Регистрация: 05.11.2009
Сообщений: 55
Репутация: 7 (7)
Чтение и парсинг файла / Python

Пару часов назад начал учить питон. Дело такое: есть файл, в нем есть строка <title>Текст</title>...как вытащить слово "Текст"?
Код Python
1
2
3
4
5
f = open("test.txt", "r+")
r = f.read()
s = r.compile(ur"<title>(.*?)</title>", r).finditer(r)
print s
f.close()
Старый 27.08.2011, 02:28   #2
CyBOSSeR
Форумчанин
Эксперт C++
 
Аватар для CyBOSSeR
 
Регистрация: 06.03.2009
Сообщений: 3,676
Репутация: 2256 (1626)
Лучшие ответы: 56
Чтение и парсинг файла

Refandler,
Код Python
1
2
3
4
5
import re
 
m = re.search('<title>(.*)</title>', '<title>Текст</title>')
 
print(m.group(1))
Другие темы раздела Форум программистов Python. Программирование с использованием Python. Помощь в решении задач на Python.
Python Python и C#
Здраствуйте, помогите переписать код с python на c#: #!/usr/bin/env python # coding=utf-8 ''' sms_mrim_client.py author: Dominus site: http://k0derz.ru/ http://agent.mail.ru/ru/help/3/2.html - поддерживаемые операторы ''' import socket, string, sys
Python Помогите реализовать ввод
Ввод осуществляется в две строки. В первой строке три целых числа m,n,k. Во второй строке k целых чисел. Пример ввода №1: 2 5 4 5 7 4 11 Пример №2: 1000 1000 1 1000 Подскажите, пожалуйста, как это реализовать Добавлено через 20 минут Ах, да, если можно, решение на 2-ом питоне пожалуйста
Старый 27.08.2011, 14:24  [ТС]   #3
Refandler
Форумчанин
 
Регистрация: 05.11.2009
Сообщений: 55
Репутация: 7 (7)
Чтение и парсинг файла

А как при открытии файла сменить его кодировку?
По примеру инета делал так:
Код Python
1
2
3
4
5
f = open("test.txt", "r+")
r = unicode(f.read(), 'utf-8')
m = re.search('<title>(.*)</title>', r)
print (m.group(1))
f.close()
При запуске консоль ругается:
Код Bash
1
2
3
  File "test.py", line 13, in <module>
    r = unicode(f.read(), 'utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd0 in position 507: invalid continuation byte
Старый 27.08.2011, 16:52   #4
CyBOSSeR
Форумчанин
Эксперт C++
 
Аватар для CyBOSSeR
 
Регистрация: 06.03.2009
Сообщений: 3,676
Репутация: 2256 (1626)
Лучшие ответы: 56
Чтение и парсинг файла

Refandler, сдается мне, что в функцию unicode нужно вторым параметром передавать исходную кодировку (файла), а не целевую.
Старый 27.08.2011, 19:35  [ТС]   #5
Refandler
Форумчанин
 
Регистрация: 05.11.2009
Сообщений: 55
Репутация: 7 (7)
Чтение и парсинг файла / Python

CyBOSSeR, плин, а я бы не догалася..уже и decode использовал неизвестно зачем а оказалось все так просто
Старый 27.08.2011, 19:35
Yandex
Объявления
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Ответ Создать новую тему

Похожие темы
Тема Автор
С++ для начинающих Парсинг файла
Вот открываю через FILE*, файл ввида "test" { "test1" "test1_1" "test2" "test2_1" "test3" "test3_1" "test4" "test4_1" }
_or_75
Visual Basic Чтение и парсинг одного файла, запись данных во второй. Исправить код
Задание. Есть текстовый файл, он имеет структуру: Имя1 время1 время2. То есть примерно в файле это выглядит так: Файл1 23:34 23:35 Файл2 12:23 12:25 и т.д. Написать файл, обрабатывающий предыдущий файл следующим образом:на выходе он формирует другой текстовый файл, в котором нет повторяющихся...
Slaff4ik
C# для начинающих Чтение XML файла и его парсинг для получения всех URL
Добрый день! Из интернета получаю XML данные - <response list="true"> - <audio> <aid>150993468</aid> <owner_id>--------</owner_id> <artist>Tony Nice Feat. Music Hayk</artist> <title>Ты со мной</title> <duration>268</duration>
sirnet
C# для начинающих Чтение из файла, парсинг и вывод результата
Доброе время суток. Подскажите пожалуйста, как, чем каким методом, можно следить\синхронизировать\ передавать данные или вообще про что почитать и где? А смысл следующий, хочется сделать некоторый парсер, некоторого текстового файлика. Вот вопрос взяли файлик, прочитали, иии что делать...
Scorpa
Java SE (J2SE) время на парсинг файла
Как можно выдавать время, за которое DOM и SAX в отдельности распарсили файл ?
zhenya.ya
Опции темы

Текущее время: 16:09. Часовой пояс GMT +4.

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.7 PL3
Copyright ©2000 - 2014, vBulletin Solutions, Inc.