Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.83/6: Рейтинг темы: голосов - 6, средняя оценка - 4.83
Gnomew
1

Как обработать ссылку, скачав по ней статью и отформатировав её?

17.10.2013, 20:06. Показов 1197. Ответов 1
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Полученный текст нужно отформатировать для максимально комфортного чтения в любом
текстовом редакторе. Правила форматирования: ширина строки не больше 80 символов (если
больше, переносим по словам), абзацы и заголовки отбиваются пустой строкой. Если в тексте
встречаются ссылки, то URL вставить в текст в квадратных скобках. Остальные правила на ваше
усмотрение.
Программа оформляется в виде утилиты командной строки, которой в качестве параметра
указывается произвольный URL. Она извлекает по этому URL страницу, обрабатывает ее и
формирует текстовый файл с текстом статьи, представленной на данной странице.
В качестве примера можно взять любую статью на lenta.ru, gazeta.ru и тд
Алгоритм должен быть максимально универсальным, то есть работать на большинстве сайтов.
Усложнение задачи 1: Имя выходного файла должно формироваться автоматически по URL.
Примерно так:
Код
http://lenta.ru/news/2013/03/dtp/index.html => [CUR_DIR]/lenta.ru/news/2013/03/dtp/index.txt
Усложнение задачи 2: Программа должна поддаваться настройке – в отдельном файле/файлах
задаются шаблоны обработки страниц.
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
17.10.2013, 20:06
Ответы с готовыми решениями:

Как сделать ссылку на статью?
как прописать url для статьи??

Как правильно написать статью и составить к ней семантическое ядро?
Как правильно написать статью и составить к ней семантическое ядро? Сколько должно быть символов...

Как обработать нажатие на ссылку
Прежде всего - ВСЕХ С НОВЫМ ГОДОМ!!!! желаю успехов во всех начинаниях. Кстати, о начинаниях...

Ссылку на статью о ms access 2003
подскажите ссылку на статью о ms access 2003 где содержится год создания,для чего служит, полное...

1
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
17.10.2013, 20:50 2
Лучший ответ Сообщение было отмечено как решение

Решение

нужен исполнитель "Скачивальщик статьи", который принимает ссылку и формирует файл с отформатированной статьёй

Python
1
2
3
4
5
6
7
8
9
10
class ArticleLoader:
    def load_article(self, url):
        pass
        # здесь пишешь продолжение
 
def load_and_format_article(url):
    al = ArticleLoader()
    al.load_article(url)
 
load_and_format_article('http://test')
все загрузчики, поисковики, форматировщики находятся внутри "Скачивальщика статьи"
должна быть иерархия исполнителей
0
17.10.2013, 20:50
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
17.10.2013, 20:50
Помогаю со студенческими работами здесь

Как в awesomium получить ссылку по титлу и перейти по ней
Здравствуйте, как в awesomium получить ссылку по титлу и перейти по ней Добавлено через 39 минут...

Как найти ссылку по искомому тексту и перейти по ней?
как найти ссылку по искомому тексту и перейти по ней $(' > li >...

Обработать ссылку
Есть TStringList с примерными данными: Ну и примерно другие же такие данные. Задача: удалить...

Обработать ссылку
Здравствуйте! Есть картинки-ссылки типу "index.php?lang=ru", с разными языками. Нужно, что бы по...

Как перебрать n-oe количество строк в текстовом файле и выбрать нужные отформатировав их и поместив в excel?
Здравствуйте, появилась проблема, а именно нужно из текстового файла вытянуть определенную строку,...

Обработать произвольную ссылку без переадресации
Народ, помогите кто чем может. Задача простая - получаю некую ссылку формата...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru