Форум программистов, компьютерный форум, киберфорум
Наши страницы
Python: Web
Войти
Регистрация
Восстановить пароль
 
Дмитрий Новиков
2 / 2 / 1
Регистрация: 21.12.2015
Сообщений: 67
#1

Как парсить только текст - Python

19.07.2017, 00:33. Просмотров 374. Ответов 2
Метки нет (Все метки)

Суть в общем такая, учусь писать парсер на питоне по одному видосу, паршу вот эту страницу https://www.weblancer.net/jobs/ правда сайт с пор видоса поменялся. но ничего вроде справляюсь, только вот проблема с полем количества заявок, в нем стоит куча проблов и перенос строки, не могу придумать как спарсить только текст ибо парситься он вот так : \n\t\t\t\t\t\t\t\t\t\t\t4 заявки\t\t\t\t\t\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\t. Также прилагаю сам код парсера. мб метод какой другой надо юзать.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import urllib.request
from bs4 import BeautifulSoup
 
def get_html(url):
    response = urllib.request.urlopen(url)
    return response.read()
 
 
def parse(html):
    soup = BeautifulSoup(html)
    projects = []
    table = soup.find('div', class_= 'container-fluid cols_table show_visited')
    rows = table.find_all('div', class_='row')
    for i in rows:
        projects.append({
            'title' : i.a.text,
            'category' : i.find('a', class_= 'text-muted').text,
            'content' : i.find('div', class_= 'col-xs-12').text,
            'order' : i.find('div', class_= 'col-sm-3 text-right text-nowrap hidden-xs').text
        })
    for i in projects:
        print(i)
 
 
def main():
    parse(get_html('https://weblancer.net/jobs?type=project'))
 
if __name__ == '__main__':
    main()

http://www.cyberforum.ru/python-web/thread1948116.html
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
19.07.2017, 00:33
Я подобрал для вас темы с готовыми решениями и ответами на вопрос Как парсить только текст (Python):

Как парсить на питоне
Добрый день! Только не пинайте жестко! Суть вопроса такова: Есть бат файл в...

Как правильно парсить CSV?
Здравствуйте, форумчане! Я пишу бота, который бы помогал пользователю...

Как исправить ошибку: формат теста исправить нельзя, только текст программы
class AmericanDate: def __init__(self, y, m, d): self.get_year...

Как парсить несколько файлов с Python-скриптом?
Всем доброго времени суток. У меня возникла такая проблема и одновременно...

Как парсить xml, научите новичку-чайнику
пожалуйста, пытаюсь решить самостоятельно, но не выходит # xml='<Test...

2
АмигоСП
21 / 21 / 18
Регистрация: 07.12.2016
Сообщений: 68
19.07.2017, 22:13 #2
Python
1
'order' : i.find('div', class_= 'col-sm-3 text-right text-nowrap hidden-xs').text.strip()
Дмитрий Новиков, обрабатывайте, как обычную строку
0
Дмитрий Новиков
2 / 2 / 1
Регистрация: 21.12.2015
Сообщений: 67
20.07.2017, 00:44  [ТС] #3
АмигоСП, Спасибо огромное=)
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
20.07.2017, 00:44
Привет! Вот еще темы с решениями:

Как Парсить несколько одинаковых XML тегов? (BeautifulSoup)
Имеется XML по типу: <players> <player> <level>5</level> ...

Как через lxml достать сразу текст тега и текст подтега?
Имеется такой html: <h3> <a>Text1<span>Text2</span></a> </h3> Как можно...

Считать текст из файла и вывести на экран только предложения, не содержащие запятых
Написать программу, которая считывает текст из файла и выводит на экран только...

Очень нужны дельные советы: парсить сайт
Стоит задача вытащить из сайта все закупки, которые были сделаны за период. Я...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru