Форум программистов, компьютерный форум, киберфорум
PHP: сети
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.50/4: Рейтинг темы: голосов - 4, средняя оценка - 4.50
35 / 36 / 16
Регистрация: 23.03.2010
Сообщений: 2,659
1

что нужно в парсере?

08.04.2012, 17:23. Показов 677. Ответов 4
Метки нет (Все метки)

делаю расширенный парсер и хочу сразу учесть все что в нем потребуется, итак что уже в нем есть

#----------------------------------------#
-весь контент
-весь контент без тегов
-все линки из контента ( кроме / и # )
-язык (lang="ru" к примеру)
-кодировка (utf-8 к примеру)
-ключевые слова (keywords)
-описание (descriptions)
-тайтл (title)
-PR (google)
-ТИЦ (yandex)
#----------------------------------------#

что еще может потребоваться сейчас или в будущем?
0

Помощь в написании контрольных, курсовых и дипломных работ здесь.

Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
08.04.2012, 17:23
Ответы с готовыми решениями:

Что делать с такой ошибкой в программе парсере?
Ребят сделал программу translator с паскаля на с++ описал try...catch для кнопки выполнить вот код:...

парни нужно кое-что добавить (нужно что бы эта программа вычисляла среднее арифметическое чисел)
нужно что бы эта программа вычисляла среднее арифметическое чисел, общую сумму, максимальное и...

Написал программу по смене слов в строке, но нужно что бы можно было вводить слова с клавиатуры.Что нужно ?
// ConsoleApplication7.cpp: определяет точку входа для консольного приложения. // #include...

Ошибка в парсере
Вот код: #!/usr/bin/env python3 import time from urllib.request import urlopen from...

4
1299 / 705 / 107
Регистрация: 25.05.2011
Сообщений: 2,158
Записей в блоге: 51
08.04.2012, 20:32 2
- Доступ к элементам DOM документа по их ID ClassName и атрибутами. По типу jQuery селекторов. Если это реализовать то всякие побрякушки принципе уже нужны не будут.
0
35 / 36 / 16
Регистрация: 23.03.2010
Сообщений: 2,659
08.04.2012, 20:39  [ТС] 3
Цитата Сообщение от Alex_pac Посмотреть сообщение
- Доступ к элементам DOM документа по их ID ClassName и атрибутами. По типу jQuery селекторов. Если это реализовать то всякие побрякушки принципе уже нужны не будут.
эээ а зачем это нужно, точнее как потом этим воспользоваться?
а еще лучше пример использования если можно...
0
1299 / 705 / 107
Регистрация: 25.05.2011
Сообщений: 2,158
Записей в блоге: 51
08.04.2012, 20:50 4
эээ а зачем это нужно, точнее как потом этим воспользоваться
странные вопросы задаешь.

например тебе надо пропарсить ссылку. вместо того чтобы писать регулярку просто пишешь из какого элемента (тег, id, classname) , что брать.

в php вроде уже подобный класс сделали. который позволяет парсить DOM http://www.php.net/manual/ru/book.dom.php
0
2378 / 941 / 129
Регистрация: 25.04.2009
Сообщений: 2,635
Записей в блоге: 4
08.04.2012, 20:55 5
Половину задачь из вашего списка можно реализовать с помощью стандартных фич php
http://www.php.net/manual/en/book.dom.php

Добавлено через 1 минуту

Не по теме:

Alex_pac, опять опоздал с ответом :)

0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
08.04.2012, 20:55

Помощь в написании контрольных, курсовых и дипломных работ здесь.

Ошибка в парсере
Добрый день, есть парсер, все работает отлично. Надо вытащить ссылку "/news/issue/2017-07-28" из...

Ошибка в парсере формулы
Здравствуйте! Помогите понять, где ошибка, пожалуйста... Пишу обозреватель дерева парсера...

Новый атрибут в парсере
При публикации новости через визуальный редактор DLE обрезает запись data-fancybox="group". Я так...

ошибки в программе парсере
привет собственно вот такой вот код import requests from bs4 import BeautifulSoup import csv...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.