С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.85/13: Рейтинг темы: голосов - 13, средняя оценка - 4.85
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416

Составить программу для поиска в интерне, используя Google и последующий парсинг результатов

19.08.2014, 09:03. Показов 2771. Ответов 23
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
вообщем идея такова!нуждаюсь в совете может быть в исходниках наработанных по данному вопросу.хочу составить программу для поиска в интерне чтобы питон спрашивал у гугла в ответ я получал страницу парсил её,спрашивал у другой поисковой системы и т.д..Надеюсь идея понятно про прокси сокеты и тому подобное я промолчу.Вопрос в том ,что не будет ли проще написать даную программу на дэлфи чем на питоне.По попыткам двум с питона передать в гет запросе поисковый запрос получил два разных ответа но это всё из за того что пользуюсь библеотекой юрл либ.пробывал две разные ссылки.ни хидерсов ни постов не передовал.по опыту помни что на делфи такие темы горазда лучше проходили ,но тут вопрос надо ставить интерпритатор скачивать тобишь его и так далее.Попроще бы хотелось.На чём писать?(копипастить)
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
19.08.2014, 09:03
Ответы с готовыми решениями:

Парсинг результатов поиска Yandex,Google и HttpWebRequest
Привет! Возникла проблема. Не получается спарсить страничку в поисковой системе средствами HttpWebRequest или другими....

Форма для поиска в Яндексе и по сайту, и в Интерне
кто-нить это уже проделывал? http://company.yandex.ru/forms/sitesearch_js.xml если сайт на WP - куда это вставлять?

Составить программу, которая бы определяла предыдущий и последующий символ для символа F по таблице кодировки
Добрый день . Прошу помочь не могу разобраться с задачей в консоле . Вот задание. Составить программу , которая бы определяла...

23
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
19.08.2014, 09:34
mikhail899, ну python однозначно будет это проще. requests - вам в помощь
Вот google api
Поищите, я уверен и у других поисковиков есть python API

Добавлено через 22 секунды
mikhail899, умайдохаетесь на дэлфи, на python проще в разы.
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
19.08.2014, 09:57  [ТС]
поисковый запрос у того же гугла решил собственно всё.url lib2 все сделал.
Python
1
2
3
4
5
6
7
8
9
import urllib2
inputs = raw_input('input')
url = "http://www.google.com/search?q="+inputs;
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
data = opener.open(url).read()
datas = open('d://'+inputs+'.html','wb')
datas.write(str(data))
datas.close()
но делфи тоже на память не хварает.
может кто ещё что скажет.
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
19.08.2014, 10:01
mikhail899, введите русские буквы.
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
19.08.2014, 10:13  [ТС]
теперь вопрос а парсить с какой библеотекой нужно?

Добавлено через 1 минуту
Wolkodav, ввел русские в поиске иероглифы ,но по результату всё нормально.
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
19.08.2014, 10:51
mikhail899, тут
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
22.08.2014, 10:31  [ТС]
Wolkodav, Wolkodav, я незнаю как устанавливать дополнительные библеотеки.urlparse не подойдет для этой цели?
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
22.08.2014, 10:50
mikhail899, а при чем тут urlparse? Вы же парсите html, а не url. тут
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
22.08.2014, 10:58  [ТС]
Wolkodav, открыл загруженную страницу текстовым редак и немного растроился потому как там нет прямых ссылок на поисковые результаты только как я понял ссылки на кэш гугла,а прямых нет.

Добавлено через 2 минуты
это установка linux
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
22.08.2014, 10:59
mikhail899, есть, посмотрите атрибут data-href)

Добавлено через 1 минуту
mikhail899, нет, это установка общая для всех ОС) Это вы виндузятники, привыкли кликать по кнопкам, учитесь пользоваться консолью, вы всетаки программируете на python.
1
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
22.08.2014, 11:21  [ТС]
Wolkodav, первый раз сталкивась с тем что библиотеки нужно устанавливать из под консоли там полный путь прописывать?не могли бы объяснить?
0
561 / 484 / 168
Регистрация: 14.02.2012
Сообщений: 1,561
22.08.2014, 11:31
Скачиваем и распаковываем PIP
http://pypi.python.org/pypi/pip
Внизу страницы ссылка на скачку архива. Скачали, распаковали, открываем командную строку — идем в папку с распакованным архивом. Оттуда пишем
Code
1
python setup.py install
Всё pip поставили, теперь у Вас есть менеджер пакетов. Это очень удобно. Дальше
Code
1
pip install beautifulsoup4
ставите библиотеку Beautiful Soup. Ещё можно скачать архив с библиотекой в папку вашего проекта и собрать её там.
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
22.08.2014, 11:40
ВАСИЛЕВС, ну вроде бы надо еще прописпть пути.
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
22.08.2014, 11:57  [ТС]
Wolkodav, а как в консоле открыть нужную папку?я зашел в консоль и нахожусь в верхней папке чем нужно
команда cd так?

Добавлено через 7 минут
вылезла ошибка traceback(most recent call last):file "setup.py", line 6,in <module> from setuptools import setup. find_packages importerror: No module named setuptools.
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
22.08.2014, 13:06
надо установить модуль setuptools
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
22.08.2014, 15:03  [ТС]
и где этот модуль?
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
22.08.2014, 15:04
Тут посмотрите...
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
22.08.2014, 16:10  [ТС]
парсить с родными библеотеками не получится?чтоб ничего не доставлять.
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
22.08.2014, 16:12
mikhail899, регулярными вырожениями, если сможете, можно вообще строковыми функциями)
0
кодер
 Аватар для mikhail899
37 / 26 / 13
Регистрация: 15.08.2014
Сообщений: 416
31.08.2014, 23:19  [ТС]
строковыми функциями понятнее даже.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
31.08.2014, 23:19
Помогаю со студенческими работами здесь

Разработать программу для поиска нужной фамилии в массиве, используя метод бинарного поиска
Разработать программу для поиска нужной фамилии в массиве, используя метод бинарного поиска. Добавлено через 2 минуты С...

Анализ результатов поиска Google
Подскажите пожалуйста программы или сервис для многостороннего анализа результатов поиска Google и Google Video

Парсер результатов поиска Google
Возник такой вопрос... видел кучу вариантов для записи в файл... Но так и не смог придумать как это отобразить в нормальном виде. Чтобы...

Проверка количества результатов поиска google
Все привет, люди добрые, помогите, пожалуйста. Нужно обработать огромный массив данным, сформировать по ним поисковые запросы и проверить...

Получение результатов поиска в Google в виде URL
Здравствуйте у меня есть &quot;код&quot; который должен грабить результаты поиска гугл, мне дали регулярки: ---google--- &lt;h3...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Новые блоги и статьи
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru