|
0 / 0 / 0
Регистрация: 12.10.2015
Сообщений: 2
|
||||||
Парсер ссылок из поисковика12.10.2015, 17:57. Показов 1840. Ответов 4
Метки нет (Все метки)
В общем я Java script только начала учить, а задали мне уже очень забавную задачу, к которой я даже толком не знаю как подойти. Нужно написать парсер который будет парсить результаты запроса из поисковика (например гугл). То есть ты ему даешь ключевое слово, он по нему контент парсит, выделяет из него ссылки на другие сайты и с них контент парсит. Для меня это не совсем темный лес, но и не светлый. Есть у меня вот такой кусок кода, но никак не могу осилить как бы его еще заставить ссылки выделять из того что он выдрал и по ним парсить текст:
0
|
||||||
| 12.10.2015, 17:57 | |
|
Ответы с готовыми решениями:
4
Парсер всех ссылок сайта Парсер ссылок сайта - ошибка 404 |
|
Ренегат
|
|
| 14.10.2015, 00:22 | |
|
Элла, вы $ выведите в более глобальную область
а дальше уже обычный парсер ссылок, записывающий их в массив, потом массив прогоняем через фильтр повторов и всё у вас будет массив неповторяющихся ссылок Добавлено через 5 минут регулярки по поиску можно найти в интернете, их там до черта Добавлено через 1 минуту фильтры массивов тоже в инете можно найти
0
|
|
|
936 / 693 / 236
Регистрация: 01.02.2015
Сообщений: 1,848
|
|
| 14.10.2015, 00:26 | |
|
Элла ведь Google по запросу "node получить страницу" сразу дает ответ на ваш вопрос. Вот не пойму, то ли правильно вопросы задавать не умеете. Или хотите, чтоб все преподнесли на тарелочке
0
|
|
|
0 / 0 / 0
Регистрация: 12.10.2015
Сообщений: 2
|
||
| 15.10.2015, 19:59 [ТС] | ||
|
0
|
||
|
936 / 693 / 236
Регистрация: 01.02.2015
Сообщений: 1,848
|
|
| 15.10.2015, 20:53 | |
|
0
|
|
| 15.10.2015, 20:53 | |
|
Помогаю со студенческими работами здесь
5
Парсер внешних ссылок по страницам сайта на JAVA - как сделать правильно? Парсер сайта и ссылок с сайта Есть ли такая биржа ссылок, где можно размещать место для ссылок вне видимости страницы сайта
??? пропал из поисковика Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|