Форум программистов, компьютерный форум, киберфорум
Наши страницы
PHP для начинающих
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.88/8: Рейтинг темы: голосов - 8, средняя оценка - 4.88
Kirk
0 / 0 / 0
Регистрация: 14.12.2007
Сообщений: 37
1

Принцип работы поисковой системы

16.03.2010, 14:49. Просмотров 1542. Ответов 2
Метки нет (Все метки)

Кто-то знает в чем заключается принцип работы поисковой системы(таких как апорт, рамблер). А вот решил написать, а с чего начать не знаю. Если есть какието идеи или статьи, то подскажите пожалуйста.
Заранее спасибо
0
QA
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
16.03.2010, 14:49
Ответы с готовыми решениями:

Написание собственной поисковой системы
Вот решили с другом написать поисковую систему типо рамблера. Но для начала хотим написать хотя бы...

Создание поисковой системы для сайта
Мне для сайта нужно сосздать поисковую систему. Я ее хотел сделать классной, так чтоб поиск велся...

Упрощенный принцип создания поисковой системы на PHP
- Доброго времени суток. Сперва объясню ситуацию: выбрал тему на курсовой проект "Поисковая...

Как получить ключевое слово, по которому пришли из поисковой системы?
Здравствуйте! Скажите пож- как получить ключевое слову по которому пришли из поисковой системы?

Принцип работы password_verify()
Добрый день, уважаемые форумчане! Прошу помощи в связи с недопониманием алгоритма работы функции...

2
sl_play
2 / 2 / 3
Регистрация: 25.05.2009
Сообщений: 2,576
16.03.2010, 16:42 2
ну, тут можно только философствовать! Исходных кодоп и описания я во всяком случае не видел. но есть догадки!
1. Пишешь базу данных, в которых содержится урлы сайтов. Раз в месяц запускается скрипт, который сдерает весь штмл код с известных урлов. Как потом искатьдумаю понял!
2. Хорощо бы тоже самое, только чтобы ещё отлавливались все ссылки в документе, тоесть скрипт заходил на каждую из них. Наверно это будет занимать много времени!
Это мои догадки!
0
bazile
67 / 43 / 68
Регистрация: 15.03.2007
Сообщений: 6,909
17.03.2010, 11:08 3
Теоретически все просто: поисковый робот (программа) регулярно посещает известные ему сайты и заносит в свою базу снимок текстовго содержания всех страниц сайта. В самом простом случае достаточно удалять все html теги оставляя только текст и заносить результат в базу. Из html кода берутся все ссылки и процесс повторяется для них, пока не будут проиндексированы все страницы. Хороший работ должен также следовать правилам описанным в файле robots.txt.

В реальности все будет сложнее в зависимости от задач которые ставятся перед поисковиком. Яндекс, например, выполняет поиск с учетом морфологии русского языка. Кроме этого поисковые системы кроме собственно поиска борятся с теми кто пытается их обманывать ('поисковый спам'). Конкретные алгоритмы работы ведущих поисковых систем врядли можно найти. Это коммерческая тайна.

Еще можно добавить выполняя индексацию робот не должен сильно нагружать сайт своими запросами, чтобы не мешать работе посетителей сайта.

Я бы посоветовал посетить форум того же Яндекса - http://guest.yandex.ru/yandex/questions.xhtml. Там можно получить более квалифицированные ответы о поисковых системах.
0
Answers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
17.03.2010, 11:08

Принцип работы парсинга
Здравствуйте. Расскажите, пожалуйста, кто знает - как лучше построить парсинг информации. Стоит...

Принцип работы MVC
Добрый вечер! Уже часов 8 пытаюсь понять технологию MVC (Model-View-Controller). Прочитал много...

Принцип работы ЧПУ
Доброго времени суток, кибербратья и киберсёстры! Давеча разговаривал с одним из начинающих...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.
Рейтинг@Mail.ru