|
0 / 0 / 0
Регистрация: 14.12.2007
Сообщений: 37
|
|
Принцип работы поисковой системы16.03.2010, 14:49. Показов 1999. Ответов 2
Метки нет (Все метки)
Кто-то знает в чем заключается принцип работы поисковой системы(таких как апорт, рамблер). А вот решил написать, а с чего начать не знаю. Если есть какието идеи или статьи, то подскажите пожалуйста.
Заранее спасибо
0
|
|
| 16.03.2010, 14:49 | |
|
Ответы с готовыми решениями:
2
Написание собственной поисковой системы Создание поисковой системы для сайта Как получить ключевое слово, по которому пришли из поисковой системы? |
|
4 / 4 / 3
Регистрация: 25.05.2009
Сообщений: 2,576
|
|
| 16.03.2010, 16:42 | |
|
ну, тут можно только философствовать!
Исходных кодоп и описания я во всяком случае не видел. но есть догадки!1. Пишешь базу данных, в которых содержится урлы сайтов. Раз в месяц запускается скрипт, который сдерает весь штмл код с известных урлов. Как потом искатьдумаю понял! 2. Хорощо бы тоже самое, только чтобы ещё отлавливались все ссылки в документе, тоесть скрипт заходил на каждую из них. Наверно это будет занимать много времени! Это мои догадки!
0
|
|
|
86 / 62 / 69
Регистрация: 15.03.2007
Сообщений: 6,903
|
|
| 17.03.2010, 11:08 | |
|
Теоретически все просто: поисковый робот (программа) регулярно посещает известные ему сайты и заносит в свою базу снимок текстовго содержания всех страниц сайта. В самом простом случае достаточно удалять все html теги оставляя только текст и заносить результат в базу. Из html кода берутся все ссылки и процесс повторяется для них, пока не будут проиндексированы все страницы. Хороший работ должен также следовать правилам описанным в файле robots.txt.
В реальности все будет сложнее в зависимости от задач которые ставятся перед поисковиком. Яндекс, например, выполняет поиск с учетом морфологии русского языка. Кроме этого поисковые системы кроме собственно поиска борятся с теми кто пытается их обманывать ('поисковый спам'). Конкретные алгоритмы работы ведущих поисковых систем врядли можно найти. Это коммерческая тайна. Еще можно добавить выполняя индексацию робот не должен сильно нагружать сайт своими запросами, чтобы не мешать работе посетителей сайта. Я бы посоветовал посетить форум того же Яндекса - http://guest.yandex.ru/yandex/questions.xhtml. Там можно получить более квалифицированные ответы о поисковых системах.
0
|
|
| 17.03.2010, 11:08 | |
|
Помогаю со студенческими работами здесь
3
Принцип работы password_verify() Принцип работы кода Принцип работы парсинга
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
|
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
|
SDL3 для Web (WebAssembly): Сборка SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
|
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога
Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
|
|
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование
. \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json>
Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом.
# Check if. . .
|
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так:
https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347
Основана на STM32F303RBT6.
На борту пять. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|