С Новым годом! Форум программистов, компьютерный форум, киберфорум
Теория программирования
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.73/56: Рейтинг темы: голосов - 56, средняя оценка - 4.73
0 / 0 / 0
Регистрация: 13.02.2016
Сообщений: 7

Как создать свой поисковик?

14.02.2016, 13:06. Показов 10854. Ответов 8

Студворк — интернет-сервис помощи студентам
Здравствуйте.

В интернете не много информации на эту тему дня "новичков"

Можете подсказать как создать поисковик похожий на ГУГЛ (по функционалу) хотя бы версии 1999 года

На каком языке нужно писать поисковик?
Сколько нужно денег на это? (если в одиночку нереально, и нужно нанимать программистов)
Сколько железа (серверов) ?

Заранее спасибо за ответы.

Добавлено через 14 часов 1 минуту
На том форуме кто нить разбирается в этом?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
14.02.2016, 13:06
Ответы с готовыми решениями:

Создать свой поисковик, но чтобы запросы были с яндекса, но в собственном дизайне
Люди, помогите, как создать свой поисковик, но чтобы запросы были с яндекса, но в моём дизайне, как?! срочно нужна помощь, прошу помогите

Как создать поисковик по нескольким сайтам
Как сделать поисковый сайт, который будет искать информацию по другим сайтам? Есть 5 сайтов которыми я не владею ( a.com, b.com , c.com,...

Как создать свой формат?
Вообщем вопрос в этом "Как создать свой формат?". У меня в нем будет хранится база аксес и прочие файлы.

8
2623 / 1634 / 266
Регистрация: 19.02.2010
Сообщений: 4,343
14.02.2016, 22:15
Четвёртая глава в книге Тоби Сегарана.
1
Заблокирован
18.02.2016, 06:46
Среднего уровня поисковик можно написать на php+databases+html+css+javascript+linux servers.
0
0 / 0 / 0
Регистрация: 13.02.2016
Сообщений: 7
18.02.2016, 11:17  [ТС]
Спасибо за ответ!
А где можно найти пошагово как это сделать?
Где найти инфу как написать своего поискового робота? (мини)
0
Модератор
Эксперт функциональных языков программирования
3133 / 2280 / 469
Регистрация: 26.03.2015
Сообщений: 8,876
18.02.2016, 16:44
Написать поисковик не сложно. Сложно его настроить, чтобы он искал более-менее адекватно.

Цитата Сообщение от blecklight Посмотреть сообщение
Где найти инфу как написать своего поискового робота?
Вы имеете ввиду бота, который будет лазить по интернету и собирать ссылки для индексации?
1
0 / 0 / 0
Регистрация: 13.02.2016
Сообщений: 7
18.02.2016, 17:37  [ТС]
А разве что бы сделать поисковик, в начале, ведь нужно создать робота который будет бегать по сайтам, и добавлять их в "базу" по которой и будет работать наш "поисковик"

То есть создать БОТа это разве не ШАГ №1 ?

Может где то есть с открытым кодом что то?
0
Модератор
Эксперт функциональных языков программирования
3133 / 2280 / 469
Регистрация: 26.03.2015
Сообщений: 8,876
18.02.2016, 19:01
Я не знаю, какой смысл Вы вкладываете в слово "поисковик".

Вам нужно:
1. Получить список документов для индексации.
2. Проиндексировать эти документы.
3. Создать интерфейс, который будет по запросу искать документы.

Технически, все три этапа выполнить не сложно, но работать это будет, мягко говоря, отвратительно.


1. Результатов обычно огромное количество (особенно, если поисковый запрос короткий). Нужно каким-то образом ранжировать документы.
2. Индексированные страницы нужно предварительно обрабатывать (убирать служебную информацию, рекламу, всякие меню и т.п.). Полнотекстовый поиск нужно настраивать... причём, отдельно для каждого языка... желательно, с учётом профессиональных жаргонов... Основная сложность - омонимы, которых очень много. Чтобы получить возможность точной настройки, вероятно, придётся писать свой движок.
3. Поисковый запрос нужно предварительно обрабатывать (например, убрать предлоги... и при этом оставить "с", если это название языка). Нужно настраивать и алгоритм вычисления релевантности.

И для решения данных задач не существует готовых формальных алгоритмов. Требуется ручная настройка. Видишь "косяк" в результатах поиска, что-нибудь "подкручиваешь", чтобы от него избавиться, и надеешься, что твои исправления не добавят новые "косяки" в другом месте.


з.ы. Пример полнотекстового поиска с открытым исходным кодом:
http://sphinxsearch.com/
1
0 / 0 / 0
Регистрация: 29.06.2016
Сообщений: 1
03.07.2016, 10:55
Я создал такой поисковик на sphinxsearch. На сегодня почти 6000000 страниц в индексе. 130000 доменов втрогого уровня. Crawler и spider самописные.
вот мой поисковик https://arhpost.ru/
Релевантность невелика.

пример поискового запроса: https://arhpost.ru/?search=Поисковая+Система

Все работает на одном компьютере.

Добавлено через 9 минут
вверху ссылка на пример поиска неверна, не в той кодировке приходит, вот пример поиска https://arhpost.ru/?search=%D0... 0%BC%D0%B0

Добавлено через 3 минуты
Вот ещё, все страницы в индексе этого сайта
https://arhpost.ru/?search=@host+cyberforum.ru
0
0 / 0 / 0
Регистрация: 18.08.2016
Сообщений: 1
18.08.2016, 09:01
Здравствуйте!
Я посмотрел ваш сайт и мне понравилось!

Если у Вас будет свободное время не могли бы Выложить подробное руководство или что то
подобное, чтобы я смог это повторить не беспокоя Вас и почувствовать то что почувствовали
Вы когда завершили ваш проект https://arhpost.ru/ !
с уважением молодой начинающий программист!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
18.08.2016, 09:01
Помогаю со студенческими работами здесь

Как создать свой сайт?
Решила создать свой сайт, точнее не я одна, а с подругой)) но в этом мы как вде блондинки)) читали, что это не так уж и трудно))) Вообще...

Как создать свой сайт
памогите мне раскожите как сделать сайт и с чего начать пож.

Как создать свой модуль?
объясните кто-нибудь как создать свой модуль:)

Как создать свой ListBox?
Я еще в процессе изучения. Сильно не пинайте :) Как можно сделать так, чтобы в выдвигающемся списке можно было визуально нажать на...

Как создать свой словарь
помогите создать свой словарь на любой язык. спс


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Old Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru