Форум программистов, компьютерный форум CyberForum.ru

поиск на c++ - C++

Восстановить пароль Регистрация
 
vantyz
54 / 54 / 2
Регистрация: 04.03.2012
Сообщений: 495
11.03.2012, 13:13     поиск на c++ #1
Привет всем,я решил написать поисковый движок.Его основа как и крупных дяденек(типо яндекс,гугл)будет на c++. Пока думаю сделать так php краулер собирает текст со страницы её название и url. c++ часть реализует поиск по этой базе. Я не прошу помочь мне написать все это,я хочу написать все сам.Просто дайте совета такая система будет быстрой,если например проиндексировать миллиард документов,то мне ,кажется,все это дело ляжет.Вот,чтобы вы посоветовали,может быть есть некоторые примеры опен сорс решений.
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
gooseim
Эксперт C++
500 / 404 / 35
Регистрация: 23.09.2010
Сообщений: 1,139
11.03.2012, 17:55     поиск на c++ #2
vantyz, чтобы вытащить нужную часть html-кода проще всего использовать регулярку. Напр. boost::regex или boost::xpressive.
Что касается миллиарда документов, то ни гугл ни yandex бы не справился, если бы у него был один компьютер и такой как у вас. Все это делается на мощнейших серверах.
vantyz
54 / 54 / 2
Регистрация: 04.03.2012
Сообщений: 495
12.03.2012, 16:17  [ТС]     поиск на c++ #3
А например для начала,пойдет так один комп отвечает за тото,другой за тото,и третий за это,такая распределенная система.
gooseim
Эксперт C++
500 / 404 / 35
Регистрация: 23.09.2010
Сообщений: 1,139
12.03.2012, 16:27     поиск на c++ #4
vantyz, я не знаю, как устроена распределенная система на поисковиках, поэтому ничего утверждать не буду.
Yandex
Объявления
12.03.2012, 16:27     поиск на c++
Ответ Создать тему
Опции темы

Текущее время: 04:58. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru