Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.69/13: Рейтинг темы: голосов - 13, средняя оценка - 4.69
0 / 0 / 0
Регистрация: 28.09.2010
Сообщений: 6

Создание индексатора для поисковика

28.09.2010, 01:51. Показов 2628. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Кароч я делаю в нашей локальной сети поисковик на пхп, он состоит из 2 частей
Индексатора , который индексирует все папки и файлы на фтп серверах, и самого поисковика, который уже ищет информацию в фалах индексации. Проблема в следующем. Если очень большой фтп сервер, то он не индексируется целиком, он выполнен на рекурсивной основе, запускается функция, которая находит папку на серве, запускается этаже функция но уже для этой папки и тд,
я уже и увеличи обьем памяти под скрипт и время выполнения но хз
если хотите могу выожить код
ПОМОГИТЕ!!!!!!!!!!
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
28.09.2010, 01:51
Ответы с готовыми решениями:

Создание индексатора для класса: Невозможно применить индексирование через [] к выражению
создаю индексатор по названию: public string this { get { ...

Создание поисковика для файлов с различными функциями
Надо создать многофункциональный поисковик, где можно изменять удалять создавать файлы.

Создание индексатора
Не могу понять как мне создать идексатор(массив) вот кодusing System; using System.Collections; namespace индексатор { ...

13
0 / 0 / 1
Регистрация: 21.06.2010
Сообщений: 201
28.09.2010, 05:53
Попробуй запустить индексирующий скрипт без сервера; если это локальная сеть, то проблем быть не должно.
0
0 / 0 / 2
Регистрация: 11.12.2008
Сообщений: 219
28.09.2010, 10:19
А если в фоне запускать, то снимается ограничение на время выполнения скрипта.
0
0 / 0 / 2
Регистрация: 11.12.2008
Сообщений: 219
28.09.2010, 10:20
Сколько всего файлов, которые неоходимо индексировать?
0
0 / 0 / 0
Регистрация: 28.09.2010
Сообщений: 6
28.09.2010, 13:48  [ТС]
2crumb:кол-во файлов на каждом сервере различно, на одном фтп может быть 2 гига ресурсов, на другом у нас аж 350 гигов
0
0 / 0 / 0
Регистрация: 28.09.2010
Сообщений: 6
28.09.2010, 13:50  [ТС]
вообще рекурсиdysq метод определения папок и файлов на серверах он работате на 100%, не нужно ли увеличивать кол-во памяти под скрипт?
и что значит запускать на фоне?
0
0 / 0 / 2
Регистрация: 11.12.2008
Сообщений: 219
28.09.2010, 13:57
Про фоновый режим уже обсуждали : http://relib.com/forums/topic.asp?id=826361

>не нужно ли увеличивать кол-во памяти под скрипт?
Так увелич, и посмотри, в чем проблемы то.

Как скрипт валится, какие ошибки вылазят?
0
0 / 0 / 0
Регистрация: 28.09.2010
Сообщений: 6
28.09.2010, 14:27  [ТС]
В том то идело что ошибок нет, он начинает работу, заканчивает всё вроде нормально, но обьем информации который он определил намного меньше то что реально на сервере лежит
выкладываю код профункции которая все это делает

//файл индексации
$indexfile=fopen('files/database.dat','a+');

//индексирование папок на сервере
function indexdir($ftp,$ip,$port,$indexfile,$dir, $stat)
{
$elements_in_dir=ftp_rawlist($ftp,$dir);

$i=0;
while (@$elements_in_dir[$i]):
//если найденное - файл
if (substr($elements_in_dir[$i],0,1)=='-')
{
//размер фала
$f_size=ftp_size($ftp,$dir.'/'.substr($elements_in_dir[$i],55,99));
if ($f_size<1000) {$size=$f_size.' байт';}
if ($f_size>=1000 && $f_size<1000000) {$size=round($f_size/1000).' Кбайт';}
if ($f_size>=1000000 && $f_size<1000000000) {$size=round($f_size/1000000).' Мбайт';}

$stat[0]++;

$stat[2]=$stat[2]+$f_size;
fwrite($indexfile,'ftp://'.$ip.':'.$port.$dir.'/'.substr($elements_in_dir[$i].'<size>'.$size.'
',55,99));
}
//папка
if (substr($elements_in_dir[$i],0,1)=='d' && substr($elements_in_dir[$i],55,99)!='.' && substr($elements_in_dir[$i],55,99)!='..')
{
echo '<font color=E2F3FE size=2>............</font><font color=black>ftp://'.$ip.':'.$port.$dir.'/'.substr($elements_in_dir[$i],55,99).'</font>
';
$stat[1]++;
fwrite($indexfile,'ftp://'.$ip.':'.$port.$dir.'/'.substr($elements_in_dir[$i].'
',55,99));
$stat=indexdir($ftp,$ip,$port,$indexfile ,$dir.'/'.substr($elements_in_dir[$i],55,99),$stat);
}

$i++;
endwhile;
return($stat);
}
0
evge
28.09.2010, 15:04
i=0;
while (@$elements_in_dir[$i])
if (substr($elements_in_dir[$i],0,1)=='-')

Циклы у тебя какие-то бесконечные, странно что работает.
0 / 0 / 0
Регистрация: 28.09.2010
Сообщений: 6
28.09.2010, 15:06  [ТС]
ничего бесконечного, он заканчивается, когда больше элеметнов в массиве нету
0
evge
28.09.2010, 15:21
Нет с циклами нормально, недосмотрел.
Но файлы ипапки обычно разделяются так (php.net):
<?

function cutspaces($str){
while(substr($str,0,1)==' '){$str=substr($str,1);}
return $str;}


$folders=array();
$files=array();
for($i=0;$i<sizeof($list);$i++){
list($permissions,$next)=split(' ',$list[$i],2);
list($num,$next)=split(' ',cutspaces($next),2);
list($owner,$next)=split(' ',cutspaces($next),2);
list($group,$next)=split(' ',cutspaces($next),2);
list($size,$next)=split(' ',cutspaces($next),2);
list($month,$next)=split(' ',cutspaces($next),2);
list($day,$next)=split(' ',cutspaces($next),2);
list($year_time,$filename)=split(' ',cutspaces($next),2);
if($filename!='.' && $filename!='..'){
if(substr($permissions,0,1)=='d'){
$folders[]=$filename;
} else {
$files[]=$filename;}}}
sort($folders);
sort($files);
?>
0 / 0 / 0
Регистрация: 28.09.2010
Сообщений: 6
01.10.2010, 15:33  [ТС]
Не понятно, фтп с огромным кол-вом папок полноссть не индексируются, а большие фтп но с меньшим кол-вом папок спок. Мож из за рекурсии?
0
0 / 0 / 2
Регистрация: 11.12.2008
Сообщений: 219
03.10.2010, 01:17
Если ты говоришь, что скрипт НОРМАЛЬНО завершается в любом случае, то посмотри какие файлы не проиндексировались, может что-то не так с ними.

Веди лог индексации каждого файла, может такм что-то вылезет.
0
Mocus
09.10.2011, 01:17
Предлагаю воспользоваться моим готовым поисковиком.
http://mt.boston.ru

Все проблемы там давно решены, всё написано на PHP, при желании можно доработать.

Если будете дорабатывать - готов оказывать 'посильную техническую поддержку' - у самого времени не хватает. Хочется столько всего сделать, но нет времени.

Если есть желание всё же написать свой поисковик и индексатор - можно посмотреть, как это сделано у меня. Там весь код с комментариями.
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
09.10.2011, 01:17
Помогаю со студенческими работами здесь

С чего начать создание поисковика
Здравствуйте. Подскажите мне пожалуйста, я хочу создать простенькую прогу по поиску файлов на харде по их имени ( вроде стандартного...

Вставка текста в форму + создание поисковика по всей базе
Люди! Очень нужна помощь. Как вставить текст большого объема в форму (и вообще возможно ли это?) чтобы в зависимости от выбранного...

База данных для поисковика
Какую СУБД лучше использовать для поисковика?

тег стал невкусен для поисковика
Смотрел анализ страницы, типа замечания увидел: ______________________________________ ВНУТРИ ТЕГА ЕСТЬ ВЛОЖЕННЫЕ ТЕГИ! В теге...

Вид URL ссылки для поисковика
Вот делаю каталог софта... Подскажите что лучше адрес вида http://site.ru/content/internet/ или...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Программа принимает математическое выражение в виде строки и выдаёт его производную в виде строки и вычисляет значение производной при заданном х Логарифм записывается как: (x-2)log(x^2+2) -. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru