Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
0 / 0 / 2
Регистрация: 19.07.2015
Сообщений: 43

Многопоточности парсеру

27.03.2016, 19:49. Показов 792. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Ребят помогите с парсером, все уже перерыл ни как не могу справиться с многопоточностью.

вот код
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
<?php
$header = array(
'http'=>array(
'method'=>"GET",
'header'=>
"Accept:*/*\r\n".
"Accept-Language:ru-RU,ru;q=0.8,en-US;q=0.6,en;q=0.4\r\n". 
"Cookie:***\r\n".
"User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36\r\n"
)
);
for ($number_page = 1; $number_page <= 10; $number_page++){
$page = stream_context_create($header);
$page_nick = file_get_contents("http://www.taxi-money.net/enclave/rating/gamer?page=$number_page", false, $page);
preg_match_all('|<a href="/enclave/gamer/(.*?)" class="ajax (.*?)">|i', $page_nick, $nick_is_rating); 
for ($number_nick = 10; $number_nick <= 19; $number_nick++){
++$rating_is_page;
$nick_for_table = "{$nick_is_rating[1][$number_nick]}";
$rating[] = ($rating_is_page);
$link[] = ("http://www.taxi-money.net/enclave/gamer/$nick_for_table");
$nick[] = ("$nick_for_table");
};
};
var_dump($nick);
?>
как мне настроить многопоточную работу скрипта, просто в будующем он должен будет парсить около 10к страниц а это очень долго
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
27.03.2016, 19:49
Ответы с готовыми решениями:

Оптимальное решение по парсеру
Добрый день всем. Дело вот в чем задумал я сделать парсер контента, но перед тем как начать хотел посоветоваться. В интернете много разных...

Соотношение многопоточности приложения c++ и многопоточности на уровне системы?
Возник следующий вопрос: в C++ существует два варианта работы с многопоточностью - std::theard и использование mutex. Но, оба этих...

Подскажите по парсеру html и регулярным выражением
Ребята, нужна помощь. Впервые пишу парсер и тем более на C#. До этого изучал с++ в институте, а сейчас возникла такая необходимость все это...

5
1 / 1 / 1
Регистрация: 17.10.2014
Сообщений: 153
27.03.2016, 19:54
я работаю с многопоточностью через крон.

Работает в 4 потока, приходит в php файлик какой-то номер от 0 до 3
PHP
1
2
$thread_count = 4;
$thread_number = $_GET["arg1"];
Затем из базы достаются id записи:
SQL
1
SELECT id,url FROM lst_parsing_str WHERE otmetka = FALSE AND id % :thread_count = :thread_number ORDER BY id LIMIT 1
Думаю, что всё понятно)
0
0 / 0 / 2
Регистрация: 19.07.2015
Сообщений: 43
27.03.2016, 20:53  [ТС]
мне это не подходит мне нужно что то типа curl
0
wq
85 / 78 / 32
Регистрация: 26.11.2015
Сообщений: 481
27.03.2016, 21:11
Цитата Сообщение от ViberSon Посмотреть сообщение
просто в будующем он должен будет парсить около 10к страниц а это очень долго
а с чего вы взяли что многопоточность ускорит работу? Под ваши нужды будет выделено несколько процессоров и 100% их времени? Тогда конечно да..
0
0 / 0 / 2
Регистрация: 19.07.2015
Сообщений: 43
27.03.2016, 22:22  [ТС]
ну я буду запускать на своем компъютере скрипт
0
wq
85 / 78 / 32
Регистрация: 26.11.2015
Сообщений: 481
27.03.2016, 23:10
Цитата Сообщение от ViberSon Посмотреть сообщение
ну я буду запускать на своем компъютере скрипт
ну и что. сколько у вас процессоров? а сколько из них будет использовать пых? даже если получится организовать реальную многопоточность, разные потоки будут драться за один порт... пока тут рассуждения разные - уже бы одним потоком все спарсили
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
27.03.2016, 23:10
Помогаю со студенческими работами здесь

нужен совет по парсеру jsoup и запросам к гуглу
Доброго времени суток! вопрос таков, не буду вдаваться в подробности как передо мной встала данная задача, но суть в следующем... ...

Как подсунуть парсеру для разбора строку вместо файла?
Я пытался сделать это так: try { XMLReader parser =...

О многопоточности
Интересно, стало, а сколько всего потоков я могу открыть в своем проекте, существуют ли какие нибудь ограничения? и от чего зависит...

по многопоточности
У меня есть анимация переходов... я её применил на боди и футер так сказать.. как сделать чтобы этот код выполнялся синхронно? public...

Создание многопоточности
Всем привет. Ребят, столкнулся с проблемой при создании многопоточности. Программа компилируется, вроде работает, но на потоки не отвечает,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes. А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru