С Новым годом! Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.76/29: Рейтинг темы: голосов - 29, средняя оценка - 4.76
5 / 5 / 1
Регистрация: 31.10.2015
Сообщений: 274

Парсер с Авито

06.03.2018, 13:11. Показов 5702. Ответов 1

Студворк — интернет-сервис помощи студентам
Пробую писать парсер с авито(вакансии) своего города. Набросал такой код используя библиотеку
PHP Simple HTML DOM Parser.

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
<?php
include 'parsing.php';
 
function parser(){
    $site='https://www.avito.ru';
    $page=("https://www.avito.ru/permskiy_kray_gornozavodsk/vakansii");
$html=new simple_html_dom();
$html->load_file($page);
 
        foreach($html->find('img[class=photo-count-show]') as $img) 
        $image[]= $img->src;
       
        foreach($html->find('h3[class=title item-description-title]') as $title)
        $zagol[]= $title->plaintext;
      
        foreach($html->find('div.about') as $zarplata)
        $cash[]= $zarplata->plaintext;
             
        foreach($html->find('a[class=item-description-title-link]') as $link)
        $links[]= $link->href;
 
 
        ?>
        
        <?php for ($x=0;$x<count($image);) {?>
<div style="float:left;clear:both;width:600px;font:10pt tahoma;margin-top:2%;" id="MainBlockVacansy">
<div style="float:left;background-size:contain;width:150px;height:150px;background-image:url('<?=$image[$x]?>');"></div>
<div style="float: left;margin:8px;"><h3><?=$zagol[$x]?></h3></div>
<div style="float: left;margin-left:40%;">Зарплата <?=$cash[$x]?></div>
</div>
<?php $x++;}
     
 }?>
А как ссылки спарсеные пройти, чтоб адреса достать? Пока не знаю....
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
06.03.2018, 13:11
Ответы с готовыми решениями:

Отобразить объявления авито/хеадхантер на сайте
Всем доброго времени суток. 1. Как сделать данную функцию на сайте? Нужно отображать все объявления с авито или хеадхантера по какому...

Где искать неопубликованные объявления Авито
Здравствуйте! Где или как искать неопубликованные (объявление которое пользователь добавил на сайт, но оно еще не прошло модерацию)...

Создание формы отправки объявления на сайт. (пример автору, авито.ру)
Привет всем нуждаюсь в некой помощи &quot;прошаренных&quot; людей. Сделал некий макет сайта для объявлений. Я так как я первый раз этим решил...

1
ytf
276 / 259 / 185
Регистрация: 15.08.2017
Сообщений: 1,483
09.03.2018, 15:32
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<?php
$site='https://www.avito.ru';
$page=file_get_contents("https://www.avito.ru/permskiy_kray_gornozavodsk/vakansii");
preg_match_all("/\<div\ class\=\"item\ item\_table.*href\=\"(.*)\".*\<img\ src\=\"(.*)\".*alt\=\"(.*)\".*\<div\ class\=\"about\ \"\>(.*)\<\/div\>/ismU", $page, $tiu);
 
for ($x=0;$x<count($tiu[0]);$x++) {
?>
<div style="float:left;clear:both;width:600px;font:10pt tahoma;margin-top:2%;" id="MainBlockVacansy">
<div style="float:left;background-size:contain;width:150px;height:150px;background-image:url('<?=$tiu[2][$x]?>');"></div>
<div style="float: left;margin:8px;"><h3><?=$tiu[3][$x]?></h3></div>
<div style="float: left;margin-left:40%;">Зарплата <?=$tiu[4][$x]?></div>
<a href="<?=$site.$tiu[1][$x]?>"><?=$tiu[1][$x]?></a>
</div>
<?php
}
?>
Добавлено через 8 минут
мне выдало ошибку о несуществовании класса simple_html_dom, поэтому я просто использовал file_get_contents
полученную страницу я распарсил функцией preg_match_all, там в общем всё просто - открываешь исходный код в браузере, прикидываешь, какой блок повторяется также часто, как объявления и заносишь его в код
PHP
1
preg_match_all("/шаблон/ismU", $страница_текста, $новая_переменная_в_которую_будут_заноситься_значения);
шаблон представляет собой текстовые строки, в которых все символы "экранированы", кроме букв латинского алфавита и цифр, если участок между цифрами надо ловить, в этом месте ставится
Code
1
(.*)
а если не надо ловить
Code
1
.*
экранирование - процесс добавления наклонной черты перед каждым символом (точкой, пробелом, и т.д.)
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
09.03.2018, 15:32
Помогаю со студенческими работами здесь

Нужен парсер Авито
Всем привет. Необходимо максимально быстро получать номера с авито по конкретной категории. Подскажите как это можно сделать? ...

За сколько запросов авито банит парсер
Всем привет. За сколько запросов авито может забанить парсер? Планируется примерно 500 запросов в день. Не за один раз конечно.

Баннер в авито
Все привет. Как приблизительно можно реализовать такой баннер в авито del

Parsing Авито
Нужно запарсить Авито и вывести следующие вещи: ссылку на сам товар,город,цена,заголовок. var parser = new HtmlParser(); ...

Выбор из авито
День добрый. Ищу ПК, пока думаю смотреть на авито. Для 1)Игр (pubg например) 2)Работа (Android Studio, поэтому только intel) ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru