Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/21: Рейтинг темы: голосов - 21, средняя оценка - 4.95
0 / 0 / 0
Регистрация: 22.11.2013
Сообщений: 2

Как разделить реестр запрещенных сайтов на списки url и ip?

22.11.2013, 10:42. Показов 4173. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Товарищи очень нужна помощь.
Суть проблемы: Работаем с реестром запрещенных сайтов, до недавнего времени все хорошо работало, но недели две назад скрипт перестал работать. Админ который все это дело настраивал уволился, а я до этого фри и линукс видел только на картинках...про питон только слышал). Пока в поисках нового админа, но за реестр нам уже угрожают штрафами.
Вообщем все это дело работает с помощью скрипта на питоне взятого отсюда https://github.com/yegorov-p/python-zapret-info.
И было автоматизировано с помощью вот этого скрипта на баше.
Кликните здесь для просмотра всего текста
Bash
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#!/bin/sh
while true
do
        (
        /root/zapretinfo/zapret_checker.py &&
                echo `date` - python : checker completed >> /var/log/zapret.log &&
        sed -f /root/zapretinfo/sed.txt url > /usr/local/rejik/banlists/blockedurl/urls &&
                echo `date` - sed    : urls refreshed >> /var/log/zapret.log &&
        squid -k reconfigure &&
                echo `date` - squid  : reconfigure... OK >> /var/log/zapret.log &&
        awk '! a[$0]++' /root/zapretinfo/ip > /root/zapretinfo/ip.txt &&
        rm -f /root/zapretinfo/ip &&
        sed -i "" -e "s/^/table 5 add /g" /root/zapretinfo/ip.txt &&
                echo `date` - sed    : table 5 add ip... >> /var/log/zapret.log &&
        scp -P33 /root/zapretinfo/ip.txt root@10.10.0.13:~/ &&
                echo `date` - scp    : table 5 send on NAS3 >> /var/log/zapret.log &&
        scp -P33 /root/zapretinfo/ip.txt root@10.10.0.14:~/ &&
                echo `date` - scp    : table 5 send on NAS1 >> /var/log/zapret.log &&
#       rm -f /root/zapretinfo/ip.txt
#       rm -f /root/zapretinfo/url
#       rm -f /root/zapretinfo/resuzlt.zip
        sleep 10800 &&
                echo ' ' >> /var/log/zapret.log
        )
done

Проблема в том что в исходном варианте скрипт на питоне только скачивает файл. Со слов админа он дописывал пару строк в скрипт на питоне, чтоб скачанный файл распарсивался в два файла ip и url. А эти файлы уже попадали бы в squid и iptables с помощью скрипта на bash.
Что надо дописать в оригинальный скрипт?. С питоном вообще не знаком помогайте.
Во вложении пример файла который необходимо парсить.
Вложения
Тип файла: rar dump.rar (14.7 Кб, 26 просмотров)
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
22.11.2013, 10:42
Ответы с готовыми решениями:

Реестр запрещенных сайтов и провайдер ТКТ (Петербург)
Значится, сейчас звонил в колцентр своего провайдера. Говорю - так и так, вы блокируете http://www.codeskulptor.org/ Очень...

Отображение изображений с запрещенных сайтов
У меня есть сайт находящийся на хосте в германии к примеру, я вывожу некоторые изображения там которые хранятся в вк, как известно в...

Список запрещенных сайтов прокуратурой\роскомнадзором
Здравствуйте форумчане. Ищу список запрещенных сайтов прокуратурой или роскомнадзором для создания правила фильтрации. У нас не большая гос...

3
22.11.2013, 13:09

Не по теме:

Цитата Сообщение от Sneg76 Посмотреть сообщение
А эти файлы уже попадали бы в squid и iptables с помощью скрипта на bash.
Призываю всех не помогать этому человеку.

0
0 / 0 / 0
Регистрация: 22.11.2013
Сообщений: 2
23.11.2013, 02:19  [ТС]
dondublon,Написал же по-чесному: "а я до этого фри и линукс видел только на картинках...про питон только слышал".

Добавлено через 10 часов 24 минуты
Всем спасибо, хотя за что).
Может кому пригодится
Python
1
2
3
4
5
6
7
8
9
xmldoc = minidom.parse('dump.xml')
                itemlist = xmldoc.getElementsByTagName('content')
 
                fileUrls = open('url', "w")
                fileIps = open('ip', "w")
 
                for c in itemlist :
                    fileUrls.write(c.getElementsByTagName('url')[0].childNodes[0].data.encode('utf-8') + '\n')
                    fileIps.write(c.getElementsByTagName('ip')[0].childNodes[0].data.encode('utf-8') + '\n')
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
23.11.2013, 18:51
Цитата Сообщение от Sneg76 Посмотреть сообщение
Python
1
xmldoc = minidom.parse('dump.xml')
непонятно, причём там xml
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
23.11.2013, 18:51
Помогаю со студенческими работами здесь

Истинная цель реестра запрещенных сайтов
Доброе время суток. Сейчас немало пересудов, вокруг реестра запрещенных web-сайтов. Многие, предполагают назначение нового закона как...

Как разделить списки?
У меня есть программа, она работает, но сказали, что нужно разделить списки, а как это сделать я ума не приложу. Я так понимаю, у меня...

Пытаюсь сделать проверку сайтов через virus total и вывести списки надежных и не надежных сайтов
я новичок в python - прошу строго не судить. Пытаюсь сделать проверку сайтов через virus total и вывести списки надежных и не надежных...

Как спуститься на url уровнем ниже, или перейти из url одного приложения в url другого?
Допустим есть приложение cat и приложение dog. В корневом urls.py прописанно: from django.contrib import admin from django.urls...

Разделить url
Есть урл такого типа Можно ли сделать так, чтобы данный урл стал таким:


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru