0 / 0 / 0
Регистрация: 03.08.2015
Сообщений: 8
|
|
1 | |
WYSIWYG-конструктор парсеров — оцените и покритикуйте идею03.08.2015, 19:57. Показов 621. Ответов 5
Метки нет (Все метки)
Здравствуйте!
Мы работаем над интересным проектом. Общая идея продукта — создать возможность человеку, не знакомому с техническими аспектами парсинга (web-scrapping, data mining), автоматизированно собирать разнородную информацию, пост-обрабатывать, агрегировать и использовать в своих целях, как то создание различного рода ресурсов, сбор и анализ статистики, наполнение готовых ресурсов. В работе с Пользователем крайне важно минимально беспокоить его чрезмерным получением от него данных и максимально использовать уже предоставленные им данные. Сейчас находимся на этапе постановки задачи, разработки ТЗ и поиска сотрудников для начальных этапов. Полная версия текущего ТЗ — https://docs.google.com/docume... ZzSyI/edit Будем рады любой критике и обсуждению, а также людям, у которых был необходимый для проекта опыт.
0
|
03.08.2015, 19:57 | |
Ответы с готовыми решениями:
5
Оцените идею холиварки Покритикуйте идею про питание для дивайса.. Оцените и покритикуйте конфигурацию! Оцените/покритикуйте сборку компьютера. |
0 / 0 / 0
Регистрация: 03.08.2015
Сообщений: 8
|
|
05.08.2015, 17:09 [ТС] | 3 |
chizz, в подробном ТЗ упомянуто, что на первом этапе проекта хотелось бы просто сделать качественное решение, которое сможет обходить любой сайт и парсить DOM-дерево, типизируя страницы, получая только необходимые данные и структурировать данные. Как результат пользователь либо просто получает данные, либо API, для доступа к актуальным данным, либо сайт, который привязан через API к получаемым данным, и отображает их.
0
|
05.08.2015, 17:14 | 4 |
scratching, но нам надо будет сначала самим построить эту модель? Или я скормлю адрес сайта вашему приложению, он построит дерево и предложит мне варианты, что я оттуда и в каком виде смогу забрать?
И все-таки хотелось бы видеть пример на каком-либо сайте. Вот например с сайта top.rbc.ru я смогу с помощью вашего приложения скопировать все заголовки и ссылки и вывести их в нужном формате? И что мне для этого нужно будет сделать?
0
|
0 / 0 / 0
Регистрация: 03.08.2015
Сообщений: 8
|
|
05.08.2015, 17:26 [ТС] | 5 |
Не совсем, вы сможете достраивать эту модель в процессе обучение системы работе с сайтом. Если для сайта уже готовы парсеры, можете позаимствовать модель или её часть из них.
Вы будете строить пути до всех данных, показывая все страницы (типизируя их при помощи какого-то критерия, например, особый вид URL, наличие какого-то элемента DOM-дерева на странице) и переходы системе, на каждой странице вы будете типизировать её, страница будет обрабатываться парсером в зависимости от типа. Получение данных со страницы будет WYSIWYG, то есть вы будете как в Object Inspector выделять элемент страницы, система будет подбирать jQuery-селектор, которым такие элементы можно доставать с любой такой страницы и способ пост-обработать данные.
0
|
05.08.2015, 17:29 | 6 |
scratching, звучит очень даже заманчиво.
Буду следить за ходом вашей разработки с интересом
1
|
05.08.2015, 17:29 | |
05.08.2015, 17:29 | |
Помогаю со студенческими работами здесь
6
Покритикуйте,оцените,дайте советы Посмотрите сборку, оцените, покритикуйте, подскажите Оцените и покритикуйте конфигурацию для игрового компьютера. Оцените и покритикуйте конфигурацию для игрового компьютера. Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |