Форум программистов, компьютерный форум, киберфорум
Проекты
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 03.08.2015
Сообщений: 8
1

WYSIWYG-конструктор парсеров — оцените и покритикуйте идею

03.08.2015, 19:57. Показов 621. Ответов 5
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Здравствуйте!

Мы работаем над интересным проектом. Общая идея продукта — создать возможность человеку, не знакомому с техническими аспектами парсинга (web-scrapping, data mining), автоматизированно собирать разнородную информацию, пост-обрабатывать, агрегировать и использовать в своих целях, как то создание различного рода ресурсов, сбор и анализ статистики, наполнение готовых ресурсов. В работе с Пользователем крайне важно минимально беспокоить его чрезмерным получением от него данных и максимально использовать уже предоставленные им данные.

Сейчас находимся на этапе постановки задачи, разработки ТЗ и поиска сотрудников для начальных этапов. Полная версия текущего ТЗ — https://docs.google.com/docume... ZzSyI/edit
Будем рады любой критике и обсуждению, а также людям, у которых был необходимый для проекта опыт.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
03.08.2015, 19:57
Ответы с готовыми решениями:

Оцените идею холиварки
Идея следующая: Есть сервис, к нему есть расширение к браузеру. Юзер заходит на любой...

Покритикуйте идею про питание для дивайса..
Увидел картинки и видео такой вот лампы и резко захотел такое-же (детский рефлекс "мама купи и мне...

Оцените и покритикуйте конфигурацию!
Компьютер собирается для следующих целей: - современные игры - работа с Adobe Photoshop - работа...

Оцените/покритикуйте сборку компьютера.
http://www.citilink.ru/configurator/q1482463 ^^^ Вот ссылка на конфигурацию....

5
993 / 521 / 102
Регистрация: 19.03.2013
Сообщений: 3,114
Записей в блоге: 19
05.08.2015, 17:03 2
А можно пару конкретных примеров того, что можно будет сделать с помощью вашего продукта? А то по описанию это мега-универсальный комбайн-конструктор.
0
0 / 0 / 0
Регистрация: 03.08.2015
Сообщений: 8
05.08.2015, 17:09  [ТС] 3
chizz, в подробном ТЗ упомянуто, что на первом этапе проекта хотелось бы просто сделать качественное решение, которое сможет обходить любой сайт и парсить DOM-дерево, типизируя страницы, получая только необходимые данные и структурировать данные. Как результат пользователь либо просто получает данные, либо API, для доступа к актуальным данным, либо сайт, который привязан через API к получаемым данным, и отображает их.
0
993 / 521 / 102
Регистрация: 19.03.2013
Сообщений: 3,114
Записей в блоге: 19
05.08.2015, 17:14 4
scratching, но нам надо будет сначала самим построить эту модель? Или я скормлю адрес сайта вашему приложению, он построит дерево и предложит мне варианты, что я оттуда и в каком виде смогу забрать?

И все-таки хотелось бы видеть пример на каком-либо сайте.
Вот например с сайта top.rbc.ru я смогу с помощью вашего приложения скопировать все заголовки и ссылки и вывести их в нужном формате? И что мне для этого нужно будет сделать?
0
0 / 0 / 0
Регистрация: 03.08.2015
Сообщений: 8
05.08.2015, 17:26  [ТС] 5
Цитата Сообщение от chizz Посмотреть сообщение
scratching, но нам надо будет сначала самим построить эту модель?
Не совсем, вы сможете достраивать эту модель в процессе обучение системы работе с сайтом. Если для сайта уже готовы парсеры, можете позаимствовать модель или её часть из них.

Цитата Сообщение от chizz Посмотреть сообщение
Вот например с сайта top.rbc.ru я смогу с помощью вашего приложения скопировать все заголовки и ссылки и вывести их в нужном формате? И что мне для этого нужно будет сделать?
Вы будете строить пути до всех данных, показывая все страницы (типизируя их при помощи какого-то критерия, например, особый вид URL, наличие какого-то элемента DOM-дерева на странице) и переходы системе, на каждой странице вы будете типизировать её, страница будет обрабатываться парсером в зависимости от типа. Получение данных со страницы будет WYSIWYG, то есть вы будете как в Object Inspector выделять элемент страницы, система будет подбирать jQuery-селектор, которым такие элементы можно доставать с любой такой страницы и способ пост-обработать данные.
0
993 / 521 / 102
Регистрация: 19.03.2013
Сообщений: 3,114
Записей в блоге: 19
05.08.2015, 17:29 6
scratching, звучит очень даже заманчиво.
Буду следить за ходом вашей разработки с интересом
1
05.08.2015, 17:29
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
05.08.2015, 17:29
Помогаю со студенческими работами здесь

Покритикуйте,оцените,дайте советы
Имеется домен http://liozenda.ru ,пытаюсь его "довести" до выполнения 50.1% ,чтобы получить зачет....

Посмотрите сборку, оцените, покритикуйте, подскажите
Процессор - Intel Core i5-8400 2.8GHz/8GT/s/9MB Мать - MSI B360M Pro-VH Оперативка - х1 -Kingston...

Оцените и покритикуйте конфигурацию для игрового компьютера.
Прошу к вашему вниманию системник : Intel s775 Core-2 Duo E8400 tray Cooler for CPU s775 Titan...

Оцените и покритикуйте конфигурацию для игрового компьютера.
Материнская плата: ASRock 970 Extreme4...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru