Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/11: Рейтинг темы: голосов - 11, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 09.11.2013
Сообщений: 5

Парсер

25.10.2014, 01:41. Показов 2045. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток форумчане!
Хочу написать парсер (я великий велосипедист). Язык реализации С++ или Java. Парсер нужен для того чтобы заполнить базу данных. Есть задание создать базу данных из 40к+ (наименований) строк (со смыслом), а вручную 40к строк, уж извините слишком( Так вот, сайт думаю взять кинопоиск, например, и база данных будет по фильмам.
Я представляю себе парсер только в теории. Сколько не искал статей, везде написано, мол используйте уже готовое. В общем вопросы такие:
1. На каком языке писать (библиотеки скорее всего уже есть)?
2. Как систематизировать информацию (сразу в бд лить или сначала может быть в файлик)?
3. Как вообще пишется парсер HTML страниц? Как выбирать именно то что нужно и отсеивать ненужное?
Все желательно с примерами.
p.s. буду благодарен дельным советам и с радостью отблагодарю бонусами на пивасик/вкусняшки
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
25.10.2014, 01:41
Ответы с готовыми решениями:

Найти определенную последовательность битов в файле
Здраствуйте! Есть видео файл. Я хочу найти в нем определенную структуру. Для этого мне нужно найти определенную последовательность...

Парсер
Здравствуйте, уважаемые программисты! в книге нашла код анализатора выражений, но не получается его скомпилировать. Не могу понять...

Как лучше написать парсер
Возник вопрос как лучше написать парсер. Интересно просто услышать советы. Грамматика примерно такова. /* Grammar * * Expr...

1
 Аватар для MastAKK
148 / 139 / 18
Регистрация: 13.10.2012
Сообщений: 592
25.10.2014, 01:49
1) На каком удобно - на таком и писать. Библиотеки для работы с сетью и бд есть практически на все современные широкоиспользуемые ЯПы.
2) Я бы в бд лил построчно, но тут надо спросить более опытных в этих делах людей.
3) У многих сайтов есть API, с которым можно вполне удобно работать без каких-либо велосипедов в виде парсинга HTML. Стоит поискать такие.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
25.10.2014, 01:49
Помогаю со студенческими работами здесь

Парсер
Помогите пожалуйста сделать примитивный парсер для какого-нибудь языка. Хотя бы опишите как он должен работать. А ещё в нём оперативка...

Преобразование типа char -> char *
Добрый день, у меня возникла вот такая вот проблема... При работе парсера, он разделяет строки как и задуманно, но появляются...

Парсер с нуля
Здравствуйте. Понимаю что тема наверняка не новая, хочу написать парсер (сайта) с нуля c++ это будет мой первый опыт) подскажите где...

Наипростейший парсер
Никак не могу вникнуть в простейшй парсер математического выражения. Мне нужно просто просчитать пример, в котором только + и - и ...

Парсер паскаля
Добрый день. Задача такая: нужно на С++ написать парсер паскаля, так чтоб тот по коду мог вызывать нужные функции отрисовки блок-схемы.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru