Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.82/11: Рейтинг темы: голосов - 11, средняя оценка - 4.82
 Аватар для awp-sirius
64 / 63 / 43
Регистрация: 01.05.2012
Сообщений: 535
.NET 4.x

Парсинг таблицы с сайта

29.08.2014, 12:14. Показов 2103. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день. Для парсинга использую библиотеку xNet
Но наткнулся на сайтик.. там используется вот такая вот чудовщина:
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
<td><span><style>
.z8gF{display:none}
.Y1nV{display:inline}
.lv-s{display:none}
.fOUx{display:inline}
.E87V{display:none}
.TEli{display:inline}
</style><div style="display:none">12</div><span style="display:none">27</span><span class="E87V">27</span><span></span><span style="display:none">40</span><span></span><span style="display:none">59</span>
<span class="E87V">59</span><div style="display:none">59</div>118<span class="E87V">176</span><div style="display:none">176</div><span class="z8gF">227</span><div style="display:none">227</div>
<span style="display:none">228</span><div style="display:none">228</div><span style="display:none">229</span><span style="display:none">241</span><span class="lv-s">241</span><span></span><span class="fOUx">.</span>
<span style="display:none">25</span><span class="E87V">25</span><span></span><span class="TEli">97</span><span class="lv-s">109</span><span style="display:none">129</span><span class="z8gF">129</span>
<span></span><span></span><div style="display:none">211</div><span style="display:none">251</span>
<span class="169">.</span>131<span style="display: inline">.</span><span style="display:none">85</span><span class="E87V">85</span><div style="display:none">85</div>
<span class="z8gF">153</span><div style="display:none">153</div><span class="TEli">211</span></span></td>
Есть таблица, и для каждой ячейки свой стиль. Некоторые: .fOUx{display:inline} - тоесть показываются, некоторые .E87V{display:none} - они не показываются и не нужны. Прописывать какой-то алгоритмом уж слишком думаю сложно.

В общем можно ли загрузить страницу сайта в текстовом виде? Без тегов.
Ну будто зайти на сайт, нажать Ctrl+A, Ctrl+C, вставить куда нужно и уже потом разбираться.
Или желательно даже выделить что-то конкретное. Типо от первого <td> До последнего </td>
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
29.08.2014, 12:14
Ответы с готовыми решениями:

Парсинг таблицы на странице сайта
Нужно спарсить данные html-таблицы (названия и данные в ячейках таблицы).

Парсинг таблицы с сайта в Unity3D для наложения на триггер
Здравствуйте, требуется спарсить таблицу с сайта (1 фотография) в unity, чтобы эта таблица стала объектом который можно будет наложить на...

[Py2.7] Парсинг сайта с экспортом конкретной таблицы в Excel-файл
Здравствуйте. В университете мне дали 2 задания по парсингу: сайта и документа Word. Про парсинг сайта на Python я смотрела видео на...

3
871 / 721 / 304
Регистрация: 15.04.2013
Сообщений: 2,047
Записей в блоге: 5
29.08.2014, 22:30
awp-sirius,
Внесите имя css класса со значением виден/скрыт в словарь, и парсите html, проверяйте встречающийся span по классу, если виден то заносим в строку.
0
 Аватар для awp-sirius
64 / 63 / 43
Регистрация: 01.05.2012
Сообщений: 535
29.08.2014, 22:33  [ТС]
XRoy, там большая таблица, стиль свой для каждой строки, разный.
Кое-где вообще не используется div или span
0
871 / 721 / 304
Регистрация: 15.04.2013
Сообщений: 2,047
Записей в блоге: 5
29.08.2014, 22:40
awp-sirius,
Если нет блока, то скорее всего видим текст
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
29.08.2014, 22:40
Помогаю со студенческими работами здесь

Парсинг данных с сайта или страницы сайта
Здравствуйте, добрые люди! Есть задача спарсить данные с страницы соц сети. Или просто со страницы с помощью js. На пхп не предлагать....

Парсинг сайта
Доброго времени суток! Пытаюсь парсить html страницу, но столкнулся с проблемой: разметка, которую я могу посмотреть в инструментах...

Парсинг с сайта
Здравствуйте. Не могу понять, как правильно спарсить: название, картинку,описание и версию. Буду благодарен за любую помощь. ...

Парсинг сайта
Здравствуйте, мне нужно справить комментарии с Инстаграм и Вконтате, но никак не получается - они не сначала всю статику отдают а потом...

Парсинг сайта
Добрый день. Возникла проблема с написанием рекурсивного парсинга страниц сайта. Суть такова, написан код, который парсит только...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru