Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/3: Рейтинг темы: голосов - 3, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 16.04.2016
Сообщений: 3

Проблемы с парсингом русского текста

07.02.2019, 16:49. Показов 744. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Задача состояла в том чтобы распарсить таблицу на сайте. Он работает корректно если парсить таблицу с числами( при этом заменить [а-я] на [0-9]), а вот с русским текстом не получается. В чем проблема
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
private string stolb1()// первый столбец
        {
            string stone = "";
            System.Net.WebClient wc = new System.Net.WebClient();
            String Response = wc.DownloadString("http://www.gks.ru/news/statcalendar/2009-4/PDF/01-Jun.htm");
 
            Regex Rate = new Regex(@"><SPAN LANG=""RU""><P ALIGN=""CENTER"">([а-я]+)</B></FONT></SPAN>");
            MatchCollection matches = Rate.Matches(Response);
            foreach (Match mat in matches)
            {
 
                stone = stone +" "+ mat.Groups[1].Value;
            }
 
            return stone;
                }
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
07.02.2019, 16:49
Ответы с готовыми решениями:

Проблемы с парсингом BeautifulSoup
Здравствуйте, столкнулся с проблемой. Есть кусок сайта: &lt;ul class=&quot;download_ul&quot;&gt; &lt;li&gt; &lt;a href=&quot;ссылка 1&quot;...

Проблемы с парсингом XML в апплете.
Следующий участок кода: SAXParser parser = SAXParserFactory.newInstance().newSAXParser(); parser.parse('XML - текст', new...

Проблемы с парсингом float из XML
Всех приветствую Делаю систему сохранения для своей игры Использую XML файл, в нем сохраняется положение объекта Но по какой-то...

1
3566 / 2507 / 1174
Регистрация: 14.08.2016
Сообщений: 8,219
07.02.2019, 20:50
в паттерне только маленькие буквы(еще и без ё). там точно не будет ни пробелов, ни тире, ни прочих знаков препинания?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
07.02.2019, 20:50
Помогаю со студенческими работами здесь

Помогите с парсингом текста
Привет коллеги. Столкнулся с интересной задачей парсинга текста из базы данных. Вот полный текст записи(переносы сохранены - в sql файле...

Небольшие сложности с парсингом текста
Такая вот задача, хочу спарсить информацию с сайта. Код исходниа. &lt;dd&gt; &lt;span...

Проблемы с кодировкой русского шрифта
Добрый день. Не могу разобраться с переносом данных из внешнего файла в программу на русском языке. Возникают проблемы с кодировкой. ...

Распознование русского текста
Всем привет. Пишу диплом - требуется обработка фотографий чеков (кириллица). Использовал tesseract с подключением модуля для русской...

обработка русского текста
приветствую, можете помочь с таким заданием? ничего в голову не приходит=\ Найти в тексте слова, в которые входят не менее пяти из...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru