С Новым годом! Форум программистов, компьютерный форум, киберфорум
Java
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
0 / 0 / 0
Регистрация: 18.11.2016
Сообщений: 4

Разбор xml

24.04.2017, 16:06. Показов 849. Ответов 1

Студворк — интернет-сервис помощи студентам
Здравствуйте. Мне нужно создать приложение, которое будет искать заданные фразы в xml документах. Поиск осуществляю с помощью Lucene, разбор xml - sax парсером.
Как так бы сделать, чтобы переменные f_name и p_body вытащить из метода characters обработчика handler для того, чтобы дальше использовать в методe getDocument подскажите пожалуйста?

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
public class Indexer 
{                
       public Indexer(String indexDirectoryPath)
           {           
             Directory indexDirectory = FSDirectory.open(new File(indexDirectoryPath));
             writer = new IndexWriter(indexDirectory, new StandardAnalyzer(Version.LUCENE_36), true, IndexWriter.MaxFieldLength.UNLIMITED);
                 try 
                 {
                      SAXParserFactory factory = SAXParserFactory.newInstance();
                      SAXParser saxParser = factory.newSAXParser();                   
                      saxParser.parse("aaa.xml", handler);
                 } 
                 catch (Exception e) 
                 {
                      e.printStackTrace();
                 }
           } 
           private Document getDocument(File file) throws IOException
           {
            Document document = new Document(); 
            Field contentField = new Field(LuceneConstants.CONTENTS, p_body);
            Field nameField = new Field(LuceneConstants.FILE_NAME, f_name, Field.Store.YES, Field.Index.NOT_ANALYZED);
                
            document.add(contentField);
            document.add(fileNameField);
 
            return document;
        }   
 
        private void indexFile(File file)
            {           
             Document document = getDocument(file);
             writer.addDocument(document);
        }
               
            DefaultHandler handler = new DefaultHandler() 
            {
                boolean flag_first_name = false;   
                boolean flag_p = false;
 
                public String f_name;
                public String p_body;
                                
 
               @Override
               public void startElement(String uri, String localName,String qName,Attributes attributes) throws SAXException 
               {
                    if (qName.equalsIgnoreCase("first-name")) 
                    {
                            flag_first_name = true;
                    }
                    if (qName.equalsIgnoreCase("p")) 
                    {
                            flag_p = true;
                    }
               }
               @Override
               public void characters(char ch[], int start, int length) throws SAXException 
               {
                       if (flag_first_name) 
                      {    
                              this.f_name = new String(ch, start, length);
                              System.out.println(f_name);                                   
                              flag_first_name = false;
                       }
                       if (flag_p) 
                       {
                                 this.p_body = new String(ch, start, length);
                                 System.out.println(p_body);
                                 flag_p = false;
                       }
                  }
             };   
}
Добавлено через 1 час 1 минуту
Нашла что-то похожее на то что нужно , но опять возникает вопрос как из списка вытащить каждый элемент в отдельную строку?

Добавлено через 13 минут
Попробовала создать список, но не получается правильно написать обращение к нему.

Все с разбором положила в отдельный класс.

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
public class SAXHandler extends DefaultHandler
{
        private ArrayList<String> mass;
        private boolean flag_first_name = false;   
        private boolean flag_last_name = false;
        private boolean flag_book_title = false;
        private boolean flag_p = false;
 
        public String[] getUsers()
        {
          return mass.toArray(new String[mass.size()]);
        }
        
        @Override
        public void startDocument() throws SAXException
        {
          mass = new ArrayList<String>();
        }
        
        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException
        {
          flag_first_name = "first-name".equals(qName);
          flag_p = "p".equals(qName);
        }
        @Override
        public void characters(char[] ch, int start, int length) throws SAXException
        {
          if(flag_first_name)
            mass.add(0, new String(ch, start, length));
          if(flag_p)
            mass.add(1, new String(ch, start, length));
        }
        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException
        {
          flag_first_name = false;   
          flag_p = false;
        }
        @Override
        public void endDocument() throws SAXException
        {
            
        }
}
Инициализация класса:
Java
1
2
3
4
5
6
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
SAXHandler handler = new SAXHandler();
parser.parse(new File("aaa.xml"), handler);
for(String str : handler.getUsers())
    System.out.println(str);
Cкажите как правильно заменить эту строчку return mass.toArray(new String[mass.size()]); , чтобы я могла обратиться к конкретному элементу списка по его номеру? Вот что-то типо того должно быть return mass.get(0);?!
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
24.04.2017, 16:06
Ответы с готовыми решениями:

Запись XML-дерева сразу в xml-файл (парсер JAXP)
Народ!Программеры!Помогите человеку,плиз! Парсерю я xml-файл,через DOM-модель,использую JAXP.После модификации надо все дерево записать в...

Java - XML: упаковать файл в xml
расскажите - каким образом можно создать xml документ с упакованным бианрным файлом внутри ? P.S. такое в принципе-то возможно ?

Парсинг XML не идёт разбор документа
Собственно есть код, который с малыми изменениями пользую давно. Сейчас чего-то не хочет читать XML-ку: public List&lt;URLxmlList&gt;...

1
 Аватар для Gr1f0nn
244 / 164 / 133
Регистрация: 30.09.2012
Сообщений: 690
24.04.2017, 16:39
Java
1
 private ArrayList<String> mass;
Java
1
2
3
4
 public String[] getUsers()
        {
          return mass.toArray(new String[mass.size()]);
        }
Зачем вы пытаетесь вернуть новый массив строк, если у вас уже есть список с этими строками, к которому вы можете обращаться именно так:
Цитата Сообщение от Yulia_plic Посмотреть сообщение
Вот что-то типо того должно быть return mass.get(0);?!
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
24.04.2017, 16:39
Помогаю со студенческими работами здесь

Разбор xml. Получить элемент по значению аттрибута
Доброго времени суток. есть строка, представляющая из себя фрагмент xml файла String xml = { &quot;&lt;?xml...

Java class вместо xml - persistence.xml
Приветствую уважаемые форумчане. Не совсем я силен ещё, поэтому и пришёл сюда чтобы спросить. Создал я persistence.xml. Всё хорошо,...

IOException parsing XML document from class path resource [src/resources/app-context.xml]; nested exception is
public class HelloWorldSpringDI { public static void main(String args) { ApplicationContext ctx = new...

Сохранение xml данных в xml-файл
Прошу помощи: Есть переменная json, которую необходимо перевести в xml, а затем сохранить на сервере в виде файла xml. Переменная...

Разбор XML
Доброго времени суток. Ребята подскажите как получить значение в этой части XML &lt;Direction Number=&quot;1&quot;&gt; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и источниками (напряжения, ЭДС и тока). Найти токи и напряжения во всех элементах. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru