Форум программистов, компьютерный форум, киберфорум
Наши страницы

Программирование Android

Войти
Регистрация
Восстановить пароль
 
 
Рейтинг: Рейтинг темы: голосов - 23, средняя оценка - 4.87
Kroshandowski
2 / 2 / 0
Регистрация: 05.04.2013
Сообщений: 234
#1

Парсинг элемента HTML страницы! - Программирование Android

12.12.2013, 23:18. Просмотров 3337. Ответов 21
Метки нет (Все метки)

Нужно спарсить погоду с главной страницы mail.ru
Если смотреть исходный код страницы,то видно где спрятано значение погоды:

Код
<span class="weather__temperature">[B]-7[/B]</span>
Код
<table class="informers informers_first" cellspacing="0"><tr><td class="informers__column informers__column_left"><a name="clb1283812" href="http://pogoda.mail.ru/" class="informers__title"><span class="informers__title__text">Погода</span></a><a class="weather clearfix" name="clb1283825" href="http://pogoda.mail.ru/prognoz/kazan/" title="снег"><span class="weather__image" style="background-image:url(//limg.imgsmail.ru/s/images/n/informers_x2/weather/1/nightsnow.png);"></span><span class="w-weather"><span class="weather__temperature">-7</span><span class="weather__forecast weather__forecast_near">,&nbsp;ночью -6</span></span><span class="w-weather"><span class="weather__forecast weather__forecast_tomorrow">завтра -2</span></span></a></td>
Так вот...нашел здесь на форуме пост про парсинг html страницы:

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
package pete.android.study;
 
import java.net.URL;
 
import org.htmlcleaner.CleanerProperties;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
 
import android.app.Activity;
import android.os.Bundle;
import android.widget.TextView;
 
public class HtmlCleanerStudyActivity extends Activity {
 
    // HTML page
    static final String BLOG_URL = "http://xjaphx.wordpress.com/";
    // XPath query
    static final String XPATH_STATS = "//div[@id='blog-stats']/ul/li";
 
    @Override
    public void onCreate(Bundle savedInstanceState) {
        // init view layout
        super.onCreate(savedInstanceState);
        setContentView(R.layout.main);
 
        // decide output
        String value = "";
        try {
            value = getBlogStats();
            ((TextView)findViewById(R.id.tv)).setText(value);
        } catch(Exception ex) {
            ((TextView)findViewById(R.id.tv)).setText("Error");
        }
    }
 
    /*
     * get blog statistics
     */
    public String getBlogStats() throws Exception {
        String stats = "";
 
        // config cleaner properties
        HtmlCleaner htmlCleaner = new HtmlCleaner();
        CleanerProperties props = htmlCleaner.getProperties();
        props.setAllowHtmlInsideAttributes(false);
        props.setAllowMultiWordAttributes(true);
        props.setRecognizeUnicodeChars(true);
        props.setOmitComments(true);
 
        // create URL object
        URL url = new URL(BLOG_URL);
        // get HTML page root node
        TagNode root = htmlCleaner.clean(url);
 
        // query XPath
        Object[] statsNode = root.evaluateXPath(XPATH_STATS);
        // process data if found any node
        if(statsNode.length > 0) {
            // I already know there's only one node, so pick index at 0.
            TagNode resultNode = (TagNode)statsNode[0];
            // get text data from HTML node
            stats = resultNode.getText().toString();
        }
 
        // return value
        return stats;
    }
}
Код работает...,но мне не понятна строка
Код
static final String XPATH_STATS = "//div[@id='blog-stats']/ul/li";
, а точнее этот кусок
Код
"//div[@id='blog-stats']/ul/li"
Вопрос...как правильно заполнить это место,основываясь на исходном коде mail.ru?

Заранее спасибо.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
12.12.2013, 23:18
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Парсинг элемента HTML страницы! (Программирование Android):

Парсинг HTML страницы - Программирование Android
Здравствуйте. Передо мной стоит задача выдрать данные из страницы, (время начала занятия, название предмета, аудиторию, имя преподавателя),...

Парсинг html страницы андроид - Программирование Android
Здравствуйте. Я новичок в программировании, так что не прошу судить строго. Вот завис на одном момента. Пишу приложение, в котором...

Парсинг html - Программирование Android
как парсить html таблицу?

jsoup, парсинг html - Программирование Android
А почему не работает такой простой код? Парсинг из инета пока не трогаем... Код: package com.example.projecta; import...

Парсинг HTML странцы - Программирование Android
Ув. форумчане, подскажите, пожалуйста. Я следую мануалу, но он, к сожалению, не корректно работает. Я создал layout файл и прописал туда...

Парсинг постов со страницы +Google - Программирование Android
Всем привет, есть задача, нужно чтобы приложение отслеживало новые посты на страницы гугл+ и заносило их в базу данных или просто в файл...

21
dajver
409 / 273 / 18
Регистрация: 18.09.2010
Сообщений: 1,112
16.12.2013, 00:04 #16
Цитата Сообщение от Kroshandowski Посмотреть сообщение
dajver, после какой строки вставлять этот кусок:
На примере вашей статьи?
Заранее спасибо.
Дак это ваш код, просто немного изменил внутренность самого ивента кнопки. Просто замените свой на этот.
0
Kroshandowski
2 / 2 / 0
Регистрация: 05.04.2013
Сообщений: 234
16.12.2013, 00:50  [ТС] #17
dajver, вы не поняли меня наверно)))В общем,есть ваш код парсига сайта.
Вот он:

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
import android.app.Activity;
import android.os.AsyncTask;
import android.os.Bundle;
import android.widget.ArrayAdapter;
import android.widget.ListView;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
import java.util.ArrayList;
public class MainActivity extends Activity {
 
        // благодоря этому классу мы будет разбирать данные на куски
        public Elements title;
        // то в чем будем хранить данные пока не передадим адаптеру
        public ArrayList<String> titleList = new ArrayList<String>();
        // Listview Adapter для вывода данных
        private ArrayAdapter<String> adapter;
        // List view
        private ListView lv;
 
        @Override
        protected void onCreate(Bundle savedInstanceState) {
 
                super.onCreate(savedInstanceState);
                setContentView(R.layout.activity_main);
                // определение данных
                lv = (ListView) findViewById(R.id.listView1);
                // запрос к нашему отдельному поток на выборку данных
                new NewThread().execute();
                // Добавляем данные для ListView
                adapter = new ArrayAdapter<String>(this, R.layout.list_item, R.id.product_name, titleList);
        }
 
        /** А вот и внутрений класс который делает запросы, если вы не читали статьи у меня в блоге про отдельные
         * потоки советую почитать */
        public class NewThread extends AsyncTask<String, Void, String> {
 
                // Метод выполняющий запрос в фоне, в версиях выше 4 андроида, запросы в главном потоке выполнять
                // нельзя, поэтому все что вам нужно выполнять - выносите в отдельный тред
                @Override
                protected String doInBackground(String... arg) {
 
                        // класс который захватывает страницу
                        Document doc;
                        try {
                                // определяем откуда будем воровать данные
                                doc = Jsoup.connect("http://freehabr.ru/").get();
                                // задаем с какого места, я выбрал заголовке статей
                                title = doc.select(".title");
                                // чистим наш аррей лист для того что бы заполнить
                                titleList.clear();
                                // и в цикле захватываем все данные какие есть на странице
                                for (Element titles : title) {
                                        // записываем в аррей лист
                                        titleList.add(titles.text());
                                }
                        } catch (IOException e) {
                                e.printStackTrace();
                        }
                        // ничего не возвращаем потому что я так захотел)
                        return null;
                }
 
                @Override
                protected void onPostExecute(String result) {
 
                        // после запроса обновляем листвью
                        lv.setAdapter(adapter);
                }
        }
}
Так вот...в какое место ВАШЕГО КОДА мне вставить вот этот код:

Java
1
2
3
4
5
6
7
8
9
10
11
// Типа обработчик нажатия кнопки
         button1 = (Button)findViewById(R.id.button1);
         button1.setOnClickListener(new OnClickListener() {
             @Override
             public void onClick(View v) {
                 
            Intent intent = new Intent(MainActivity.this, TwoActivity.class);
            startActivity(intent);
 
             }
         });
0
dajver
409 / 273 / 18
Регистрация: 18.09.2010
Сообщений: 1,112
16.12.2013, 01:26 #18
Цитата Сообщение от Kroshandowski Посмотреть сообщение
Так вот...в какое место ВАШЕГО КОДА мне вставить вот этот код:

Java
1
2
3
4
5
6
7
8
9
10
11
// Типа обработчик нажатия кнопки
         Button button1 = (Button)findViewById(R.id.button1);
         button1.setOnClickListener(new OnClickListener() {
             @Override
             public void onClick(View v) {
                 
            Intent intent = new Intent(MainActivity.this, TwoActivity.class);
            startActivity(intent);
 
             }
         });
в onCreate

Добавлено через 33 минуты
Вот написал статью в блоге про интенты, надеюсь понятно

http://dajver.blogspot.com/2013/12/android.html
1
Kroshandowski
2 / 2 / 0
Регистрация: 05.04.2013
Сообщений: 234
16.12.2013, 03:09  [ТС] #19
dajver, Либо я дурак,либо лыжи не едут)))
Все сделал по статье,нет никаких красных подчеркиваний....запускаю и при переходе не вкладку с Activity выдает сообщение Unfortunately, Parser has stopped
Что это может быть?
0
dajver
409 / 273 / 18
Регистрация: 18.09.2010
Сообщений: 1,112
16.12.2013, 03:15 #20
Цитата Сообщение от Kroshandowski Посмотреть сообщение
dajver, Либо я дурак,либо лыжи не едут)))
Все сделал по статье,нет никаких красных подчеркиваний....запускаю и при переходе не вкладку с Activity выдает сообщение Unfortunately, Parser has stopped
Что это может быть?
В манифесте прописали активность как в статье? Скиньте листинг AndroidManifest
0
Kroshandowski
2 / 2 / 0
Регистрация: 05.04.2013
Сообщений: 234
16.12.2013, 03:25  [ТС] #21
dajver,
Кликните здесь для просмотра всего текста

<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
package="com.example.informer"
android:versionCode="1"
android:versionName="1.0">

<uses-sdk android:minSdkVersion="7"
android:targetSdkVersion="16"/>
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
<uses-permission android:name="android.permission.INTERNET"/>
<application android:label="@string/app_name"
android:icon="@drawable/ic_launcher"
android:theme="@android:style/Theme.Light.NoTitleBar">

<activity android:name=".MainActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.MAIN"/>
<category android:name="android.intent.category.LAUNCHER"/>
</intent-filter>
</activity>

<activity android:name=".WeatherActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.pogoda"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>

<activity android:name=".TrafficActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.probka"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>

<activity android:name=".NewsActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.novosti"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>
<activity android:name=".MapActivity"
android:label="@string/app_name">
</activity>
</application>
</manifest>



MapActivity это то что мне нужно открыть из TrafficActivity
0
dajver
409 / 273 / 18
Регистрация: 18.09.2010
Сообщений: 1,112
16.12.2013, 03:30 #22
Цитата Сообщение от Kroshandowski Посмотреть сообщение
dajver,
Кликните здесь для просмотра всего текста

<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
package="com.example.informer"
android:versionCode="1"
android:versionName="1.0">

<uses-sdk android:minSdkVersion="7"
android:targetSdkVersion="16"/>
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
<uses-permission android:name="android.permission.INTERNET"/>
<application android:label="@string/app_name"
android:icon="@drawable/ic_launcher"
android:theme="@android:style/Theme.Light.NoTitleBar">

<activity android:name=".MainActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.MAIN"/>
<category android:name="android.intent.category.LAUNCHER"/>
</intent-filter>
</activity>

<activity android:name=".WeatherActivity"

</activity>

<activity android:name=".TrafficActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.probka"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>

<activity android:name=".NewsActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.novosti"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>
<activity android:name=".MapActivity"
android:label="@string/app_name">
</activity>
</application>
</manifest>



MapActivity это то что мне нужно открыть из TrafficActivity
Вы все активити назначаете главными, не делайте так)

XML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<activity android:name=".MainActivity"
                  android:label="@string/app_name">
            <intent-filter>
                <action android:name="android.intent.action.MAIN"/>
                <category android:name="android.intent.category.LAUNCHER"/>
            </intent-filter>
        </activity>
 
        <activity android:name=".WeatherActivity">
        </activity>
 
        <activity android:name=".TrafficActivity">
        </activity>
 
        <activity android:name=".NewsActivity">
                    </activity>
вот так вставте
0
16.12.2013, 03:30
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
16.12.2013, 03:30
Привет! Вот еще темы с ответами:

Парсинг Html после выполнения скриптов - Программирование Android
Здравствуйте! Пытаюсь разобраться с парсингом страниц из интернета, вроде бы ничего сложного. Но возникла проблема - сайт, из которого я...

Получить HTML код страницы - Программирование Android
Здравствуйте, подскажите. Реально ли стать промежуточным звеном в отображении контента в webView. Т.е при переходе по URL получить код...

Получить код HTML страницы - Программирование Android
Уважаемые гуру, подскажите чем быстрей и проще получить код HTML страницы. Обычной общедоступной, без авторизации.

Получение html кода страницы - Программирование Android
Помогите разобраться с получением html кода интернет страницы в приложении android, для последующего извлечения из неё информации.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
22
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru