Форум программистов, компьютерный форум CyberForum.ru

Парсинг элемента HTML страницы! - Android

Восстановить пароль Регистрация
 
 
Рейтинг: Рейтинг темы: голосов - 23, средняя оценка - 4.87
Kroshandowski
 Аватар для Kroshandowski
2 / 2 / 0
Регистрация: 05.04.2013
Сообщений: 234
12.12.2013, 23:18     Парсинг элемента HTML страницы! #1
Нужно спарсить погоду с главной страницы mail.ru
Если смотреть исходный код страницы,то видно где спрятано значение погоды:

Код
<span class="weather__temperature">[B]-7[/B]</span>
Код
<table class="informers informers_first" cellspacing="0"><tr><td class="informers__column informers__column_left"><a name="clb1283812" href="http://pogoda.mail.ru/" class="informers__title"><span class="informers__title__text">Погода</span></a><a class="weather clearfix" name="clb1283825" href="http://pogoda.mail.ru/prognoz/kazan/" title="снег"><span class="weather__image" style="background-image:url(//limg.imgsmail.ru/s/images/n/informers_x2/weather/1/nightsnow.png);"></span><span class="w-weather"><span class="weather__temperature">-7</span><span class="weather__forecast weather__forecast_near">,&nbsp;ночью -6</span></span><span class="w-weather"><span class="weather__forecast weather__forecast_tomorrow">завтра -2</span></span></a></td>
Так вот...нашел здесь на форуме пост про парсинг html страницы:

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
package pete.android.study;
 
import java.net.URL;
 
import org.htmlcleaner.CleanerProperties;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
 
import android.app.Activity;
import android.os.Bundle;
import android.widget.TextView;
 
public class HtmlCleanerStudyActivity extends Activity {
 
    // HTML page
    static final String BLOG_URL = "http://xjaphx.wordpress.com/";
    // XPath query
    static final String XPATH_STATS = "//div[@id='blog-stats']/ul/li";
 
    @Override
    public void onCreate(Bundle savedInstanceState) {
        // init view layout
        super.onCreate(savedInstanceState);
        setContentView(R.layout.main);
 
        // decide output
        String value = "";
        try {
            value = getBlogStats();
            ((TextView)findViewById(R.id.tv)).setText(value);
        } catch(Exception ex) {
            ((TextView)findViewById(R.id.tv)).setText("Error");
        }
    }
 
    /*
     * get blog statistics
     */
    public String getBlogStats() throws Exception {
        String stats = "";
 
        // config cleaner properties
        HtmlCleaner htmlCleaner = new HtmlCleaner();
        CleanerProperties props = htmlCleaner.getProperties();
        props.setAllowHtmlInsideAttributes(false);
        props.setAllowMultiWordAttributes(true);
        props.setRecognizeUnicodeChars(true);
        props.setOmitComments(true);
 
        // create URL object
        URL url = new URL(BLOG_URL);
        // get HTML page root node
        TagNode root = htmlCleaner.clean(url);
 
        // query XPath
        Object[] statsNode = root.evaluateXPath(XPATH_STATS);
        // process data if found any node
        if(statsNode.length > 0) {
            // I already know there's only one node, so pick index at 0.
            TagNode resultNode = (TagNode)statsNode[0];
            // get text data from HTML node
            stats = resultNode.getText().toString();
        }
 
        // return value
        return stats;
    }
}
Код работает...,но мне не понятна строка
Код
static final String XPATH_STATS = "//div[@id='blog-stats']/ul/li";
, а точнее этот кусок
Код
"//div[@id='blog-stats']/ul/li"
Вопрос...как правильно заполнить это место,основываясь на исходном коде mail.ru?

Заранее спасибо.
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Kroshandowski
 Аватар для Kroshandowski
2 / 2 / 0
Регистрация: 05.04.2013
Сообщений: 234
16.12.2013, 03:25  [ТС]     Парсинг элемента HTML страницы! #21
dajver,
Кликните здесь для просмотра всего текста

<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
package="com.example.informer"
android:versionCode="1"
android:versionName="1.0">

<uses-sdk android:minSdkVersion="7"
android:targetSdkVersion="16"/>
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
<uses-permission android:name="android.permission.INTERNET"/>
<application android:label="@string/app_name"
android:icon="@drawable/ic_launcher"
android:theme="@android:style/Theme.Light.NoTitleBar">

<activity android:name=".MainActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.MAIN"/>
<category android:name="android.intent.category.LAUNCHER"/>
</intent-filter>
</activity>

<activity android:name=".WeatherActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.pogoda"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>

<activity android:name=".TrafficActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.probka"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>

<activity android:name=".NewsActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.novosti"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>
<activity android:name=".MapActivity"
android:label="@string/app_name">
</activity>
</application>
</manifest>



MapActivity это то что мне нужно открыть из TrafficActivity
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
16.12.2013, 03:30     Парсинг элемента HTML страницы!
Еще ссылки по теме:

Парсинг html страницы андроид Android
Парсинг Html после выполнения скриптов Android
Парсинг HTML странцы Android
Получение html кода страницы Android
Получить HTML код страницы Android

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
dajver
 Аватар для dajver
406 / 270 / 18
Регистрация: 18.09.2010
Сообщений: 1,106
16.12.2013, 03:30     Парсинг элемента HTML страницы! #22
Цитата Сообщение от Kroshandowski Посмотреть сообщение
dajver,
Кликните здесь для просмотра всего текста

<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
package="com.example.informer"
android:versionCode="1"
android:versionName="1.0">

<uses-sdk android:minSdkVersion="7"
android:targetSdkVersion="16"/>
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
<uses-permission android:name="android.permission.INTERNET"/>
<application android:label="@string/app_name"
android:icon="@drawable/ic_launcher"
android:theme="@android:style/Theme.Light.NoTitleBar">

<activity android:name=".MainActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.MAIN"/>
<category android:name="android.intent.category.LAUNCHER"/>
</intent-filter>
</activity>

<activity android:name=".WeatherActivity"

</activity>

<activity android:name=".TrafficActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.probka"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>

<activity android:name=".NewsActivity"
android:label="@string/app_name">
<intent-filter>
<action android:name="android.intent.action.novosti"/>
<category android:name="android.intent.category.DEFAULT"/>
</intent-filter>
</activity>
<activity android:name=".MapActivity"
android:label="@string/app_name">
</activity>
</application>
</manifest>



MapActivity это то что мне нужно открыть из TrafficActivity
Вы все активити назначаете главными, не делайте так)

XML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<activity android:name=".MainActivity"
                  android:label="@string/app_name">
            <intent-filter>
                <action android:name="android.intent.action.MAIN"/>
                <category android:name="android.intent.category.LAUNCHER"/>
            </intent-filter>
        </activity>
 
        <activity android:name=".WeatherActivity">
        </activity>
 
        <activity android:name=".TrafficActivity">
        </activity>
 
        <activity android:name=".NewsActivity">
                    </activity>
вот так вставте
Yandex
Объявления
16.12.2013, 03:30     Парсинг элемента HTML страницы!
Ответ Создать тему
Опции темы

Текущее время: 15:12. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru