Форум программистов, компьютерный форум, киберфорум
Наши страницы
Java SE (J2SE)
Войти
Регистрация
Восстановить пароль
 
Рейтинг 5.00/10: Рейтинг темы: голосов - 10, средняя оценка - 5.00
temperus
1 / 1 / 0
Регистрация: 02.03.2011
Сообщений: 42
1

парсер html страницы

22.10.2012, 16:53. Просмотров 1740. Ответов 1
Метки нет (Все метки)

Здраствуйте

есть вот такой участок кода

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
static public String getSomeUrl(final String url) throws URISyntaxException, IOException, UrlNotFound, ClientProtocolException
{
        stringBuffer = getUrlSource(url); // переменная stringBuffer типа StringBuffer, в нее пихаем исходник страницы.
        String src = stringBuffer.toString();
        Pattern p = Pattern.compile("(?s)(?i).*source\\s+src='(.+?mp4)'.*"); // регулярка не работает.
        Matcher m = p.matcher(src);
        if (m.matches()) 
        {
                String link = m.group(1);
             
                return link;
        }
        else
        {
            throw new UrlNotFound();
        }
}
исходник страницы html:


...много всякой фигни...

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
<script type="text/javascript" src="/jwplayer.js"></script>
    <script type="text/javascript">
        //main configuration
        var playerMainConfig = {
            flashplayer: "/player.swf",
            file: "http://content4.vid.com/eWosYZh%252FqncsmmjUNOTq5PDOnyV6mVAYfL2kDy43HrhSAZxejcG5ajqqL0j%252BcPNc4bR16SdPY669Qx01Tut6QLURo%252FRig45umtqQDhIissc%252FTCJNWlvzZYoPKXOsx39A/1870354.mp4",
            image: "http://thumbs.vid.com/640x480/22102012/18703541640x480.jpg",
            provider: 'http',
            width: "100%",
            height: 480,
            controlbar: 'bottom',
                    wmode: 'transparent',
            events: {
                onPlay: function(e) {
                    if (e.oldstate == "BUFFERING")
                        $("#bottomAd").slideDown(); //show bottom ad
                    else
                        $("#pauseAd").fadeOut();    //hide pause ad
                },
                onPause: function(e) {
                    //show pause ad
                    $("#pauseAd").fadeIn();
                    $("#pauseAd").css('left', $("#player").position().left + Math.round($("#player").width()/2 - $("#pauseAd").width()/2));
                    $("#pauseAd").css('top', $("#player").position().top + Math.round($("#player").height()/2 - $("#pauseAd").height()/2));
                }
          }
 
        };
    </script>
... опять много всякой фигни.

нужна Ваша помощь с тем, чтобы выдернуть ссылку на mp4 файл

С Уважением, Антон

Заказываю контрольные, курсовые, дипломные и любые другие студенческие работы здесь.

0
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
22.10.2012, 16:53
Ответы с готовыми решениями:

парсер html страницы
Здраствуйте. пытаюсь спарсить исходник одной html страницы мне нужно...

парсер html страницы
Здраствуйте. Пытаюсь написать парсер под android для html страницы, чтобы...

Многопоточный HTML Парсер
Суть задачи состоит в том чтобы парсить html по ссылке на наличие email-ов, в...

Парсер html на java
Пытаюсь написать парсер html. Подсматриваю на другом сайте (del) Согласно...

Парсинг HTML страницы с frameset
Доброго времени суток! Мне необходимо распарсить страничку сайта. Сайт...

1
Skipy
1996 / 1419 / 91
Регистрация: 25.11.2010
Сообщений: 3,611
22.10.2012, 17:44 2
Так она и не должна работать на этом фрагменте. Регулярка писалась под страницу, в которой URL содержится в нескольких экземплярах, в том числе и в фрагменте типа <source src='тут нужный url'/>. Именно из такого куска url и вырезается.

Из фрагмента из этой темы можно вырезать вот таким выражением: (?s)(?i).*file:.*?(http.+?mp4).*.
1
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
22.10.2012, 17:44

HttpClient, не возвращается содержимое html страницы
Ребята у меня есть задача автоматизировать работу человека на сайте. Для этого...

Java. Получения содержимого HTML страницы
Доброго времени суток. Проблема в следующем. Моя программа должна с разных...

Программа для парсинга HTML страницы
Моя задача состоит в том чтобы я написал программу в которой вводишь URL и она...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru