35 / 30 / 2
Регистрация: 31.12.2009
Сообщений: 349
|
|||||||||||
1 | |||||||||||
Достать с сайта чистый текст12.02.2011, 23:46. Просмотров 1774. Ответов 5
Метки нет Все метки)
(
Вот нужно достать с сайтов чистый текст.
т.е без тегов, без комментариев, без содержания <head> и <noindex> У меня сейчас две проблемы, как то не корректно вытаскивает текст. использую:
использую такую функцию:
общая цель просмотреть сайт, так как его видит яндекс.
0
|
|
12.02.2011, 23:46 | |
Достать контент (текст между тегами) из др. сайта Как через lxml достать сразу текст тега и текст подтега? Перенос сайта с Joomla на чистый PHP без движка Где найти чистый дистрибутив Windows 7 ? (Ну может и не совсем чистый) |
|
112 / 55 / 13
Регистрация: 26.12.2010
Сообщений: 205
|
|||||||||||
13.02.2011, 14:27 | 2 | ||||||||||
А не проще использовать базовую функцию?
0
|
35 / 30 / 2
Регистрация: 31.12.2009
Сообщений: 349
|
|
13.02.2011, 14:41 [ТС] | 3 |
базовая функция не справляется. iconv - как определить какая кодировка мне нужна? т.е какая кодировка на сайте?
0
|
112 / 55 / 13
Регистрация: 26.12.2010
Сообщений: 205
|
||||||
13.02.2011, 14:58 | 4 | |||||
Если веб-сайт находится на веб-сервере, обычно кодировка передается заголовком
Примерно вот так: Код
Content-type: text/html;charset=utf-8 Как его получить одно дело, как обработать - другое. Допустим имеется заголовок
1
|
35 / 30 / 2
Регистрация: 31.12.2009
Сообщений: 349
|
|
13.02.2011, 15:23 [ТС] | 5 |
а вот как достать загаловки. За это спасибо!
Код
$url = 'http://www.example.com'; print_r(get_headers($url)); print_r(get_headers($url, 1));
0
|
112 / 55 / 13
Регистрация: 26.12.2010
Сообщений: 205
|
||||||
13.02.2011, 20:28 | 6 | |||||
Попробуйте ...
0
|
13.02.2011, 20:28 | |
Заказываю контрольные, курсовые, дипломные и любые другие студенческие работы здесь.
Достать значение с сайта Достать из .dll текст!
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |