30 / 16 / 1
Регистрация: 11.04.2010
Сообщений: 534
|
|
1 | |
Возможно ли рипнуть всю Википедию?29.06.2012, 19:28. Показов 2660. Ответов 23
Метки нет (Все метки)
0
|
29.06.2012, 19:28 | |
Ответы с готовыми решениями:
23
Как скачать всю википедию в виде html страниц Возможно ли проверить не всю программу, а лишь ее кусок кода через F11 возможно ли зафиксировать высоту одного блока, а для 2го сделать всю оставшуюся без position? Побить википедию |
30 / 16 / 1
Регистрация: 11.04.2010
Сообщений: 534
|
|
29.06.2012, 19:51 [ТС] | 3 |
0
|
29.06.2012, 20:29 | 4 |
...не знаю насчет телепорт, но технически это можно сделать... а зачем?
в русской википедии 870721 статей. это если по 200 килобайт на статью (не считая картинок и т.д.), то выйдет, что необходимо скачать 174 ГБ (как минимум). + еще ссылки на каталоги статей и прочее. ну, технически - это вполне реально.
1
|
30 / 16 / 1
Регистрация: 11.04.2010
Сообщений: 534
|
|
30.06.2012, 01:19 [ТС] | 5 |
Хранилище есть на 24Тб. Подскажите как грамотно это сделать. Рипнуть пока русские страницы. Если вас не затруднит.
0
|
30.06.2012, 02:09 | 6 |
так программой teleport pro, если уж о ней зашла речь!
можно скрипт подумать и написать. слева в википедии есть ссылка "указатель а-я" (алфавитный), вот по нему на 3 страницы в глубину, как то так я думаю. имеет смысл скачивать по времени, чтобы сайт не забанил. если цель благородная, то может имеет смысл поговорить с участниками википедии, может они помогут чем-то или хотя бы не будут банить ваш рип. что по поводу вопроса "зачем"?
1
|
30 / 16 / 1
Регистрация: 11.04.2010
Сообщений: 534
|
|
30.06.2012, 02:21 [ТС] | 7 |
Отвечу на этот вопрос просто, мало ли что нас ждёт в будущем с сетью. Поэтому я бекаплю из интернета всю полезную информацию и сортирую её на SAS жесткие диски. Исключительно для себя и только для себя. У меня много рипнутых познавательных сайтов есть, которых уже не существует, или уже изменены в отрицательную сторону. Поэтому вот такой вопрос поставился, рипнуть википедию, сначала ru потом уже остальное.
0
|
30.06.2012, 13:11 | 8 |
с точки зрения теории вероятности больше шансов, что у тебя навернется НМЖД, чем полетят разом все ДЦ у Википедии, или что Телекому и большой тройке надоест доить с людей деньги за воздух (сеть) и они прикроют сеть.
Если ты ждешь какого-то Армагепца, то разумней строить бункер и запасать соль, сахар, спички, тарен...
1
|
30 / 16 / 1
Регистрация: 11.04.2010
Сообщений: 534
|
|
30.06.2012, 15:40 [ТС] | 9 |
Я думаю, у меня такое не скоро накроется такой вот блок: http://elmir.ua/catalog/komp_y... k831a.html
И все же, как грамотно рипнуть Вики? И причем тут Армагещец? Армагедец может быть только с сетью....
0
|
4226 / 1796 / 211
Регистрация: 24.11.2009
Сообщений: 27,562
|
|
30.06.2012, 16:41 | 11 |
Скорость держит не прога, да и винт такой ещё поискать. И не факт, что к окончанию закачки скачанные страницы будут актуальны, так как сам ресурс имеет привычку обновляться.
1
|
30 / 16 / 1
Регистрация: 11.04.2010
Сообщений: 534
|
|
30.06.2012, 16:52 [ТС] | 12 |
0
|
Исследователь
196 / 175 / 13
Регистрация: 30.10.2011
Сообщений: 605
|
|
30.06.2012, 16:53 | 13 |
Согласен с предыдущим постом: википедия еще 20 раз обновится, пока будет идти скачивание файлов))
1
|
4226 / 1796 / 211
Регистрация: 24.11.2009
Сообщений: 27,562
|
|
30.06.2012, 16:58 | 14 |
Ну не все, конечно станицы, особо старые уже имеют устоявшееся состояние. Но часть может стать на себя не похожа, меняясь к лучшему. Всё таки качать такой объём - процесс не быстрый.
1
|
13208 / 6597 / 1041
Регистрация: 10.01.2008
Сообщений: 15,069
|
|
30.06.2012, 17:28 | 15 |
Также не исключено, что через каждые N МБ/сутки или /час Вам будут говорит, что "Вы скачиваете слишком много информации. Не хотите ли ввести капчу или подождать сутки?" Всякое же бывает. Если так, что весь процесс может растянуться в разы.
1
|
154 / 146 / 20
Регистрация: 12.03.2011
Сообщений: 806
|
|
30.06.2012, 20:06 | 16 |
Есть рипы вики, правда старые (на iPhone залил недавно, не помню какого года уже)
1
|
88 / 67 / 37
Регистрация: 28.06.2012
Сообщений: 161
|
|
30.06.2012, 20:11 | 17 |
Не смешите мои тапочки.
ru.wikipedia.org/wiki/Википедия:Как_сделать_копию_Википедии Редиректор от ссылки глючит, не обессудьте.
1
|
154 / 146 / 20
Регистрация: 12.03.2011
Сообщений: 806
|
|
30.06.2012, 20:19 | 18 |
Все оказывается так просто .
1
|
30 / 16 / 1
Регистрация: 11.04.2010
Сообщений: 534
|
|
01.07.2012, 00:28 [ТС] | 19 |
0
|
88 / 67 / 37
Регистрация: 28.06.2012
Сообщений: 161
|
|
01.07.2012, 10:18 | 20 |
Gastello, да, реальная статья.
Как можно увидеть, не так уж это нереально.
1
|
01.07.2012, 10:18 | |
01.07.2012, 10:18 | |
Помогаю со студенческими работами здесь
20
Как победить Википедию? Как парсить Википедию? Модуль (Рецензии/Комментарии) Как рипнуть? Как рипнуть дизайн с этого сайта? Программа отправляет запрос википедию и получает ответ Как скачать "Википедию"? Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |