|
0 / 0 / 0
Регистрация: 02.10.2017
Сообщений: 3
|
|
Скрипт для выгрузки книги из Google Books02.10.2017, 15:38. Показов 3462. Ответов 2
Всем привет. Попытаюсь объяснить проблему лаконично.
Задача: выгрузить книгу с ограниченным доступом из гугл букс. То есть, в описании написано "просмотр фрагмента" и все. Возьмем для примера книгу "Мусульманское завоевание Египта и северной Африки". Смотрим в содержание: Глава под названием "The Golden Ball". Вбиваем The golden ball в поиск по книге и гугл выдает тот самый искомый фрагмент и еще маленький кусочек - The stocky young arab sat on a slope of the hill, his shrewd, ... Вот если скопировать этот лишний кусочек и вставить уже в общий поиск книг, гугл поиск выдаст результат с той самой книгой, но уже под названием будет целый абзац. Потом копируем конец абзаца и вбиваем в поиск уже внутри самой книги, нам выдают другой фрагмент с еще большим текстом. То есть, теоретически, так можно подсмотреть всю книгу, но вручную это займет как минимум неделю-две. Цель: написать скрипт или программу, которая делала бы это за меня или найти другой скрипт, который создавали для решения похожих проблем (думаю, такого нет). Есть ли кто может такой написать и главное, сколько это будет стоить? Создал на php потому что не знал, куда надо. Надеюсь в тексте все понятно. Для ясности нн хватает пары скриншотов, но я сижу с убитого калькулятора, долго возиться придется.
0
|
|
| 02.10.2017, 15:38 | |
|
Ответы с готовыми решениями:
2
Скрипт выгрузки файлов с сервера Не работает php-скрипт для выгрузки данных в XML-файл. Просьба глянуть что не так Скрипт для выгрузки в CSV членов группы AD с определёнными атрибутами |
|
14145 / 9374 / 1350
Регистрация: 21.01.2016
Сообщений: 35,311
|
|
| 02.10.2017, 17:50 | |
|
Gaius Lulius, считаете, что гугл букс дурачки писали, которым подобный сценарий в голову не приходил и они от него не защитились?
0
|
|
|
0 / 0 / 0
Регистрация: 02.10.2017
Сообщений: 3
|
|
| 02.10.2017, 18:43 [ТС] | |
|
Только что понял, что при поиске внутри книги результат выдается в виде картинок, с которых копировать нельзя, в отличии от общего поиска, в котором тот же самый фрагмент выдается в виде текста. А это затрудняет задачу. Программа, даже если ее кто-то и напишет, должна будет задействовать ocr после поиска внутри книги, извлекать последнюю строку результата и вставлять в общий поиск и так далее. Внезапно осознал, что это будет очень трудоемкая и дорогостоящая услуга, которую мой карман не потянет. Но отвечу на ваш вопрос:
Гугл писали не дурачки, но эту лазейку они, видимо, проморгали (точнее не подумали, что скществуют дебилы, готовые пойти на такие ухищрения из-за какой-то книги). Они лишь пофиксили способы автоматической выгрузки книг с другим уровнем доступа, где через разные ip давали разные результаты. Через доступ, изначально предназначенный для поиска нужного фрагмента можно аккуратно, но медленноб подглядеть всю книгу. Единственным условием является сильное желание и свободное время, потому что уйдет его дойуха. Короч, теоретически идея осуществима, а конечный продукт был бы крайне востребован, но когда было выбирал между программирванием и сериалами, я выбрал второе. Потому что ленивая сволочь.
0
|
|
| 02.10.2017, 18:43 | |
|
Помогаю со студенческими работами здесь
3
Нужен скрипт для выгрузки прайса товара с Яндекс.Маркет в XML/YML Просмотр изображений как в http://books.google.ru Скрипт выгрузки товаров на Яндекс.Маркет Неработает скрипт для гостевой книги Скрипт на perl для телефонной книги Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так:
https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347
Основана на STM32F303RBT6.
На борту пять. . .
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Программа принимает математическое выражение в виде строки и выдаёт его производную в виде строки и вычисляет
значение производной при заданном х
Логарифм записывается как: (x-2)log(x^2+2) -. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|