Обсуждение интернет-ресурсов

Maglorius

Квестор
интересно, а что, какие книги не открываются в россии и почему? или это гугл сам ограничивает?
Да, гугль определяет страну, к которой принадлежит ваш ip и ограничивает доступ к книгам, если вы не в США. Есть также предположение, что это отражается и на результатах поиска по книгам, но тут я не уверен на 100%.

Почему это так - сказать затрудняюсь. Могу предположить, что поскольку Гугль не знает всех нюансов законов об авторском праве в каждой стране (в США - знает), то он просто перестраховывается, так сказать, на всякий случай.

Но многие книги из Гугля, доступные для США, выложены на Архив.Орг. Не все, конечно. Но и это хорошее подспорье.
 

aeg

Принцепс сената
Но многие книги из Гугля, доступные для США, выложены на Архив.Орг. Не все, конечно. Но и это хорошее подспорье.

А многие книги из Гугльбукса, недоступные даже для США, уже выложены на Гигапедии. Я там книжку по остготской просопографии нашёл и разные серии типа Loeb Classics Library.

Там книги и выпущенные в 2009-2010 гг. есть, чего на Гугльбуксе не бывает никогда.
 

Maglorius

Квестор
А многие книги из Гугльбукса, недоступные даже для США, уже выложены на Гигапедии. Я там книжку по остготской просопографии нашёл и разные серии типа Loeb Classics Library.

Там книги и выпущенные в 2009-2010 гг. есть, чего на Гугльбуксе не бывает никогда.
Об этом уже писалось выше. Я говорил о нюансах именно Гугльбукса.
 

Maglorius

Квестор
И ещё о нюансах Гугльбукса. Опишу мой метод постраничного сохранения книг, используя браузер Mozilla Firefox, недоступных для скачивания целиком. Может быть кому-нибудь пригодится.

1) Открываем в браузере нужную страницу: http://books.google.ru/books?id=_hBD_QlmorIC&pg=PA165

2) Переходим в меню Инструменты > Информация о странице

3) На закладке Мультимедиа ищем нужную нам картинку: http://books.google.ru/books?id=_hBD_Qlmor...CcPFzHDqg&w=685

4) Копируем её в буфер обмена и вставляем в новое окно браузера. Сохраняем полученное изображение с любым названием (лично я предпочитаю номер страницы).

5) Если изменить ключ 685 на 1025, то размер изображения получаем максимальный из возможных. Я также меняю ключ ru&sig на en&sig, но это уже дело вкуса.
 

Aelia

Virgo Maxima
Ох, как сложно... Я обычно сохраняю просто через PrintScreen, и потом в Фотошоп. Но так, конечно, качество получается гораздо хуже. Возьму Ваш метод на вооружение для картинок и текстов, подлежащих распознанию, а остальное, пожалуй, буду сохранять по-прежнему: мне главное, чтобы прочитать было можно. :)
 

Maglorius

Квестор
Это только рассказывается сложно, а делается легко и просто (со временем вырабатывается автоматизм) Я лично трачу на этот процесс секунд 10. Принтскрин с фотошопом требуют больше усилий, наличия дополнительного софта (Фотошоп или аналог) и дают гораздо более худший результат.
 

Maglorius

Квестор
Вместо Альдебарана и Либрусека ещё можно пользоваться "Библиотекой Старого Чародея". Выбор там, конечно, гораздо меньше, зато книги отлично вычитаны и никаких ограничений по скачиванию.

http://oldmaglib.com/
 

aeg

Принцепс сената
Ох, как сложно... Я обычно сохраняю просто через PrintScreen, и потом в Фотошоп. Но так, конечно, качество получается гораздо хуже. Возьму Ваш метод на вооружение для картинок и текстов, подлежащих распознанию, а остальное, пожалуй, буду сохранять по-прежнему: мне главное, чтобы прочитать было можно. :)

В Internet Explorer-е можно и проще. Зачем возиться с каждой страницей, когда можно и сразу всё скопировать :) ?

1) Сделать побольше места под временные файлы Интернета: меню "Сервис"/"Свойства обозревателя", закладка "Общие", в Истории просмотра нажать кнопку "Параметры" и написать число в "Используемое место на диске". Там же можно посмотреть, где Internet Explorer держит эти самые файлы - возле надписи "Текущая".

Это надо сделать только один раз.

2) Почистить папку с временными файлами, чтобы не было лишних: меню "Сервис"/"Свойства обозревателя", закладка "Общие", в Истории просмотра нажать кнопку "Удалить", поставить галочку около "Временные файлы Интернета" и нажать кнопку "Удалить".

3) Открыть нужную книгу на Google Books и пролистать её сначала до конца.

4) Из папки с временными файлами Интернета (см. пункт 1) скопировать все файлы с именем books и расширением .png . Просмотреть их и переименовать.


Но сначала неполностью выложенную книгу лучше поискать на Гигапедии - иногда они там бывают целиком. Или на www.archive.org, если книга старая, но недоступна.


Распознавание вообще можно делать прямо с экрана. В FineReader-е для этого есть специальная программа - ABBYY Screenshot Reader. Она позволяет распознавать текст, выделяя картинку прямо на экране, а результат кладёт в буфер или в файл. Там можно и языки задавать.
 

Maglorius

Квестор
В Internet Explorer-е можно и проще. Зачем возиться с каждой страницей, когда можно и сразу всё скопировать :) ?
Кэш смотреть можно и в Mozilla Firefox. Только это далеко не проще. Во-первых, неудобно получать максимальный размер изображения. Во-вторых, листая подряд всю книгу можно довольно быстро заработать блокировку.
 

Гиви Чрелашвили

Проконсул
"Да, гугль определяет страну, к которой принадлежит ваш ip и ограничивает доступ к книгам, если вы не в США. Есть также предположение, что это отражается и на результатах поиска по книгам, но тут я не уверен на 100%."

IP домашнего компа можно подделать, сменив его на американский, причем довольно просто.
Думаю, в таком гиганте, как Гугл, где сидят прекрасные специалисты, это хорошо знают. Сдается мне, что они определяют страну не по IP компа, а по провайдеру.
 

Maglorius

Квестор
Думаю, в таком гиганте, как Гугл, где сидят прекрасные специалисты, это хорошо знают. Сдается мне, что они определяют страну не по IP компа, а по провайдеру.
Факт в том, что, используя американский прокси-сервер (его легко найти в списках прокси), гугль прекрасно обманывается.
 

aeg

Принцепс сената
А прокси - это что ?
Это тоже своего рода провайдер.

Прокси - это сервер, который подменяет в запросе адрес Вашего компьютера на свой и отсылает этот запрос дальше. Когда приходит ответ, он меняет адрес наоборот и возвращает ответ Вашему компьютеру.

Аналог: Вам пиво не продают, так как не исполнилось 18 лет. Вы просите купить Вам пиво соседа, который старше 18 лет. Сосед - это и есть прокси.
 

Гиви Чрелашвили

Проконсул
Вы меня, професионального программиста, будете учить, что такое прокси-сервер ?
Зачем так сложно объяснять, это просто сервер-посредник и всё.
В данном случае, он именно выполняет роль провайдера, ибо для Гугла он выглядит именно как провайдер.
И у вас неточность: он подменяет не адрес компьютера (IP компьютера), а адрес провайдера (IP провайдера), под которым числится интернет-сервис
вашего компьютера.
На адрес домашнего компьютера Гугл вообще не реагирует, как я уже сказал, его элементарно можно поменять на любой IP с первой группой любой страны, если только вы не на рабочем сервере компании, а имеете свой домашний компьютер с динамически меняющимся IP. А вот адрес (IP) провайдера так просто не поменяешь.
Адрес домашнему компу присваивается всё равно от адреса провайдера, но не полностью, а только его первые три (иногда две) группы. Четвертая группа IP компьютера (а иногда и третья) меняется динамически после каждой перезагрузки компьютера.
Единственный вариант, который обманет Гугл, дав ему неверную информацию о стране, это действительно сесть на чужой сервер, забив при помощи его адреса IP вашего текущего провайдера.
Однако о таких случаях Гугл не беспокоится по причине мизерности этих случаев.
Раньше IP компьютера далеко не каждый знал, как изменить.
Есть для этого специальные программы, но о них знать надо.
Теперь это можно сделать легче.
Сам ваш провайдер часто дает вам такую возможность, если вы покупаете интернет-доступ, который как минимум DSL (о FIOSe я уже не говорю).
Мой провайдер, американская компания Verizon, например, дает мне возможность изменить настройки и перед использованием интернета либо спрятать свой IP (сделать его пустым), либо поменять на любое, которое я введу. То есть, сейчас огромное количество людей, даже в плане интернет-использования не продвинутые, вполне могут адрес компа сменить на что угодно. А вот сесть на другой сервер - это уже надо быть как минимум продвинутым юзером. А таких, по сравнению с не то, что десятками, а с сотнями миллионов, а то и с несколькими миллиардами юзеров, которые пользуются компанией Гугл ежедневно, очень мало, так что они компанию Гугл не очень волнуют.
 

Nikkor

Пропретор
Еще раз спасибо.
Уважаемый aeg, Вам не кажется, что подобные ссылки лучше размещать в специальной ветке - "Ссылки по истории ..."? Там все структурировано, и они всегда и у всех будут под руками. Здесь же через некоторое время они попросту окажутся похороненными под грудой новых страниц :)
P.S. У Вас нормально качаются pdf с archive.org? У меня до недавнего времени проблем не было, а последние недели при попытке скачать обычный или bw pdf в большинстве случаев все подвисает в бесконечный режим ожидания. При этом дежавю примерно такого же размера скачиваются без проблем.
 

Aelia

Virgo Maxima
Уважаемый aeg, Вам не кажется, что подобные ссылки лучше размещать в специальной ветке - "Ссылки по истории ..."?

А там уже есть ссылки на PIR, по-моему. Вот кто-бы мне дал ссылки на PIR-2, которая Гроага-Штейна... А то я только первый том нашла.
 

aeg

Принцепс сената
[UL=]QU[/URL]TE=Nikkor, Jan 9 2011, 19:00]Еще раз спасибо.
Уважаемый aeg, Вам не кажется, что подобные ссылки лучше размещать в специальной ветке - "Ссылки по истории ..."?
[/QUOTE]

Там уже были ссылки.

[UL=]QU[/URL]TE=Nikkor, Jan 9 2011, 19:00]P.S. У Вас нормально качаются pdf с archive.org? У меня до недавнего времени проблем не было, а последние недели при попытке скачать обычный или bw pdf в большинстве случаев все подвисает в бесконечный режим ожидания. При этом дежавю примерно такого же размера скачиваются без проблем.

[/QUOTE]

Я всегда качаю не со страницы книги, а ещё нажимаю на ней ссылку с надписью "All Files: HTTP". Там лежат прямые ссылки, а на странице книги может быть перенаправление, которое не у всех корректно работает (при обрыве докачка не продолжается, а начинается снова). Да и типов файлов там больше.

Например, 3-й том PIR:
[UL=http://www.archive.org/details/prosopographiaim03akaduoft]http://www.archive.org/details/prosopographiaim03akaduoft[/URL]

Перехожу по "All Files: HTTP" на:
[UL=http://ia700404.us.archive.org/12/items/prosopographiaim03akaduoft/]http://ia700404.us.archive.org/12/items/pr...iaim03akaduoft/[/URL]

и скачиваю (подчёркнуты характерные признаки):
1) цветной PDF
[UL=http://ia700404.us.archive.org/12/items/prosopographiaim03akaduoft/prosopographiaim03akaduoft]http://ia700404.us.archive.org/12/items/pr...hiaim03akaduoft[/URL].pdf
2) чёрно-белый PDF
[UL=http://ia700404.us.archive.org/12/items/prosopographiaim03akaduoft/prosopographiaim03akaduoft_]http://ia700404.us.archive.org/12/items/pr...iaim03akaduoft_[/URL]bw.pdf
3) Дежавю
[UL=http://ia700404.us.archive.org/12/items/prosopographiaim03akaduoft/prosopographiaim03akaduoft]http://ia700404.us.archive.org/12/items/pr...hiaim03akaduoft[/URL].djvu
4) текст
[UL=http://ia700404.us.archive.org/12/items/prosopographiaim03akaduoft/prosopographiaim03akaduoft_]http://ia700404.us.archive.org/12/items/pr...iaim03akaduoft_[/URL]djvu.txt

Если надо отсканированные страницы в хорошем разрешении для распознавания, то выбираем самый большой по размеру файл (7 Гбайт):
[UL=http://ia700404.us.archive.org/12/items/prosopographiaim03akaduoft/prosopographiaim03akaduoft_orig_cr2.tar]http://ia700404.us.archive.org/12/items/pr...ft_orig_cr2.tar[/URL]
 
Верх