Valera (valera) wrote,
Valera
valera

Как неудобным способом обеспечить себе удобное чтение

или Инструкция для юзверей библиотеки lib.aldebaran.ru желающих скачивать именно те книги, которые там разрешено читать только на сайте.

Значит так. Вот, к примеру, книжка: http://lib.aldebaran.ru/author/sinicyn_oleg/sinicyn_oleg_zapretnaya_dver/sinicyn_oleg_zapretnaya_dver__1.html

Если мы зайдем на страничку и попробуем
1) Выделить текст (чтоб скопировать)
2) Зайти в source code (чтоб найти там текст)
3) Сохранить страничку (чтоб читать локальную копию)
4) Отключить javascript (чтоб скопировать)

То нас ждет разочарование. Все это приведет к потраченному времени и отсутствию столь желаемого текста.

Как все же скачать текст:

1) качаем Firebug extension для Файерфокса: http://www.getfirebug.com/
2) качаем Notepad++: http://sourceforge.net/projects/notepad-plus/
3) Открываем ту же страничку с текстом
4) Нажимаем на кнопочку файербага чтоб открыть его.
5) В Файербаге нажимаем Inspect. Это дает нам возможно водить мышкой над элементами страницы в то время как они будут выделятся в окошке файербага показывая их код.
6) Наводим мышку на тот div, в котором весь нужный нам текст страницы и кликаем на этот div. Таким образом его код остается выделенным в окошке файербага и мы можем с ним работать.
7) В Файербаге райт-кликаем на нужный нам div и выбираем 'copy innerHTML'
8) Открываем Notepad++ и вставляем скопированный текст в новый файл.
9) В N++ нажимаем Ctrl + H (replace), ставим галочку рядом с "Regular expression", а в 'Find what' вставляем <span class="h">[^<]+</span>, нажимаем 'Replace All'
10) Вот, в принципе, мы и добыли нужную нам страничку текста. Сверху и снизу осталось по div с ненужными нам ссылками, но это легко стереть вручную.

Немного геморройная процедура, но при желании ее можно полностью автоматизировать. Мне пока что лень, так как понадобилась только одна книга. Но тут все open source under GNU general public license, так что feel free to modify and redistribute it in any desirable fashion.
Tags: books, computer, geek, ideas, instructions, programming
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment