Як зробити електронну копію паперової книги

Відео: ЯК ЗРОБИТИ КНИГИ ДЛЯ ЛЯЛЬОК // ПАПЕРОВИХ // How to make a book for dolls

Що для вас означає книга? Якщо це не просто захоплюючий попутник, але і мудрий наставник, то ви хоч раз замислювалися про те, щоб зберегти її на майбутнє. Оцифровка паперових книг має два безперечних переваги: книга в електронному вигляді завжди під рукою, і їй дуже легко ділитися.



З цього мануала ви дізнаєтеся про основні етапи створення зручної електронної версії паперової книги з навігацією і можливістю копіювання тексту.

вступ

Варто зазначити, що в століття бурхливого захисту авторських прав і легкої доступності літератури, спочатку зверстаної в електронній формі, має сенс оцифровувати або старі фундаментальні радянські підручники, або щось дійсно рідкісне і тільки для особистого користування.
Маючи доступ до старих технічних довідників, я іноді безоплатно допомагав тим незнайомим мені людям, яким так не вистачало хороших джерел знань для навчання. І коли вже я наймався, хотілося виконати свою роботу на досить високому рівні, щоб читачеві книги було приємно в неї занурюватися.

Етап 1. Копіювання книги

Згодом багато процесів спрощуються. Якщо з п`ят років тому цей етап був вкрай тривалим (доводилося користуватися сканером), то з поліпшенням камер мобільних телефонів витрачається час істотно скоротилося. Звичайно, камера камері ворожнечу, але, якщо підібрати прийнятні умови зйомки, повинен підійти будь-який більш-менш сучасний телефон.
Зрозуміло, використання сканера все ж більш переважно. Особливо якщо справа стосується технічної літератури, що містить безліч формул і креслень.
Передбачаючи події, зазначу, що знімки згодом будуть оброблені спеціальною програмою. Але все ж варто сумлінно поставитися до самої зйомки, щоб не ставити якість кінцевого продукту в залежність лише від постобработки.
Приклад не самого хорошого знімка: освітлення страждає, сторінки до кінця не распрямлени. Все заради експерименту.Приклад не самого хорошого знімка: освітлення страждає, сторінки до кінця не випрямлені. Все заради експериментуТому постарайтеся максимально широко розкривати сторінки, щоб вигини у корінця книги були мінімальні. Було б здорово, якби вам хтось в цьому допомагав. Одна людина тримає телефон, а другий перевертає і випрямляє сторінки. До всього іншого, студенти люблять робити на бібліотечних книгах позначки, і непогано було б їх стерти.
Робимо серію знімків і перекидаємо їх на комп`ютер в окрему папку. Прийшла пора попрацювати неживому мозку.

Етап 2. Обробка

Я стикався з двома серйозними програмами для обробки відсканованих (сфотографованих) книг: ScanTailor і ScanKromsator. Можливо, за роки мого інактіва з`явилися ще якісь гідні альтернативи, але я сумніваюся - вже дуже мала і бідна для користувача ніша. Самі пропалені Книгодел воліють ScanKromsator. У ньому гранично багато налаштувань і можливостей, але розібратися і зрозуміти всі запропоновані навороти, мабуть, не в змозі і сам автор програми (жарт). Тому я рекомендую вам ScanTailor. Мені довелося спостерігати за розвитком цієї утиліти з перших днів її існування. Розробник ще кілька років тому припинив підтримку проекту, але все-таки дав світові хороший інструмент для обробки сканів.


Початок роботи

Робота в ScanTailor послідовна і проста. Всі проміжні дії відображені в лівій частині робочої області, ви з легкістю увіллєтеся в процес.
Виберіть папку з вихідними кодами, вихідна папка буде створена автоматично. Для всіх сторінок встановіть максимально можливе DPI - 600 600. Потужності сучасних комп`ютерів дозволяють досить швидко обробляти такі зображення.
ScanTailor_pic1Не шкодуйте DPI для своєї книги

Крок 1. Виправлення орієнтації

Найпростіший і швидкий крок. Швидше за все, ви спочатку фотографували сторінки з вірною орієнтацією, тому і клопоту виникнути не повинно. Зазначу лише, що спочатку ScanTailor буде пропонувати вам запустити пакетну обробку поточного дії (невеликий значок Play навпаки кроку) - обов`язково їм користуйтеся, щоб не клацати по кожному зображенню окремо.
ScanTailor_pic2На мій погляд, ScanTailor може пишатися своїм продуманим інтерфейсом

Крок 2. Разрезка сторінок

Практично безпроблемний крок. Я вкрай рідко зустрічав помилки програми на цьому етапі. Обов`язково зверніть увагу на обкладинку книги - саме тут найчастіше виникають нюанси.
ScanTailor_pic3Більшої наочності і придумати важко

Крок 3. Компенсація нахилу

У переважній більшості випадків алгоритм спрацьовує коректно. Не чекайте підступу, переходите до наступного кроку.
ScanTailor_pic4До ваших послуг ручна настройка до часток градуса

Крок 4. Корисна область

Напевно, це самий відповідальний момент. Тільки зміст книги має визначальне значення, оформлення - справа вторинна. Саме з цього кроку починає працювати зв`язка «комп`ютер - людина». У програмі часом трапляються невеликі збої, тому після автоматичної обробки пробіжіться очима по мініатюрах сторінок в правій частині екрана. Зазвичай помилки відразу кидаються в очі.
ScanTailor_pic5«Бракована» корисна область буде видно при перегляді мініатюр сторінок

Крок 5. Поля

Розмір полів - як кому подобається. Більш важливим моментом є можливість вирівнювання розмірів сторінок. Не забудьте поставити цю галочку, щоб не отримати на виході «танцюючі» сторінки.
ScanTailor_pic6Обкладинку зазвичай доводиться допрацьовувати в графічному редакторі

Крок 6. Вихід

Останній бій - він важкий самий. Плюс самий ресурсномісткий для вашого комп`ютера і найвимогливіший до вашої уваги.
ScanTailor_pic7Необроблені сторінки позначаються знаком питанняФінішний відрізок знаменується низкою найважливіший дій. Перш за все ви визначаєте вихідний режим книги: чорно-білий, кольоровий або змішаний. Потім сторінки очищаються від сміття, викривлені рядки вирівнюються. Не буду вдаватися в подробиці, але скажу вам на не самі помітні закладки, розташовані дещо нелогічно і незвично - між превью сторінки і стрічкою мініатюр. Кожна закладка відповідає за важливу функцію ручного налаштування одержуваних зображень. Якщо ви знайдете бажання і час вникнути в принцип їх роботи, ваші книги будуть більш високої якості.


Сторінка до і після коригування спотворення рядківСторінка до і після коригування спотворення рядків

підсумок

Прагнучи до ідеалу, на цю роботу ви можете витратити не одну годину. Все залежить від вашої зацікавленості в кінцевому результаті і якості вихідних знімків. Так, я ще раз повертаюся до цієї теми. Трохи більші старання на етапі підготовки можуть заощадити величезну кількість часу, який йде на приведення сторінок в пристойний вигляд.
Прошу не брати за зразок наведені скріншоти - на все про все у мене пішло не більше пари хвилин. Я не сумніваюся, що забув вказати вам на деякі нюанси роботи зі ScanTailor - занадто давно я нічого не обробляв з його допомогою.
У підсумку ви отримаєте набір розрізнених сторінок в форматі .tif. Пора зшивати!

Етап 3. Створення djvu-файлу

Якщо ви хочете швидко зварганити DjVu-файл, зверніться за допомогою до малесенькій утиліті DjVu Small. Є й більш серйозні програми, наприклад DjVu Editor Pro. Звичайно, кращим бачиться застосування другого інструменту. Але вирішувати вам: встановіть обидві програми і порівняйте їх можливості.
DjVu Small
Що стосується створення PDF - в Інтернеті є вагон і маленький візок відповідних програм і веб-сервісів.

Етап 4. Створення OCR-шару

Одним з визнаних світових лідерів в розпізнаванні тексту безсумнівно є компанія ABBYY з її відомим продуктом FineReader. Напевно, немає таких людей, які не чули про цю програму, тому і розписувати особливо нічого. З недавнього часу FineReader вміє відкривати і зберігати результати роботи прямо в DjVu, що виключає необхідність використання проміжного софта.

Етап 5. Створення змісту

На просторах Мережі довелося зустрічати позитивні відгуки про програму Pdf Djvu Bookmarker. Як стає зрозуміло з назви, софтіна вміє працювати з обома найпоширенішими форматами електронних книг.

висновок

Швидше за все, ви не подужали багато букв і відразу перейшли до висновків. А вони для пересічної людини невтішні. Електронне книговидання - справа клопітка, повне труднощів і сюрпризів. Щоб дослужитися навіть до «зеленого поясу», вам доведеться витратити купу часу. Оцифровка паперових книг на високому рівні - доля ентузіастів. Якщо ви все ж таки зважитеся пройти чортову дюжину кіл пекла, то отримаєте непередавані враження. Завжди приємно робити щось суспільно корисне і отримувати за це звичайні людські подяки.
Але в цілому рекомендую зупинитися після обробки в ScanTailor, об`єднати розрізнені сторінки в PDF і далі не лізти в нетрі.
Усвідомлено і несвідомо я упустив купу дрібниць і нюансів, які підстережуть вас на шляху створення гарної електронної книги. Сподіваюся, що до обговорення в коментарях підключаться знаючі люди і вкажуть на мої неточності або розкажуть про свої секрети.
Увага, тільки СЬОГОДНІ!


Оцініть, будь ласка статтю
Всього голосів: 125