242x242
book1
slide5q
Ps
web
richebour
web-l
web
_crop_detail_q85
04-2008
web5
mk1
img
dsc_5186
olga_baklanova_
web
web
web
sokornov_54-242
web
Digitisation and Classification
Оцифровка вселенной PDF Print E-mail
There are no translations available.

Евгений Козловский

 

Оцифровка изображений

Создание архивов с механизмами легкого поиска нужной информации

Надежность архивов, возможный перевод из одного вида в другой в процессе развития технологий

Аппаратное обеспечение надежности архивов: файловые массивы, резервирование, RAID

Устройство сетевых серверов и каналов для открытия доступа к своим массивам данных и получения информации от других

 

worcВзгляд и нечто

Окружающий нас мир удручающе (восхитительно, непреодолимо, ненужное - вычеркнуть) аналогов. Плавен. Недискретен. Даже великолепно отвесная издалека пропасть в горах Кавказа при ближнем рассмотрении оказывается вся изрыта трещинками, испещрена неровностями и неправильностями. Даже идеально, зеркально отполированная металлическая поверхность открывается под микроскопом чем-то вроде поля для гольфа, покрытого холмиками и лунками. И не дай вам Бог глянуть в сильную лупу на восхитительно гладкую, бархатистую кожу лица красавицы, даже  подгримированной.

Эту аналоговость довольно трудно зафиксировать: объективно и всесторонне. Любая фотография покажет вам только один ракурс пейзажа, и даже сколь угодно толстый пакет фотографий всё равно не будет исчерпывающим. Запись голоса великого человека - непременно включит в себя разного рода помехи, чаще всего вызванные ограничениями технологии записи. Как скрупулезно и блистательно ни исполни копию знаменитой картины, - подлинный эксперт всегда её разоблачит.

Оставим в покое самое природу и сосредоточимся только на аналоговых с неё слепках: прямых вроде фотографии, видео- или звукозаписи и преображённых, - художественных произведениях, артефактах. Они, под влиянием непреодолимого закона о росте энтропии (хаоса), подвержены влиянию времени и с его ходом видоизменяются: выцветают, осыпаются, гибнут в катастрофах. Наименее подвержены таким разрушениям артефакты письменные: записанные литературные произведения, документы. Они уже изначально представляют собою некую знаковую формализацию идей и, будучи своевременно и точно скопированы путём переписывания (перепечатания) могут избежать разрушительного воздействия времени. Если знаковая копия снята точно, гибель первоисточника огорчит нас потерей подлинного артефакта, но не приведёт к потере смысла: образа, знания. Правда, в старые времена, когда древние книги переписывались от руки, практически не удавалось избегать как случайных ошибок, допущенных переписчиками, так и намеренных искажений. По этой причине до сих пор идут ожесточённые споры по текстам разных летописей и канонических книг. Тем не менее, мы можем в первом приближении считать, что мысли записанные уже в значительной мере формализованы с помощью знаков и таким образом первоначально оцифрованы. То есть, уже в определённой мере защищены от роста энтропии.

Что же касается всех прочих, не знаковых (в технологическом смысле) артефактов, - защитить их от времени и перипетий истории невозможно концептуально: всякая аналоговая копия теряет что-то по сравнению с оригиналом. Даже изготовленный с применением специальных фотоматериалов контратип с негатива. Не говоря уж о второй или третьей аналоговой копии звукозаписи. Не говоря уже о картинах или скульптурах. И даже об авторских оттисках гравюр, где каждый следующий отличается от предыдущего и, в общем случае, последний всегда хуже первого. По крайней мере - в смысле точности.

Похоже, что на сегодняшний день единственным методом, противостоящим энтропии и служащим недорогому производству тождественных копий артефактов, можно счесть исключительно оцифровку. То есть - скрупулезное и с достаточной частотой проведённое измерение артефакта и фиксацию полученных при измерении значений. Эти значения записываются в цифровом виде, как правило, чтобы быть подвластными машинной (компьютерной) обработке, в двоичной системе: нолик - единичка, есть сигнал - нет сигнала. Таким образом оцифрованный артефакт можно хранить на любом носителе, включая даже школьную тетрадку, исписанную вручную единичками и ноликами. Стопка таких тетрадок,  если знаешь правила оцифровки,  может представлять собой и мелодию, и фотографию, и видеоролик. Если же отвлечься от взятых исключительно для примера тетрадок и перейти к реальным на сегодня жёстким компьютерным дискам, разным CD и DVD-ROM'ам, Blu-Ray дискам, флэш-накопителям, цифровым магнитным лентам, - то окажется, что сделать абсолютно идентичную оригиналу копию артефакта или даже любое их количество не стоит практически никаких сил и занимает незначительное время.

Оцифровка сегодня проникла в мир артефактов столь глубоко, что подавляющее большинство из них оцифровываются непосредственно в момент создания. Например, съёмка на цифровые фото-, кино- и видеоаппараты, запись звука на цифровые рекордеры, набор текста на компьютере. (Последний пример концептуально несколько сложнее первых, поскольку, набирая текст, автор пользуется изначальной, символьной, оцифровкой, а текстовый редактор, установленный на компьютере, подменяет символы наборами общепринятых цифр, кодов, - для облегчения того же последующего копирования или редактирования.) Эти, всё более широко, - даже на графику, живопись, вплоть до скульптуры, - распространяемые методы создания артефактов (художественных произведений и документов) порождают новые проблемы. Например, проблему оригинала и копии, то есть можно ли отличить изначально цифровой оригинал от идентичной ему цифровой же копии. Но это предмет для отдельных исследований.

Понятное дело, что вполне адекватно оцифровать артефакт невозможно даже теоретически. Cовременным физикам ещё не до конца понятна структура материи, - так что любая оцифровка будет одновременно и огрублением источника. Чем выше точность оцифровки, тем больше времени, энергии, информационных ёмкостей она требует, тем более громоздким, более трудным для хранения, копирования, распространения, открытия свободного доступа по каналам связи оказывается результат. Чем ниже эта точность, - тем дальше цифровая копия отстоит от оригинала.

На сегодняшний день критерием достаточной глубины оцифровки принято считать «разрешение» органов чувств человека. То есть, если при дальнейшей глубине (точности) оцифровки глаз или ухо человека уже не различает разницы, - такой порог точности можно считать достаточным. Однако мы ещё далеко не всё знаем и о природе чувств человека, и о внутренних свойствах разного рода артефактов, так что те, кто хочет иметь достаточно точную цифровую копию некоего артефакта (картины, симфонического концерта, снятого ещё на пленку кинофильма), пренебрегая затратами, обычно задают точность оцифровки с определённым запасом. По тем же причинам такие люди (или организации) предпочитают не сжимать оцифрованный результат, - хотя подавляющее большинство людей неспособно заметить глазом или слухом такое сжатие, - если оно установлено в разумных пределах.

 

Этот раздел будет посвящен конкретным решениям в области оцифровки, хранения, копирования, организации свободного или ограниченного доступа по линиям связи разного рода, преимущественно - музейных, - артефактов. Как в теоретическом, так и в практическом отношении. Как на уровне государственных проектов, так и на уровне мелких муниципальных и даже домашних.

Типы цифровых файлов

Типов цифровых файлов (контейнеров), в которых можно хранить оцифрованную реальность, - невообразимое множество, хотя их структура принципиально одинакова: череда тех самых нулей и единичек плюс заголовки для распознания способа воспроизведения, плюс иногда метаданные (например, сведения о марке фотоаппарата, выдержке, диафрагме, объективе, дате съемки), плюс, наконец, - в случае сжатых форматов, - отдельные данные для корректировки. Классифицировать содержащие информацию файлы можно по нескольким признакам.

Например: открытые и общеупотребительные или проприетарные, закрытые, в которых сохраняют данные некоторые аппаратно-программные комплексы. Понятное дело, что во всех отношениях предпочтительнее пользоваться открытыми, универсальными форматами, однако не часто можно встретить специальный аппаратно-программный комплекс с собственным файловым форматом, который не позволял бы переводить этот проприетарный формат в общеупотребительный. Другой разговор, что в результате такого перевода могут быть утрачены некоторые метаданные, так что в случаях, когда используется такое проприетарное оборудование, возможно, имеет смысл, после перевода результатов оцифровки в формат общеупотребительный, сохранить и нативные файлы. В качестве примера, во-первых, можно привести не поддающиеся переводу без потерь в общеупотребительные форматы аудио-диски от Sony, так называемые Super Audio CD. Для записи звука в этом формате приходится покупать у Sony очень дорогой специальный записывающий комплекс. Да и далеко не все проигрыватели способны воспроизводить Super Audio CD, хотя, разумеется, качество записи на них многократно превышает качество записи на обычные CD или в компьютерном формате WAV.

Во-вторых, диски, предназначенные для хранения изображений, видео, текстов, звука.

В-третьих, несжатые форматы, наиболее громоздкие, но и наиболее адекватные оцифрованной реальности; сжатые без потерь, когда в файлах заключено достаточно информации, чтобы полностью восстановить исходную. Вариант вроде бы самый предпочтительный, однако требующий некоторых временных и аппаратных затрат на раскодирование. Наконец - сжатые с невосполнимыми потерями. Причем, когда речь идёт о видео, нужно различать сжатие статическое и динамическое: в первом случае сжимается каждый кадр, но они все остаются в файле, во втором - кроме сжатия каждой картинки, прореживается и весь их ряд, так что из 15 кадров, составляющих обычно три четверти секунды видео, только один остается реальным, прочие восстанавливаются на основе отдельно записанной разностной информации и по предсказанию перемен. Иной раз попросту приходится записывать информацию в сжатой форме: не только из экономии пространства (которое, вообще говоря, экономить не следует, особенно, когда речь идет о хранении уникальных данных, и особенно - на фоне нынешнего драматического удешевления носителей цифровой информации), но из-за неспособности доступной цифровой техники (по преимуществу - видеотехники высокой чёткости, VHD), переваривать, пропускать сквозь себя и фиксировать несжатые информационные потоки. Так что в случаях, когда оцифровывается уникальная информация, добываемая с большим трудом, возможно, потребуется привлечение дорогостоящей специальной аппаратуры.

Сжатые (в разумных пределах) файлы, как правило, имеют качество более чем достаточное, чтобы получить представление о сохраненных в них цифровых образах артефактов, однако, всякая попытка их редактировать (например, монтировать видео) неминуемо приводит к необратимому ухудшению качества, что роднит их обработку с аналоговым копированием.

Получив общее представление о файлах, содержащих результаты оцифровки артефактов, перейдём к их перечислению для разных видов информации и краткому описанию наиболее употребительных.

Графические файлы

Вообще говоря, их, даже открытых и распространенных, великое множество. Назовем часть:

Растровые форматы: BMP, ECW, GIF, ICO, ILBM, JPEG, JPEG 2000, MrSID, PCX, PNG, PSD, TGA, TIFF, HD Photo.

Векторные форматы: Scalable Vector Graphics (SVG и SVGZ), Encapsulated PostScript (EPS), метафайлы Windows: WMF, EMF, файлы CorelDraw: CDR, CMX.

Комплексные форматы: DjVu, PDF, CGM.

Растровый формат представляет собой простое перечисление каждой точки изображения с её полными характеристиками: цветовыми и яркостными. Программы, читающие растровые графические файлы, просто рисуют на экране каждую точку, согласно инструкциям, ей соответствующим. Например: координаты точки, количество каждого из основных цветов, из которых можно составить любой видимый (RGB, Red, Green, Blue: Красный, Зеленый, Голубой, - или CMYK: Cyan, Magenta, Yellow, Key color: Голубой, Пурпурный, Желтый, Черный или Ключ) и, наконец, их интенсивность. В некоторых растровых форматах применяется сжатие без потерь. Наиболее простой метод, применённый в подформате BMP - RLE, ныне устаревшем и очень мало распространенном, - вместо повторяющихся подряд одинаковых во всех смыслах точек, записываются характеристики одной и число их повторений. Такое сжатие очень хорошо работает на картинках с гладким фоном и почти не дает положительных результатов у, скажем, фотографий. Более сложные алгоритмы сжатия без потерь применяются, например, у формата TIFF и называются LZW сжатие.

Вполне понятно, что картинка, записанная в растровом формате, наилучшим образом выглядит при воспроизведении в масштабе 1:1, что далеко не всегда получается на реальных компьютерных мониторах, которые редко имеют совпадающее с картинкой разрешение. Всяческое некратное масштабирование растровых картинок, а особенно - их увеличение, даже кратное, приводит к искажениям, иной раз весьма заметным. Продвинутые графические редакторы и специальные «увеличивающие» графические процессоры позволяют уменьшить потери масштабирования, но никак не нейтрализовать их полностью. Однако целый ряд (подавляющее большинство) изображений может быть записан исключительно в растровом виде, а порою и в заранее заданном размере, - как, например, в цифровых фотоаппаратах с фиксированным логическим разрешением матрицы.

В случае, когда вы оцифровываете какое-нибудь изображение, вы заранее должны представлять себе, как оно впоследствии будет использоваться, и в случаях, когда это возможно, выбирать правильное разрешение. На всякий случай - повышенное, хоть это и приводит к резкому увеличению размера файла.

Одним из самых старых растровых форматов можно считать BMP. Он проигрывает современным в некоторых возможностях, в, так сказать, мощности, - однако сохраняет графическую информацию (когда это ему по силам) честно и без потерь. На сегодня формат утратил популярность, однако в случаях, когда поневоле сталкиваешься с ним, бояться его не стоит.

В настоящее время чаще других, для сохранения качественно оцифрованных изображений используется сегодня формат TIFF (Tagged Image File Format), чистый или сжатый без потерь по алгоритму LZW, что позволяет сэкономить порою до половины дискового пространства. Он достаточно могуч, может включать себя много разных метаданных, поддерживает большую глубину цвета и понимается подавляющим большинством программ просмотра и редактирования графики.

В виду широчайшего распространения мощнейшего графического процессора от Adobe Photoshop, - некоторое распространение получили и его «родные» файлы с расширением PSD. Растровый формат хранения графической информации, использующий сжатие без потерь, созданный специально для программы Adobe Photoshop и поддерживающий все её возможности: слои и папки слоёв, прозрачность и полупрозрачность, векторные графические элементы и стили слоёв.

Отдельно стоит упомянуть файлы с расширением RAW, которые отнюдь не являются стандартами, а переводятся как «сырьё» или как цифровые негативы. Эти файлы представляют собой точные снимки с матриц цифровых фотоаппаратов, причем алгоритм записи изображения на матрицу у разных производителей и даже у разных моделей одного производителя бывает разным. Как правило, для серьезной оцифровки не стоит доверять встроенным в фотоаппараты конверторам цифровых негативов в общераспространенные графические форматы, - в сжатый JPEG, но иногда и в TIFF, - а заняться «цифровой печатью» вручную, используя специальные конверторы, обычно прилагаемые к цифровым фотоаппаратам, включая модули для встраивания в Adobe Photoshop. «Ручная печать» (обработка специальными программами RAW-файлов) позволяет исправить целый ряд дефектов снимка: изменить баланс белого, скорректировать экспозицию, убрать артефакты объективов и так далее.

Adobe Systems в 2004-м году представила унифицированный формат цифровых негативов DNG (Digital Negative Specification), предложив его спецификацию бесплатно всем производителям цифровых фотоаппаратов, так что покупатели камер тех производителей, которые поддержали спецификацию, уже не нуждаются в специальных конверторах: универсальный изначально встроен в Adobe Photoshop. К тому же, формат понимается сегодня многими программами-просмотрщиками изображений, например - ACDSee.

К растровым же форматам относится и максимально распространенный сегодня формат JPEG (Joint Photographic Experts Group). Это - формат сжатия с потерями по весьма сложному алгоритму (подробности). Уровень сжатия в нем можно задавать по шкале от 1 до 100 (или, в некоторых программах, - до 10), чем он выше, тем меньше результирующий файл, чем ниже - тем он ближе к оригиналу, но в любом случае от него отличается. Алгоритм учитывает особенности восприятия видео информации человеческими глазом и мозгом, так что не слишком сильно сжатая картинка представляется большинству людей идеальной. Формат подходящий для выкладки на Интернет-сайты, но плохо переносящий любого рода редактирование и прецизионную печать. Многие цифровые фотоаппараты из недорогих способны сохранять фотографии только в формате JPEG.

Векторные форматы не хранят в себе информацию о каждой точке картинки, но - только о, так сказать, поведении графики, о векторах, на которые картинка раскладывается. Например, указывается координата опорной точки и - что от нее под таким-то углом должна идти прямая линия (дуга окружности, парабола и так далее) до встречи с таким-то объектом. Тут же может быть указана толщина и тип линии, цвет фона и тому подобные параметры. Размеры векторных файлов в этом случае значительно меньше, чем растровых. Но главное преимущество векторных изображений - их бесконечная масштабируемость без потерь.

Правда перевести в векторную форму какую-нибудь фотографию природы получается очень непросто и с очевидными потерями: формализовать изображение, каждый фрагмент которого, по сути, случаен, - дело, возможно, не выполнимое в принципе. Однако в случае простой графики, мультипликационного кино, лубка, - вполне возможно, что овчинка будет стоить выделки. Кроме того, векторную картинку всегда можно, увеличив/уменьшив ровно до нужного вам размера перевести в растровый формат, - практически, без потерь. Жаль, что обратный процесс слишком сложен и никогда не приводит к идеальным результатам.

Один из примеров применения векторной графики, с которым всем приходится сталкиваться постоянно, - это TrueType, PostScript и некоторые другие векторные шрифты, которыми вы пользуетесь на компьютере: они легко масштабируются в любую сторону, ничуть не меняя своего качества. Для сравнения, попробуйте открыть один из старых, векторных, шрифтов, по традиции включенных в операционные системы от Microsoft, и попробуйте его заметно увеличить: ступеньки и квадратики, из которых состоят буквы, вас сильно потрясут.

Наиболее распространенный векторный графический редактор - CorelDRAW от канадской корпорации Corel. Можно назвать также Adobe Illustrator и Macromedia FreeHand. В Windows (практически, во все ее варианты) встроен WMF (англ. Windows MetaFile) - универсальный формат векторных графических файлов для Windows-приложений. Он весьма специфичен и имеет весьма ограниченные возможности: приспособлен, в основном, для работы с коллекциями графических изображений Microsoft Clip Gallery, для рисования разного рода формул в Microsoft Word и так далее. К тому же не работает в других операционных системах. На платформе Macintosh аналогичную роль играет формат PICT.

Комплексные форматы (самый популярный из которых на сегодня - созданный фирмой Adobe Systems и ставший в 2007-м году международным стандартом PDF, Portable Document Format) представляют собой сложные комплексы, предстающие перед читателем обычно как документы, максимально похожие на бумажные, со всеми особенностями книжной верстки и разного рода растровыми и векторными иллюстрациями. В этих форматах в Сети часто выкладываются книги, руководствами в таком формате обычно сопровождаются сложные высокотехнологические устройства. Комплексные форматы обычно кроссплатформенны, то есть не зависят от операционной системы, в которой открываются, могут включать в себя текстовый слой, по которому легко проводить, например, поиск, могут подхватывать установленные на компьютере шрифты или же иметь их уже внедренными в тело. Целый ряд программ, сопровождающих бытовые сканеры и специальных включают в себя возможность записывания отсканированных изображений, обычно текстовых или с текстовыми элементами, именно в комплексные форматы, как правило - в PDF. Всё более распространяющийся формат DjVu применяется (цитирую Википедию) специально для хранения сканированных документов - книг, журналов, рукописей и пр., где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами.

Однако сохранять в комплексных форматах чистые изображения не имеет смысла, поскольку их качество при переводе в один из таких форматов безусловно теряется.

В большинстве случаев, перевод документов и изображений в комплексные форматы осуществляется через виртуальные принтеры. Вы составляете документ в одной из программ: текстовом, графическом редакторе, верстальной программе, - и задаете его печать на такой виртуальный принтер.

Файлы включающие текст и изображения

Исходя из сказанного во вводной части, напечатанные или рукописные текстовые страницы уже заключают в себе некоторое кодирование (буквы, цифры, знаки препинания), - поэтому любая текстовая страница, оцифрованная как изображение, может служить неразрушаемой цифровой копией текста, и для ее сохранения могут использоваться файлы всех форматов, упомянутых в предыдущем разделе.

В некоторых случаях лучший способ оцифровки текста - это просто получение и сохранение его цифрового изображения. То есть текст можно рассматривать как некую картинку и ничего с ней более не делать. Например, снимки с редких первопечатных и рукописных книг, с древних свитков и даже клинописных табличек, автографы великих людей и старые печатные документы, в которых огромную роль играет внешний вид, шрифты, заставки, почерк и тому подобные вещи.

В других случаях, когда документ как артефакт не столь важен, сколь важно его содержание, имеет смысл перевести знаки текста в стандартные коды, легкие как для чтения, так и для копирования и распространения. Процесс перевода графического изображения текста в чисто цифровой вид называется распознаванием. Для распознавания существует целый ряд «умных» программ, об одной из них, наиболее предпочтительной в России, я расскажу позже. Однако машинное распознавание почти никогда не бывает стопроцентно верным, так что требует вычитки, а некоторые, особенно совсем старые тексты, вообще не поддаются машинному распознаванию, и нуждаются в свежем наборе с оригинала, при этом не важно, оцифрованного или «аналогового».

Несмотря на заметный прогресс в оцифровочной аппаратуре, надо иметь в виду, что некоторые аппараты (как правило, сканеры) могут оказывать разрушающее влияние на оригиналы, поэтому выбирать аппараты для оцифровки особо ценных, древних, ветхих оригиналов следует с большой осмотрительностью. Впрочем, даже в самых сложных случаях, можно найти соответствующую аппаратуру, - другой разговор, что она может оказаться редкой и дорогой. Важное правило: любые операции по оцифровке оригиналов - древних ли рукописей, акварелей, фотоотпечатков или негативов, - следует проводить только под надзором специалиста и в соответствии с правилами, установленными для этих артефактов.

Пожалуй, идеальным вариантом оцифровки текстов (а тем более - комплексных страниц, включающих, кроме собственно текста, элементы графического оформления), стоит считать сохранение их в описанных выше комплексных форматах, когда первый слой документа представляет собой точную копию его внешнего вида, а внутренний, невидимый, - текст в компьютерных кодах. Тогда, с одной стороны, вы работаете с текстом, как с оригиналом, с другой - вам всегда доступны такие чисто цифровые возможности, как поиск слова или фразы по фрагменту, переход к нужным главам, гиперссылки. Кроме того, если документ для читающего недостаточно разборчив, из такого комплексного представления легко можно извлечь текстовую составляющую, представленную печатными шрифтами. Большинство существующих на сегодняшний день программ, работающих с комплексными форматами, обслуживают формат PDF. Некоторые программы распознавания изначально предлагают сохранение документа сразу в двухслойном формате: графическом и текстовом. Однако, если текстовый (в компьютерных кодах) формат занимает минимум места, для сохранения верхнего, графического, слоя в необходимом разрешении нужно быть готовым к тому, что файлы с двухслойно оцифрованными артефактами будут очень громоздкими, а не слишком громоздкие дадут лишь приблизительное представление о документе и не позволят достаточного увеличить его для внимательного просмотра и изучения.

Итак, сделав должные замечания по поводу оцифровки текстов в графическом виде, перейдем к способам их сохранения в виде кодов.

Еще на самой заре компьютеризации, как стандарт, была принята так называемая таблица ASCII - American Standard Code for Information Interchange или Американский Стандартный Код для Обмена Информацией (в виде цветной диаграммы). Первоначально она представляла собой таблицу на 128 клеток (описываемая 7-битным двоичным числом), где первые клетки были заняты управляющими символами («конец строки» или «перевод каретки», демонстрирующими ее «машинописные» истоки); следующие - знаками препинания и цифрами, затем шли заглавные буквы английского алфавита, за ними до конца - строчные. Например, латинской «А» соответствует десятичная цифра 65, а восклицательному знаку - 33. В такой таблице не оставалось места символам национальных алфавитов (в случае немецкого, испанского или французского, требовалось добавить всего несколько клеток; для русского же алфавита - была нужна практически еще одна такая таблица). Почти сразу же 7-битная кодовая таблица была расширена до 8-битной, с 256-ю клетками, где вторую половину занимали национальные символы и несколько знаков так называемой псевдографики, позволяющих в текстовом режиме рисовать простые схемы и таблицы.

Общий стандарт на все национальные кодировки появился далеко не сразу, так что вторую половину таблицы заполняли по-разному. Не будем вдаваться в тонкости отображения других языков, а остановимся только на русском. Для него и сегодня существует добрый десяток кодировок: CP866, KOI7-R, KOI8-R и ISO-8859-5, CP437, Windows-1251, MacCyrillic и так далее. Отдельно существуют разновидности таблиц для национальных алфавитов республик бывшего СССР, например KOI8-U - для Украины. Долгое время разные пользователи создавали тексты в разных кодировках, например, почти весь Интернет сидел (традиционно, отталкиваясь от UNIX-систем) на KOI8, и электронные письма, проходящие через десятки серверов, порой принимали не только не читаемый, но и в принципе не дешифруемый вид. Для спасения от этой напасти был выпущен целый ряд программ-декодировщиков, помогающих в большинстве случаев.

История кодировок запутана и для интересующихся - увлекательна (подробности ищите здесь), но, по счастью, практически осталась в прошлом. Ибо появившийся еще в 1991 году универсальный стандарт кодирования под названием Unicode (Юникод, Уникод) сегодня достаточно широко распространен. Отсылаю особо интересующихся к соответствующей статье, для остальных же привожу вступительную выдержку из нее:

«Юнико́д, или Унико́д (англ. Unicode) - стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.), объединяющей крупнейшие IT-корпорации. Применение этого стандарта позволяет закодировать большое число символов из разных систем письменности: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становятся ненужными кодовые страницы.

Стандарт состоит из двух основных разделов: универсальный набор символов (UCS, Universal Character Set) и семейство кодировок (UTF, Unicode Transformation Format). Универсальный набор символов задаёт однозначное соответствие символов кодам - элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS.

Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F».

Для тех, кто не намерен разбираться даже в таком сравнительно простом определении, попробую дать совсем простое объяснение. Символьная таблица Unicode - 16-битная (двухбайтная), то есть способна уместить в себе целых 65 536 символов, - так что каждый 128-клеточный фрагмент (кроме первого, в котором остаются ASCII-символы) этой огромной таблицы отдан тому или иному алфавиту (в случае с иероглифами - несколько фрагментов); и код того или иного знака состоит из адреса этого фрагмента, и только потом - из номера его клетки.

Правда, из экономии далеко не все современные шрифты заполняют все фрагменты Unicode-таблицы, некоторые так и остаются пустыми. Когда речь идет об отображении Unicode-текста на компьютере, стоит только поменять отображающий шрифт на подходящий. Но иной раз недоразумения происходят практически на уровне «железа». Например, в электронной книге, произведенной Sony (PRS-500, PRS-505) хотя и используется Unicode, «славянские» фрагменты таблицы оставлены пустыми, и, чтобы читать русские книги, приходится «перепрошивать» книгу полноценными шрифтами.

И хотя на практике, особенно в России, до сих пор очень широко распространена майкрософтовская восьмибитная кодировка Windows-1251, я рекомендую при распознании текстов (или после него) переводить результат в Unicode: для большей универсальности и совместимости. Правда, это позволяют не все текстовые программы - самые простые, как правило, поддерживают только восьмибитную (однобайтную) кодировку.

Самый простой (и самый экономный) формат файлов для текстовой информации, - это обычный текстовый файл. В системе Windows ему, как правило, присваивают расширение TXT, но оно не обязательно. Можно встретить текстовые файлы с расширением LOG (в них обычно записывается отчет о работе той или иной программы) или файлы без расширения. Текстовые файлы понимают самые разные редакторы, включенные в любую операционную систему. Но при записи в текстовом формате юникодных (даже восьмибитных) текстов могут возникать разные проблемы. Кроме того, текстовые файлы до крайности примитивны и не поддерживают даже элементарного форматирования, да и читать их не слишком удобно. Зато они очень хорошо сжимаются архиваторами, нередко - до пяти процентов первоначального размера. Кроме того, минимальное нарушение в сложном файле, содержащем текст, может испортить весь файл непоправимо, в то время, как нарушения в текстовых файлах оставляют весь текст, кроме нарушенного фрагмента неизменным. Как правило, текстовые файлы могут быть импортированы в сложные текстовые процессоры, вроде, Microsoft Word'а, а также в программы верстки. В Microsoft Windows для создания текстовых файлов и работы с ними используется редактор «Блокнот» (Notepad).

Чаще всего сегодня для создания и обработки текстов пользуются довольно продвинутыми текстовыми процессами, проприетарными (например, Microsoft Word) и свободными (например, OpenOffice), которые создают файлы собственных форматов с собственными расширениями: DOC, DOCX, WPS, TEX, INFO, WPD, LWP и так далее. Все они, кроме непосредственно, текста, включают элементы форматирования: абзацы, курсив, над- и подстрочные символы и прочее и открываются, как правило, программами, их создавшими. Но в большинстве случаев они могут открываться и перекрестно, путем конвертирования из формата в формат, т.к. большинство текстовых процессоров поддерживают сохранение текста и не в своем формате, которых, в разных случаях, бывает от одного-двух до доброго десятка.

Большинство сегодняшних текстовых (и не только) редакторов работают по системе WYSIWYG (произносится как визивиг) - сокращение от What You See Is What You Get (англ. что видишь, то и получишь). То есть, работая над текстом (набирая его, редактируя, форматируя), вы видите на экране его так, как он будет напечатан на бумаге. Во многих случаях это бывает полезно и необходимо. Тут же стоит упомянуть о том, что с текстом (точнее - с его форматированием, версткой) работают еще и специализированные версточные программы, которые выдают результат в виде, пригодном для типографской печати. Я не буду касаться в этой статье описания таких программ - просто перечислю несколько самых распространенных: Adobe PageMaker, Corel Ventura Publisher, Quark XPress, Adobe InDesign, CorelDRAW, Macromedia FreeHand и так далее... В случае необходимости сверстать какую-нибудь книгу или брошюру лучше всего воспользоваться услугами профессионала (или стать таковым!), который знает лучшие из верстальных программ. Такие программы как правило сохраняют результаты работы в собственных проприетарных файлах, связанных с печатными устройствами. Самый распространенный, от Adobe, формат таких файлов (который чаще всего используется для совместимости) - это EPS (Encapsulated PostScript).

Вернемся к форматам текстовых файлов. Кроме упомянутых выше, существует еще целый ряд универсальных форматов. Например, RTF,

Rich Text Format  или «формат обогащённого текста» (rich с английского - богатый). Это свободный межплатформенный формат хранения размеченных (то есть - отформатированных) текстовых документов, предложенный Microsoft еще в 1987 году и с тех пор постоянно меняющийся. Форматирование в RTF-файлах осуществляется за счет специальных (универсальных) команд, предваряющих или завершающих тот или иной фрагмент. Синтаксис формата RTF сильно напоминает формат LaTeX, специализированный редактор для ученых. Изучив эти команды, можно читать RTF-файлы в обычных текстовых редакторах, понимая форматирование текста. RTF-файлы обычно используют для универсальности и переноса отформатированного текста из одного редактора в другой, с одной платформы (операционной системы) на другую.

Если сравнить размер, например, Windows'ного DOC-файла с размером RTF-файла, полученного из него с помощью команды «Сохранить как...», окажется, что последний больше первого во много раз и, вдобавок, совсем не факт, что RTF-файл сохранит все нюансы форматирования. Но на сегодняшний день это, пожалуй, лучший из способов переноса отформатированного текста.

Редактор WordPad, встроенный в Microsoft Windows, по умолчанию сохраняет документы в формате RTF. Текстовые редакторы AbiWord и OpenOffice.org позволяют просматривать и редактировать файлы в формате RTF. По умолчанию редактор в Mac OS X - TextEdit, - также поддерживает RTF.

Отдельно стоит сказать, что сегодня, в век Интернета, очень много текстов готовится для публикации на сайтах и для этого текст переводят (или изначально создают) в интернет-форматах, основой для которых является язык HTML.

Снова цитирую начало статьи - для тех, кто не хочет лезть в Википедию:

«HTML (от англ. HyperText Markup Language - «язык разметки гипертекста») - стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц создаются при помощи языка HTML (или XHTML). Язык HTML интерпретируется браузером и отображается в виде документа, в удобной для человека форме.

HTML является приложением SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879».

HTML-файлы создаются специализированными редакторами, но могут генерироваться и редакторами универсальными, тем же Microsoft Word. Более того, такие файлы можно создавать и в простейших текстовых редакторах, просто добавляя в нужных местах нужные команды, так называемые теги, которые будут интерпретироваться тем или иным браузером. В эпоху браузерных войн, не все браузеры понимали все теги, и мы могли частенько на какой-нибудь веб-странице увидеть просьбу смотреть ее каким-либо определенным браузером.

Одним из главных открытий HTML (или WEB целиком) является язык гиперссылок, когда нажимая на соответствующим образом обставленное тегами слово (для вас оно выглядит просто окрашенным в другой цвет), вы попадаете в нужное место на этой странице, или на другом сайте. Так же легко можно пойти по гиперссылкам дальше или вернуться назад.

Гиперссылки оказались столь удобны, что на их основе (и на основе элементов XML) появились специальные «книжные» форматы, применяемые как в софтовых читальных программах, так и в «железных» электронных книгах. Они дают возможность легко переходить от текста к примечанию и назад, перемещаться по главам, вставлять в текст иллюстрации и многое другое. В России особенно распространен формат fb2 - FictionBook, - именно в нем в Сети представлены едва ли не 90 процентов книг. Существует целый ряд бесплатных конвертеров, позволяющих переводить файлы DOC, RTF, TXT, HTML, и если вы намереваетесь выложить в Сеть для самого широкого распространения оцифрованную, распознанную и отформатированную вами книгу, имеет смысл перевести ее в формат fb2.

Электронные книги LBook изначально понимают формат fb2, причем, не только чистый, но и упакованный в ZIP-архив (т.к. сжатие бережет место). Электронные книги от Sony используют несколько другой, но очень похожий по структуре формат файлов: BBeB Book (LRF). Поскольку «железные читалки» получают всё большее распространение, на эти форматы тоже стоит обратить внимание.

Звуковые файлы

Форматы файлов, хранящих в себе оцифрованный звук, можно подразделить на три категории: несжатые, сжатые с потерями и сжатые без потерь. Оставим в стороне нефайловую запись звука, точнее — запись в специальных форматах: CD, DVD Audio и SACD, содержащиеся на соответствующих дисках. Для преобразования первых из них в стандартные файлы (и наоборот) существует множество программ, в том числе и бесплатных.

Проблемы записи звука отдельная большая тема, не укладывающаяся в текущую серию статей. Упомянем только, что есть два основных вида оцифровки звука: в процессе записи и уже сделанных аналоговых записей, по преимуществу — с магнитных лент, грампластинок и даже с валиков фонографа. Современные звукозаписывающие комплексы, сложные и дорогие, обычно уже имеют в своем составе устройства для цифровой записи звука, включая многоканальный. Впрочем, качественно оцифровывать аналоговые записи можно и на недорогой аппаратуре. К ним можно отнести вставные компьютерные платы, звуковые карты, мощности которых на современных компьютерах вполне хватает для «правильной» оцифровки звука. Правда, если эти карты находятся внутри компьютера или интегрированы в материнские платы,  бывает трудно избежать разного рода наводок. В связи с этим для оцифровки высшего качества лучше всего пользоваться внешними устройствами.

Самым распространенным стандартом записи звука без сжатия можно считать формат LPCM — Linear pulse code modulation или, по-русски, Линейная импульсно-кодовая модуляция. Он применяется, в разных модификациях, на CD, DVD Audio и Video и на Blu-Ray дисках. Чтобы иметь представление о том, как вообще оцифровывается звук, мы должны представлять процесс. Звук можно представить графически в виде некой кривой, близкой к синусоиде. В процессе записи с определенными, сравнительно очень короткими, интервалами, измеряются координаты точек этой кривой.  Этот процесс называется квантованием. Каждое значение (уровень звука) укладывается на специальную дискретную шкалу, имеющую число ступеней, кратное степени двойки, например, 8, 16, 32, 64 и так далее. Так, в CD используется 16-битное квантование, в DVD Audio — до 24-битного, в формате Ogg Vorbis— до 32-бит, и значения округляются до ближайшего на шкале.

Согласно знаменитой теореме Котельникова (известной также, на Западе, как теорема Найквиста), если аналоговый сигнал x(t) имеет ограниченный спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчётам, взятым с частотой  удвоенной максимальной частоты спектра.

Принято считать, что человеческое ухо, даже молодое и чувствительное, не способно различать частоты выше 20 кГц. Поэтому для того, чтобы в точности восстановить оцифрованный звук, достаточно цифровать его с двойной частотой. При появлении CD за предельно необходимую частоту оцифровки, как стандарт, была принята, величина в 44,1 кГц. Однако люди с абсолютным слухом замечают некую «деревянность», неточность звука с компакт-дисков. Причина в том, что теорема Котельникова относится к идеальному случаю бесконечной длительности сигнала и отсутствию в нем составляющих, пусть даже не слышных ухом, но выходящих за пределы установленной нами частоты. В реальных условиях записи живого звука эти «идеальности» то и дело нарушаются, что и приводит к не вполне точному (хотя для большинства достаточному) восстановлению звука. Для преодоления этих ограничений возникли новые звуковые форматы с заметно большей частотой дискретизации: 48, 96 и даже 192 кГц. Идеального восстановления все равно не получилось, но его точность увеличилась во много раз.

Здесь же отметим, что, кроме LPCM, существует и другой, менее распространенный, принцип оцифровки звука: дифференциальная или (дельта) импульсно-кодовая модуляция, при которой измеряется не каждое значение звуковой кривой, а только разность между предыдущим и текущим значениями. Грубо говоря, записывается не сама кривая, а график ее производных. Такой способ кодировки используется в дисках SACD (Super Audio Compact Disc), где частота дискретизации поднята до невероятных 28224 кГц, зато значения отсчетов могут быть только единичкой или нулем.

Результаты LPCM оцифровки обычно записываются в файлы формата WAV - от «волны», символизирующей ту самую кривую изображения звука (формат предложен Microsoft и IBM). Это, с одной стороны, один из самых точных форматов записи оцифрованного звука, с другой — самый громоздкий. В нем одна минута записи звука с качеством CD (частота дискретизации 44,1 кГц, 16-битное квантование, два канала) занимает около 5 Мегабайтов. Тем не менее, для сохранения уникальных звуковых записей имеет смысл пользоваться именно этим форматом, стандартным, то есть понимаемым большинством звуковых редакторов и проигрывателей и пригодным для редактирования без ухудшения качества, причем, возможно, не ограничиваться CD-параметрами, а поднимать дискретизацию хотя бы до 48 кГц, а квантование — до 24-битного.

Если оригинал уже где-то надежно сохранен, а звуковые файлы надо раздавать, выкладывать в Интернет, записывать на флэшки и компакт-диски, имеет смысл воспользоваться одним из распространенных способов сжатия звука. На сегодняшний день более других популярны форматы mp3 (MPEG-1 Layer III), AAC (Advanced Audio Coding), майкрософтовский WMA (Windows Media Audio), сониевский ATRAC (Adaptive Transform Acoustic Coding), Ogg Vorbis и целый ряд других.

Хотя все эти форматы отличаются один от другого в тонкостях алгоритмов сжатия звука, но смысл сжатия один у всех: поступиться некоторой точностью воспроизведения звука в деталях, которые не заметны подавляющему большинству людей.

Позволю себе небольшое отступление. В одной из автомобильных магнитол от Sony обнаружилась кнопка, улучшающая воспроизведение сжатых звуковых файлов. Это происходит за счет хорошего знания алгоритмов сжатия, предположения, в каких местах какие будут потери и восполнение этих потерь смоделированным звуком. Я взял оригинальный компакт-диск (CD) и сжал его содержание в формат WMA. Оригинал вставил в чейнджер в багажнике, сжатую копию вставил в дисковод самой магнитолы. И проверил «на разницу» добрый десяток своих знакомых, некоторые из которых по праву считались знатоками звука. В десяти случаях из десяти при отключенной «улучшалке» предпочтение отдавалось оригинальному диску, но в тех же десяти — при включенной «улучшалке” — сжатому звуку. Конечно, как бы его не улучшали, он всегда проиграет по точности оригиналу, но по человеческому восприятию, как видно из эксперимента, — всегда же выиграет.

При такой незначительной разнице в восприятии, разница в «весе» поразительная. Файл, сжатый не самым эффективным алгоритмом mp3 с потоком 128 кбит/с (максимально — до 320) весит в десять (!) раз меньше, чем несжатый. Более современные и совершенные алгоритмы сжатия позволяют получать тот же самый эффект при меньшем размере или учший при одинаковом.

Отдельно стоит назвать целый ряд специальных алгоритмов сжатия речи, применяющихся в телефонии, по преимуществу, сотовой или IP.

Еще существует ряд форматов сжатия звука, применяющихся при производстве DVD и BD фильмов. Это в большинстве своем, многоканальные (5.1, 6.1 и 7.1) форматы, использующие сжатый звук. Самый известный из них —  AC3 или Dolby Digital с максимальным потоком в 448 кбит/с и DTS (Digital Theater System) с максимальным общим потоком звука до 1,536 кбит/с. Современные звуковые форматы для BD: Dolby Digital Plus, Dolby TrueHD, DTS-HD High Resolution и DTS-HD Master Audio, — являются развитием DVD форматов, где увеличивая число возможных каналов или частоту дискретизации каждого или применяя сжатие звука без потерь. При сжатии звука, как правило, ведется протокол процесса, а потом на воспроизведение передается и сжатый файл, и протокол, согласно которому звук восстанавливается до оригинального или практически до оригинального.

Впрочем, понимание тонкостей этого формата вам понадобится не раньше, чем вы возьметесь за создание собственных DVD или BD фильмов. Кстати замечу, что всё большее количество BD фильмов сопровождается несжатым LPCM звуком, только теперь не стерео, а многоканальным, — поскольку на BD места достаточно.

Последние форматы, которых хотелось бы коснуться — чисто звуковые файлы, сжатые без потерь. Для сжатия используются алгоритмы, аналогичные LZW сжатию графических TIFF файлов или сжатию любых данных алгоритмами ZIP и RAR. Главная беда подобных алгоритмов, то, что они позволяют обычно сэкономить не больше 25-30 процентов места, а времени, особенно на кодирование, требуют заметного. Обычно такие алгоритмы применяются для выкладывания CD в файлообменные сети, где люди стараются экономить трафик.

Практически всё, что вам надо знать об этих форматах и файлах, находится по этому адресу, но, поскольку текста там совсем немного (хотя много углубляющих знание, полезных ссылок), я позволю себе привести этот текст целиком.

«В ряде случаев возникает необходимость сжать звуковые данные так, чтобы их было удобнее перенести на том или ином носителе или передать через Интернет, но при этом качество их сохранялось таким же. С этой целью используются алгоритмы (кодеки) сжатия без потерь или lossless-кодеки, обеспечивающие уменьшение объёма данных на 20-35%.

Очень популярным и одним из немногих свободных кодеков сжатия без потерь является FLAC (Free Lossless Audio Codec). Принцип его действия весьма обстоятельно изложен в документации на русском языке, входящей в состав пакета flac, содержащего средства кодирования и декодирования. Файлы в формате FLAC можно воспроизводить в различных проигрывателях, например XMMS (пакет xmms-in-flac).

Другие свободные форматы поддерживаются меньше. Это Musepack, True Audio и WavPack.

Достаточно популярным, но несвободным является lossless-формат Monkey's Audio (файлы с раширением ape). Пакет, обеспечивающий поддержку данного формата в XMMS называется xmms-in-mac».

Видео файлы

Несколько лет назад по миру начался победный марш «Видео Высокой Четкости» (HDV, High Definition Video), одной из ветвей которого можно считать Телевидение Высокой Четкости HDTV. (Не путать со стандартом любительских видеокамер высокого разрешения - HDV, который предполагает анаморфный формат кадра 1440х1080, применение кодека MPEG-2 и запись на цифровую ленту в кассете).

В лучшем и высшем качестве, так называемом Full HD, 1920×1080 пикселей или элементарных точек, площадь кадра HDV, по сравнению со стандартным кадром (SD, 720×576), - впятеро больше, что позволяет повысить количество зрительной информации и создать впечатление «гладкой картинки», которой на SD - из-за небольшого разрешения и чересстрочной структуры изображения (сначала на экран подаются нечетные строки картинки, затем - четные) добиться было практически невозможно, даже применяя разного рода программные и аппаратные ухищрения. Поэтому, приглядевшись, вы всегда заметите на стандартных видеокартинках некую строчность. Правда, вводя стандарты HDV, производители пока что толком не обеспокоились тем, чтобы пропорционально выросшей площади картинки увеличились каналы, передающие информацию, так что зачастую (впрочем, далеко не всегда) бывает так, что видео-картинка HDV подается на экран потоком меньшим, чем подавалась «cтандартная». И тем не менее, зрительское ощущение от первой всегда оказывается куда лучше, чем от последней. Причин тому, как минимум, две: реальное увеличение видимых точек картинки уже само по себе создает впечатление большей четкости, а применяемые в видео HDV алгоритмы сжатия более совершенны, чем те, что применялись в SD.

Вообще говоря, в профессиональном кино, и при изначально цифровой съемке, и при сканировании пленки, - применяются и большие разрешения: 2K (2048×1080) и 4K (4096×2160). Существуют и соответствующие профессиональные проекторы.

При применении Full HD аппаратов для просмотра (плазменных и жидкокристаллических дисплеев, проекторов) и используя качественные оригиналы (сегодня в быту это - BD или Blu-Ray диски, вмещающие до 50 Гб информации: сравните с DVD - до 9 Гб), можно видеть картинку, практически соответствующую «разрешению» нашего глаза, то есть можно считать, что в принципе, на стандарте, при разрешении 1080р и потоке - до 50 мбит/сек, идеал качества цифрового видео уже достигнут. Поэтому, даже если у вас нет пока должных дисплеев и/или проекторов, снимать цифровое видео или сканировать (цифровать) кино, снятое на пленку, имеет смысл именно в HD-формате.

Для съемки HD-видео сегодня на рынке существует множество видеокамер, - простейшие, за 180 долларов, сложно-любительски, за полторы-две тысячи и профессиональные за многие десятки, а то и сотни тысяч долларов. Надо иметь в виду, что, применяя сравнительно недорогие камеры, вы, по сравнению с SD-камерами, конечно, добьетесь улучшения картинки, но настоящей, «звенящей», не получите: для этого нужна специальная съемочная «обвязка» (тележки, краны, штативы, стэдикамы), и изначально толстый видео-поток (лучшие из сегодняшних любительских камер не позволяют ему быть выше 25 мбит/сек, в то время как максимум - 50!), и специальное оборудование для «правильного» сжатия видео. Правда, в последнее время, стали появляться паллиативные решения. Например, цифровой фотоаппарат от Canon - Eos 5D Mark II, - позволяет вести и HD-видеосъемку в Full HD при конченом потоке данных в максимальные 25 мбит/сек. У него, к сожалению, нет ни следящего автофокуса, ни меняющейся экспозиции, так что съемка с его помощью подобна съемке профессионального кино, где оператору ассистируют два-три помощника, но, не исключено, что в «музейных» целях ради получения сравнительно недорогого высококачественного видео, стоит пойти на такие неудобства.

Что касается оцифровки кинопленки, - автору неизвестна недорогая, любительская аппаратура, решающая эту задачу, - даже в случае с любительскими, 8-ми или 16-миллиметровыми камерами. Однако существуют специальные лаборатории, занимающиеся исключительно этим. Услуги, ими оказываемые - недешевы, однако результаты - более чем удовлетворительны. При этом надо иметь в виду, что кинопленка, как аналоговый носитель,  подвержена разрушающему влиянию времени: на ней возникают царапины, склеенные разрывы, выцветает краска и тому подобное. Поэтому, получив видеоматериал оцифрованный с кинопленки, его следует подвергнуть серьезной, где - полуавтоматической, но чаще всего - ручной обработке.

Чаще всего приходится встречаться с более простой задачей: переводом в цифровой формат аналоговых видеокассет, обычно - VHS-формата. Это дело несложное и недорогое и посильно и дома, и на самом  микроскопическом предприятии. По вполне разумным ценам (от ста до, максимум, тысячи долларов) на рынке имеются видеооцифровщики, как внешние, так и на платах, встраеваемых внутрь компьютера. Очень часто оцифровщики видео входят в состав, например, телевизионных тюнеров и могут оцифровывать видео не только со внешнего источника, но и прямо с эфира. Более того, сейчас на рынках появляется множество бытовых видеорекордеров, позволяющих оцифровывать видеосигнал от VHS-видеоплееров, а так же имеющих плееры внутри собственного корпуса. Результаты оцифровки сохраняются обычно на встроенном в видеорекордер жестком диске и могут сниматься с него либо по кабелю, либо - напрямую записываться на DVD.

Надо иметь в виду, что VHS-записи, как правило, невысокого качества и заметно уступают качеству DVD, - так что в этом случае гнаться при оцифровке за «Высокой Четкостью» не имеет никакого смысла. Другой разговор, что несовершенства аналоговой записи имеют иную природу, чем несовершенства цифровой и последующего сжатия оцифрованного оригинала, - так что в идеале нужно стремиться к минимизации несовершенства, а не накладывать одно на другое.

Стандартное видео (SD) мы просматриваем, обычно, на DVD-плеерах в динамически сжатом виде, по алгоритму MPEG-2. Динамическое сжатие обозначает, что реально фиксируется только каждый пятнадцатый кадр, все остальные рассчитываются, исходя из предсказаний и разностной информации (то есть записываются только изменения, произошедшие от кадра к кадру). Глазу такое сжатие не слишком заметно (хотя глаз тренированный мгновенно его узнает), однако всякая дальнейшая работа с динамически сжатым видео будет неизбежно приводить к его ухудшению, порче (например, в случае использования сжатых с потерями графических файлов JPEG). Так, если вы цифруете видео с расчетом на его дальнейшее хранение как нечто уникальное и важное, - имеет смысл первоначальную оцифровку провести без динамического сжатия. (Потом, чтобы облегчить широкий просмотр, обработанный материал всё равно придется сжимать). Такую возможность предоставляет стандарт DV, в котором работают очень многие SD-видеокамеры (некоторые из них, кстати, тоже умеют цифровать анналоговый видеосигнал - с той же, скажем VHS). Стандарт хорош тем, что во-первых, практически не имеет никаких настроек, так что испортить видео неквалифицированным вмешательством почти невозможно; и во-вторых, стандарт не применяет динамического сжатия, только статическое: записывается каждый кадр, но - сжимается по принципу JPEG. Таким образом, полученное в формате DV видео можно почти безболезненно подвергать последующему монтажу и наложению разного рода эффектов. Однако, оцифровщиков, умеющих цифровать видео в стандарте DV, на рынке становится всё меньше, - в основном, они записывают результат в динамически сжатом виде. Существуют сравнительно дорогие, тысячедолларовые, оцифровщики, которые не сжимают видео даже статически, - конечно, при этом заметно возрастает объем видеокадров, достигая гигабайта на одну минуту видео. В крайнем случае, стоит раздобыть SD-видеокамеру с умением цифровать аналоговый сигнал (то есть у нее должен быть не только аналоговый видеовыход, но и аналоговый видеовход).

Расширений у видеофайлов - особенно, учитывая появление HDV, - великое множество. Некоторые из них соотносятся с создавшими файлы кодеками (программами кодирования и, как правило, сжатия видео), но большинство являются так называемыми «контейнерами», которые могут вмещать в себя видео, звук, субтитры, произведенные самыми разными кодеками. Один из наиболее распространенных контейнеров - AVI (Audio Video Interleave, Чередование Аудио и Видео), впервые использованный Microsoft в 1992 году. Сегодня на фронте «Видео Высокой Четкости», всё большее распространение получает контейнер «Матрёшка» (Matroska) с расширением MKV. Для поклонников Apple существует универсальный контейнер MOV, предназначенный, в первую очередь, для QuickTime - собственной технологии Apple Computer.

Кодеков, чьи произведения упаковываются в один из контейнеров или идут под расширениями, происходящими из имен кодеков, - великое множество. Широко распространенный, поскольку именно с его помощью создаются, например, DVD, - MPEG-2. Из большого семейства стандартов MPEG-4 наиболее популярны DivX, Xvid, Nero Digital и 3ivx; для сжатия видео HDV часто используется MPEG-4 part 10/MPEG-4 AVC/H.264 или Advanced Video Coding.

Увы, «Видео Высокой Четкости», в доступных аппаратно-программных вариантах, не имеет несжатого формата, подобного DV, так что вы всегда должны быть готовы к тому, что любые монтажные манипуляции с ним будут приводить к некоторому ухудшению качества.