Сжатие данных
план-конспект занятия

Шарапов Николай Николаевич

Архивирование файлов


Сжатие информации – алгоритмическое преобразование исходных данных, производимых с целью уменьшения занимаемого ими объема.

Виды сжатия информации:

  • Сжатие с потерями – вид сжатия данных, при использовании которого распакованные данные отличаются от исходных, но степень отличия не существенна, с точки зрения их дальнейшего использования.

Сжатие JPEG (квантизер - 90%).
Размер - 1,29 мб.

Сжатие JPEG (квантизер - 10%).
Размер - 183 кб.



Примеры сжатия данных с потерями: краткое содержание литературного произведения, jpeg, mpeg, mp3

  • Сжатие без потерь - метод сжатия данных, при использовании которого распакованные данные однозначно могут быть восстановлены с точностью до бита.

Портрет формат без сжатия.
Размер - 28,8 мб.

Портрет сжатие без потерь.
Размер - 7,5 мб.



Примеры сжатия данных без потерь: архивы (zip, rar, 7z, и др.), png, WebM, flac

Коэффициент сжатия (Степень сжатия) – отношение размера исходных данных к размеру сжатых данных. Показывает, во сколько раз были сжаты данные.

k=SO/SC ,

(где Sо - объём исходных данных, а Sс - объём сжатых)



В зависимости от типа сжимаемых данных коэффициент сжатия может сильно отличаться. Например: видеопоток, к которому уже было применено сжатие кодеком (HEVC) будет сжиматься крайне слабо, а большое количество несжатых текстовых документов (книг) даст очень высокий коэффициент сжатия в десятки, сотни раз.

Архивирование файлов – процесс упаковки нескольких файлов в один файл-контейнер, именуемый архивом. Архивирование производится как с сжатием, так и без него.

Архиватор – программа для упаковки и распаковки файлов-контейнеров (архивов), часто с возможностью сжатия информации в них.

Распространённые архиваторы: 7 ZIP [GNU], WINZIP [PROP], WINRAR [PROP].

Распространённые форматы архивов: .7Z, .ZIP, .RAR, .TAR, .GZ, .ARJ

Архивы различаются по степени сжатия (коэффициенту сжатия) и скорости запаковки/распаковки. Обычно, чем сильнее сжаты данные, тем более сложный алгоритм при этом используется и скорость обработки падает.

Для обеспечения безопасности данных создают архив с шифрованием, для доступа к которому потребуется ключ (пароль).

Разновидности архивов:
Самораспаковывающийся архив (SFX) - файл, содержащий в себе запакованные данные, а также исполняемый код для распаковки. Не требует ни навыков работы с архиватором, ни наличия самого архиватора. Важно: большинство мессенджеров и браузеров блокируют или предупреждают о потенциальном вреде исполняемых файлов, прикреплённых к сообщениям. Т.е. получатель может принять SFX-архив за спам или за вирус.

Неприрывный архив - все упакованные файлы рассматриваются как один неприрывный поток данных. Это позволяет получить больший коэффициент сжатия, но уменьшается скорость обработки и архив становится менее устойчивым к повреждениям.

Многотомный архив - сохранение массива файлов в архив, разделённый на отдельные части фиксированного размера. У такого архива есть две задачи:
1. Более высокая защита от повреждений данных;
2. Возможность упаковки массива по частям на различные съёмные носители.

MultiPacked - многократно упакованные различными алгоритмами файлы. Теоретически позволяет получить бОльший коэффициент сжатия, но пропорционально увеличивает время упаковки/распаковки.
Частный случай упаковки двумя алгоритмами: архив .tgz, файлы в нём были индивидуально сжаты утилитой gzip, затем упакованы в один архив утилитой tar.


Интересно:
Zip-бомба - вредоносный файл очень малого размера (~46 кб), при распаковке которого на устройство, разворачиваются данные размером 4,5 Пб. Процесс распаковки Zip-бомбы временно выводит из работоспособного состояния устройство любой производительности, т.к. занимает все его доступные ресурсы.

Многократное сжатие с шифрованием является одним из распространённых методов полиморфизма у компьютерных вирусов, применяемого для защиты вируса от обнаружения антивирусным сканером.

Вопросы для самоконтроля

Простые вопросы:- что такое архивирование?
- что такое сжатие с потерями?
- что такое сжатие без потерь?
- что такое архиватор?
- что такое архив (в компьютерной терминологии)?
- для чего можно использовать архив с уровнем сжатия - «Без сжатия»?
- как влияет на скорость сжатия/распаковки степень сжатия?
- как степень сжатия влияет на размер конечного файла?
- что показывает коэффициент сжатия?
Сложные вопросы:
- что дает многократное сжатие?
- какие достоинства и недостатки есть у самораспаковывающегося архива?
- что такое Непрерывный архив (Solid-архив)?
- что такое Многотомный архив?

Шарапов Н.Н.
 

 

Скачать:

ВложениеРазмер
PDF icon arhivirovanie.pdf123.43 КБ

Предварительный просмотр:

По теме: методические разработки, презентации и конспекты

ТЕСТ Баллоны для сжатых и сжиженных газов

ТЕСТ Баллоны для сжатых и сжиженных газовМДК 02.02. Технология газовой сваркиПМ.02.  Сварка и резка деталей из различных сталей, цветных металлов и их сплавов, чугунов во всех пространственн...

Редукторы для сжатого кислорода

ТЕСТ Редукторы для сжатого кислородаМДК 02.02. Технология газовой сваркиПМ.02.  Сварка и резка деталей из различных сталей, цветных металлов и их сплавов, чугунов во всех пространственных по...

Медиапособие №3 Расчет пружин сжатия

Медиапособие по выполнению практической работы...

конспект занятия МДК 01.01. Тема 2.1. Основы проектирования строительных конструкций.. Практическое занятие по теме 4. Основы расчета строительных конструкций, работающих на сжатие. Расчет стальных колонн.

МДК 01.01. Тема 2.1. Основы проектирования строительных конструкций.  Тема 2.1. Основы проектирования строительных конструкций. Практическое занятие по теме 4. Основы расчета строительных  к...

Расчеты на прочность при растяжении и сжатии

Развитие математического мышления студентов при проведении практической работы “Расчеты на прочность при растяжении и сжатии...