Восстановление информации
 
Блог
 
Восстановление файлов с помощью контентного анализа


Восстановление файлов с помощью контентного анализа


Февраль, 2013 Теги: , , , , ,

Контентный анализ диска – один из столпов современной индустрии восстановления информации. С помощью контентного анализа возможно восстановление даже таких файлов, информация о которых не появляется в файловой системе – например, в случае форматирования диска, уничтожения или повреждения файловой системы, наконец – в случаях, если файлы были удалены длительное время назад.

Signature Search

Алгоритм поиска файлов с помощью контентного анализа

Рассмотрим работу алгоритма контентного анализа на примере программы по восстановлению файлов с дисков и флеш-карт, отформатированных под файловую систему FAT. Starus FAT Recovery способна находить файлы нескольких сотен разновидностей. Ниже приведена работа алгоритма контентного анализа при сканировании диска.

  1. Детектирование. В режиме детектирования алгоритм сканирует диск в поисках известных программе файловых сигнатур. К примеру, фотографии в популярном формате JPEG всегда имеют сигнатуру «JFIF», по которой можно определить факт наличия файла на диске.
  2. Идентификация. Обнаружение сигнатуры – ещё далеко не всё. Некоторые сигнатуры настолько короткие, что в процессе сканирования диска будут многократно встречаться ложные срабатывания. Некоторые сигнатуры пересекаются между различными типами файлов, а некоторые встречаются неоднократно в одном файле. Для точного определения типа найденного файла проводятся дополнительные проверки – например, перекрёстные проверки данных, взятых из заголовка файла и фактически считанной информации.
  3. Анализ. Для определения точного размера файла в байтах проводится разбор и анализ его заголовка. Результат – точное число байт, обозначающее размер файла.
  4. Определение местоположения файла на диске. С помощью данных, полученных из заголовка файла, определён его точный размер, а наличие файловой сигнатуры идентифицирует начало файла. Основываясь на этих данных, программа вычисляет те секторы на диске, которые предположительно занимает данный файл. Важно отметить, что вычисления эти базируются на некоторых предположениях, которые далеко не всегда истинны. В частности, предполагается, что весь файл целиком хранится в виде одного непрерывного фрагмента, что не всегда соответствует действительности ввиду фрагментации диска. Кроме того, некоторые секторы могут принадлежать другим файлам – при наличии файловой системы этот факт легко проверить, но если файловая система повреждена или отсутствует – остаётся лишь предполагать, что все данные принадлежат именно тому файлу, который восстанавливается в данный момент.

Ограничения контентного анализа

Увы, контентный анализ диска – не панацея, а скорее инструмент последней надежды. При серьёзных повреждениях файловой системы только таким образом и можно восстановить хотя бы часть файлов.

С помощью контентного анализа можно восстановить не все данные, а только те, информация о которых есть в базе данных соответствующей программы. К примеру, в базе данных Starus FAT Recovery есть информация о более чем 250 форматах файлов, включая наиболее распространённые DOC/DOCX, XLS/XLSX, JPEG/JPG, RAW и множество других.

Важно отметить, что некоторые типы файлов методом контентного анализа невозможно восстановить принципиально. В частности, зашифрованные файлы специально создаются таким образом, чтобы не обладать повторяющимися сигнатурами. Многие файлы логов, двоичные форматы, некоторые базы данных также не обладают сигнатурами, что делает невозможным их обнаружение на диске.

Другим ограничением является фрагментация диска. Как было показано выше, методом контентного анализа без проблем можно восстановить только файлы, сохранённые в виде одного непрерывного фрагмента. Фрагментированный файл может быть полностью восстановлен только при наличии неповреждённой записи о нём в файловой системе.

В любом случае в Вашем распоряжении всегда есть инструменты восстановления Starus Recovery, которые эффективно выполнят поиск необходимых файлов и представят вам полный отчет о возможности вернуть вашим данным вторую жизнь!

Комментирование закрыто.

^