-Поиск по дневнику

Поиск сообщений в VolNaVit


Восстановители документов

Пятница, 26 Апреля 2013 г. 22:57 + в цитатник
 

В США названы лучшие восстановители измельчённых документов

Бумагорезательные машины хорошо справляются с уничтожением документов, однако даже они не могут полностью обеспечить конфиденциальность содержавшихся на их страницах данных. Это продемонстрировала группа ученых, выигравшая приз 50 тыс. долларов в конкурсе Shredder Challenge, который организовала американское военное агентство DARPA. 

Согласно условиям конкурса участники (а таковых набралось около 9 тыс.) должны были как можно быстрее восстановить информацию, содержавшуюся в пяти различных документах (DARPA предоставляет возможность виртуально потренироваться в этом на своем сайте).

В итоге команде из трех разработчиков программного обеспечения, работающих в Lockheed Martin, удалось собрать паззл на два дня раньше, чем ожидалось. Для восстановления содержимого документов специалисты сначала отсканировали каждый фрагмент разрезанного листа, получили его уникальные характеристики, и реконструировали на компьютере документ. После этого кусочки бумаги были собраны вручную, сообщает Techcrunch.

 

Команда-победитель обошла почти 9000 соперничающих групп. Перед вами один из восстановленных документов. Несмотря на неполную реконструкцию, «детективы» сумели понять, о чём идёт речь в этой бумаге (иллюстрация Shredder Challenge/DARPA).

Победитель соревнования по реконструкции текстов, пропущенных через шредер, стал известен намного раньше, чем ожидалось. Чемпионы-сыщики проявили изобретательность и смекалку.

Стартовавший в конце октября конкурс по воссозданию измельчённых документов Shredder Challenge завершён.

Первое место и призовые $50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США» (All Your Shreds Are Belong To U.S.). Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И ещё она первой ответила на связанные с загадками вопросы относительно городов и людей, упоминаемых в текстах.

 

Исходный и реконструированный победителем текст номер 1. Он был разбит всего на 224 кусочка (дальше степень измельчения пазлов шла по нарастающей), потому данную бумагу команда собрала уже 6 ноября (иллюстрация Shredder Challenge/DARPA).

Ключом к успешному решению задания оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков, сообщает устроившее конкурс агентство DARPA. Программа-победитель подбирала отсканированные кусочки бумаг друг к другу лишь вчерне и предъявляла пары для проверки членам команды.

Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросанные по ним подсказки, то есть обращали внимание на смысл складывающихся головоломок.

К примеру, в первом тексте упоминается название фильма, который снял режиссёр Анатоль Литвак в 1937 году. В энциклопедии можно узнать, что в данном году Литвак выпустил две ленты – «Товарищ» и «Женщина, которую я люблю». Товарищ по-английски – comrade, и это как раз то слово, с которого начинается первый документ.

 

Загадка номер пять была самой сложной во всей серии. Здесь было разрезано и перемешано сразу три листка бумаги (на фото показан только третий — до измельчения и после восстановления).
Один из трёх листов был исполосован в направлении, перпендикулярном двум другим, а общее число кусочков составило более шести тысяч! Вдобавок небольшая часть текста представляла собой морзянку в виде нагромождения повторяющихся слов dit и dah. Над этой головоломкой команда победителей колдовала до 29 ноября (иллюстрация Shredder Challenge/DARPA).

Собрав третий документ (на фото под заголовком), участники должны были назвать судьям задуманный в загадке город — Сьенфуэгос.

Интересно, что напрямую в документе этот город не упоминался, но зато там были указаны географические координаты Гаваны, нарисованы очертания Кубы и дан набросок весьма известного городского парка Сьенфуэгоса.

 

Исходный документ номер 3 и скрытые в нём подсказки. Данная бумага была разрезана на 1115 кусочков (иллюстрация Shredder Challenge/DARPA).

При выборе победителя учитывалось не только первенство в сборке пазлов. За те или иные правильные ответы на вопросы по содержанию документов судьи начисляли дополнительные баллы. Группа All Your Shreds Are Belong To U.S. оказалась лучшей не только в деле программирования, но и просто эрудиции, сообразительности.

 

Задача номер два. Умеренное число обрывков – всего 373 — позволило победителям восстановить этот документ быстро и практически на 100% (иллюстрация Shredder Challenge/DARPA).

Своё последнее решение из серии заданий команда из Сан-Франциско прислала всего через 33 дня после анонса конкурса. На составление алгоритма машинного зрения и сортировки обрывков, а также собственно на сборку бумаг умельцы потратили 600 человеко-часов.

Между тем перед стартом соревнования некоторые эксперты DARPA считали предложенные загадки практически нерешаемыми, во всяком случае в столь сжатые сроки.

Однако победители не только опровергли все прогнозы, но и наглядно показали, как из измельчённой мешанины бумаг можно извлекать читабельный текст и разбираться в его смысле даже при недостаче частей документа. А ведь именно это и было нужно инициаторам конкурса, представлявшим интересы военных и спецслужб.

 

Четвёртый пазл (порезанный на 2340 кусочков) поддался победителям лишь частично. Но и восстановленных фрагментов хватило для того, чтобы узнать «имена учёных», работавщих над «секретным проектом» (иллюстрация Shredder Challenge/DARPA).

 

Серия сообщений "Вокруг света":
Часть 1 - Традиции приветствия
Часть 2 - Язык жестов
...
Часть 10 - Памятка для иностранцев: как вести себя с русскими
Часть 11 - 10 мэров, кардинально изменивших свой город
Часть 12 - Восстановители документов
Часть 13 - Ответ офицера
Часть 14 - Топ-37 секретных мест куда сходить в Москве!
Часть 15 - Хочешь быть русским — будь им
Часть 16 - Пароход «Н.В. Гоголь»

Метки:  

 

Добавить комментарий:
Текст комментария: смайлики

Проверка орфографии: (найти ошибки)

Прикрепить картинку:

 Переводить URL в ссылку
 Подписаться на комментарии
 Подписать картинку