В прошлом году вышли Narrative Clip и Autographer, в этом году должны выйти Google Glass — всё это говорит о том, что к массовому рынку приближаются технологии, обеспечивающие непрерывную фото- и видеосъёмку всей нашей повседневной жизни. Эти гаджеты могут генерировать подробные визуальные дневники, помогать нам совершенствоваться и улучшать память. Но как насчёт съёмки в ванной или на чувствительной рабочей встрече?
Многим людям эта мысль не понравится, и компьютерщики из университета Индианы разработали ПО, которое с помощью технологии компьютерного зрения автоматически идентифицирует потенциально конфиденциальные или нежелательные фотографии, снятые на такие устройства, и запрещает их публикацию. Прототип этой программы под названием PlaceAvoider будет представлен на симпозиуме по сетевым и распределённым системам безопасности, который пройдёт в феврале в Сан-Диего.
На ручное редактирование тысяч изображений, которые могут генерировать такие устройства, просто нет времени, а в социально связанном мире это может привести к непреднамеренной публикации фотографий, которые вы не хотели публиковать, — говорит Апу Кападия (Apu Kapadia), один из руководителей проекта. — Те, кого это беспокоит, могут просто не публиковать трансляцию своей жизни, поэтому мы хотим помочь людям использовать максимум возможностей таких приложений, дав им возможность безопасной публикации.
Группа Кападии в самом начале признала невозможность создания такого алгоритма, который бы определял чувствительные картинки только исходя из визуального содержимого, поскольку у всех людей разные предпочтения в части того, что публиковать, а что нет, и это сложно поддаётся определению. Разработчики создали ПО, которое обучается самими пользователями. В частности, пользователь должен сфотографировать те комнаты, которые нужно поместить в чёрный список. Затем PlaceAvoider помечает все новые фотографии, снятые в этих комнатах, и даёт пользователю их просмотреть.
В системе используется уже известный алгоритм компьютерного зрения под названием SIFT (scale-invariant feature transform — преобразование масштабонезависимых особенностей). С его помощью на обучающих изображениях определяются области высокого контраста вокруг углов и граней, которые с большой вероятностью будут визуально одинаковы даже при разной освещённости и с разных точек зрения. Для каждой такой области генерируется «числовой отпечаток пальца» из 128 разных чисел, описывающих характеристики вроде цвета, текстуры и положения по отношению к другим областям изображения. Поскольку иногда изображения нерезкие, PlaceAvoider также учитывает более общие характеристики, такие как цвет и текстура стен и ковров, а также последовательность кадров.
В тестах точность определения соответствия изображений из домов и рабочих мест исследователей чёрному списку составила 89,8%.
На данный момент PlaceAvoider является исследовательским прототипом. Ряд её компонентов, хотя уже написаны, пока не собраны в законченный продукт, при этом разработчики используют смартфон, повешенный на шею, а не реальный гаджет для лайфлоггинга. Если адаптировать PlaceAvoider для такого гаджета, можно создать отдельный интерфейс, который будет помечать потенциально чувствительные изображения сразу же после съёмки или помещать их на карантин для дальнейшей обработки.
Технологии анализа изображений в этой системе могут пригодиться и в других областях помимо защиты частной жизни. Например, можно создавать умные фотоколлекции из лучших кадров с важных событий, будь то день рождения или путешествие, — говорит Дэвид Крэндал (David Crandall), другой руководитель проекта. — Выделение фотографий, которые мы не хотим публиковать, — это лишь одна сфера, но если подойти шире, такие алгоритмы можно использовать и для автоматической организации больших коллекций изображений, чтобы сделать их более безопасными и полезными, более удобными для навигации и поиска.
Джонатан Зиттрейн (Jonathan Zittrain), профессор юрфака из Гарварда и основатель Беркмановского центра изучения интернета и общества под эгидой этого вуза, считает PlaceAvoider «многообещающим подходом», который может снять некоторые вредные побочные эффекты лайфлоггинга. Однако он добавляет:
В помощи нуждается не оператор записывающего устройства. Должны быть способы, чтобы люди в общей среде — студенты в классе или сотрудники на совещании — могли выставлять политику по умолчанию в части того, какой ожидается уровень конфиденциальности.
Nik Fleming, MIT Technology Review