Archive org что это такое

HackWare.ru

Этичный хакинг и тестирование на проникновение, информационная безопасность

Веб-архивы Интернета: как искать удалённую информацию и восстанавливать сайты

Что такое Wayback Machine и Архивы Интернета

В этой статье мы рассмотрим Веб Архивы сайтов или Интернет архивы: как искать удалённую с сайтов информацию, как скачать больше несуществующие сайты и другие примеры и случаи использования.

Принцип работы всех Интернет Архивов схожий: кто-то (любой пользователь) указывает страницу для сохранения. Интернет Архив скачивает её, в том числе текст, изображения и стили оформления, а затем сохраняет. По запросу сохранённые страницу могут быть просмотрены из Интернет Архива, при этом не имеет значения, если исходная страница изменилась или сайт в данный момент недоступен или вовсе перестал существовать.

Многие Интернет Архивы хранят несколько версий одной и той же страницы, делая её снимок в разное время. Благодаря этому можно проследить историю изменения сайта или веб-страницы в течение всех лет существования.

В этой статье будет показано, как находить удалённую или изменённую информацию, как использовать Интернет Архивы для восстановления сайтов, отдельных страниц или файлов, а также некоторые другие случае использования.

Wayback Machine — это название одного из популярного веб архива сайтов. Иногда Wayback Machine используется как синоним «Интернет Архив».

Какие существуют веб-архивы Интернета

Я знаю о трёх архивах веб-сайтов (если вы знаете больше, то пишите их в комментариях):

web.archive.org

Этот сервис веб архива ещё известен как Wayback Machine. Имеет разные дополнительные функции, чаще всего используется инструментами по восстановлению сайтов и информации.

Для сохранения страницы в архив перейдите по адресу https://archive.org/web/ введите адрес интересующей вас страницы и нажмите кнопку «SAVE PAGE».

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Для просмотра доступных сохранённых версий веб-страницы, перейдите по адресу https://archive.org/web/, введите адрес интересующей вас страницы или домен веб-сайта и нажмите «BROWSE HISTORY»:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

В самом верху написано, сколько всего снимком страницы сделано, дата первого и последнего снимка.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Затем идёт шкала времени на которой можно выбрать интересующий год, при выборе года, будет обновляться календарь.

Обратите внимание, что календарь показывает не количество изменений на сайте, а количество раз, когда был сделан архив страницы.

Точки на календаре означают разные события, разные цвета несут разный смысл о веб захвате. Голубой означает, что при архивации страницы от веб-сервера был получен код ответа 2nn (всё хорошо); зелёный означает, что архиватор получил статус 3nn (перенаправление); оранжевый означает, что получен статус 4nn (ошибка на стороне клиента, например, страница не найдена), а красный означает, что при архивации получена ошибка 5nn (проблемы на сервере). Вероятно, чаще всего вас должны интересовать голубые и зелёные точки и ссылки.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

При клике на выбранное время, будет открыта ссылка, например, http://web.archive.org/web/20160803222240/https://hackware.ru/ и вам будет показано, как выглядела страница в то время:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Используя эту миниатюру вы сможете переходить к следующему снимку страницы, либо перепрыгнуть к нужной дате:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Лучший способ увидеть все файлы, которые были архивированы для определённого сайта, это открыть ссылку вида http://web.archive.org/*/www.yoursite.com/*, например, http://web.archive.org/*/hackware.ru/

Кроме календаря доступна следующие страницы:

Changes

«Changes» — это инструмент, который вы можете использовать для идентификации и отображения изменений в содержимом заархивированных URL.

Начать вы можете с того, что выберите два различных дня какого-то URL. Для этого кликните на соответствующие точки:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

И нажмите кнопку Compare. В результате будут показаны два варианта страницы. Жёлтый цвет показывает удалённый контент, а голубой цвет показывает добавленный контент.

Summary

В этой вкладке статистика о количестве изменений MIME-типов.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Site Map

Как следует из название, здесь показывается диаграмма карты сайта, используя которую вы можете перейти к архиву интересующей вас страницы.

Поиск по Интернет архиву

Если вместо адреса страницы вы введёте что-то другое, то будет выполнен поиск по архивированным сайтам:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Показ страницы на определённую дату

Кроме использования календаря для перехода к нужной дате, вы можете просмотреть страницу на нужную дату используя ссылку следующего вида: http://web.archive.org/web/ГГГГММДДЧЧММСС/АДРЕС_СТРАНИЦЫ/

Обратите внимание, что в строке ГГГГММДДЧЧММСС можно пропустить любое количество конечных цифр.

Если на нужную дату не найдена архивная копия, то будет показана версия на ближайшую имеющуюся дату.

archive.md

Адреса данного Архива Интернета:

На главной странице говорящие за себя поля:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Для поиска по сохранённым страницам можно как указывать конкретный URL, так и домены, например:

Данный сервис сохраняет следующие части страницы:

Не сохраняются следующие части веб-страниц:

Архивируемая страница и все изображения должны быть менее 50 Мегабайт.

Для каждой архивированной страницы создаётся ссылка вида http://archive.is/XXXXX, где XXXXX это уникальный идентификатор страницы. Также к любой сохранённой странице можно получить доступ следующим образом:

Дату можно продолжить далее, указав часы, минуты и секунды:

Для улучшения читаемости, год, месяц, день, часы, минуты и секунды могут быть разделены точками, тире или двоеточиями:

Также возможно обратиться ко всем снимкам указанного URL:

Все сохранённые страницы домена:

Все сохранённые страницы всех субдоменов

Чтобы обратиться к самой последней версии страницы в архиве или к самой старой, поддерживаются адреса вида:

Чтобы обратиться к определённой части длинной страницы имеется две опции:

В доменах поддерживаются национальные символы:

Обратите внимание, что при создании архивной копии страницы архивируемому сайту отправляется IP адрес человека, создающего снимок страницы. Это делается через заголовок X-Forwarded-For для правильного определения вашего региона и показа соответствующего содержимого.

web-arhive.ru

Архив интернет (Web archive) — это бесплатный сервис по поиску архивных копий сайтов. С помощью данного сервиса вы можете проверить внешний вид и содержимое страницы в сети интернет на определённую дату.

На момент написания, этот сервис, вроде бы, нормально не работает («Database Exception (#2002)»). Если у вас есть по нему какие-то новости, то пишите их в комментариях.

Поиск сразу по всем Веб-архивам

Может так случиться, что интересующая страница или файл отсутствует в веб архиве. В этом случае можно попытаться найти интересующую сохранённую страницу в другом Архиве Интернета. Специально для этого я сделал довольно простой сервис, который для введённого адреса даёт ссылки на снимки страницы в рассмотренных трёх архивах.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Что делать, если удалённая страница не сохранена ни в одном из архивов?

Архивы Интернета сохраняют страницы только если какой-то пользователь сделал на это запрос — они не имеют функции обходчиков и ищут новые страницы и ссылки. По этой причине возможно, что интересующая вас страница оказалась удалено до того, как была сохранена в каком-либо веб-архиве.

Тем не менее можно воспользоваться услугами поисковых движков, которые активно ищут новые ссылки и оперативно сохраняют новые страницы. Для показа страницы из кэша Google нужно в поиске Гугла ввести

Если ввести подобный запрос в поиск Google, то сразу будет открыта страница из кэша.

Для просмотра текстовой версии можно использовать ссылку вида:

Для просмотра исходного кода веб страницы из кэша Google используйте ссылку вида:

Например, текстовый вид:

Как полностью скачать сайт из веб-архива

Если вы хотите восстановить удалённый сайт, то вам поможет программа Wayback Machine Downloader.

Программа загрузит последнюю версию каждого файла, присутствующего в Архиве Интернета Wayback Machine, и сохранить его в папку вида ./websites/example.com/. Она также пересоздаст структуру директорий и автоматически создаст страницы index.html чтобы скаченный сайт без каких либо изменений можно было бы поместить на веб-сервер Apache или Nginx.

Об установке программы и дополнительных опциях смотрите на странице https://kali.tools/?p=5211

Пример скачивания полной копии сайта suip.biz из веб-архива:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Структура скаченных файлов:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Локальная копия сайта, обратите внимание на провайдера Интернет услуг:

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Как скачать все изменения страницы из веб-архива

Если вас интересует не весь сайт, а определённая страница, но при этом вам нужно проследить все изменения на ней, то в этом случае используйте программу Waybackpack.

К примеру для скачивания всех копий главной страницы сайта suip.biz, начиная с даты (—to-date 2017), эти страницы должны быть помещены в папку (-d /home/mial/test), при этом программа должна следовать HTTP редиректам (—follow-redirects):

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Чтобы для указанного сайта (hackware.ru) вывести список всех доступных копий в веб-архиве (—list):

Как узнать все страницы сайта, которые сохранены в веб-архиве

Для получения ссылок, которые хранятся в Архиве Интернета, используйте программу waybackurls.

Эта программа извлекает все URL указанного домена, о которых знает Wayback Machine. Это можно использовать для быстрого составления карты сайта.

Чтобы получить список всех страниц о которых знает Wayback Machine для домена suip.biz:

Заключение

Предыдущие три программы рассмотрены совсем кратко. Дополнительную информацию об их установке и об имеющихся опциях вы сможете найти по ссылкам на карточки этих программ.

Ещё парочка программ, которые работают с архивом интернета:

Источник

Справочная: “Архив Интернета” — история создания, миссия и дочерние проекты

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Вероятно, на Хабре не так много пользователей, кто никогда не слышал об «Архиве Интернета» (Internet Archive), сервисе, который занимается поиском и сохранением важных для всего человечества цифровых данных, будь то интернет-странички, книги, видео или информация иного типа.

Кто управляет Интернет-архивом, когда он появился и какова его миссия? Об этом читайте в сегодняшней «Справочной».

Зачем вообще нужен «Архив»?

Это далеко не только развлечение. Миссия организации — всеобщий доступ ко всей информации. «Интернет-архив» стремится бороться с монополией на предоставление информации со стороны как телекоммуникационных компаний (Google, Facebook и т.п.), так и государств.

При этом «Архив» является законопослушной организацией. Если по закону США какую-то информацию необходимо удалить, организация это делает.

«Архив Интернета» также служит инструментом работы ученых, спецслужб, историков (например, археографов) и представителей многих других сфер, не говоря уже об отдельных пользователях.

Когда появился «Интернет-архив»?

Создатель «Архива» — американец Брюстер Кейл, который создал компанию Alexa Internet. Оба его сервиса стали чрезвычайно популярными, оба они процветают и сейчас.

«Интернет-архив» начал архивировать информацию с сайтов и хранить копии веб-страниц, начиная с 1996 года. Штаб-квартира этой некоммерческой организации располагается в Сан-Франциско, США.

Правда, в течение пяти лет данные были недоступны для общего доступа — данные хранились на серверах «Архива», и это все, просмотреть старые копии сайтов могла лишь администрация сервиса. С 2001 года администрация сервиса решила предоставить доступ к сохраненным данным всем желающим.

В самом начале «Интернет-архив» был лишь веб-архивом, но затем организация начала сохранять книги, аудио, движущиеся изображения, ПО. Сейчас «Интернет-архив» выступает хранилищем для фотографий и других изображений НАСА, текстов Open Library и т.п.

На что существует организация?

Как работает «Архив»?

Большинство сотрудников заняты в центрах по сканированию книг, выполняя рутинную, но достаточно трудоемкую работу. У организации три дата-центра, расположенных в Калифорнии, США. Один — в Сан-Франциско, второй — Редвуд Сити, третий — Ричмонде. Для того, чтобы избежать опасности потери данных в случае природной катастрофы или других катаклизмов, у «Архива» есть запасные мощности в Египте и Амстердаме.

«Миллионы людей потратили массу времени и усилий, чтобы разделить с другими то, что мы знаем в виде интернета. Мы хотим создать библиотеку для этой новой платформы для публикаций», — заявил основатель Архива интернета Брюстер Кале (Brewster Kahle)

Насколько велик сейчас “Архив”?

У «Интернет-архива» есть несколько подразделений, и у того, которое занимается сбором информации с сайтов, есть собственное название — Wayback Machine. На момент написания «Справочной» в архиве хранилось 339 миллиардов сохраненных веб-страниц. В 2017 году в «Архиве» хранилось 30 петабайт информации, это примерно 300 млрд веб-страниц, 12 млн книг, 4 млн аудиозаписей, 3,3 млн видеороликов, 1,5 млн фотографий и 170 тыс. различных дистрибутивов ПО. Всего за год сервис заметно «прибавил в весе», теперь «Архив» хранит 339 млрд веб-страниц, 19 млн книг, 4,5 млн видеофайлов, 4,7 млн аудиофайлов, 3,2 млн изображений разного рода, 381 тыс. дистрибутивов ПО.

Как организовано хранение данных?

Информация хранится на жестких дисках в так называемых «дата-нодах». Это серверы, каждый из которых содержит 36 жестких дисков (плюс два диска с операционными системами). Дата-ноды группируются в массивы по 10 машин и представляют собой кластерное хранилище. В 2016 году «Архив» использовал 8-терабайтными HDD, сейчас ситуация примерно такая же. Получается, что одна нода вмещает около 288 терабайт данных. В целом, еще используются жесткие диски и других размеров: 2, 3 и 4 ТБ.

В 2016 году жестких дисков было около 20 000. Дата-центры «Архива» оснащены климатическими установками для поддержания микроклимата с постоянными характеристиками. Одно кластерное хранилище из 10 нод потребляет около 5 кВт энергии.

Структура Internet Archive представляет собой виртуальную «библиотеку», которая поделена на такие секции, как книги, фильмы, музыка и т.п. Для каждого элемента есть описание, внесенное в каталог — обычно это название, имя автора и дополнительная информация. С технической точки зрения элементы структурированы и находятся в Linux-директориях.

Общий объем данных, хранимых «Архивом» составляет 22 ПБ, при этом сейчас есть место еще для 22 ПБ. «Потому, что мы параноики», — говорят представители сервиса.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Посмотрите на скриншот содержимого директории — там есть файл с названием, оканчивающимся на «_files.xml». Это каталог с информацией обо всех файлах директории.

Что будет с данными, если выйдет из строя один или несколько серверов?

Ничего страшного не произойдет — данные дублируются. Как только в библиотеке «Архива» появляется новый элемент, он тут же реплицируется и размещается на различных жестких дисках на разных серверах. Процесс «зеркалирования» контента помогает справиться с проблемами вроде отключения электричества и сбоях в файловой системе.

Если выходит из строя жесткий диск, его заменяют на новый. Благодаря зеркалируемой и редуплицируемой структуре данных новичок сразу же заполняется данными, которые находились на старом HDD, вышедшем из строя.

У «Архива» есть специализированная система, которая отслеживает состояние HDD. В день приходится заменять 6-7 вышедших из строя накопителей.

Что такое Wayback Machine?

Это лишь один из сервисов «Интернет-архива», который специализируется на сохранении веб-страниц. У сервиса есть собственный «паук», который регулярно обследует все доступные в сети сайты и сохраняет их на специализированных серверах. Чем популярнее веб-сайт, тем чаще робот копирует его содержимое. Если администратор ресурса не желает, чтобы информация сайта копировалась ботом, достаточно прописать запрет в файле robots.txt.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое
Популярные ресурсы копируются часто — практически ежедневно. Wayback Machine индексирует даже социальные сети, включая Twitter, Facebook

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

В 2017 году «Архив» запустил обновленный сервис Wayback Machine, пообещав более удобный доступ к сохраненным веб-страницам. Сервис был написан если не с нуля, то здорово переработан. Теперь он поддерживает ряд форматов файлов, которые ранее просто не сохранялись В том же 2017 году организация заявила, что каждую неделю ее сервера сохраняют около 1 млрд веб-страниц.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое
Так выглядел Twitter в 2007 году

Что еще можно найти в базе «Интернет-архива»?

Книги. Коллекция организации огромна, она включает оцифрованные книги, как распространенные, так и очень редкие издания. Книги сохраняются не только англоязычные, но и на многих других языках. У «Архива» есть специализированные центры по сканированию книг, всего таких центров 33, расположены они в пяти странах по всему миру.

В день сотрудники центров сканируют около 1000 книг. В базе сервиса содержатся миллионы изданий, работа по их оцифровке финансируется как обычными людьми, так и различными организациями, включая библиотеки и фонды.

С 2007 года «Интернет-архив» сохраняет в своей базе общедоступные книги из Google Book Search. После запуска, база книг быстро разрослась — в 2013 году насчитывалось уже более 900 тысяч книг, сохраненных из сервиса Google.

Один из сервисов «Архива» также предоставляет доступ к книгам, которые полностью открыты, таковых насчитывается уже более миллиона. Называется этот сервис Open Library.

Видео. Сервис хранит 4,5 млн роликов. Они разбиты по тематикам и имеют самую разную направленность. На серверах «Архива» хранятся фильмы, документальные фильмы, записи спортивных соревнований, ТВ-шоу и многие другие материалы.

В 2015 году «Архив» дал начало масштабному проекту — оцифровке видеокассет. Сначала речь шла о 40 тысячах кассет из архива Мэрион Стоукс, женщины, которая в течение многих десятилетий записывала на кассеты новости. Затем добавились и другие видеокассеты, которые присылали «Архиву» поклонники идеи оцифровки данных, важных для человечества.

Аудио. Аналогично видео, «Архив» хранит и аудиофайлы, которые также разбиты по тематикам. В прошлом году «Архив» начал реализовывать свой новый проект — расшифровку шеллачных пластинок, старейшего формата аудиозаписей. Звук сохранялся на пластинках из шеллака — природной смолы, которую выделяют самками червецов. Всего в архиве Great 78 Project несколько сотен тысяч пластинок.

Программное обеспечение. Конечно, хранить все созданное человечеством ПО просто невозможно, даже для «Архива». На серверах хранится винтаж — например, программы для Macintosh, ПО под DOS и прочий софт. В 2016 году сотрудники «Архива» выложили 1500+ программ под Windows 3.1, работать можно прямо в браузере. В 2017 Internet Archive выпустил архив софта для первых Macintosh.

Игры. Да, «Архив» предоставляет доступ к огромному количеству игр. В некоторые из них можно поиграть в среде браузерного эмулятора. Игры хранятся самые разные, в том числе, и с портативных аналогово-цифровых приставок. Есть игры под MS-DOS и консольные игры для Atari и ColecoVision.

Archive org что это такое. Смотреть фото Archive org что это такое. Смотреть картинку Archive org что это такое. Картинка про Archive org что это такое. Фото Archive org что это такое

Впервые архив старых игр организация выложила еще в 2013 году. Речь идет о тайтлах 30–40 летней давности, в которые можно было играть прямо в браузере. Это игры для приставок Atari 2600 (1977 года выпуска), Atari 7800 (1986 г.), ColecoVision (1982 г.), Philips Videopac G7000 (1978 г.) и Astrocade (1983 г.). Самое интересное, что Internet Archive добился того, что играть можно вполне легально. Сейчас коллекция насчитывает уже более 3400 игр и продолжает пополняться.

Источник

Web-Archive как средство доказывания

Нередко авторы (правообладатели) сталкиваются с ситуацией, когда нарушение их исключительных прав в сети Интернет правонарушитель устраняет до предъявления ему требований в досудебном или судебном порядке (претензии или искового заявления). Подобные ситуации практически полностью лишают автора (правообладателя) возможности взыскать по суду с виновных лиц денежную компенсацию, поскольку истец при сложившихся обстоятельствах, скорее всего, не сможет подтвердить перед правоприменителем факт нарушения его исключительных прав, входящий в предмет доказывания по такой категории дел. Однако действительно ли приведенный случай является абсолютно безвыходным или всё же в практике существуют какие-либо способы решения указанной проблемы? Попытаемся разобраться.

Традиционным методом фиксации размещения тех или иных объектов на сайтах в сети Интернет признается составление нотариального протокола осмотра сайта. Между тем, у такого способа есть ряд существенных недостатков:

Учитывая вышеперечисленные негативные стороны, можно заключить, что составление нотариального протокола хотя и является на настоящий момент основным средством доказывания факта размещения спорного контента на сайтах в сети Интернет, но абсолютно не гарантирует успешную защиту исключительных прав в суде.

Существуют ли альтернативные способы подтвердить обстоятельства размещения на определенном веб-ресурсе в конкретную дату произведения или иного объекта интеллектуальных прав?

Прежде всего, необходимо уточнить, что Интернет, как и любой файл в памяти компьютера, не существует «в воздухе»: каждый сайт во всемирной паутине не только имеет свой адрес (доменное имя), подобно недвижимому имуществу, но и физически размещается на определенных серверах, обслуживаемых чаще всего хостинг-провайдерами. В большинстве распространенных мессенджеров уже давно закрепилась функция архивации старых ненужных бесед, которая позволяет убрать те или иные чаты с главного экрана приложения, но при этом допускает восстановление доступа к ним в случае необходимости. Поскольку, как мы уже сказали, сайты в сети Интернет в сущности ничем не отличаются от текстовых, графических или аудиовизуальных файлов, составляющих содержание чатов в мессенджерах, то для всего, что содержится на просторах сети, также была предусмотрена функция архивации, которая в обиходе программистов получила условное наименование «Web-Archive». Именно использование Web-Archive позволяет ретроспективно посмотреть на страницы сайтов в сети Интернет, отмотать стрелки часов назад и зафиксировать размещение на тех или иных веб-ресурсах интересующих нас объектов, которые в настоящем времени уже могут быть удалены с такого веб-ресурса.

Web-Archive (также Internet Archive, Архив Интернета, Wayback Machine) — сервис, изначально разработанный в 1996 году некоммерческой организацией «Internet Archive» в США, предназначенный для сбора и последующей архивации копий веб-страниц, а также графических, аудио и видеоматериалов, размещенных на таких веб-страницах, предоставляющий доступ к своему архиву неограниченному кругу лиц на безвозмездной основе. URL-адрес сайта: archive.org. На март 2019 года объем данных, содержащихся в Web-Archive, насчитывал 45 петабайт (то есть около 47 миллионов гигабайт

Механизм работы сайта предельно прост: в поле поиска, по аналогии с адресной строкой браузера, вводится URL-адрес необходимой веб-страницы в сети Интернет. После осуществления поискового запроса система предлагает пользователю календарь с датами, в которые Web-Archive делал снимки искомой веб-страницы. Когда пользователь выберет наиболее удовлетворяющую его интересам дату, сервис покажет, как веб-страница выглядела в указанный период времени и какие материалы были на ней размещены. Кроме того, в Web-Archive имеется рубрикация, позволяющая совершить поиск текстовых, графических, звуковых, аудиовизуальных файлов, а также найти то или иное программное обеспечение.

Позже появились схожие, в том числе российские, сервисы, занимающиеся архивацией различных сегментов сети Интернет. В качестве примера можно привести ресурсы web-arhive.ru и archive.is. Для удобства в дальнейшем все сервисы такого типа мы будем называть Web-Archive.

Впрочем, позиции судов насчет принятия в качестве средств доказывания сведений из сервисов Web-Arсhive не являются единообразными, в связи с чем представляется интересным более детально проанализировать имеющиеся в базах судебные акты.

Судебная практика. Как ни странно, практика использования сведений из Web-Archive в целом складывается благоприятно. Так, Арбитражный суд города Москва в своём Решении от 17 июля 2017 года по делу № А40-206553/2015 указал следующую характеристику рассматриваемого сервиса:

Доказательства, представленные Истцом с сайта https://archive.org/web, являются допустимыми и относимыми.

Сайт https://archive.org/web является общедоступными сайтом, представляющим собой архив по сбору копий веб-страниц, графических материалов, видео- и аудиозаписей и программного обеспечения. Архив обеспечивает долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики.

Использование приведенного сайта при доказывании рекомендовано федеральными государственными органами, в частности Федеральной антимонопольной службой России в Письме от 28.08.2015 № АК/45828/15 «О рекламе в сети «Интернет», что означает, что данному ресурсу можно доверять в части предоставления им информации.

Схожие позиции содержатся в следующих судебных актах: Постановление Девятого арбитражного апелляционного суда от 20 октября 2017 года по вышеприведенному делу № А40-206553/2015; Решение Суда по интеллектуальным правам от 15 ноября 2018 года по делу № СИП-317/2017; Решение Бутырского районного суда от 16 августа 2016 года по делу № 2-5527/16 (Апелляционным определением от от 12 декабря 2016 года Московского городского суда оставлено в силе).

Некоторые суды, однако, склонны не признавать сведения из Web-Archive надлежащими доказательствами. Так, в рамках рассмотрения по существу в своём Решении по делу № А53-17108/2013 Арбитражный суд Ростовской области не стал анализировать распечатки с сервиса Web-Archive, в которых содержались важные обстоятельства, имеющие значение для дела, признав их недопустимыми средствами доказывания. Суд апелляционной инстанции (Постановление Пятнадцатого арбитражного апелляционного суда от 13 июня 2014 года) Решение нижестоящей инстанции отменил, указав:

Доводы представителя истца о том, что представленные ответчиком материалы не могут являться допустимыми доказательствами по делу, судом апелляционной инстанции отклоняются, поскольку они распечатаны со страниц специализированного сервиса, имеющего юридический статус библиотеки. К указанному сервису имеет доступ любой пользователь сети «Интернет», в связи с чем у суда нет оснований не доверять информации, находящейся на данном сервисе. Кроме того, сайт web.archive.org и создан специально для хранения информации о том, каким именно было содержимое интернет-страницы (сайта) в то или иное время. Учитывая, что указанный информационный ресурс расположен за пределами Российской Федерации и вмешательство заинтересованных лиц (участников спора) в указанный информационный ресурс исключено, апелляционный суд находит возможным принять распечатки страниц указанного ресурса.

В Решении Суда по интеллектуальным правам от 16 ноября 2018 года по делу № СИП-324/2018 правоприменитель признал, что представленной в материалы дела распечаткой с Интернет-сайта, полученной посредством электронного сервиса «Web archive», подтверждается факт размещения объекта на сайте, но при этом уточнил, что ей не подтверждается фактическое использование спорного товарного знака ответчиком в отношении определенного класса МКТУ.

Иные способы доказывания. Несмотря на имеющиеся неоспоримые преимущества сведений из систем Web-Archive, имеются и другие средства доказывания, позволяющие в отсутствие нотариального протокола подтвердить в суде факт размещения тех или иных объектов на сайтах в сети Интернет.

Наиболее доступным большинству способом доказать, что в определенный момент времени на определенном сайте был размещен тот или иной объект правовой охраны, является создание ретроспективных скриншотов необходимых веб-страниц. Сообщество IP view рекомендует: Если Вы случайно заметили, что кто-то разместил Ваши фотографии, стихотворения, музыкальные композиции или иные объекты интеллектуальных прав на своём сайте, не проходите мимо — потратьте несколько минут и зафиксируйте нарушения, нажав на клавиатуре клавишу «PrintScreen» и сохранив получившиеся изображения с помощью любых графических редакторов (Microsoft Paint, Adobe Photoshop и других). Так Вы сможете в той или иной степени обеспечить защиту своих исключительных прав в случае, если в дальнейшем решите наказать нарушителя за его противоправные деяния.

При создании ретроспективных скриншотов, которые в дальнейшем потенциально будут использоваться в качестве доказательств по делу, нужно придерживаться некоторых правил. Так, скриншоты должны сохраняться в исходном виде и размере, не допускается их переработка, на них обязательно должны присутствовать время и дата, которые обычно показываются на панели внизу экрана, — несоблюдение этих требований многократно увеличивает дальнейшее признание судом таких доказательств ненадлежащими (недостоверными, сфальсифицированными). Кроме того, если фиксируется размещение нескольких охраняемых объектов, расположенных на разных URL-адресах, рекомендуется запечатлевать всю последовательность переходов с одной веб-страницы на другую. И конечно, если не прибегать к помощи нотариуса в подобных ситуациях, то придется заверять скриншоты самостоятельно, в противном случае суд, вероятнее всего, такие доказательства отклонит.

Более подробно о ретроспективных скриншотах как о средствах доказывания Сообщество IP view расскажет в одной из своих следующих статей.

На практике встречаются случаи, когда в качестве подтверждения размещения спорного контента на сайте в сети Интернет стороны представляют самостоятельно составленные протоколы по типу нотариальных. Содержательная часть таких самодельных протоколов практически не отличается от сведений, закрепляемых в нотариальных протоколах, однако суды традиционно доверяют нотариату больше, нежели простому гражданину или представителю юридического лица. Поэтому нередко возникают сложности, связанные с несоответствием таких протоколов требованию достоверности, обычно предъявляемому к доказательствам. Правильный порядок составления самодельных протоколов осмотра сайта мы более детально осветим в рамках отдельного исследования.

Выводы. Таким образом, мы можем сделать вывод, что в настоящее время в судебной практике не выработалось единого подхода относительно оценки сведений из систем Web-Archive. В качестве крайней меры полученные из такого источника данные, которые сторона либо ее представитель заверили самостоятельно, могут быть использованы для подтверждения позиции стороны по делу, однако в ординарных ситуациях всё же пока рекомендуется не экономить на нотариальных протоколах и фиксировать юридические факты наиболее распространенным способом. Впрочем, хочется выразить надежду, что в недалеком светлом будущем процедуры доказывания будут упрощаться и скоро любой пользователь, представивший в судебном заседании выписку из Web-Archive, сможет беспрепятственно защитить свои права в суде, особенно в аспекте соблюдения принципа доступности правосудия.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *