Группа сотрудников Гарвардской школы права вместе с журналистами The Times оценили уровень надёжности интернета как хранилища информации на примере ссылок в статьях The New York Times.
Оказалось, что более половины статей NYT, начиная с 1996 года, частично или полностью ссылаются на «мёртвые» страницы, что подрывает доверие к журналистике и снижает информационную ценность контента.
Исследователи рассмотрели более 553 тысяч статьей, которые содержат внутри себя почти 2,3 миллиона ссылок на внешние сайты. Около 6% из них «умерли» только за три последних года, а если считать с 1998 года, то доля «мёртвых» ссылок в статьях превышает 72%. Такие ссылки могут вести на плашку с ошибкой 404 («Не найдено») или перенаправлять на главную страницу целевого сайта — но бывают варианты и похуже.
Вокруг «мёртвых» ссылок на крупных ресурсах выстроена целая теневая индустрия. Если такая ссылка ведёт на несуществующий сайт, то его могут «реанимировать» на заказ с тем же доменом и такой же адресацией до конкретной страницы. Но вместо оригинальной информации на этой странице могут разместить рекламу или страницу с прямо противоположной информацией.
Например, в 2011 году член Верховного суда США Сэмюэл Алито высказал особое мнение касательно отмены запрета на продажу «жестоких» видеоигр детям в Калифорнии, сопроводив его ссылкой на подробное объяснение своего мнения. Но эта ссылка быстро «умерла» и стала вести на плашку с насмешливым сообщением.
Авторы исследования считают, что рост числа «умерших» ссылок — большая проблема не только для журналистов, но и для всего интернета.
Точечным решением могут стать архивирующие сервисы вроде Wayback Machine или Perma.cc, но глобально они вряд ли могут изменить текущую тенденцию к распаду контекста повествований и исчезновению источников информации.