В России продолжили работать 65% заблокированных сайтов
2016 год стал рекордным по числу веб-страниц и IP-адресов, попавших в существующий с конца 2012 года Единый реестр доменных имен, страниц сайтов и сетевых адресов, содержащих информацию, распространение которой в России запрещено. Почти 87 тыс. страниц, доменных имен и IP-адресов оказались в черном списке, говорилось в сообщении Роскомнадзора. Почти треть из них — 34,5 тыс. — по состоянию на конец декабря так и оставались в реестре, то есть их администраторы не стали удалять противозаконные материалы. Всего на конец 2016 года в реестре находилось около 51,7 тыс. страниц, доменов и IP-адресов; к середине февраля 2017 года их число выросло до 60,2 тыс.
При этом темпы пополнения реестра растут с каждым годом. В течение 2013 года в него внесли 14,5 тыс. сайтов и страниц, из которых к концу года заблокированными оставались 3,4 тыс. ресурсов. В 2014 году были внесены 28,96 тыс. сайтов и страниц, из которых 4 тыс. оставались заблокированными, в 2015 году — 49,7 тыс. сайтов и страниц, из которых 18,8 тыс. оставались заблокированными, следует из материалов Роскомнадзора.
Всего, по данным Роскомсвободы — общественного проекта, пропагандирующего свободу информации в интернете, в общей сложности в реестре побывали более 137,4 тыс. сайтов, из них почти 60% были впоследствии разблокированы. Официальных данных о том, какие сайты остаются заблокированными из-за того, что не удалили запрещенную информацию, нет. РБК проанализировал реестр и пришел к выводу, что, несмотря на блокировку, не менее 65% сайтов из реестра продолжают работать, то есть их администраторы продолжают оплачивать регистрацию домена, хостинг и наполнение контентом.
Как вычислялись работающие сайты
Для анализа интернет-страниц, попавших в черный список Роскомнадзора, была использована копия реестра с сайта Роскомсвободы. Источник РБК в Роскомнадзоре подтвердил релевантность данных из этой копии. Анализ контента проводился только по тем сайтам, которые открывались по состоянию на 16 декабря 2016 года — их было почти 30 тыс. Чтобы определить тематику ресурса, использовались наборы ключевых слов. Для идентификации географии IP-адресов использовалась свободно распространяемая база блоков IP-адресов GeoLite2.
Метод пополнения