22 мая, 2013

Средства и методы фильтрации контента в Интернете

С возникновением потребности в фильтрации контента в Интернете, государства столкнулись с трудностями применения традиционных методов контроля над средствами массовой информации в Сети. Одну из основных проблем для цензоров представляла динамичность социальной составляющей Интернета – огромное количество материала вновь и вновь создается множеством пользователей. Другим препятствием являлся международный характер Сети, когда серверы с информацией зачастую находятся вне юрисдикции и досягаемости правоохранительных органов отдельных стран.

В начале и середине 90-х годов прошлого века среди многих ученых и специалистов господствовала идея, что Интернет в принципе не поддается контролю. В 1998 году президент США Билл Клинтон высказался о тщетности усилий Китая по созданию национальной системы фильтрации Интернета, сравнив ее с «попыткой прибить желе к стене». Но по мере развития Интернета стала очевидна ошибочность этих суждений. Согласно исследованию OpenNet Initiative, если в 2002 году только несколько стран применяли системы фильтрации контента, то к 2007 году их число возросло до 25 (к настоящему времени эта цифра возросла еще почти вдвое). Также законы о блокировании детской порнографии в Сети были приняты в ряде европейских стран. Использование традиционных методов контроля за СМИ в сочетании с новыми техническими средствами позволило государствам ограничивать доступ своих граждан к нежелательным материалам с приемлемой эффективностью.

Классификация систем фильтрации Интернета

Исследование Дерека Бамбаура из Университета Аризоны, проведенное в 2008 году[1], предлагает классификацию интернет-фильтров, которая абстрагируется от характера блокируемого контента. Вместо этого системы оцениваются по четырем параметрам – открытость, прозрачность, точность и подотчетность. Такой подход позволяет наиболее полно оценить, насколько практика государства соответствует заявленным целям фильтрации, и нарушается ли право граждан на информацию.

Открытость

Этот параметр оценивает то, насколько явно государство признает фильтрацию Интернета и объясняет свою мотивацию. Так, на сайте подразделения правительства Саудовской Аравии, занимающегося Интернетом, описана действующая система фильтрации. В качестве объяснения, почему правительство считает необходимым блокировать определенный материал, приводятся выдержки из Корана и ссылки на статьи. При попытке посетить нежелательный ресурс, пользователю выдается страница с указанием того, что данный материал заблокирован.

В Китае, напротив, значительная часть фильтрации осуществляется незаметно, а ее применение маскируется под технические ошибки. В результате этого, пользователь может в принципе не осознавать, какой материал блокируется и почему, так как китайские власти официально не признают отдельные эпизоды цензуры. Таким образом, несмотря на всю свою жесткость, система Саудовской Аравии гораздо более открыта, чем китайская – пользователям сообщают, что государство вмешивается в Интернет, и объясняют почему.

Прозрачность

Параметр прозрачности оценивает, насколько четко прописаны критерии, по которым материал подлежит фильтрации. В законах Китая для этого используются расплывчатые формулировки вроде «распространяющий слухи» и «нарушающий национальное единство», которые позволяют блокировать любой материал, не устраивающий цензоров. Франция блокирует доступ к сайтам, разжигающим межнациональную и религиозную рознь. Критерии для определения такого рода материала являются частью уголовного законодательства страны, поэтому возможности для злоупотребления ограничены. Вместе, критерии открытости и прозрачности позволяют определить, на какой уровень контроля информации претендуют власти страны.

Точность

Параметр точности позволяет оценить насколько успешно воплощается заявленная государством политика в области интернет-цензуры. Неотъемлемой проблемой большинства методов интернет фильтрации является чрезмерное и недостаточное блокирование. При чрезмерном блокировании вместе с нежелательным материалом недоступным оказывается и вполне безобидный. Подобное можно было наблюдать в России, когда вместе с заблокированными ресурсами недоступными становились и сторонние сайты, располагающиеся на одной группе серверов. Обратный эффект наблюдается при недостаточном блокировании – пользователи могут видеть тот контент, который государство рассматривает как вредный.

И чрезмерное, и недостаточное блокирование может быть случайным и преднамеренным. К примеру, имел место случай, когда провайдер в Пенсильвании по ошибке заблокировал более миллиона сайтов, выполняя предписание суда об ограничении доступа к 400 сайтам, содержащим детскую порнографию. В Сингапуре, напротив, несмотря на заявленную государством борьбу с онлайн-порнографией, символически заблокированы только несколько сайтов.

Подотчетность

Данный параметр оценивает уровень участия граждан в политике интернет-фильтрации, проводимой государством. Прошел ли закон, регулирующий Интернет, должный общественный контроль и обсуждение? Могут ли пользователи оспорить то или иное решение цензоров или, напротив, внести на рассмотрение сайт, нарушающий закон?

Закон США об авторском праве в цифровую эпоху (Digital Millennium Copyright Act), регулирующий защиту авторских прав в Интернете, был принят после серии публичных слушаний и рассмотрения в Конгрессе. С другой стороны, политика регулирования интернета в Саудовской Аравии была принята без демократического участия ее граждан, что вообще характерно для этой страны. Но при этом жители Саудовской Аравии могут внести на рассмотрение сайты для фильтрации или оспорить решение блокировать определенный ресурс. Таким образом, участие граждан возможно и при авторитарных политических режимах.

Методы цензуры контента в Интернете

Сбор информации в Интернете

Хотя сам по себе сбор информации в Интернете не относится к фильтрации контента, полученные таким методом данные могут быть использованы для выявления пользователей, получающих доступ к запрещенному материалу, сайтов, содержащих такие материалы, и способов обхода интернет-фильтров.

  • Хранение логов и иной технической информации. В большинстве стран введены законы, обязывающие интернет провайдеров хранить информацию о пользователях и посещенных ими ресурсах. Полиция и спецслужбы могут использовать эту информацию для установления личности  нарушителей в Интернете.
  • Наблюдение за интернет-кафе. С целью предотвращения использования интернет-кафе для нелегальной деятельности в ряде стран к их владельцам предъявляются жесткие требования по обеспечению безопасности. Так, в Китае и Италии пользоваться интернет-кафе можно только при предъявлении паспорта, а владельцы обязаны хранить записи о пользователях. Во Вьетнаме и Бирме в каждом интернет-кафе должна быть установлена видеокамера.
  • Системы интернет-слежки. Возможности по отслеживанию интернет-трафика предусмотрены законодательством практически всех стран мира. В России действует СОРМ-2, обязывающий провайдеров устанавливать специальное устройство, позволяющее спецслужбам отслеживать трафик отдельных пользователей. Аналогичная система под названием CALEA действует и в США. Особый интерес представляют системы, способные изучать трафик целой страны, используя технологию глубокого анализа пакетов (Deep Packet Inspection). С помощью подобных систем возможно осуществлять наблюдение за активностью пользователей, например определяя какие приложения и сервисы они используют и какую информацию пересылают. Применение таких систем противоречит праву граждан на частную жизнь и запрещено в ЕС и России. Тем не менее, в настоящее время на межгосударственном уровне ведутся дебаты о допустимости их применения в целях борьбы с терроризмом и нарушением авторских прав. Поскольку изучение трафика целой страны требует значительных вычислительных мощностей, позволить себе системы массового наблюдения за Интернетом могут не все государства. В США Агентство национальной безопасности в рамках «Патриотического акта» отслеживает активность в Сети с помощью суперкомпьютеров NarusInsight. Китай использует глубокий анализ пакетов в целях интернет-цензуры; среди других стран, замеченных в таком применении технологии – Иран и Тунис.

Нетехнические методы

Арсенал нетехнических методов фильтрации в Интернете, находящийся в распоряжении государства, во многом совпадает с используемыми методами для контроля традиционных СМИ. Их эффективность резко повышается при параллельном использовании современных средств сбора информации в Интернете и действующих законах о хранении провайдерами технической информации.

  • Законы, запрещающие публикацию того или иного контента. Такая мера остается одним из основных средств контроля Интернета, как в демократических странах, так и в авторитарных. Ключевое значение здесь имеет физическое расположение сервера, на котором находится запрещенный материал. Ресурсы, находящиеся на территории страны обычно сами стараются убирать противозаконные материалы во избежание неприятностей с законом, или же делают это по первому обращению надзорных органов. В спорных ситуациях последнее слово остается за судом. Если же ресурс расположен вне юрисдикции страны, то решение принимает его владелец. Например, крупные международный сайты, такие как YouTube или Twitter,  в своем решении ориентируются, прежде всего, на условия своего пользовательского соглашения и неформальные переговоры с представителями властей страны. При этом решение суда не является решающим аргументом, так как оно не распространяется на граждан и организации других стран. Подобная ситуация зачастую приводит к практике «двойных стандартов» со стороны крупных социальных сервисов, когда однотипный контент может удаляться, а может не удаляться, в зависимости от качества отношений с правительствами конкретных стран.
  • Давление на интернет-провайдеров, владельцев сайтов и пользователей с целью заставить их убрать нежелательные материалы или изменить их. В условиях, когда категории запрещенного контента определены нечетко, у властей страны остается большой простор в их трактовке. Есть масса других способов давления на пользователей – угрозы, насилие, увольнение, штрафы и т.д. В отношении провайдеров и владельцев сайтов возможностей еще больше – отзыв лицензии, дерегистрация доменного имени, физический арест серверов и оборудования. Зачастую доказать давление очень трудно, поэтому международные организации, занимающиеся изучением свободы в Интернете, вынуждены полагаться только на заявления пользователей и экспертов, которые зачастую ангажированы одной из сторон конфликта.
  • Самоцензура. В условиях, когда провайдер может лишиться лицензии, сайт быть заблокирован, а пользователь арестован, производители интернет-контента предпочитают не рисковать и сознательно избегают острых тем. Во избежание трений с властями, провайдеры и сайты удаляют контент, содержащий даже намеки на запрещенный материал. В такой ситуации властям достаточно провести несколько показательных процессов, чтобы все остальные участники Сети поняли сигнал. Особенно показателен в этом плане Китай. Крупные западные компании, как Yahoo и Microsoft в погоне за динамичным китайским рынком добровольно принимают все ограничения, навязываемые цензорами. Так, специальный клиент Skype, разработанный специально для Китая, фильтрует сообщения пользователей и опционально сохраняет часть разговоров на сервере.

Технические методы

  • Блокирование по IP-адресу. При применении данного метода сервер, на котором находится нежелательный материал, становится полностью недоступным для пользователя. Главным преимуществом этого метода является его простота – он может быть реализован с помощью базового сетевого оборудования, используемого интернет-провайдерами. Однако с учетом современных технологий по одному IP-адресу могут находиться тысячи сайтов, а также других сервисов, таких как FTP или электронная почта, поэтому его блокирование приведет к тому, что все они станут недоступны.  Из-за низкой точности данного метода страны применяют его с осторожностью. Блокирование по IP-адресу легко обходится при помощи различных технических решений, в частности, прокси-серверов и  VPN.
  • Искажение DNS-записей. При обращении пользователя к любому сайту, компьютер посылает запрос к DNS-серверу для того, чтобы преобразовать доменное имя в IP-адрес. В случае применения данного метода, DNS сервер возвращает неверный адрес, и сайт оказывается недоступным. Искажение DNS-записи также может быть реализована без применения дополнительного оборудования. Ее преимуществом перед блокированием по IP-адресу является более высокая точность – недоступным становится только один сайт на сервере. При этом все равно происходит чрезмерное блокирование. Например, Китай периодически лишает своих пользователей доступа к CNN International из-за появляющихся там нежелательных новостей. Хотя ставится цель фильтрации только одной страницы новости, остальные страницы сайта также становятся недоступны. Искажение DNS-записей легко обходится пользователями – в настройках браузера достаточно указать альтернативный DNS-сервер или вручную прописать IP-адрес заблокированного сайта.
  • Блокирование по URL-адресу. В HTTP-протоколе URL-адрес содержит  доменное имя сайта, а также параметры запроса. Они могут быть сверены со списком заблокированных ключевых слов, и в случае соответствия, связь пользователя с запрошенным ресурсом разрывается, или он перенаправляется на блок-страницу. Данный метод является более эффективным по сравнению с блокированием по IP-адресу и искажением DNS-записи, но требует дополнительного оборудования, так как использует поверхностный анализ пакетов. Его дополнительным преимуществом является то, что он способен динамически блокировать новые страницы, если в их адресе содержатся запрещенные слова. Например, в Китае блокируются все запросы, содержащие слова “falun” и “gong”. Однако при неправильной настройке ключевых слов точность метода резко ухудшается – он может пропускать нежелательный материал или, наоборот, допускать чрезмерное блокирование. Блокирование по URL-адресу нельзя обойти с помощью обычных прокси-серверов – необходимы инструменты, которые шифруют трафик, такие как VPN или TOR.
  • Пакетная фильтрация. Наиболее сложный и дорогостоящий метод, так как он требует применения глубокого анализа пакетов. На данный момент полноценно реализован только в Китае. При использовании пакетной фильтрации, изучаются не только заголовки пакетов, содержащих URL адрес, но и все их содержимое. В случае наличия запрещенных слов, связь между пользователем и сервером разрывается. Метод позволяет фильтровать нежелательный контент не только в веб-страницах, но и во всех протоколах – электронной почте, сервисах мгновенных сообщений и др. Существенным недостатком данного метода является то, что применение глубокого анализа пакетов может привести к снижению скорости интернет-соединения, что, к примеру, наблюдается при доступе из Китая к зарубежным интернет-серверам. В остальном, пакетная фильтрация обладает теми же достоинствами и недостатками, что и блокирование по URL-адресу.
  • Фильтрация через HTTP прокси-сервер. Данный метод наиболее часто используется организациями для подключения корпоративных сетей к Интернету, но его можно использовать для фильтрации интернета в рамках всей страны. Гибридный вариант под названием Cleanfeed эффективно применяется в Великобритании и Канаде для борьбы с детской порнографией. Каждый запрос пользователя сверяется со списком IP-адресов, содержащих запрещенные материалы. Если совпадений нет, то запрос пользователя отсылается напрямую. В противном случае, он перенаправляется на прокси-сервер общественной организации Internet Watch Foundation. Прокси-сервер получает запрашиваемую страницу и анализирует ее на наличие детской порнографии. Если страница не содержит запрещенных материалов, то пользователь получает к ней доступ, иначе – создается видимость, что ресурс недоступен. Гибридные варианты фильтрации через HTTP прокси-сервер позволяют при низкой стоимости точно блокировать узкие категории контента. При этом, они столь же легко обходятся, как и фильтрация по IP-адресу.
  • Нарушение работы сети. В экстренных случаях, таких как массовые беспорядки, власти страны могут пойти на полное или частичное отключение Интернета. Достигается это путем физического отключения роутеров из Сети или же изменения их настроек, из-за чего большая часть соединений сбрасывается. Данный метод применялся в Египте в ходе беспорядков 2011 года, Ливии, Сирии и Бирме. Тем не менее, опыт использования данного метода в ряде стран показывает, что полное блокирование доступа в Сеть зачастую провоцирует дополнительный рост массовых беспорядков. Более подробно об этом рассказывается в отдельной главе доклада.
  • Фильтрация результатов поиска. В ряде стран, таких как Китай, Франция и Германия, работающие там поисковые системы обязаны исключать из результатов поиска ссылки на запрещенные материалы. Так, во французских и германских версиях Google из поисковых результатов исключаются ссылки на неонацистские группы и другие материалы, запрещенные законом. Таким образом, пользователи не могут найти нежелательный контент. Фильтрация результатов поиска – один из основных методов борьбы с нарушениями авторских прав в Интернете. Метод обходится использованием других поисковым систем – например, международная версия Google не исключает из результатов сайты неонацистских группировок  и при этом доступна из Франции и Германии.

Ниже представлена таблица из книги Access Denied: The Practice and Policy of Global Internet Filtering[2], в которой обозначено использование различными странами указанных методов фильтрации интернет-контента:

Варианты размещения систем технической фильтрации

Обязательным условием установки интернет-фильтров, является их размещение на ключевых участках сети, через которые проходит весь трафик. Поэтому возможны  следующие уровни их установки:

  • Международный шлюз. Этот вариант предполагает централизованный подход к фильтрации контента. Программное и аппаратное обеспечение устанавливается на участке, соединяющем национальную сеть с международными магистралями. Преимуществом данного метода является более полный контроль и единообразность подхода к цензуре – политика фильтрации может оперативно корректироваться, а ее изменения будут затрагивать сразу всех пользователей. Однако, создание централизованной системы фильтрации Интернета, способной точно блокировать нежелательный контент, требует существенных затрат, пропорциональных объему внешнего трафика. Данный метод используются большинством мусульманских стран Ближнего востока. В Китае, Пакистане, Узбекистане и Иране он применяется совместно с фильтрацией на уровне интернет-провайдеров.
  • Интернет-провайдеры. Другим подходом к цензуре в Интернете является установка систем фильтрации всеми провайдерами страны. В вопросе того, какие ресурсы подлежат блокировке, они ориентируются на решения судов, или на реестр, который ведут государственные или негосударственные органы. В случае если методы фильтрации не регламентируются, их реализация остается на усмотрение каждой компании. В результате, практика фильтрации может существенно варьироваться от провайдера к провайдеру, как в сторону избыточного, так и недостаточного блокирования. В частности, в России из-за некорректной реализации требований закона 139-ФЗ отдельными компаниями, для их пользователей оказались недоступны все блоги на платформе Wordpress. Фильтрация на уровне интернет-провайдеров применяется большинством европейских стран, а также Вьетнамом, Бирмой и Южной Кореей и рядом других государств.
  • Интернет-сайты и сети организаций. Фильтрация на уровне сетей организаций чаще всего применяется частными компаниями для контроля использования Интернета своими сотрудниками, но также используется государствами для регулирования работы школ, библиотек, и правительственных учреждений. Так, в США в соответствии с Актом о защите детей в Интернете условием получения государственных субсидий для школ и библиотек является установка фильтров, ограничивающий доступ несовершеннолетних к порнографии. Поскольку требование не является обязательным для всех учреждений, а закон предусматривает отключение фильтров по просьбе взрослых пользователей, Акт не ограничивает свободу слова, закрепленную в Конституции США.

В государствах, где по закону интернет-сайты и сервисы отвечают за контент, размещаемый на них пользователями, их владельцы нанимают сотрудников, отвечающих за цензуру, и устанавливают специальное программное обеспечение, отслеживающее запрещенный контент. Например, действовавшая в Китае блог-платформа компании Microsoft MSN Spaces не допускала названия блогов, содержащие слова «демократия» и «свобода», автоматически отклоняя такие варианты. Сервис микроблогов Sina Weibo блокирует записи по обширному набору ключевых слов, а в его штате числятся сотни сотрудников, осуществляющих цензуру вручную.

  • Индивидуальные компьютеры. Данный подход предусматривает установку программного обеспечения для фильтрации непосредственно на компьютеры пользователей. Главной проблемой здесь является трудность отслеживания того, чтобы пользователь не удалил или отключил фильтр. С учетом этого, чаще всего индивидуальные фильтры используются на компьютерах частных компаний, которые могут технически ограничить права своих сотрудников вносить изменения в настройки, а также родителями для защиты детей от нежелательного контента в Сети. Попытки применять данный подход для государственной цензуры предпринимал Китай. В планах его властей была установка программного обеспечения «Зеленая дамба», блокирующего доступ к удаленно обновляемому списку сайтов и способного распознавать порнографические изображения, на все компьютеры страны. Но из-за многочисленных технических трудностей государственные органы отказались от этой инициативы.

 

[1] Derek E. Bambauer Cybersieves // Duke Law Journal. — 2009.

[2] OpenNet Initiative Access Denied: The Practice and Policy of Global Internet Filtering — Cambridge: MIT Press, 2008.