Что такое контент фильтрация?
В широком смысле контент-фильтрация — это система обеспечивающая фильтрацию контента (данных) на различных уровнях, используя шаблоны, базы и параметры. Вот базовые параметры, которые предъявляет Ростелеком к модулю контент-фильтрации
1. Использование баз данных запрещенных ресурсов.. Тут одним Роскомнадзором не обойтись. Сюда также входят базы Министерства Юстиции и Министерства Образования — в совокупности более полумиллиона сайтов. Как зарубежных, так и отечественных.
2. Возможность блокировки отдельного контента. . Имеется ввиду блокировка как отдельных страниц какого-то сайта (википедия — хороший пример), так и контента внутри каждой (или отдельной) страницы, например, встроенное видео и т.д.
3. URL и DSN-фильтрация.
4. Анализ содержимого (текста) на странице.. Фильтр должен уметь находить в тексте запрещенные слова, а также их словоформы.
5. Фильтрация текстовых запросов. Естественно, следует оградить учеников не только от запрещенных ресурсов, но и фильтровать поисковую выдачу — текст, а в особенности — изображения.