Фильтрация по базе ЦАИР EcoNAT Documentation / Фильтрация по базе ЦАИР
В системе EcoSGE реализована возможность URL-фильтрации по базе данных Центра анализа интернет-ресурсов (ЦАИР). Для подключения базы необходима соответствующая лицензия (CAIR).
Список установленных лицензий выводится командой show license.
EcoSGE:# show license
CGNAT: Ok
BRAS: Ok
DPI: Ok
URL filter: Ok
RADIUS: Ok
CAIR: Ok
При наличии данной лицензии в ветке конфигурации system.dpi доступен элемент cair, который является модифицированной версией списка DPI со следующими параметрами:
EcoSGE:system.dpi.cair# ls
base_url "http://md5.base.cdn.cair.ru/last.txt"
uplevel_domains_url "http://md5.base.cdn.cair.ru/uplevel_domains.txt"
update_schedule interval 86400
Где:
base_url – адрес базы ЦАИР;
uplevel_domains_url – адрес базы доменов верхнего уровня (ДВУ);
update_schedule – периодичность автоматического обновления баз в секундах; при значении never автоматическое обновление выключено.
Загрузка баз ЦАИР и ДВУ вручную производится командами dpiload cair и dpiload uplevel соответственно. Рекомендуется регулярно обновлять обе базы (автоматически или вручную).
Информация о сайтах в базах хранится в формате <md5 hash hostname> <номера категорий сайтов в 16-ричном виде через двоеточие>. Пример:
# head cair.txt -1
823211830251a3d40804125cdf1a1b13 2
Базы содержат только домены, то есть, например, "www.example.com", но не "www.example.com/theme/1".
Все домены, содержащиеся в базе ЦАИР, блокируются аналогично принципу блокировки записей типа "domain-mask". Например, если в базе ЦАИР есть запись вида "example.com", то будет осуществляться фильтрация HTTP- и HTTPS-запросов к ресурсам "www.example.com", "help.example.com", "123.example.com" и так далее.
Для включения категорий ЦАИР в действие какого-либо списка DPI используется параметр cair_categories, в котором категории также указываются в 16-ричном виде через двоеточие. Пример:
EcoSGE:system.dpi.dpilist1# ls
enable
bittorrent off
whitelist_mode off
log_matches off
log_pictures off
exceptions off
behaviour ignore
redirect_use_interval off
redirect_interval 600
redirect_interval_url 2592000
redirect_url "http://blocked.operator.ru"
color_direction both
color_tos_byte 32
download_url ""
update_schedule never
cair_categories "1:2:20:30:35:36:37:38:39:3c:3e:3f:41:44:49:4e:4f:54:5c:5d:5e:63"
no_ip ( )
no_ip_remote ( )
ip ( 0.0.0.0/0 )
no_ipv6 ( )
ipv6 ( )
Список категорий и соответствующие им номера представлены в таблице ниже.
| Номер 10-ричный | Номер 16-ричный | Категория |
|---|---|---|
| 1 | 1 | Алкоголь |
| 2 | 2 | Эротика, порнография |
| 3 | 3 | Реклама |
| 4 | 4 | Власти, правительство |
| 5 | 5 | Авто |
| 6 | 6 | Кино, онлайн-видео |
| 7 | 7 | Строительство и ремонт |
| 8 | 8 | Предметы потребления |
| 9 | 9 | Кулинария |
| 10 | A | Дача |
| 11 | B | Курсы, обучение |
| 12 | C | Электроника и электротехника |
| 13 | D | Промышленное оборудование |
| 14 | E | Семья |
| 15 | F | Мода и стиль |
| 16 | 10 | Финансы |
| 17 | 11 | Изобразительное искусство |
| 18 | 12 | Компьютеры, аппаратное обеспечение |
| 19 | 13 | Здоровье |
| 20 | 14 | Хобби |
| 21 | 15 | Юмор |
| 22 | 16 | Интерьер |
| 23 | 17 | Доступ в Интернет Сайты компаний, предоставляющих услуги доступа в Интернет. |
| 24 | 18 | Юридические услуги |
| 25 | 19 | Литература, электронные книги |
| 26 | 1A | СМИ |
| 27 | 1B | Машиностроение |
| 28 | 1C | Металлургия |
| 29 | 1D | Мобильная связь |
| 30 | 1E | Музыка |
| 31 | 1F | Общественные организации |
| 32 | 20 | Компьютерные игры |
| 33 | 21 | Домашние животные |
| 34 | 22 | Фото |
| 35 | 23 | Афиша |
| 36 | 24 | Недвижимость |
| 37 | 25 | Религия |
| 38 | 26 | Школа |
| 39 | 27 | Наука |
| 40 | 28 | Спорт |
| 41 | 29 | Театры |
| 42 | 2A | Транспорт |
| 43 | 2B | Туризм |
| 44 | 2C | Университеты |
| 45 | 2D | Работа и вакансии |
| 46 | 2E | Создание сайтов |
| 47 | 2F | Чаты |
| 48 | 30 | Сайты знакомств |
| 49 | 31 | Войска и вооружение |
| 50 | 32 | Форумы и блоги |
| 51 | 33 | Сервера бесплатной электронной почты |
| 52 | 34 | Бесплатные хостинги |
| 53 | 35 | Нелегальная помощь школьникам и студентам |
| 54 | 36 | Убийства, насилие, трупы |
| 55 | 37 | Онлайн-казино |
| 56 | 38 | Социальные сети |
| 57 | 39 | Терроризм, экстремизм |
| 58 | 3A | Торговля |
| 59 | 3B | Нижнее белье, купальники |
| 60 | 3C | Обеспечение анонимности, обход контентных фильтров |
| 61 | 3D | Службы обмена сообщениями |
| 62 | 3E | Файлообменные сети и сайты |
| 63 | 3F | Табак |
| 64 | 40 | Поисковые системы |
| 65 | 41 | Наркотики |
| 66 | 42 | Злоупотребление свободой в СМИ |
| 68 | 44 | Вредоносные программы |
| 69 | 45 | Ненадлежащая реклама |
| 70 | 46 | Информация с ограниченным доступом |
| 71 | 47 | Банеры и рекламные программы |
| 72 | 48 | Вождение и автомобили (негатив) |
| 73 | 49 | Досуг и развлечение (негатив) |
| 74 | 4A | Здоровье и медицина (негатив) |
| 75 | 4B | Корпоративные сайты |
| 77 | 4D | Отправка СМС сообщений с помощью Интернет-ресурсов |
| 78 | 4E | Доски объявлений |
| 79 | 4F | Неприличный и грубый юмор |
| 81 | 51 | Системы поиска изображений |
| 82 | 52 | Программное обеспечение |
| 83 | 53 | Информационный мусор |
| 84 | 54 | Баннерные сервера |
| 85 | 55 | Белый список |
| 86 | 56 | Безопасные для детей сайты |
| 87 | 57 | Сервисы коротких ссылок |
| 88 | 58 | Спам |
| 89 | 59 | Нарушение авторских прав и смежных прав |
| 90 | 5A | Единый реестр Роскомнадзор Сайты содержащие информацию, распространение которой в Российской Федерации запрещено (http://eais.rkn.gov.ru). |
| 91 | 5B | Мошенники |
| 92 | 5C | Федеральный список экстремистских материалов |
| 93 | 5D | Детское порно |
| 94 | 5E | Магия, колдовство, оккультизм, теургия |
| 95 | 5F | Счетчики, аналитика, метрика, статистика |
| 96 | 60 | Женские сайты и журналы |
| 97 | 61 | Мужские сайты и журналы |
| 98 | 62 | Заработок в Интернет Сайты, заявленные для заработка в интернете, торговля бинарными опционами и прочими |
| 100 | 64 | Подделка документов |
| 101 | 65 | Служебные сайты (api, скрипты, js) |
| 102 | 66 | Прочие услуги |
| 103 | 67 | Справочники, каталоги |
| 145 | 91 | Реестр безопасных образовательных сайтов (РБОС). Подробная информация доступна по ссылке |
Команда show cairrecords <URL> позволяет узнать, к каким категориям ЦАИР относится тот или иной адрес. Пример:
EcoSGE:system.dpi.dpilist1# show cairrecords example1.com
domain example1.com is present in CAIR categorie(s) 30:2f:38
EcoSGE:system.dpi.dpilist1# show cairrecords example2.com
domain example2.com is present in CAIR categorie(s) 37:5a
EcoSGE:system.dpi.dpilist1# show cairrecords example3.com
domain example3.com is not present in CAIR categories

