Распространяется ли ФЗ-420 на малый бизнес?

Да. Ограничений по размеру компании нет. ИП с базой клиентов в 2 000 контактов — это оператор персональных данных. Штрафы для ИП и небольших ООО ниже, чем для крупных юрлиц, но это всё равно миллионы рублей.

Что считается утечкой персональных данных по закону?

Утечка — любое несанкционированное получение доступа к персональным данным третьими лицами. Взлом сервера, отправка базы не тому адресату, кража ноутбука сотрудника, случайная публикация данных на открытом ресурсе — всё это утечка.

Нужно ли уведомлять субъектов персональных данных об утечке?

Да, в течение 72 часов после обнаружения инцидента. Уведомление должно содержать описание произошедшего, перечень затронутых данных и контакты для обратной связи. Форма произвольная, но факт отправки нужно задокументировать.

Можно ли избежать штрафа за утечку персональных данных, если утечка произошла у подрядчика?

Сложно. Оператор несёт ответственность за данные, переданные третьим лицам, если только не докажет, что принял все разумные меры: заключил договор с условиями об обработке персональных данных, провёл проверку контрагента, организовал контроль. На практике таких аргументов обычно недостаточно.

Какой штраф за утечку данных одного сотрудника?

Формально утечка 1 записи подпадает под нижнюю планку: от 3 млн рублей для юридического лица. Но РКН при мелких инцидентах чаще выносит предписание, чем штраф — если компания уведомила вовремя и устраняет нарушения.

+7 (495) 777-66-90

Машинное обучение в системах информационной безопасности: принципы, методы и практическое применение

лонгриды

13.01.2023

16/03/26

Б-152

Лонгриды

События /

Машинное обучение в системах информационной безопасности:

В эпоху тотальной цифровизации обеспечение безопасности информационной инфраструктуры компании является одной из наиболее важных задач, решение которой осуществляется комплексом организационных и технических мер.

Для минимизации различного типа угроз приобретаются дорогостоящие программные и программно-аппаратные средства, направленные на защиту конфиденциальной информации организации.

Ключевым элементом современных решений является машинное обучение (ML). Однако его эффективность напрямую зависит от того, насколько корректно выбраны и настроены модели под конкретные задачи.

Поэтому мы не просто используем готовые инструменты, мы глубоко разбираемся в принципах их работы, понимая, что находится «под капотом». Мы предоставляем экспертные консультации и проектируем системы защиты, которые начинаются не с выбора продукта, а с глубокого анализа целей и задач нашего клиента, его уникальной ИТ-среды и бизнес-процессов. Мы убеждены, что эффективная защита должна быть не барьером для бизнеса, а его неотъемлемой и гибкой частью.

В этой статье мы рассмотрим, какие принципы и методы ML (Machine Learning) заложены в основу современных систем защиты.

Введение

Различие между машинным обучением и традиционным программным обеспечением

Содержание

Методы машинного обучения

Заключение

Введение

Различие между машинным обучением и традиционным программным обеспечением

Содержание

Методы машинного обучения

Заключение

Введение

Парадокс технологического прогресса заключается в том, что он является обоюдоострым мечом.

Мощные инструменты, разрабатываемые для автоматизации и усовершенствования рабочего процесса, были взяты на вооружение и злоумышленниками. В результате мы столкнулись с усовершенствованными методами реализации киберугроз, которые легко обходят сигнатурные средства защиты, основанные на известных шаблонах.

В условиях этого непрекращающегося противоборства на первый план выходит технология, способная к обучению и прогнозированию.

Машинное обучение (ML) становится тем самым стратегическим переломом, который позволяет не просто ждать известных угроз, а проактивно выискивать аномалии в гигантских массивах данных.

Внедрение машинного обучения сместило фокус с реагирования на уже произошедшие инциденты на их предупреждение и пресечение на самых ранних стадиях. Это позволяет не просто быстрее реагировать, а действовать на опережение, сводя потенциальный ущерб к минимуму.

Различие между машинным обучением и традиционным программным обеспечением

Чтобы понять революционность машинного обучения в информационной безопасности, необходимо осознать кардинальное различие между ним и классическим программным обеспечением. Это различие не в степени сложности, а в самом подходе к решению задач.

Для дальнейшего анализа, нам, все-таки, необходимо остановиться и обозначить фундаментальные понятия. Сделаем небольшое отступление и определимся что называется «традиционным программным обеспечением», а что представляет из себя машинное обучение.

Традиционное программное обеспечение — это статические, заранее запрограммированные на выполнение определенного набора правил системы, которые никаким образом не «учатся» и не «адаптируются». Подразделяются на системные и прикладные:

Традиционное системное программное обеспечение — это совокупность программ, которые обеспечивают управление компонентами компьютера, облегчают взаимодействие между техникой и прикладными программами. Например, операционные системы или драйверы устройств
Традиционное прикладное программное обеспечение — класс программ, предназначенных для решения практических задач в разных областях: офисной, мультимедийной и тому подобное. Например, текстовые редакторы, электронные таблицы.

Методы машинного обучения

Машинное обучение – это технология, основанная на математических алгоритмах (моделях), позволяющая компьютерам самостоятельно находить решение задач. Это достигается благодаря тем самым моделям, которые на основе проанализированных данных делают предсказания.

Существуют различные виды машинного обучения. Рассмотрим основные:

1. Машинное обучение с учителем

Для лучшего понимания представим, что компьютер (машина) неразумный ребенок, которому требуется решить очень сложную задачку. Мы можем предоставить ему структурированный список учебников (размеченный набор данных), в которых подробно прописано, как решать задачу. После решения, он может подсмотреть последнюю страницу учебника, где написаны ответы, и проверить правильность своих выводов.

Это представление описывает принцип «Обучение с учителем» — метод, при котором модель учится решать задачу на заранее размеченном наборе данных, опираясь на примеры с уже известными ответами.

В системах чаще всего используется для выполнения задачи классификации. Например, классификация писем на спам и не спам происходит именно так: модель обучается на тысячах писем с метками и затем определяет категорию новых сообщений.

Данный метод машинного обучения применяется в антивирусах, где задачей является классификация вредоносных файлов: модель анализирует характеристики (байты, заголовки, строки) для их дальнейшей классификации.

Такой вид также активно применяется в средствах обнаружения сетевых атак для анализа сетевого трафика с целью выявления в нем аномалий. Здесь модель также обучается различать легитимные и вредоносные действия на основе размеченных исторических данных.

2. Машинное обучение без учителя

Рассмотрим похожую ситуацию, но с измененными условиями. У нас все также неразумный ребенок, которому требуется решить задачу, но теперь никакой помощи извне у него нет. Учебники и алгоритмы решения задачи он должен найти самостоятельно, выявляя различные закономерности и выдвигая вместо четкого ответа — предположения.

Таким образом работает «Обучение без учителя» — метод, при котором алгоритм самостоятельно находит структуру и закономерности в предоставленном наборе данных. Кажется, что такой метод абсолютно неэффективен и бесполезен, однако, те же алгоритмы в социальных сетях работают именно по такому принципу.

Основная задача, которая решается с помощью применения данного метода — задача кластеризации. Модель группирует данные на основе их сходства таким образом, чтобы объекты в одной группе (кластере) были более схожи друг с другом и отличались от объектов в другой группе (кластере).

Если говорить о средствах защиты, то такой метод лег в основу UEBA-систем (систем аналитики поведения пользователей и сущностей) для анализа данных, выявления закономерностей и построения поведенческих профилей пользователей и устройств.

Для каждого пользователя или устройства создается его «цифровой профиль» с моделью поведения. В случае отклонения от нормы, система зафиксирует аномалию и просигнализирует об инциденте.

3. Обучение с подкреплением

Теперь нашему малышу не надо решать задачи, вместо этого он будет играть в шахматы. Но есть один нюанс — он совсем не знает правил игры.

Его задача — методом проб и ошибок выиграть партию у своего противника. За каждый правильный ход ученику будет даваться конфета, но если он ошибется, его будут неприятно щипать. Конечной целью будет являться получения как можно большего количества конфет и выигранных партий, при этом имея минимальное число ссадин.

Такая модель отражает вид машинного обучения — «Обучение с подкреплением» — метод, при котором система обучается не на предоставляемых данных, а через анализирование реакции среды на взаимодействие с ней. Из примера можно понять, что одним из направлений такого обучение является разработка игровых стратегий. Однако обучение с подкреплением активно применяется в алгоритмах, использующихся в финансовом секторе, робототехнике и автономном транспортном производстве.

Метод отлично применим для задач, решение которых должно иметь максимальную эффективность и выгоду, с продумыванием каждого действия с учетом их отложенных последствий.

Сценарий адаптации под среду и система вознаграждений отлично подошли для применения данного метода в сканерах уязвимости. Система с нулевым знанием о сканируемой инфраструктуре производит ряд стандартных действий для получения первичных сведений.

Рассмотрим ситуацию, когда производится сканирование портов: системе достанется награда в том случае, если она найдет уязвимость (например, открытый порт, который должен быть закрыт), получит доступ к оболочке (управлению сетевыми настройками) и перехватит учетные данные.

Однако, если процесс сканирования не дал никаких результатов, при этом было затрачено немалое количество времени, или действия привели к срабатыванию IPS (система защиты от сетевых атак в реальном времени), на систему налагается большое количество штрафов. Как положительный, так и отрицательный результат учитываются системой в дальнейшем обучении на новом наборе данных.

4. Глубокое обучение

Для понимания глубокого машинного обучения представим, что у нас уже не маленький ребенок, а подросток, способный к сложному абстрактному мышлению. Его задачей будет научиться распознавать кошек на картинках с тем условием, что он никогда раньше не видел это животное.

Четкие инструкции вида «если есть усы, уши и хвост — это кот» не выдаются. Вместо этого предоставляется огромная стопка фотографий (большой набор данных) и команда: «Смотри и учись сам!».

Данная задача будет решаться в несколько этапов:

1. Ребенок сначала учится выделять простейшие элементы — линии, углы, пятна, градиенты света.

2. На основе этих линий и углов он начинает распознавать более сложные формы: овалы (глаза), треугольники (уши), изогнутые линии (хвост).

3. Комбинируя эти формы, он собирает целостные объекты: «пушистое тело с четырьмя лапами, ушами и хвостом». В конце концов, он формирует в своем сознании абстрактное понятие «кошачесть», которое позволяет ему безошибочно отличить кошку от собаки, даже если он видит конкретное животное впервые.

Это представление описывает принцип Глубокого обучения — метод, в котором многослойная искусственная нейронная сеть имитирует описанный процесс: автоматическое извлечение из сырых данных иерархию все более сложных и абстрактных признаков, от простых к сложным, для решения поставленных задач.

В отличие от более простых моделей машинного обучения, которые часто проектируются под одну задачу (например, классификацию), глубокое обучение представляет собой семейство универсальных методов, способных решать широчайший спектр задач.

В современных системах защиты это позволяет использовать единый технологический подход для борьбы с разнородными угрозами: от обнаружения нового вредоносного ПО до выявления сложных поведенческих аномалий.

В антивирусах нового поколения (NGAV): глубокие нейронные сети анализируют исполняемые файлы, представляя их в виде изображений или последовательностей байт. Модель сама, без заранее известных сигнатур, учится выделять паттерны, характерные для вредоносного кода, на всех уровнях от отдельных команд до общей структуры программы. Это позволяет обнаруживать неизвестные ранее угрозы (zero-day).

В системах анализа поведения (UEBA): здесь сеть учится понимать «цифровой профиль» каждого пользователя.

Она не просто ищет аномалии, а строит сложную поведенческую модель: как пользователь обычно работает с клавиатурой, к каким приложениям обращается, в какое время активен. Рекуррентные нейронные сети (RNN) отлично справляются с анализом таких последовательностей действий, выявляя сложные, растянутые во времени атаки, которые не заметить при точечной проверке.

В системах обнаружения вторжений (IDS): Сети анализируют сетевой трафик, учась отличать нормальную активность от аномальной на основе глубокого анализа тысяч параметров одновременно, что делает их чрезвычайно эффективными против изощренных целевых атак.

Вы уверены, что ваша защита не тормозит бизнес?

Мы не берем готовые инструменты, а разбираемся, что у них «под капотом». Начинаем не с продукта, а с анализа ваших целей, среды и процессов. Проектируем защиту, которая встроена в бизнес, а не стоит перед ним барьером.

ОСТАВИТЬ ЗАЯВКУ

Заключение

Таким образом, применение машинного обучения в современных средствах защиты информации эволюционировало от экспериментальной технологии до критического компонента, обеспечивающего устойчивость к сложным и развивающимся киберугрозам. Рассмотренные методы ML формируют многоуровневую систему защиты, где каждый подход решает свой класс задач:

Обучение с учителем служит высокоточным инструментом для детектирования известных угроз. Его способность к классификации на основе размеченных исторических данных лежит в основе фильтрации спама, сигнатурного анализа вредоносного ПО и категоризации сетевых атак.

Обучение без учителя решает задачу обнаружения неизвестных угроз и внутренних аномалий. Анализируя данные без заранее заданных меток, этот метод выявляет скрытые паттерны и отклонения от нормального поведения, что незаменимо для противодействия целевым атакам и инсайдерским угрозам.

Обучение с подкреплением позволяет создавать системы, способные к автономному и адаптивному реагированию на угрозы. Модели, построенные на этом методе, обучаются выстраивать стратегию защиты через взаимодействие со средой, методом проб и ошибок. Это открывает путь к созданию киберсистем, способных в реальном времени динамически перенастраивать правила файрволов, изолировать зараженные сегменты сети или противодействовать продвинутым противникам в условиях неопределенности.

Глубокое обучение обеспечивает переход на качественно новый уровень анализа за счет автоматического извлечения сложных иерархических признаков из сырых данных. Способность моделей, таких как сверточные и рекуррентные нейронные сети, обрабатывать исполняемые файлы, сетевой трафик и поведенческие последовательности позволяет выявлять сложные вредоносные программы и многоэтапные атаки, не поддающиеся описанию с помощью правил.

Внедрение машинного обучения – стратегическое решение, требующее глубокого понимания принципов его работы. Эффективность защиты определяется не наличием ML-модуля «в коробке», а тем, насколько точно выбранные алгоритмы соответствуют конкретным задачам и угрозам. Мы предоставляем консультации и проектируем решения, в которых машинное обучение работает не на маркетинг, а на безопасность вашего бизнеса.

Ввод оборотных штрафов за утечки откладывается минимум до 1 июля 2023 года

Если вам близок инженерный и правовой разбор информационной безопасности без упрощений, мы регулярно публикуем практические разборы, кейсы и комментарии к регуляторным и технологическим изменениям в сфере ИБ и защиты данных. Подписаться на наш Telegram-канал.

бизнес

юридические вопросы

маркетинг

Материалы по теме