Какие два приложения обычно используют технологию ml
Об активном применении ML-алгоритмов в области информационных технологий и коммерции известно достаточно давно, но вот определиться с необходимостью их использования в ИБ мы не могли, пока сами не ответили на следующие вопросы:
- область, где она будет применена;
- данные, которые могут быть предоставлены для анализа;
- результат, который хотим получить.
Ниже даны подробные ответы на каждый вопрос.
«Очень трудно искать в темной комнате черную кошку. Особенно, если там ее нет»
Одним из основных направлений обеспечения безопасности в нашей организации всегда было выявление фактов неслужебного использования информации. Функции и задачи, возложенные на нашу организацию, и предоставляемые в соответствии с ними массивы данных принципиально нельзя разделить между пользователями, данные предоставляются каждому пользователю практически в полном объеме. Поэтому от классической задачи выявления несанкционированного доступа мы были вынуждены перейти к намного более сложной — анализу соответствия использования данных задачам, которые стоят перед пользователем. Сначала за счет жесткой формализации процессов обработки и их небольшого количества данная задача решалась простыми методами: описанием последовательности событий, которые считались легитимными, и формированием инцидента по любым отклонениям.
Но резкое увеличение количества задач и долгое время их описания или невозможность такового в принципе в текущий момент привели к тому, что количество инцидентов в день стало превышать на 2 порядка предыдущие значения, и мы перестали справляться. Иначе говоря, перед нами встала проблема соотношения точности и полноты инцидентов. Наших предыдущих критериев точности оказалось недостаточно, чтобы генерировать разумное количество инцидентов, при этом мы не могли скорректировать критерии их генерации и сократить их количество (так как реализация риска инцидента, который мы исключили, могла привести к крупным потерям). Но при этом мы знали, что такие критерии существуют, поскольку работники решали конкретные задачи с конкретным результатом.
По факту мы получили одну из основных задач ML: выявление закономерностей, существование которых мы предполагаем, но полной формальной информацией о них не обладаем.
Резкое увеличение количества задач и долгое время их описания или невозможность такового в принципе в текущий момент привели к тому, что количество инцидентов в день стало превышать на 2 порядка предыдущие значения, и мы перестали справляться.
Мужик ловит такси:
— Куда вам?
— Нет, к удавам я не поеду.
— Вы меня неправильно поняли. Куда вам надо?
— Ну, раз надо, поехали к удавам…
В свое время, занимаясь выявлением инцидентов даже в детально описанных и формализованных процессах, мы столкнулись с проблемами различной идентификации объектов и интерпретации действий с ними. Анализируя события в различных прикладных системах, таких как электронный документооборот, специализированный (дополненный) учет, аналитические системы, мы постоянно сталкивались с отсутствием сквозных идентификаторов и/или минимального достаточного набора признаков для каждого объекта и, как следствие, с невозможностью представить их как единое целое для любой автоматизированной системы. В меньшем масштабе эта проблема актуальна и для объектов доступа. Думаем, многие помнят свои 3–5 имен пользователей для каждой системы, где проводится работа.
Решение этих проблем было одним из самых масштабных с точки зрения взаимодействия с ИТ-, бизнес-подразделениями (функциональными) нашей организации и разработчиками прикладных систем. В результате мы прошли путь получения событий о безопасности из отладочных данных СУБД с использованием многострочных запросов к внедрению IdM с единым именем пользователя и консолидированным журналом событий с указанием действий над объектами из единого реестра.
Второй задачей было определить соответствие событий и процессов, причем эта связь могла быть одна ко многим, т.е. фактически одно событие могло относиться одновременно к нескольким задачам, решаемым пользователем. И точное соответствие можно было определить только в ходе анализа конкретного процесса.
Без решения этих задач применение ML на несвязанном объеме данных может не только привести к неинтерпретируемому результату, но и выявить ложные зависимости: например, увеличение количества попыток подбора паролей от среднего объема удоя коров в Калужской области.
Двое летят на воздушном шаре. Их унесло, и они не знают, где летят cейчас. Пролетают мимо холма, на котором сидит человек. Храбрые воздухоплаватели спрашивают его:
— Скажите, пожалуйста, где мы сейчас находимся?
Человек на холме долго думает, а потом отвечает:
— На воздушном шаре.
Как уже упоминалось выше, в последнее время нашей основной проблемой стало увеличение на порядки количества инцидентов, которые по факту не являлись попытками неслужебного использования информации, а возникали вследствие кратного увеличения пользователей прикладных систем и процента формализации задач, ими решаемых. И если количество ошибок первого рода мы старались свести к минимуму за счет увеличения полноты генерируемых инцидентов, то количество ресурсов, требуемых на обработку инцидентов, вызванных ошибками второго рода, многократно превышало текущие.
При этом такие пути решения, как:
- четкое определение соответствия между сотрудниками и процессами;
- детальная формализация процессов;
- введение дополнительных механизмов обоснования доступа,
— приводили к нерациональным и непропорциональным тратам ресурсов бизнес-подразделений (функциональных).
Принимая решение использовать технологии ML при постановке задачи «обучение с учителем», мы понимали, что валидация данных, полученных по результатам использования, потребует достаточно больших дополнительных усилий от аналитика, отвечающего за разрешение инцидентов безопасности, в короткий период времени. Эти усилия включали бы:
- использование информации из наложенных средств безопасности, включая инженерно-технические;
- получение информации непосредственно от пользователя и его руководителей;
- построение гипотез о некорректном сборе событий об инциденте, их проверку и пр.
Но, учитывая, что полученная экспертная выборка помогла бы кардинально снизить количество гипотез, которые тем или иным образом он был бы вынужден проверять, пусть и не разом, мы посчитали это обоснованными затратами времени.
Одно из основных направлений обеспечения безопасности в нашей организации — выявление фактов неслужебного использования информации.
Надпись на надгробии:
«Не все йогурты одинаково полезны. »
В заключение хотелось бы сказать, что технология ML уже показала себя как полезная и жизнеспособная во многих отраслях нашей жизни. Применять ее или нет в области ИБ в своей организации, каждый из нас должен решить сам. Ее использование должно быть осознанным выбором, и мы надеемся, что приведенные ответы на вопросы помогут вам сделать правильный выбор. У нас слишком мало времени, чтобы тратить его на необоснованные решения. А мы пока находимся в начале своего пути и о результатах внедрения ML-системы, которая будет стоять на страже нашей ИБ, рассчитываем отдельно рассказать в ближайшем будущем.
26. Инженера
попросили настроить время бездействия системы, после которого будет отключаться
жесткие диски на корпоративных ноутбуках на базе ОС Windows. Инженер выставил
параметры питания в ОС Windows, однако ничего не изменилось. Где ему следует
искать возможность включить управление питанием?
Командная строка
+BIOS
Безопасный режим
Системный реестр
Администрирование
27. Инженер
отлаживает сеть, в которой на некотором узле, через который проходят данные,
предположительно теряются пакеты. Он знает только IP-адрес конечного
устройства, о промежуточных не известно ничего. Какую команду можно
использовать для выявления неисправного узла?
+tracert
ping
ipconfig /flushdns
ipconfig /displaydns
28. Какие два
действия следует выполнить перед установкой ОЗУ в ноутбук? (Выберите два
варианта.)
Отключить дисплей от нижней панели ноутбука.
Перед установкой ОЗУ обновить сохраненные настройки CMOS в соответствии с новой
емкостью ОЗУ.
Использовать термопасту для прикрепления памяти к материнской плате.
+Отключить источник питания переменного тока.
Извлечь зажимы, удерживающие модуль памяти, из гнезд, в которые будет вставлено
новое ОЗУ.
+Извлечь аккумулятор.
29. Укажите
преимущества профилактического обслуживания компьютеров. (Выберите три
варианта).
устранение необходимости в ремонте
экономия времени инженеров, выполняющих ремонт
улучшение времени доступа к ОЗУ
+сокращение числа сбоев оборудования
+продление срока службы компонентов
+повышение надежности защиты данных
30. Инженер
выполняет устранение неисправностей принтера, который печатает непонятные
символы вместо документа. Укажите две вероятные причины этой проблемы.
(Выберите два варианта.)
Лоток для бумаги пуст.
Бумага является старой и влажной.
+На компьютер установлен неверный драйвер.
Служба принтера остановлена.
+Кабель данных плохо подключен к принтеру.
31. Новый инженер
отдела ИТ принимает на себя обязанности по техническому обслуживанию тяжелого
принтера. Какой совет следует дать этому инженеру во избежание травм при
транспортировке тяжелого принтера на площадку для технического обслуживания?
+Согнуть колени и использовать мышцы ног для подъема принтера.
Согнуть спину, чтобы поднять принтер.
Не сгибать колени при подъеме принтера.
Использовать мышцы рук и спины для подъема принтера.
32. Какие две
программы поставляются с большинством принтеров и устанавливаются пользователем?
(Выберите два варианта.)
текстовый редактор
+ПО для настройки
операционная система
+драйвер принтера
исправления для принтера
обновления BIOS
33. В организации
обеспокоены тем, что компьютеры уязвимы для заражения вредоносным ПО. Какие два
действия помогут решить эту проблему? (Выберите два варианта.)
Шифрование содержимого жесткого диска.
+Включение поиска вирусов и шпионского ПО в режиме реального времени.
+Включение автоматических обновлений программного обеспечения для защиты от
вирусов и шпионского ПО.
Настройка запуска программного обеспечения для защиты от шпионского ПО в
периоды активного использования компьютера.
Настройка пароля жесткого диска.
34. Заказчик
передал инженеру модуль SODIMM емкостью 4 Гбайта для обновления памяти на
рабочей станции, однако у инженера возникли проблемы с ее установкой. Укажите
возможную причину проблемы.
Для рабочей станции требуется твердотельный
накопитель.
У рабочей станции нет доступных гнезд.
+Модуль несовместим с рабочей станцией.
Для рабочей станции требуется флэш-память.
40. Какую меру предосторожности следует принятьинженеру при проверке термографического принтера, который внезапно перестал
работать?
Не прикасаться к проводу коротрона, который может быть под высоким напряжением.
+Не прикасаться к термопечатающей головке, которая могла сильно нагреться.
Не прикасаться к валику, который может быть под высоким напряжением.
Не прикасаться к блоку термофиксатора, который мог сильно нагреться.
Искусственный интеллект (AI) и машинное обучение (ML) важны, когда у компании много данных и нужно упростить работу с ними или больше зарабатывать с их помощью. Такой сценарий актуален, к примеру, для маркетинга, IT- и банковской сфер.
Ак Барс Банк, чтобы поделиться опытом в обработке клиентских сведений, организовал на Kazan Digital Week 2021 секцию «AI&ML для монетизации данных». Здесь обсудили, чем AI и ML полезны бизнесу, как их внедрить и какие сложности могут из-за них появиться.
Чуть более узкое понятие — ML (machine learning) — машинное обучение. Это один из методов искусственного интеллекта, и он как раз отвечает за передачу необходимых «знаний» AI-системе.
С помощью искусственного интеллекта компании:
- создают персонализированные предложения, изображения, видео, тексты;
- выстраивают общение с потенциальными и реальными клиентами (чат-боты — это тот же AI);
- подбирают персональные продукты и проценты от банков и банковских карт;
- показывают подходящие вакансии на Headhunter;
- разрабатывают мобильные приложения;
- распознают речь и создают голосовые помощники.
В обычной жизни люди сталкиваются с Al и ML, сами того не замечая. Например, вы на рабочем ноутбуке читали про новую модель iPhone, и уже по дороге домой в Instagram вам то и дело предлагают рекламные объявления в духе «новый iPhone в рассрочку».
Еще один пример. Вам нужно срочно заполнить сайт текстом, и вы обращаетесь в контент-агентство в надежде, что за вашу задачу быстро возьмутся. Свободных копирайтеров нет, зато агентство использует технологии искусственного интеллекта — и вы тут же получаете готовые тексты для сайта.
Сейчас AI и ML наиболее широко используют в шести направлениях:
- Аналитика, управление проектами и принятие решений.
- Обработка естественной речи.
- Персонализация маркетинга и обслуживания.
- Интернет вещей и цифровые двойники.
- Автономные устройства (например, роботы-пылесосы).
- AI-разработка (например, разработка бизнес-решений без привлечения консультантов).
Чтобы использовать искусственный интеллект и машинное обучение в компании, нужно собрать данные о клиентах. Весь этот объем информации называется Big Data — база данных, которые компании получают из внешних и внутренних источников: отчетов, данных службы поддержки и отдела продаж, систем аналитики и действий самих клиентов.
Самый простой пример — опросы в чат-ботах или по электронной почте. Клиент отвечает на вопросы, его ответы переносятся в базу, после чего можно подключить к работе AI и ML и создать для него персональное предложение.
Условно все компании можно разделить на 3 группы:
- We have nothing: не используют данные, потому что не понимают или не видят в этом смысла. Как правило, у них большой дефицит в специалистах, очень дорогие облачные или коробочные решения, сложный процесс внедрения новых технологий. Начать работу с данными здесь сложнее и дольше всего.
- We have data: только начинают использовать данные в работе, собирают аналитику, чтобы понимать, как работает их бизнес. У них, как и в первой группе, могут быть дорогие облачные или коробочные решения, постоянный дефицит кадров, устаревший набор технологий.
- Data-Driven Company: хорошо выстроили data-driven-процессы. Они уже умеют собирать и применять данные в бизнесе. Именно в таких компаниях новые технологии быстро приживаются и развиваются.
Условная классификация компаний по уровню работы с данными
На работу с данными перешли еще не все компании, потому что data-бизнес, включая AI и ML, очень молод, ему 10 лет. Он все еще развивается, и технологии быстро сменяют друг друга. Если компания хочет успевать за обновлениями, в штате нужен хотя бы один человек, который разбирается в данных, готов изучать новые AI-решения и внедрять их в бизнес. Но специалистов, разбирающихся в данных, на рынке не хватает.
Увы, дефицит специалистов — не единственная проблема. Есть другие препятствия для использования данных в бизнесе:
- Колоссальные ограничения с точки зрения информационной и юридической безопасности.
- Слабая нормативно-правовая база на территории РФ/СНГ.
- Применимые в России методы и подходы не подойдут для Европы и США из-за того, что у них свои регламенты и очень жесткие.
Если вышеперечисленные проблемы удастся миновать, и компания начинает работу с данными, появляются новые сложности на этапе внедрения данных в продукты:
- Рынок не знает, что хочет.
- Рынок не знает, что можно.
- В некоторых областях слишком высокая конкуренция.
- Разработка продуктов иногда нерентабельна.
- Компания не хочет или не может обогащать данные.
Все новые технологии, связанные с обработкой входящей информации вроде распознавания речи или чат-ботов, еще только развиваются и дорого стоят. Компания, которая хочет их внедрить, должна запастись временем и большим бюджетом.
Разработка новшества и его внедрение могут обойтись дороже старых бизнес-процессов. Например, решили уволить всех продавцов, разместить по всему периметру магазина камеры и установить кассы самообслуживания. При таком сценарии покупка, установка и обслуживание нового оборудования будут дороже оплаты труда реальных продавцов.
По статистике, 87% data-science-проектов остаются на пилотной стадии и никем не используются. Для реализации технологий в любом случае придется много экспериментировать и тратиться.
Получить AI-решение в некоторых случаях очень сложно, а в некоторых — невозможно вообще.
Машинное обучение (ML, Machine Learning) — простыми словами, это технология искусственного интеллекта (ИИ), которая предоставляет вычислительным системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования.
Человек отличается от компьютера тем, что он учится на своих ошибках, действиях. Машинам нужно указывать, что делать, так как они подчиняются строгой логике и лишены смысла. Поэтому мы пишем программы, которые дают кремниевому разуму точные инструкции. Машинное обучение просто заставляет компьютер самостоятельно составлять подробные пошаговые инструкции на опыте прошлых данных.
Что собой представляет машинное обучение?
Фактически это компьютерные программы с определёнными алгоритмами действия:
- процесс начинается с анализа массива информации,
- затем выявляется шаблон или закономерность,
- после всего формируется непосредственный опыт
- и составляются инструкции на его основе.
Система без вмешательства человека способна предлагать готовые решения, обоснованные реальными данными.
Методы машинного обучения
Принято отличать методы машинного обучения (алгоритмы, то есть их основную стратегию обучения) по степени контроля и вмешательства человека. Мы сегодня имеем дело как с незначительными приложениями, помогающими ускорить рутинные процессы, так и с полностью автоматизированными комплексами безостановочного изучения массивов информации на крупных предприятиях.
Алгоритмы контролируемого машинного обучения
Контролируемое «обучение с учителем» (Supervised Learning) предполагает использование ИИ всего изученного в прошлом к новым данным. Помеченные пользователем примеры используются для предсказания будущих событий. В основе метода — анализ обозначенного «учителем» набора обучающих данных. Алгоритм машинного обучения создаёт контролируемую функцию прогнозирования выходных значений.
Алгоритмы неконтролируемого машинного обучения
«Обучение без учителя» (Unsupervised Learning) используется, когда информация никем не классифицируется и не маркируется. Неконтролируемое обучение анализирует, как системы могут вывести функцию для описания скрытой структуры из немаркированных данных.
Алгоритмы частичного машинного обучения
Алгоритмы частично управляемого машинного обучения (Semi-supervised Learning) находятся где-то между контролируемым и неконтролируемым обучением. Они используют все имеющиеся данные. Обычно небольшой объём информации помечается «учителем». Это помогает уточнить действия машины при работе с большим объёмом немаркированных данных и ускорить процесс. Системы могут значительно повысить точность работы при использовании такого метода.
Алгоритмы машинного обучения с подкреплением
В роли «подкрепления» (Reinforcement Learning) выступает традиционный человеческий подход метода «проб и ошибок». Машина взаимодействует со своей средой, производя действия и обнаруживая ошибки или вознаграждения (достижение целей). Алгоритмы обучения с подкреплением позволяют программным агентам автоматически определять идеальное поведение в конкретном контексте, чтобы максимизировать его производительность.
Даже в найме сотрудников эйчарами используются автоматические методы отбора лучших кандидатов. В бизнес-аналитике и вовсе уже не обойтись без способностей искусственного интеллекта. И если вы ставите перед своей организацией в качестве цели достичь конкурентного преимущества, то машинное обучение — лучшее, что можно использовать для накопленной за годы трудов вашей компании массивов данных.
Компания ZEL-УслугиОбратитесь в компанию ИТ-аутсорсинга для дальнейшей экспертной поддержки и консультации по этой теме и любым другим техническим вопросам.
Читайте также: