воскресенье, 20 июня 2010 г.

Issac Albeniz - Asturias

пятница, 18 июня 2010 г.

Планирование рекламных кампаний в Интернет

Планирование проведения рекламных кампаний (РК) в Интернет - процесс комплексный, состоящий из двух составных частей:
  1. Определение таргетингов
  2. Распределение показов
Первый из них, определение настроек таргетинга, подразумевает выбор из всех возможных рекламных площадок в Интернет тех, на которых рекламодатель хотел бы показывать рекламу (таргетинг по площадкам), а так же выделение из всей аудитории той, которой эта реклама адресована. Такое выделение возможно несколькими способами: по географическому размещению пользователей (геотаргетинг), по юзер-агентам пользователей, по регистрационным данным пользователей (демотаргетинг), и т.д.

Задача же непосредственного распределения показов по выбранным площадкам представляет собой выбор оптимального числа показов на каждой из них. Под оптимальностью здесь понимается максимальная отдача от рекламы, измеряемая, например, количеством кликов по баннерам. В простейшем случае рекламодатель ограничен своим бюджетом и трафиком сайтов-площадок, при этом он максимизирует количество кликов. Формально такую ситуацию можно представить следующим образом:

              трафик    стоимость   средний ctr*
Сайт1:       t1            p1                c1
Сайт2:       t1            p2                c2
Бюджет РК: $B

, где Сайт1 и Сайт2 - рекламные площадки в Интернет,
трафик - суточный трафик площадки,
средний ctr - средний показатель ctr по площадке (ctr - click-though-rate - показатель эффективности Интернет-рекламы, измеряемый как отношение числа кликов по баннеру к числу показов баннера),
пересечения строк и столбцов - значение показателя для конкретного сайта.

В математическом выражении эти ограничения выглядят так:
Пусть xi - количество показов рекламы на конкретном сайте, тогда:
бюджетное ограничение: p1*x1+p2*x2 <= B              (1)
ограничение по трафику: x1 <= t1 ; x2 <= t2              (2)
условие неотрицательности: x1, x2 >= 0              (3)
Целевая функция: c1*x1 + c2*x2 -> max              (4)

В простейшем случае с двумя рекламными площадками и таким набором ограничений задача решается в течение пары минут. Однако, в жизни все как правило несколько сложнее. Первое, что усложняет ситуацию - обратный таргетинг (использование слайсов). Слайс - это некоторый процент трафика площадки, который та выделяет под конкретного рекламодателя. Например, в нашем случае это:
Сайт1: s1
Сайт2: s2
Тогда ограниения по трафику (2) должны изменяться на эти показатели:
 x1 <= t1*s1 ; x2 <= t2*s2              (5)
В остальном схема та же.

Более интересный случай, при котором каждый сайт предлагает разные условия в разное время или целевая аудитория неравномерно распределена по суткам, что вытекает в разные значения ctr для разных временных интервалов. В таком случае каждый временной интервал для каждого сайта можно рассматривать как отдельную площадку со своими условиями, например:
Сайт1: утро: c1 вечер c'1
Сайт2: утро: c2 вечер c'2
Тогда формально задача сводится к такой:
Пусть x1 - количество показов на площадке 1 утром, x'1 - вечером, а x2 - количество показов на второй площадке утром, x'2 - вечером, тогда:

бюджетное ограничение: p1*(x1+x'1)+p2*(x2+x'2) <= B                        (6)
ограничение по трафику: (x1+x'1) <= t1*s1 ; (x2+x'2) <= t2*s2              (7)
условие неотрицательности: x1, x2, x'1, x'2>= 0                                      (8)
Целевая функция: c1*x1 + c2*x2 + c'1*x'1 + c'2*x'2 -> max                   (9)

В общем виде такого рода задачи можно представить как:  (10)
P*∑Xj <= B
∑Xj <= T*S
Xij >=0
∑∑(Cij*Xij) -> max
, где P - вектор цен сайтов
T - вектор трафиков сайтов
S - вектор слайсов сайтов
Cij - ctr i-того сайта в j-ый период
Xij - количество показов на i-ом сайте в j-ый период
∑Xj - вектор суммарных количеств показов для каждого сайта за все периоды


Такого рода задачи решаются с помощью методов линейного программирования, а именно, из вида (10) приведенные к стандартной форме решаются симплекс методом. Сущность метода здесь описывать не буду. Более простые ситуации (с малым количеством переменных) можно решить графически. В конце будут приведены примеры решения такого рода задач.

Таким способом можно решать задачи различного рода, оперирующие теми же понятиями. Например, перед компанией стоит другая задача: достигнуть определенного числа кликов за минимальные деньги. Тогда в формальном представлении задача сводится к такой (11):

∑∑(Cij*Xij) = K
∑Xj <= T*S
Xij >=0
P*∑Xj -> min

, где условие бюджетного ограничения перетекло в целевую функцию, которая должна быть минимизирована, в то время как целевая функция перешла в новое ограничение: сумма всех кликов (ctr*показы) должна равняться определенному значению K.

Использование симплекс-метода в решении задач планирования РК имеет ряд преимуществ:

  1. Гарантированное нахождение оптимального решения в заданных рамках (если оно существует)
  2. Возможность использования результатов предыдущих вычислений ответа с целью анализа изменений
Второй пункт стоит пояснить. Линейное программирование предоставляет инструмент учета устойчивости решения, с помощью которого можно прогнозировать изменение оптимального решения в ответ на те или иные изменения окружения задачи (изменения ограничений или целевой функции). Примерами таких изменений могут послужить колебания ctr сайтов, изменения цен или величины бюджета.

Пример1.
Пусть даны такие начальные условия:
                       трафик    стоимость   средний ctr*
Сайт1:       1000            1                0,2
Сайт2:       2000            2                0,1
Бюджет РК: $1000
Тогда ограничения:
бюджетное: x1+2*x2 <= 1000
на трафик: x1 <= 1000 ; x2 <= 2000
целевая функция: 0,2*x1 + 0,1*x2 -> max

Строим график:

Линия А-В - бюджетное ограничение, рассматрвиаем только положительную область, т.к. работаем с натуральными показателями. Выделенная область - область допустимых значений x1 и x2. Ограниченя на трафик не изменяют выделенной области. Кол-во кликов растет вдоль вектора grad = (2, 1) (градиент целевой функции), отсюда следует вывод об оптимальности точки B, т.е. все показы совершаются на сайте 1. Логично, что при отсутствии лимитирующих ограничений на трафик, ниболее выгодно все показы совершать на том сайте, где выгоднее отношение ctr к цене. Другая ситуация рассмотрена в примере 2.
Пример2
Добавим в предыдущий пример ограничение на слайсы. Пусть первый сайт выделяет 50% трафика, а второй - 95%. Тогда ограничения изменятся следующим образом:
бюджетное: x1+2*x2 <= 1000
на трафик: x1 <= 1000*0,5 ; x2 <= 2000*0,95
целевая функция: 0,2*x1 + 0,1*x2 -> max

В этом случае ограничения на трафик меняют допустимое множество решений, и в оптимуме мы переходим в точку С.

воскресенье, 6 июня 2010 г.

Процесс анализа информационных рисков

В рамках подготовки к защите диплома...

На сегодняшний день многие компании в своей деятельности используют различные достижения сферы информационных технологий для получения конкурентных преимуществ. Однако, использование любого нового инструмента, в том числе и ИТ, влечет за собой добровольное принятие новых, связных с этим инструментом, рисков, угрожающих непрерывности бизнеса. Таким образом становится актуальным умение управлять такими рисками.
Отсюда вытекает основная цель данной работы:"Создание аналитической основы системы управления информационными рисками." Для ее достижения необходимо решить следующие задачи:
  1. Определить понятие «информационный риск»
  2. Определить и формализовать процесс анализа информационных рисков
  3. Разработать способ сбора и хранения результатов анализа, отвечающего требованиям системы управления рисками
Многие ученые сходятся во мнении, что термин "риск" обозначает принятие решения, результат которого заранее неизвестен. Риск имеет отношение только к будущему и неразрывно связан с принятием решений. Можно сказать, что риск всегда обозначает вероятностный характер исхода, причем вероятность бывает двух типов. Первый тип - объективная - связан с природой вещей и материи, в то время как второй - субъективная - связан с недостатком информации у лица, принимающего решения. Здесь следует разграничить два понятия: риск и неопределенность. На сегодняшний день существует два основных подхода к такого рода разграничению. 

Информационный подход основывается на представлении о том, что различия между риском и неопределенностью сводятся к объему доступной информации об исследуемой ситуации. Риск характеризуется как «измеримая неопределенность», а непосредственно неопределенность – «неизмеримая определенность». Оценочный подход базируется на представлении о том, что различия между риском и неопределенностью заключаются в субъективном отношении к реализации того или иного исхода, а именно риск связан с отношением к неблагоприятным исходам, а неопределенность связана с многовариантностью будущего развития, т.е. с неоднозначностью исхода. Подводя итог, можно сказать, что неопределенность объективна по природе, она порождает риски, которые субъективны по природе.

Поняв, что же такое риск в целом, можно перейти к основной теме работы: рискам информационным. На сегодняшний день существует множество определений данного понятия, однако, далеко не все охватывают все грани термина. Некоторые определения рассматривают только риски систем, некоторые не принимают во внимание угрозы интеллектуальной собственности. Наиболее функционально полное определение должно охватывать все области воздействия такого рода рисков, а именно: Информационные технологии (Сети, ПО, Аппаратное обеспечение etc.), Поддержка принятия решений (СППР, Стандартизация, Совместимость etc.), Интеллектуальная собственность (Нематериальные активы, Учет и отчетность etc.). Примером такого определения может являться: "Возможность наступления случайного события, приводящего к нарушениям функционирования и снижению качества информации в информационной системе предприятия, а также к неправомерному использованию или распространению информации во внешней среде, в результате которых наносится ущерб предприятию"

Для того, чтобы правильно управлять такого рода рисками, в первую очередь необходимо уметь их определять и анализировать. Процесс анализа информационных рисков состоит из четырех основных этапов.

Первый этап: Идентификация и группирование информационных ресурсов. На данном этапе составляется список информационных ресурсов предприятия, они группируются по классам. Для каждого ресурса выявляется его критичность, например одна из трех:
  • критические ресурсы – организация или подразделение не могут продолжать свою деятельность без данных ресурсов;
  • основные ресурсы - организация или подразделение могут продолжать свою деятельность, но очень ограниченное время , и ресурсы должны быть обязательно восстановлены;
  • нормальные ресурсы - организация или подразделение могут продолжать свою деятельность длительный период времени, но некоторые пользователи будут частично ущемлены.
Таким образом, на данном этапе составляется макет информационной инфраструктуры предприятия.

Следующий этап: Идентификация и измерение рисков. Под идентификацией здесь понимается выбор из списка общих рисков, свойственных информационным технологиям, тех, которые являются относящимися к текущей инфраструктуре. В качестве общего списка (отправной точки) можно взять, например, список, предложенный немецким стандартом информационной безопасности BSI - IT Baseline Protection Manual. Измерение же рисков можно осуществить по следующей схеме:
МЕРА РИСКА = P(происшествия) * Величина потерь
, где первый множитель - вероятность наступления рискового события. Если оба показателя количественные, то значение можно получить обычной операцией умножения, однако, если хотя бы один их показателей качественный и такая операция не определена, то можно воспользоваться матричным методом оценки. Строится матрица, где по вертикали откладываются вероятности происшествия (например, от А - минимальная до E - максимальная), а по горизонтали - прогнозируемые величины потерь. На пересечении актуальных столбцов и строк будет получен результат измерения:

Третий этап: Выявление средств защиты и переоценка рисков. Поскольку большинство компаний понимает, что они подвержены информационным рисками, они используют те или иные средства защиты от них. На данном этапе такие средства защиты группируются по классам угроз, от которых они защищают, и происходит переоценка рисков с учетом этих самых средств. Подход к измерению выражается формулой: 
МЕРА РИСКА = Р(угрозы)*Р(уязвимости)*Величина потерь
Вероятность происшествия тут разбита на две вероятностные характеристики: первая из них - вероятность угрозы - это вероятность того, что рисковое событие произойдет. Вторая - вероятность уязвимости - это вероятность того, что система защиты пропустит это событие.

Последний этап заключается в проведении финальной оценки и выдаче рекомендаций по управлению рисками. Как правило, компании выбирают одну из четырех основных стратегий управления рисками: 
  • Принятие - если риск мал и прогнозируемые потери не велики, компании как правило принимают такие риски.
  • Страхование - данная стратегия направлена на снижение величины возможных потерь, обычно за счет переложения части рисков на контрагентов.
  • Контроль - эта стратегия направлена на снижение вероятностей наступления рисковых событий. Примерами мер могут служить: использование более совершенных средств защиты, исправление ошибок, установка патчей
  • Избегание - если вероятность и возможные потери непозволительно велики, компании могут решить избежать таких рисков, избавившись от рискового актива.
Во время исполнения процесса анализа информационных рисков накапливается большое количество информации, нужной в дальнейшем. Для хранения такой информации возможно использование специального инструмента - базы данных. Такая БД должна хранить следующие сущности:
  • Информационный ресурс, характеризуется:
    • наименованием,
    • классом,
    • категорией,
    • описанием,
    • ответственным сотрудником;
  • Риск, характеризующийся:
    • названием,
    • сценарным анализом;
  • Средство защиты, характеризующееся:
    • названием,
    • комментарием
Между выделенными сущностями возможны следующие связи:

  • Между риском и ресурсом:
    • Для каждого ресурса - связные риски,
    • Для каждого риска – связные ресурсы,
    • Каждая связка риск-ресурс характеризуется:
      • Вероятностью,
      • Прогнозируемым ущербом,
      • Оценкой;
  • Между ресурсом, средством защиты и риском:
    • Для каждого риска - связные ресурсы и средства защиты,
    • Для каждого ресурса – связные риски и средства защиты,
    • Для каждого средства защиты – связные риски и ресурсы,
    • Каждая связь риск-ресурс-средство защиты характеризуется:
      • Значением угрозы,
      • Значением уязвимости,
      • Значением прогнозируемой степени ущерба,
      • Оценкой.
Для удобства использования  специалистами, не владеющими языками запросов (например, менеджерами) к такой БД разумно пристроить графический интерфейс. Основными требованиями к такого рода интерфейсу могут служить:
  1. Наличие интерфейсов CRUD-взаимодействия (создание, чтение, обновление и удаление записей)
  2. Наличие интерфейсов построения отчетов в трех формах:
    1. Текстовом (в виде заполненных бланков документов)
    2. Табличном (в виде двумерных таблиц)
    3. Графическом (в виде графиков различного типа)
Таким образом, в ходе данной работы были:

  1. Рассмотрены различные подходы к определению понятия информационный риск
  2. Описан и формализован процесс анализа информационных рисков
  3. На основе формализации процесса сделаны выводы о его предпочтительности: процесс выигрывает за счет
    1. своей непрерывности
    2. возможности построения актуального макета системы информационной безопасности
  4. Предложен вариант организации аналитической основы управления информационными рисками за счет внедрения использования специально спроектированной базы данных.

пятница, 4 июня 2010 г.

Интересное замечание

Когда появляется необходимость привлечь внимание спорящих или малововлеченных людей или просто в шумном месте, а также встает необходимость перебить кого-то или кому-то возразить, то обычное в таких ситуациях повышение голоса, как правило, не приносит должной реакции. Даже наоборот, оно вызывает еще большее сопротивление. Однако, стоит произнести нужную фразу простым уверенным, низким голосом (баритонистым, например), и цель достигнута: все замолкают и, хотя бы на время, начинают слушать. Удержать внимание - это уже цель другая, достигаемая за счет ораторского мастерства говорящего; но его привлечение, как правило, заслуга самого голоса.

Возникает вопрос, почему именно такие тембр и высота так привлекают людей? Психологи могут ответить, что это, например, было заложено в детстве, как голос отца, который доносился до нас, несмышленных малышей, в возрасте нескольких дней, или что это - память предков-неандертальцев, взыгрывающая в мозгу в этот момент, или любую другую похожую чушь.

Но мне кажется, все это происходит просто потому, что такой голос - красивый. Банально красивее прочих. И как человек замирает, увидев прекрасную картину или статую или заметив краем глаза природные красоты, так и тут люди вздрагивают от простой красоты, которая прорезает окружающий фон. Они замолкают в удовольствии, которое им доставляет слух, и в этот момент оратор продолжает свою речь. Все рукоплещут ему, как повелителю митингов, собраний, обсуждений, а благодарить то надо в первую очередь не его умения подбирать слова (хотя и их тоже), а то, что в людях еще есть чувство прекрасного и они могут им наслаждаться. И это прекрасно.

К слову о прекрасном голосе:

[ http://www.youtube.com/watch?v=sHR-o_tO-cY ]
Лучший.