Как обустроить мансарду?



Как создать искусственный водоем?



Как наладить теплоизоляцию?



Как сделать стяжку пола?



Как выбрать теплый пол?



Зачем нужны фасадные системы?



Что может получиться из балкона?


Главная страница » Энциклопедия строителя

содержание:
[стр.Введение] [стр.1] [стр.2]

страница - 0

Методы регрессионно - когнитивного анализа в задачах прогнозирования данных биллинговой системы

Кораблин М.А., Салмин А.А. (alx63@bk.ru), Мелик-Шахназаров А.В.

Поволжская государственная академия телекоммуникаций и информатики

В соответствии с основными нормативно - регламентирующими материалами Международного Союза Электросвязи (МСЭ) [1] биллинговые системы (БС) в основном охватывают два уровня управления телекоммуникационными сетями (Telecommunication Management Network - TMN) [2] - управление услугами и управление бизнесом. Концепция TMN носит общий характер и отражает основную направленность телекоммуникационного бизнеса: ориентацию на нужды конкретного потребителя, быструю и конструктивную реакцию на его запросы, широкий спектр предлагаемых услуг. Такие целевые установки позволяют рассматривать БС и процессы биллинга основным инструментом реализации рыночной политики оператора.

Один из основных недостатков современных биллинговых систем заключается в том, что клиент (потенциальный абонент) в БС фактически рассматривается как «лицевой счет», обезличивается [3]. Такой подход к клиенту приводит к образованию упущенной выгоды, которая связана с недоучетом потребностей и возможностей клиента. Во многих ситуациях размер этой упущенной выгоды весьма значителен, поэтому в условиях обостряющейся конкурентной борьбы за клиента на первый план выходит индивидуальный подход к обслуживанию, способный найти наиболее рациональный «индивидуальный баланс интересов» на рынке телекоммуникационных услуг.

Как показывают оценки экспертов [4], привлечение нового клиента стоит примерно в 10 раз больше, чем удержание старого, а возврат ушедшего - в 100 раз больше. Эти цифры во многом объясняют появление новой парадигмы бизнеса, в основу которой заложены долгосрочные, индивидуальные отношения с клиентом. Реализация этой парадигмы основывается на знании не только платежеспособности клиента, но его потребностей, интересов, особенностей и т. д. Информация об атрибутах такого рода сама по себе ничего не дает для развития бизнеса. Для того чтобы связать такие атрибуты клиента непосредственно с параметрами биллинговых процессов, необходимо выявить «скрытые» знания о наличии или отсутствии подобных связей, их надежности и достоверности. Решение этой задачи поддерживается новыми классами аналитических информационных систем, - в первую очередь это OLAP -технологии (On-Line Analytical Processing) [5, 6] и CRM - технологии (Customer Relationship Management) [7].

С направлением CRM тесно связаны методы интеллектуального анализа данных (ИАД) (Data Mining) [8, 9]. Сфера использования этих методов отличается тем, что накопленные объемы данных обобщаются до такого уровня представления информации, который может быть охарактеризован как получение знаний. Инженерия знаний - одно из направлений современного искусственного интеллекта - включает в себя множество различных методов. Цель Data Mining состоит в выявлении скрытых правил и закономерностей в наборах данных. Такие закономерности представляются в виде эмпирических моделей, классификационных правил, выделенных кластеров и т. д. Концепция Data Mining позволяет увидеть нетривиальные взаимоотношения между данными, которые могут способствовать увеличению эффективности деятельности предприятия в целом. Выявленная закономерность, как правило, не может претендовать на всеобщность или


универсальность, но она может дать аналитику определенный повод для объяснения отдельных аспектов реинжиниринга бизнеса, в том числе и телекоммуникационного.

Наиболее рельефно возможности ИАД [6, 9] характеризуют механизмы классификации данных и выявления цепочек. Классификация позволяет выявить классообразующие признаки, по которым тот или иной объект можно отнести к заданному классу. Например, признаки устойчивости (надежности, стабильности) клиента. Выявление цепочек (событий или связанных факторов) позволяет установить связи между факторами, которые на первый взгляд не связаны друг с другом. Такие цепочки могут быть хронологическими или причинно-следственными, связи между элементами цепочек могут определяться на различных основах: вероятностной, корреляционной, регрессионной и т.п.

Ниже рассматривается регрессионно - когнитивная модель для интеллектуального анализа данных и её использование в биллинговых системах для анализа объемов услуг, предлагаемых клиентам. Количество видов телекоммуникационных услуг постоянно растет, а их объемы варьируются от клиента к клиенту, изменяются во времени, подвержены сезонным изменениям и т.п. Взаимосвязи между объемами услуг разных видов неочевидны: существуют ли скрытые связи между услугами, какова «сила» этих связей и к чему приведут возможные изменения объемов оказываемых услуг. Ответ на эти и подобные вопросы имеет вполне определенное практическое значение, позволяющее предсказать изменение объемов и, соответственно, экономические эффекты, свойственные той или иной ситуации, складывающейся на рынке телекоммуникационных услуг.

Не нарушая общности рассуждений, рассмотрим пример, в котором используются лишь 4 вида услуг: международная связь (М), местная связь (МС), передача данных (ПД) и Интернет (И). На рис. 1 приведен полносвязный граф, иллюстрирующий возможные связи между услугами.

width=282

Рис. 1. Полносвязный граф, иллюстрирующий возможные

связи между услугами

Двунаправленные стрелки иллюстрируют взаимные влияния факторов.

Для количественного анализа таких взаимных влияний мы построили линейную регрессионную модель вида:

И = Иб + км^и М + кмС-и МС + квд^и ПД; М = ки^м И + Мб + кмс-м МО+^д^М ПД; МС = ки^мС И + км^мС М + МСб + квд^мС ПД; ПД = ки^ПД И + км^ПД М + кмС-ПД МС + ПДб.

(1)

Здесь Мб, Иб, МСб, ПДб - базовые объемы по видам услуг (свободные члены регрессий), к -коэффициенты влияния. Например, кМ^И определяет влияние объемов международной связи на объемы услуг Интернета.

Значения коэффициентов оцениваются на основе биллинговых файлов, в нашем случае это набор из 2000 записей по объемам услуг, оказываемых различным клиентам в разное время.


Упрощая ситуацию, мы оставили вне поля зрения хронологию получения записей и тип клиента. Значения базовых объемов и коэффициентов, вычисленные в системе PolyAnalist [10], сведены в таблицу 1. Здесь по диагонали расставлены базовые объемы услуг, а в остальных клетках безразмерные коэффициенты линейных связей. Строки таблицы идентифицированы видами услуг как зависимыми переменными, а столбцы - как влияющими переменными. Например, коэффициент к М^И размещается в столбце М (влияющая переменная) и строке И (зависимая переменная). Матрица [к в общем случае асимметрична.

Таблица 1

И

м

МС

ПД

И

28831

- 0,0937054

0,360806

0,0559736

м

- 0,128943

114059

0,831809

0

МС

0,193472

0,320125

18804

- 0,0349213

ПД

0,0398273

0

0

20869

Структура таблицы определяет когнитивный граф [11, 12, 13] взаимосвязей между объёмами услуг, который не относится к полносвязным. Кроме того, соответствующий сигнальный граф [14], определяемый только знаками коэффициентов (+ или -), свидетельствует о наличии в системе услуг множества положительных и отрицательных обратных связей, которые в совокупности определяют характер влияния исследуемых факторов друг на друга (рис. 2).

+

width=284

Рис. 2. Сигнальный граф, иллюстрирующий возможные связи между услугами для таблицы 1

Такого рода регрессионно-когнитивная графовая модель не только определяет связанную цепочку факторов, но и позволяет экстраполировать процессы формирования объемов рассматриваемых услуг. Обычная регрессионная модель позволяет предсказать значение одного из элементов цепочки по другим известным без учета динамики обратных связей, только на основе прямого вычисления одного из уравнений системы (1). Предлагаемая модель способна на основе общей информации о связях между вершинами когнитивного графа реализовать серию (последовательность) вычислений системы (1), продолжающуюся до наступления в системе устойчивого состояния. При этом схема вычислительного процесса по предсказанию объемов услуг приобретает итерационный характер (рис. 3).




содержание:
[стр.Введение] [стр.1] [стр.2]

© ЗАО "ЛэндМэн"