基于SVM的电信话务量预测方法硕士学位论文.doc
《基于SVM的电信话务量预测方法硕士学位论文.doc》由会员分享,可在线阅读,更多相关《基于SVM的电信话务量预测方法硕士学位论文.doc(73页珍藏版)》请在三一文库上搜索。
1、分类号分类号 密级密级 U D C 编号编号 中 南 大 学 CENTRAL SOUTH UNIVERSITY 硕士学位论文硕士学位论文 论 文 题 目 基于支持向量机的电信话务量 预测方法 学 科、专 业 控制科学与工程 原创性声明原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致 谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。 与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的 说明。 作者签名: 日期: 年 月 日 学位论文版权使用
2、授权书学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文, 允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分 内容,可以采用复印、缩印或其它手段保存学位论文。同时授权中 国科学技术信息研究所将本学位论文收录到中国学位论文全文数 据库 ,并通过网络向社会公众提供信息服务。 作者签名: 导师签名 日期: 年 月 日 1 摘摘 要要 话务预测技术是通讯网络系统设计、规划和优化的重要手段之 一,同时也能为电信企业制定营销策略提供决策支持。虽然话务预 测的研究已有 20 多年历史,并形成了一些话务预测方法,
3、但是随着 新理论和新技术的发展,对话务预测新方法的研究仍在不断地深入 进行。支持向量机作为数据挖掘的一项新技术,应用于模式识别和 处理回归问题等诸多领域。本文利用支持向量机优越的非线性学习 及预测性能,针对短期话务预测的各种影响因素的非线性特性,提 出基于支持向量机的电信话务量预测新方法,以提高预测精度和时 效性,该研究具有重要的理论意义和实用价值。 由于影响话务量的因素繁多且复杂,若对输入不加适当选择处 理会导致预测精度降低,训练时间增加。考虑到话务量变化的周期 性特点,因此本文采用话务量聚类预处理技术,应用模糊聚类分析 的基本原理,依据输入样本的相似度选取训练样本,即选用同类特 征数据作为
4、预测输入,保证了数据特征的一致性,强化了历史数据 规律。在基于支持向量机话务预测之前,先对样本进行模糊聚类分 析,选取与预测样本特征相似的样本作为支持向量机的训练样本。 本文分析了支持向量机的基本原理,支持向量机具有非线性拟 合、泛化能力强、训练收敛速度快等显著特点。数值试验结果表明, 支持向量机具有较强的学习能力。另外,本文还具体讨论了支持向 量机中高斯核函数中参数对支持向量机学习预测性能的影响,指 出高斯核函数具有描述样本相似程度这一性质,通过数值实验和理 论分析给出了一种选择高斯核函数的方法拐点法。进一步指出样 本数据标准化对学习预测的影响,给出了标准化后选择较优高斯核 函数参数的一个大
5、致范围。针对话务量与各种影响因素之间的非线 性关系,建立了基于支持向量机的短期话务量预测模型,结果表明 基于支持向量机的话务量预测精度要优于神经网络方法和周期时间 序列方法。 关键字:支持向量机,模糊聚类,预测模型,高斯核函数 I ABSTRACT Traffic forecasting technology is one of important means for network communication system designing, planning and optimization, and it also can provide decision support for te
6、lecom enterprise when marketing strategy development. Currently there have been more studies in theory and complemented methods of traffic forecasting and obtained some achievement. New theory and new technology based traffic forecasting researches have been developed continuously. As new technology
7、 of data mining, support vector machines(SVM) have been successfully applied in pattern recognition and regression problem,et al.This paper proposes to use its advantages of non-linear processing and generating ability to accomplish short-term traffic forecasting of telecom system, so as to improve
8、forecasting precision. Consequently the study is significant in theory and is valuable in practice. Because of numerous traffic influence factors having a great of complex characteristics, and the pattern, without selecting input vectors, will lead to reduce of the precision and increase of the comp
9、utering time. Therefore this paper adopts an effective fuzzy clustering analysis and process technology for the traffic data and combines the clustering algorithm with SVM. A new SVM method based on FCM fuzzy clusting algorithm for short-term traffic forecasting is first presented in this paper. Thi
10、s method chooses training samples by fuzzy clustering according to similarity degree of the input samples in consideration of the periodic characteristic of traffic change, which means take the same type of the data as the learning samples for forecasting, guarantee the consistency of the data chara
11、cteristic and enhance the history data regulation. This paper analyses the basic theories of SVM. SVM have the remarkable advantages of non-linear regression, high forecasting accuracy and small time complexity. The results of numerical experiments show that SVM really has great prediction ability.
12、In addition, we discusses on gauss kernel SVM and how the parameter influences the quality of SVM in tail. We also show that gauss kernel function can describe the likeness degree of the sample. Moreover,we II propose a new algorithm for finding a good parameter, we called inflexion method. Whats mo
13、re, we point out the influence of standardize to predict, and then give mostly scope of the excellent parameter, which in gauss kernel function after standardized. According the non- linear relationship between the forecasting traffic and its influence factors, this paper proposes a short-term traff
14、ic forecasting model based on SVM. Compared with the forecasting method of artificial neural networks (ANN) and circle time series, the simulation results of the practical application show that the SVM method is much better than others. KEY WORDS: support vector machines, fuzzy clusting, forecasting
15、 model, gauss kernel function 1 目目 录录 摘摘 要要1 ABSTRACT I 第一章第一章 绪绪 论论1 1.1 研究背景和意义1 1.2 电信话务量预测研究现状2 1.3 研究内容与研究目标4 1.4 论文构成5 第二章第二章 话务量预测的聚类预处理技术话务量预测的聚类预处理技术7 2.1 电信话务量7 2.1.1 话务量特性分析.7 2.1.2 话务量预测的特点.10 2.1.3 话务量预测流程.11 2.1.4 预测误差分析.12 2.2 加权 FCM 聚类算法.12 2.2.1 FCM 聚类算法简介 13 2.2.2 加权 FCM 聚类算法 15 2.
16、3 基于加权 FCM 的话务量聚类.17 2.3.1 话务量聚类的意义17 2.3.2 加权 FCM 话务量聚类流程 18 2.4 本章小结20 第三章第三章 支持向量回归机的预测能力支持向量回归机的预测能力21 3.1 支持向量机原理21 3.1.1 最优分类面.22 3.1.2 广义最优分类超平面.24 3.2 支持向量机回归算法24 3.2.1 线性支持向量回归机.24 3.2.2 非线性支持向量回归机.27 2 3.3 支持向量机的训练算法28 3.4 支持向量机的预测能力30 3.4.1 支持向量机的内插性能.30 3.4.2 支持向量机的外推性能.32 3.4.3 支持向量机的抗噪
17、声性能.32 3.5 支持向量机用于话务量预测的优势34 3.6 本章小结34 第四章第四章 基于支持向量机的话务量预测模型基于支持向量机的话务量预测模型36 4.1 话务量预测模型36 4.1.1 模型的输入与输出.36 4.1.2 模型预测流程.38 4.1.3 模型参数优选.40 4.2 仿真实验与结果分析45 4.2.1 实验过程.45 4.2.2 实验结果.47 4.2.3 与其他预测方法比较.47 4.3 预测模型的应用50 4.3.1 增量学习.50 4.3.2 话务流量监控.51 4.4 建模与模型应用需注意的问题53 4.5 本章小结54 第五章第五章 结论与展望结论与展望5
18、6 参参 考考 文文 献献58 致致 谢谢63 攻读学位期间主要的研究成果攻读学位期间主要的研究成果64 中南大学硕士学位论文 第一章 绪论 1 第一章第一章 绪绪 论论 1.1 研究背景和意义 伴随中国经济的稳步发展,我国的电信业也取得了长足的发展与进步。但 与此同时,各运营商之间的竞争愈加激烈,竞争的加剧迫使各运营商千方百计 的挖掘自身潜力,从技术和服务两方面入手,不断的提高客户满意度和管理决 策准确度。对各运营商而言,如何建设、优化和经营好自己的网络,如何进行 更准确的市场定位是需要考虑的首要问题。正确的决策源于科学的规划,而符 合市场规律的业务预测是进行科学规划的重要手段。 目前国内几
19、大电信企业已完成了业务支撑系统的升级和改造工作,实现了 电信运营服务的整体自动化流程处理和管理平台。同时,业务支撑系统应用软 件也开始对运营数据进行更精细的数据分析工作,但数据挖掘的应用仍处于初 级阶段,主要表现为技术手段落后、挖掘主题不够深入、易用性差,不利于实 施和推广,难以提供有效的决策支持。 话务量是电信业务流量的简称,是反映用户通讯频繁程度和通话时间长短 的一种指标。话务预测技术是通讯网络系统设计、规划和优化的重要手段之一, 同时也能为电信企业制定营销策略提供决策支持。网络维护中心通过预测话务 量来预测将来的网络运营情况,为将来可能出现的网络问题,提前作好准备, 避免出现网络大面积拥
20、塞,提高网络运营的服务质量;市场及营销部门通过对 业务结构、网络流量流向的分析和预测,能够了解现在和将来一段时间内不同 运营商,不同地域,不同用户之间互联互通的情况,帮助他们进行合理的资源 调度和分配,并制定有效的营销策略提高自身客户的忠诚度,有针对性的吸引 竞争对手的客户。目前,大多数运营商的网络分析优化部门对历史数据的一些 指标做简单的统计工作,通过分析历史数据,只能了解各个通信设备等通信资 源过去的利用情况和运营状况,但对未来的网络调整、优化、扩容以及将来可 能发生的情况等缺少科学的预测;即便某些较发达地区的运营商开发了话务量 预测系统,但针对话务量的预测工作仍存在明显的不足之处,从技术
21、上主要表 现为: 1) 预测精度不高 目前已建立的话务量预测系统所采用的主要预测方法为单因素周期时间序 列,基于时间序列的方法往往寄望于从历史数据中寻找到话务量变化的规律, 但影响话务量的因素众多,而历史数据中蕴含的信息毕竟有限,因此该方法难 中南大学硕士学位论文 第一章 绪论 2 以获得理想的预测精度。 2) 预测模型复杂,实用性不强 由于节假日与平常的话务量变化规律不一致,因此在应用时间序列方法对 话务量进行建模预测时,往往需要分别对节假日、周末以及工作日建模。然而 通过这种方式建立的模型自动化水平较低,往往需要不断的进行模型修正,而 模型修正必须依赖一定的业务经验和技术知识,这样就给使用
22、者造成负担,实 用性降低。 然而,对短期话务量预测有两个基本的要求: 1) 精确性:短期话务量预测必须具备较高的预测精确,一般要求相对误差 不超过 3-5%,精度越高,决策的准确度也会越高。 2) 时效性:为保证有充分的实施时间,短期话务量预测必须快速地得出预 测结果。时效性差会降低预测的实用价值,因此通过预测模型应尽可能迅速的 得到预测结果。 由于存在各种内、外随机因素的影响,通讯系统的话务量大小在本质上来 说是不可控的。因此了解未来话务量的可能变化的一个有效方法,就是观察话 务量的历史记录,对其从本质上去研究和分析;另外,通讯系统话务量呈现周 期性特征,给研究分析提供有利方面;此外,某些可
23、以较容易得到的业务发展 指标(如用户数等)能代表业务发展的趋势,能有效的描述未来话务量的大体 趋势走向。 只有密切注意到话务量具有这些重要特征,才能有针对性的提出一套实际 可行的方法,本文正是在总结了现有的话务量预测方法并分析话务量特性及预 测特点后,在话务量聚类预处理基础上,利用目前已广泛应用于预测领域的支 持向量机回归方法对话务量预测过程建模,提出基于支持向量机的电信话务量 预测新方法,以提高预测精度和时效性,该研究对于高精度和高效率的电信话 务量预测具有重要的理论意义和实用价值。 1.2 电信话务量预测研究现状 国内对于电信话务量预测的研究开始于上世纪八、九十年代,至今已形成 了几种常见
24、的预测方法,如时间序列法、回归分析法、模糊神经网络法等。但 由于影响话务量变化的因素非线性程度极高,难以通过建立精确的数学模型来 进行预测,所以精确的话务量预测仍然相当困难。实践证明,没有一个预测方 法是绝对准确的,也没有一个方法能适应所有的电信业务预测要求。 1) 时间序列法 中南大学硕士学位论文 第一章 绪论 3 话务量数据是按照时间先后排列在一起的,因此它符合时间序列(Time series)的特点。经常被采用的时间序列模型有以下几种:自回归模型(AR)、动 平均模型(MA)、自回归-动平均模型(ARMA)和累积式自回归-动平均模型 (ARIMA)等1-5。 付楚胜根据线性预测理论,摒弃
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 SVM 电信 话务量 预测 方法 硕士学位 论文
链接地址:https://www.31doc.com/p-3922414.html