贵州电信基于端到端的 VOLTE 问题定位方法研究
贵州电信分公司 陈守益
【摘要】随着 LTE 快速发展,VOLTE 已经成为运营商发展的重要业务,对 VOLTE 用户感知体验的关注度也逐步升温。如何给VOLTE 用户提供优异的端到端感知体验,是VOLTE 优化提升的方向。本文通过分析 VOLTE 业务流程特征,基于端到端的分析思想, 从终端侧、无线侧、EPC 侧、IMS 侧四个方面,分别对比总结了问题出现的主要原因及分析定位方法,并通过具体案例进一步说明,最终形成了基于端到端的 VOLTE 问题定位方法,为 VOLTE 优化工作提供了系统化的分析思路,有效地提升了用户感知。
【关键字】VOLTE 端到端 语音感知流程优化
【业务类别】VOLTE 业务
一、概述
VOLTE 端到端涉及 5 大领域分为终端、接入网、承载网、核心网、业务平台。其中,较为复杂的是核心网,主要分为分组域(接入核心网)、信令网、IMS 域、电路域、分组域和用户数据。LTE 网络下,IMS 提供语音服务,VOLTE 语音使用编解码由 UE 和 IMS 核心网协商确定,ENODEB、EPC 是透明的,语音流承载在 QCI1 上,是基于 RTP/UDP/IP 协议。如图 1 所示:
图 1 VOLTE 端到端涉及网元
VOLTE 端到端质量优化分析主要从用户到用户间语音质量感知,对 VOLTE 端到端语音质量问题进行定界、分析及优化处理。
二、分析过程
(一) VOLTE 网络架构
VOLTE 业务是基于 IP 多媒体子系统(IMS,IPMediaSubsystem)网络,在 LTE 使用为控制层面(Controlplane)和语音服务的媒体层面(Mediaplane)(图 1),这使语音服务(控制和媒体层面)作为数据流在 LTE 数据承载网络中传输,因此,VOLTE 业务涉及 EUTRAN、EPC、IMS 三个域,其中 EUTRAN 和 EPC 主要负责移动性管理及承载建立等功能,IMS 主要负责处理 VOLTE 相关业务实现。
VOLTE 商用部署,主要是对 2G/3G/4G 网元进行功能升级改造以及新建 IMS 网络。新建的 IMS 网络网元众多,根据功能的不同,可分为三层:用户接入层,主要负责网络的互连互通及底层承载控制;业务控制层,复测呼叫控制、安全管理、业务触发、资源控制、网络互通等核心功能;业务应用层,负责各种业务的实现。
(二) VOLTE 信令流程
VOLTE 信令流程主要可分为:注册与去注册流程、语音/视频通话流程、短信流程三类。
1) 注册与去注册
注册流程主要分为三个阶段:EPC 附着、IMS 注册、第三方服务器注册(图 3)。EPC 附着流程主要新增 P-CSCF 地址发现与 IMS 默认承载建立流程;IMS 注册中,P-CSCF 注册与 S-CSCF 注册依次进行;第三方服务器注册主要与网络部署情况及用户开通功能有关,注册过程中,会依次向多个服务器进行注册。
2) 语音/视频通话流程
正常通话流程可分为:主叫发起通话请求、被叫域选、被叫建立专有承载、主叫建立专有承载、振铃接通、挂断及专有承载释放,共六个阶段(图4),同时,整个流程涉及三个域几乎所有的网元,因此通话流程优化是 VOLTE 端到端优化的重中之重。
(三) 总体优化思路
VOLTE 端到端问题定位,需要从终端侧、无线侧、EPC 侧、IMS 侧进行分段分析。
1) 终端侧:
终端 VOLTE 功能实现由终端厂家根据相关协议标准进行设计,不同厂家的不同设计,是导致 VOLTE 终端问题出现的根本原因,因此,终端问题定位,主要关注终端 VOLTE 功能实现是否符合协议标准。
2) 无线侧:
无线侧在 VOLTE 业务实现过程中的作用与普通 4G 业务基本一致,但由于VOLTE 业务属于时延敏感型业务,对于无线环境变化敏感,因此,无线侧问题定位重点关注终端与网络连接变化。
3) EPC 侧:
VOLTE 业务中,EPC 侧不再承担业务的信令交互和功能实现,相对而言,可与无线侧整体视作“接入层”,主要负责移动性管理和业务承载,相比普通 4G 业务,VOLTE 引入的新承载类型,是 EPC 定位的关键。
4) IMS 侧:
IMS 侧是VOLTE 业务问题定位中的“重中之重”,承担了 VOLTE 业务的信令交互、功能实现,对于 IMS 侧问题定位,主要通过对比正常信令流程,找出异常事件,最终定位具体网元。
三、端到端定位措施
(一) 问题定位
VOLTE 使用的 SIP 是一种相对开放的协议标准,不同终端厂家对协议解读的不同,会导致终端生成的 SIP 信令存在异常,影响正常通话。同时,由于新增了VOLTE 业务,EPC 信令流程上也有一些变化,终端若不能做相应变化,也会导致VOLTE 业务失败。
终端问题主要可归为两类:一类是信令缺少关键字段,导致网络侧无法触发响应;
另一类是傖令相关字段设置异常,导致触发异常事件。定位终端问题可通过以下步骤进行:
(1) 整体把握,关注信令响应。由于终端生成的信令无法在空口侧获取, 可在与终端信令交互的边缘网元 MME、PSBC 等对照正常流程,分析针对终端请求的网络侧响应是否正常。
(2) 细致分析,核查关键字段。对于异常响应,进一步分析终端上报信令是否存在关键字段缺失,关键字段设置是否正常。
(二) 无线侧问题定位
VOLTE 业务流程中,无线侧的作用与 4G 业务一致。由于 SIP 信令承载在 EPS 默认承载,VOLTE 业务流程中,需要终端与 4G 网络始终保持连接。控制面,终端与网络的连接状态是由 RRC 连接来体现的,而用户面,连接状态由 E-RAB 承载来体现。
(1)RRC 连接建立与释放
RRC 连接建立一般发生在 EPC 信令交互之前,当无业务时,触发不活动定时器,释放 RRC 连接,因此,RRC 连接建立与释放,分别发生在 VOLTE 业务发起前与业务释放后,业务过程中出现 RRC 释放归属异常事件。同时,小区切换过程中RRC 重建立失败也会导致。RRC 连接异常释放,同样归属异常事件。
(2)E-RAB 承载
E-RAB 承载在发起相关业务时,E-RAB 通过 RRC 重配建立,业务结束后通过RRC 重配释放,所以,E-RAB 承载相关问题主要关注 RRC 重配置信令。普通 4G 业务中,一般只建立一个默认承载,但 VOLTE 新引入了一个默认承载和两个专有承载,因此,对于 RRC 重配置需要深入分析建立、释放、修改的 E-RAB 承载类型。
(三) EPC 侧问题定位
相比普通 4G 数据业务,VOLTE 业务新引入了 IMS 默认承载(QCI=5)以及 IMS 专有承载(QCI=1、2)。IMS 默认承载建立过程通常紧跟 EPC 附着流程进行,建立后直至终端去附着之后才释放;而 IMS 专有承载只有在触发了相关业务流程才建立,业务结束后释放。因此,EPC 侧信令流程问题定位重点关注 IMS 相关承载建立与释放的问题,尤其是“随用随建”的 IMS 专用承载。
VOLTE 业务流程中,无线侧的作用与 4G 业务一致。由于 SIP 信令承载在 EPS 默认承载,VOLTE 业务流程中,需要终端与 4G 网络始终保持连接。控制面,终端与网络的连接状态是由 RRC 连接来体现的,而用户面,连接状态由 E-RAB 承载来体现。
(1)RRC 连接建立与释放
RRC 连接建立一般发生在 EPC 信令交互之前,当无业务时,触发不活动定时器,释放 RRC 连接,因此,RRC 连接建立与释放,分别发生在 VOLTE 业务发起前与业务释放后,业务过程中出现 RRC 释放归属异常事件。同时,小区切换过程中RRC 重建立失败也会导致,RRC 连接异常释放,同样归属异常事件。
(2)E-RAB 承载
E-RAB 承载在发起相关业务时,E-RAB 通过 RRC 重配建立,业务结束后通过RRC 重配释放,所以,E-RAB 承载相关问题主要关注 RRC 重配置信令。普通 4G 业务中,一般只建立一个默认承载,但 VOLTE 新引入了一个默认承载和两个专有承载,因此,对于 RRC 重配置需要深入分析建立、释放、修改的 E-RAB 承载类型。
(四) IMS 侧问题定位
IMS 网络是 VOLTE 业务流程中处理实现各项业务的核心,其中网元众多,且与其它网元存在连接,因此 IMS 网络接口丰富。而一项业务往往涉及多个网元、多个接口,给 IMS 侧问题定位带来难题。
IMS 侧问题定位要求优化前,对 IMS 网络架构、各网元功能、涉及协议标准要有一定的了解,接下来可参考以下步骤进行定位:
(1) 核查用户签约信息
签约信息包括静态签约信息和动态签约信息两类。静态签约信息是用户在开户时,静态存储在 HSS(归属用户服务器)等相关网元中,随信令流程中通过Diameter 信令调用;动态签约信息是在用户注册时,网络侧根据配置进行动态分配,存储在各个完成注册的网元中,用户去注册后自动删除。一方面,VOLTE 注册流程涉及多个网元注册流程,涉及签约信息多,因此,用户签约信息异常会导致注册失败;另一方面,部分签约作用于通话流程、SRVCC 流程等,不在注册流程中体现,因此用户签约信息异常并不会影响用户注册,但会导致业务失败。
(2) 对照正常流程,发现异常事件
VOLTE 各项业务流程均可大致分为几个阶段,各个阶段需完成不同的子流程, 例如,VOLTE 通话流程的主叫侧专载建立阶段,网络侧需要完成:编码协商、获取主叫用户签约信息、指示 PCRF(策略与计费规则功能单元)建立专有承载等多个子流程,通过对照正常流程,确定异常事件发生在哪个阶段,从而确定异常事件是否与用户感知情况一致;同样也有利于缩小异常网元的范围。异常事件一般会中止业务流程,因此异常信令一般在异常流程之后,可直接在异常业务流程结尾发现异常事件。
(3) 确定异常网元
异常业务流程结尾的异常事件往往是为了告知终端或网络侧业务中止,因此异常信令不能说明触发该条信令的网元异常,需要以异常事件回溯到初始发起异常事件的网元,根据这各网元上报的异常原因进行定位。
四、案例验证
用户反馈 15:41 分发生 VOLTE 通话掉话,分析排查 VOLTE 掉话原因。
1、核实呼叫话单,用户呼叫占用 F 武汉硚口营房村 BBU21_淮海路与青年路交汇口 OCQH_0 小区,基站无当前告警及历史告警,各项网络指标正常。
2、从 IMS 核心网获取用户 VOLTE 呼叫 SIP 消息,终端 15:40:27(抓包是 UTC
时间,实际时间加 8 小时)发起 INVITE 消息,发起 VOLTE 网络通话。
分析 INVITE 消息,会话主叫号码 1890XXXXX,被叫号码 189XXXXXXX。3、分析呼叫消息,被叫在 15:40:30180ring 振铃,VOLTE 呼叫成功。
4、从 ACK 消息判断终端在 15:40:36 开始发生摘机通话,通话 27s 后,15:41:03 发生 BYE 消息,通话结束。
5、结合 PSBC 的 CHR 数据分析,BYE 消息为 18907182509 终端主动发起,终端主动拆线导致掉话。
6、分析 BYE 消息,发现 BYE 原因值为“INTERNALERROR”,该原因值定义为终端内部
错误,当终端出现协议上未定义的拆线原因时就会报这个错误码。
7、结合 IMS 消息分析,本次 VOLTE 呼叫掉话为终端内部错误引起主动拆线导致。
五、总结
VOLTE 业务涉及网元众多,在优化过程中,可将问题定位思路端到端地分为终端侧、无线侧、EPC 侧、IMS 侧四段,其中无线侧与 EPC 侧在 VOLTE 业务中整体可视为“接入层”,不参与 SIP 信令处理,因此优化思路与传统 4G 业务相似,但需要重点对比VOLTE 业务相对普通4G 业务引入的变化差异,例如专有承载等; 而终端侧和 IMS 侧是对 SIP 信令解析处理的核心环节,对于这两段的问题定位, 主要取决于对信令流程以及协议规范的掌握程度,同时从显性问题入手,排除用户签约异常问题,再对照正常信令流程,逐步倒推至问题网元。