admin 管理员组

文章数量: 887021


2024年3月7日发(作者:ue4开发工程师)

5G SA 接入问题定位总结

一、 概述

SA 方案是 5G NR 直接接入 5GC,控制信令完全不依赖 4G 网络,通过核心网互操作实现5G 网络与 4G 网络的协同。采用 SA 方案,5G 网络可支持网络切片、MEC 等新特性,4G 核心网MME 需要升级支持N26 接口,4G 基站仅需较少升级(如增加与 5G 切换等相关参数),

4G/5G 基站可异厂家组网 ,终端不需要双连接。

SA Option 2 架构包含 5GC(5G Core Network)和 NG-RAN(NG Radio Access Network),

5GC 主要包括AM(F Access and Mobility Management Function)和 UP(F User Plane Function),

NG-RAN 包括gNodeB 和 UE。各网元间的接口如下:

gNodeB 通过 NG-C 接口与 AMF 连接,实现 NG 控制面功能;通过 NG-U 接口与 UPF 连接,实现 NG 用户面功能。

gNodeB 之间通过 Xn-C 和 Xn-U 接口连接,分别实现 Xn 控制面和用户面功能。

gNodeB 与 UE 之间通过 UU 接口连接,实现无线新空口功能。

二、 SA 接入流程

SA 接入流程与 LTE 初始接入过程类似,包含了随机接入、RRC 建立、鉴权、加密、UE

能力识别和DRB 建立等过程。

1. UE在PLMN选择、频点扫描和小区选择后对选择的GNB小区发起随机接入;

2. UE向GNB发送RRC建立请求,携带UE标识和建立原因值(例如MO-Data、Mo-signalling等);

3. gNB向UE回复RRC连接建立,携带上下行初始BWP、CSI、T310/N310/N311定时器等;

4. UE向gNB回复建立完成,携带selectedPLMN-Identity、registeredAMF、snssai-list和NAS消息;

5. gNB向核心网AMF发送初始上下文信息;

6. 核心网向UE发起鉴权请求;

7. UE向核心网回复鉴权响应;

8. 核心网向UE发送加密指示;

9. UE向核心网恢复加密完成;

10. 核心网向 UE 发送上下文建立请求, 主要包括UE AMBR 、 mobility-RestrictionList 、

UE-securityCapabilities 、coreNetworkAssistanceInformationForInactive等信元;

11. GNB向UE发送查询UE能力信息指示,包括freqBandinformation信元;

12. UE向GNB回复UE能力信息,包括PDCP/RLC/MAC/PHY和RF等支持的能力;

13. GNB将UE能力信息透传给核心网;

14. GNB向UE发送安全模式指示,包括加密算法和完整性算法;

15. UE回复安全模式加密完成;

16. GNB向UE发送RRC重配置消息,激活BWP1;

17. UE向GNB回复RRC重配置完成;

18. GNB向核心网恢复UE上下行建立完成响应;

19. 核心网向GNB发送PDU承载建立请求,携带PDUSessionResource SetupListSUReq,包括上下行AMBR,

UGW IP,fiveQI及E-RAB-ID;

20. GNB向UE下发RRC重配置消息,下发SRB2&DRB相关信息;

21. UE向GNB回复重配置完成;

22. GNB向核心网回复PDU承载建立完成;

三、 SA 接入问题定位方法

3.1 总体定位思路

根据接入流程失败问题节点进行原因定位,总体思路如下图所示:

3.2 终端不发起 RRC 接入

3.2.1 基本概念

终端搜网注册流程主要分为以下几个部分:PLMN 选择、扫频、小区选择和小区注册。

具体如下图所示:

运营商控制网络服务的方法通常通过 SIM 卡的信息来实现。UE 在搜网注册之前首先要进行初始化过程,来完成 SIM 卡与终端的一个基本交互过程。初始化过后,终端可以读出SIM 卡内包含的文件信息,以备后来服务之用。最常用的 SIM 卡文件就是 EFimsi 文件,这一文件包含基本的运营商信息,此外还有RPLMN 等信息。

3.2.2 判断方法

基站侧没有收到RRCSetupReq,需要在终端侧观察,终端侧是否有发起RRC 接入。

3.2.3 问题定位

➢ 排查小区是否建立成功;

➢ 排查小区发功是否正常;

➢ 排查终端侧是否有接收到 SIB1,检查 SIB1 中下发的PLMN 与开卡信息是否相符;

3.2.4 典型案例

(1)、基站侧没有收到 RRCSetupReq

从终端日志来看,已搜到小区,并接收 mib、sib,但是打印"do not find EPLMN,camped

fail"。

终端侧进一步排查,发现USIM 卡中写入了FPLMN,导致终端没有发起接入。

将USIM 卡中FPLMN 删除后,用户可以正常接入。

3.3 随机接入失败

3.3.1 基本概念

UE gNB

1

Random Access Preamble

UE gNB

Random Access Response

2

0

RA Preamble assignment

3

Scheduled Transmission

Random Access Preamble

1

Contention Resolution

4

2

Random Access Response

(a) Contention-Based (b) Contention-Free

1. 基于竞争的随机接入

步骤 1:UE 在 PRACH 上发送 preamble(Msg1),基站通过检测 Preamble 获得 preamble

ID(RAPID)和下行Tx Beam,并估计传输时延。

步骤 2:基站在PDSCH 上发送RAR(Msg2),RAR 中携带第 1 步中估计的传输时延对应的TA,RAPID,TC-RNTI,及用于第 3 步Msg3 发送的UL Grant。UE 使用TA 调整上行定时。Msg2

在第一步确定的下行Tx beam 上发送。

步骤 3:根据RAR 中UL Grant 的调度发送Msg3,其中携带 UE 的标识信息。

步骤 4:gNodeB 在PDSCH 上将竞争解决消息(Msg4)发送给 UE,该步骤解决了由于多个UE 试图使用同一个随机接入资源和相同 preamble 接入时导致的竞争和冲突, Msg4 在第一步确定的下行Tx beam 上发送。

2. 基于非竞争的随机接入

基于非竞争的随机接入使用专用的随机接入资源和 preamble,不存在竞争冲突,因此不需要第 3 步和第 4 步。

3.3.2 判断方法

UE 侧查看接入失败为随机接入失败;或通过话统查看随机接入成功率

竞争随机接入成功率:/

非竞争随机接入成功率:3/

常用随机接入话统指标定义如下:

1911816542 随机前导的接收次数

1911816544 竞争冲突解决成功次数

1911816545 专用前导的接收次数

1911816546 3 基于非竞争的随机接入过程中Msg3 的接收次数

3.3.3 问题定位

当前导致随机接入失败的可能原因有:

1. 弱覆盖或干扰导致随机接入失败;

通过跟踪, 看是否有连续几次 20ms 时间间隔随机接入失败,最后成功的用户。

2. 超小区半径接入;

3. Prach 参数等配置异常或者物理层原因导致接入失败;

➢ 根序列索引需要进行网络规划,避免周边小区接收到Preamble 下发RAR 消息,对本小区产生下行干扰

NRDUCELLPRACH: RootSequenceIndex=X;

➢ 时隙配比和时隙结构配置:要求全网一致,不一致会有上下行干扰问题,可能导致随机接入异常

时隙配比 参数:NRDUCELL 中的参数 SlotAssignment

时隙结构 参数:NRDUCELL 中的参数 SlotStructure

➢ MOD NRDUCELL:CellRadius=XX; 小区半径配置,该配置会影响生成Preamble 序列所使用的 NCS 参数,如果配置过小会导致中远点用户无法接入。

➢ 确认未开启PUSCH 占用PRACH 功能

NRDUCellRsvdParam:RsvdSwParam4_BIT5=0 代表 PUSCH 占用PRACH 功能未生效

3.4 RRC 建立失败

3.4.1 基本概念

UE

Network

RRCSetupRequest

RRCSetup

RRCSetupComplete

RRC 建立主要是为了建立SRB1,UE 发送初始NAS 层消息给网络。

RRC 连接建立的主要信元有:

UE-identity (RRCSetupRequest 和RRCConnectionSetup 消息)

establishmentCause (RRCSetupRequest)

radioResourceConfiguration for Only SRB1 (RRCSetup)

selectedPLMN-Identity (RRCSetupComplete)

✓ nas-DedicatedInformation (RRCSetupComplete)

3.4.2 判断方法

RRC 建立失败包括如下三种情况

1. RRC Rej:UU 口检查收到 RRCSetupRequest,没有下发 RRCSetup,下发了RRCSetupRej;

2. RRC NoReply:UU 口检查收到RRCSetupRequest,下发了RRCSetup,但是等待RRCSetupCpmplete 超时;或者下发RRCSetup 后又立即下发了RRCRel;

3. RRC 丢弃:UU 口检查收到 RRCSetupRequest 后,直接丢弃,没有进行下一步的处理。

3.4.3 问题定位

CHR 中可查看如下事件来查看RRC 建立失败:

(1)

RRC Reject 定位思路

L3 内部各模块消息交互流程图:

对于RRC Reject 类问题,需要排查的主要场景包括:

1) 是否是资源分配失败;

2) 是否基站其它异常流程导致。

(2)

RRCNoReply 定位思路

定位思路与 LTE 一样。

(3)

RRC 丢弃定位思路

当小区接收到 UE 发送的RRC Setup Request 消息时,因为流控直接丢弃该消息时,指标

rl 加 1,一般需要获取主控板一键式日志进一步定位。

3.4.4 典型案例

两个终端分别接入一个基站上的两个小区,一个 CPE 接入其中一个后,另外一个接入到另一个小区失败,收到msg5 后立即释放。

问题分析:

1. 首先查看告警和故障,未看到异常

2. 收到msg5 后立即释放,由于 license 是在msg5 之后判断,查看 license 配置,license

是 1,因此第二个用户无法接入

license 告警机制:

1)

超过license 配置并且持续 5 分钟才会上报告警

2)

license 超过 0-10%允许用户接入,超过 10%之后会限制用户接入(在收到 msg5 之后判断)

问题结论:

RRC 连接用户数License (NR) 1 ,是基站级别的,只能接入一个用户。

3.5 NGSig 及 NAS 异常问题

3.5.1 基本概念

NGSig:/ 反映 NGSig 建立成功率。当 gNodeB

向AMF 发送 INITIAL UE MESSAGE 时,指标 加 1,当 gNodeB 向AMF 发送INITIAL UE MESSAGE 后, 收到 AMF 发送给该用户的第一条 NG 接口消息时, 指标 加 1。

NAS:属于 UE 与AMF 之间的过程,基站侧话统并不直接感知 NAS 过程异常。

3.5.2 判断方法

NGSig 问题现象:

1) 基站发送初始化 UE 消息后,但是核心网没有响应任何 NAS 消息或者上下文建立请求消息或者 MME 释放上下文消息。这种场景需要联合核心网一起分析原因。

2) 基站发送初始化 UE 消息后,核心网直接发送 NG_RESET 释放单用户,导致 NGSIG 建立失败。这种场景需要联合核心网一起分析原因。

3) 基站收到MSG5 消息后,NG 链路被闭塞或者内部异常,导致基站没有给核心网发送初始化 UE 消息。这种场景需要基站侧分析原因。

NAS 问题现象:

1) NAS 过程异常,核心网主动释放 UE。

2) 核心网没有发送 UE 上下文建立请求,基站主动释放。

3.5.3 问题定位

(1)

NGSig 建立异常问题

基站 NG 标口无初始化 UE 消息:基站或配置问题

基站 NG 标口有初始化 UE 消息:核心网AMF 或传输问题

(2)

NAS 过程异常

1) 分析核心网释放前得下行和上行 NAS 消息中的Cause 原因。根据Cause 原因在协议

24.501 中,查找其大概含义。如果指向核心网则需要核心网侧分析。如果指向终端侧则需要终端侧分析。如果原因值指向终端,也可以联系核心网分析其上下行 NAS 消息内容是否异常。

2) 核心网没有发送 UE 上下文建立请求,基站主动释放。确认基站在问题时间段传输无告警以及传输正常,则需要联系核心网给出原因。

3.5.4 典型案例

问题现象:用户收到MSG5 后,未发起INIT UE Message,而是直接 UU 口释放。

分析DBG 日志发现 L3 在给核心网发送INIT UE MSG 消息时,在填充该消息过程中,根据TAI(跟踪区域标识)获取TAC(跟踪区域码)失败,导致给核心网发送 INIT UE MSG 消息失败,

随后 L3 释放用户。

TrackingAreaId 是通过 GNBTRACKINGAREA 这个 MO 配置的。通过 NRCELL 可以找到NRDUCELL,而 NRDUCELL 中有 TrackingAreaId 参数字段,因此可以通过 NRDUCELL 找到TrackingAreaId,通过TrackingAreaId 可以找到Tracking Area Code(也即 TAC)。

问题结论:问题时间点,由于测试配置错误,没有把TrackingAreaId 和NRDUCELL 的跟踪区域标识参数绑定在一起,导致根据TAI 查找TAC 失败,L3 填充 INIT UE MSG 消息失败,

没有给核心网发送INIT UE MSG 消息,L3 直接释放用户。

3.6 上下文建立失败

3.6.1 基本概念

RRC 建立成功后,UE 向gNodeB 发送RRCSetupComplete,携带 selectedPLMN-Identity、

registeredAMF、s-nssai-list 和 NAS 消息。

gNodeB 为 UE 分 配 专 用的 RAN-UE-NGAP-ID , 根据 selectedPLMN-Identity 、registeredAMF、s-nssai-list 选择 AMF 节点,然后将 RRCSetupComplete 消息中携带的 NAS 消息通过InitialUeMessage 发送给AMF。

gNodeB 透传 UE 和AMF 之间的 NAS 直传消息,完成 IDENTITY 查询、鉴权、NAS 安全模式和注册过程。

AMF 向gNodeB 发送 InitialContextSetupReq 消息,启动初始上下文建立过程。

3.6.2 判断方法

当gNodeB 收到 AMF 发送的 INITIAL CONTEXT SETUP REQUEST 消息后,在处理过程中产生错误,导致上下文建立失败,在向AMF 发送 INITIAL CONTEXT SETUP FAILURE 消息时,根据不同原因统计对应指标。 如果是无线层错误导致上下文建立失败, 统计 指标,无线层错误描述请参考 3GPP TS38.413 协议定义。如果是无线资源不足导致上下文建立失败,统计oRes 指标。

3.6.3 问题定位

若没有收到相关交互响应消息,先排查如下几点,若几点都排查完,则找对端共同分析。

1. NG 链路的SCTP 传输丢包重传类问题初步排查

1)

排查是否有传输类告警SCTP 链路拥塞告警

NG 接口故障告警

2)

SCTP 话统排查拥塞、丢包、重传、特殊核心网传输参数配置

SCTP 拥塞:

若收到交互失败响应消息,则找对端共同分析。

2. 对于 进一步排查,信令当前走到哪里,查看是否是

oRes 无线资源不足导致上下文建立失败,进一步排查基站空口资源情况;或者是plyUE 无响应导致上下文建立失败, 进一步排查空口覆盖、干扰等情况或者异常终端。

3.6.4 典型案例

(1)、终端未响应导致上下文建立失败

问题描述:基站侧跟踪发现,收到 AMF 的INIT CONTEXT SETUP REQ 后,基站 UU 口下发安全模式及重配置消息,但是未收到终端侧响应,空口等待定时器 20s 超时后,基站回复INIT

CONTEXT SETUP FAIL 给AMF。

发现基站下发的信息都是NACK 或者DTX,只有msg4 一个 ACK。

问题结论:核查终端版本,发现终端侧版本较老,终端侧版本升级后问题得到解决。

3.7 PDUSession 建立失败

3.7.1 基本概念

NG-RAN node

PDU SESSION RESOURCE SETUP REQUEST

PDU SESSION RESOURCE SETUP RESPONSE

AMF

QosFlow 建立过程一般由 UE 在需要向无线网络申请服务时主动发起,并通过初始 UE 上下文建立流程或PDU Session 建立流程完成建立。

3.7.2 判断方法

➢ 检查 UE 是否有发出PDUSessionEstablishmentRequest 消息(此为NAS 消息),若未发出,需要终端侧进一步分析。

➢ 检查 NG 口AMF 是否有发送PDU Session Resource Setup Request 消息,若没有,找 AMF

进一步分析。

➢ 检查 UU 口Qos 是否建立成功,NG 口是否有给AMF 响应 PDU Session Resource Setup

Response,若未有,则基站进一步分析。

➢ PDU Session Resource Setup Response

中若有携带原因值,则 PDU Session 建立失败,需要根据原因值进一步分析。

3.7.3 问题定位

针对PDUSessionSetupFail,查看 CHR 如下事件来进一步定位:

定位思路如下:

3.7.4 典型案例

(1)、PDU Session 建立失败,原因是传输资源不可用

问题分析:基站收到 PDU Session RSRC Setup Req 后,直接给核心网返回了 PDU Session

RSRC Setup Rsp,里面携带原因值“transport resource unavailable”。

一般查看 NG-U 传输是否正常,以及 NG-U 链路是否正常配置。经排查在问题时间点存在

gNBNG 的用户面故障告警。经排查发现中间传输链路有故障,处理传输故障后问题恢复。

四、 经验总结

本文在SA 建网过程中接入失败问题排查思路和方法进行了详细介绍,包括SA 接入流程、各个接入时段基本概念、判断方法、问题定位和典型案例进行逐步描述,希望对 SA 商用过程中问题定位提供借鉴作用。


本文标签: 接入 建立 问题