popyone
发布于 2024-01-31 / 32 阅读
0
0

由于光纤模块引起的丢包问题处理

说明

    前面说了自己用AC+AP+二层管理交换机组网,一路折腾的过程,这里来专门说说一个细节方面的东西:光纤模块。

    自己使用光纤模块在这之前是给企业的设备上用,优先考虑稳定和兼容,价格没怎么考虑,比如,华为的设备就上华为的光纤模块,不会去采购第三方厂家生产的。一直以来都很稳定,没出现过啥问题。

    这次自己用,AC用的华为AC6508,支持两个万兆SFP+端口,二层网关交换机是希力通讯机架式8口2.5G+1口10G SFP+交换机,光纤模块在JD买的几十元一个的10G多模lc模块。AC作为dhcp服务和wlan服务,承接了内网中所有三层交换的业务。二层交换机通过光纤端口和AC连接,软防火墙接入到二层交换机2.5G端口,提供网络接入服务。

    最先发现问题的是媳妇,早上直播课的时候,出现几秒钟的网络信号低,当时以为是isp切换ip,路由器重新拨号的问题;第二天又在同一个时间点出现,查看防火墙日志,在网关日志中发现dpinger检查到AC的网关接口丢包率超过20%,防火墙网络没断,但是通往AC的接口出现问题。根据这个发生的时间点,发现威联通NAS正好是这个时间自动开机,到虚拟网络交换机启动的时间;威联通的虚拟交换机是给container用的,以前测试用过一下,一直没用,将虚拟交换机删除之后,重启威联通NAS,防火墙的网关日志没有出现丢包的提示。我以为问题就这样解决了,小看了这问题。

    第三天出现同样问题,防火墙的网关日志没有提示丢包,但是有个其他错误 sendto error xx,xx具体是什么数字已经忘记了,按照官方文档就是说测试发送到dhcp的报文出现问题;我的第一想法是,会不会希力二层网管交换机和光模块不兼容吧,以前傻瓜而成交换机没发现这个问题呢,在小黄鱼上买了一对华为的多模光纤模块,准备试试。

    买了之后第二天还是有点想不过,这些问题怎么以前就没遇到,可不可以通过配置来解决?威联通启动引发丢包的问题,感觉是STP引起的,在华为网站找到了关于MSTP问题处理 <故障案例:大量TC报文导致框式交换机ARP学习异常> ,将终端(NAS)直连到AC端口配置为stp edged-port enable。
观察了一段时间,发现过了一天,sendto error xx错误又出现了,十几分钟出现一条。这时候,购买的华为多模光纤模块到了,下班回家,吃过饭马上关AC和交换机,把模块换上;过了一天,在去看日志,没再出现sendto error xx错误,看来问题是被解决掉了。

总结

  1. 威联通NAS的虚拟交换机启停引起的STP生成树变化,对网关的确有影响,可以参考华为的故障案例处理,减少MAC、ARP表项刷新次数。
  2. 边缘端口连接的设备开机和关机时,端口UP、DOWN,交换机就会反复发送TC报文,将这些边缘端口配置stp edged-port enable。
  3. 光纤模块尽可能购买大厂正品全新的,一个模块的寿命5年左右,没遇到问题还好,遇到问题可能还真不容易想到这个。

评论