簡介
本檔案介紹如何在Catalyst 9200/9200L和9300/9300L的Stackwise部署中排除常見故障情況。
必要條件
採用元件
本節指定與Catalyst 9000系列上的Stackwise相關的產品ID(PID)和相關元件。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
Stackwise平台
振鈴速度取決於PID。這些PID支援Stackwise:
- Cisco Catalyst 9200 - StackWise-160
- Cisco Catalyst 9200L - StackWise-80
- Cisco Catalyst 9300 - StackWise-480
- Cisco Catalyst 9300L - StackWise-320
- Cisco Catalyst 9300X - StackWise-1T
Stackwise硬體
C9200/C9200L和C9300L PID堆疊套件包含一個可容納在機箱中的堆疊介面卡,以及一個連線到介面卡的電纜。C9300/9300X PID堆疊套件只需要電纜。
背景資訊
本文適用於Catalyst 9200/9200L、9300/9300L和9300X交換器。
StackWise架構允許環狀拓撲中最多包含八台交換器的堆疊實現高密度堆疊頻寬。堆疊架構可擴充交換器的外形、輸送量、連線埠密度和備援,並提供單一的控制和管理平面。它簡化了管理,並實現了更高的可復原性和可擴充性。
疑難排解和驗證Stackwise
已建立的堆疊中的操作問題通常與一個或多個成員裝置的靜默重新載入有關,因為堆疊合併是常見的重新載入原因。 本節介紹堆疊環不穩定如何引發重新載入和其他問題,以及如何驗證堆疊環和解決相關問題。
Stackwise操作
使用相關的Stackwise堆疊套件連線兩台或多台(最多八台)交換器,以形成資料堆疊。堆疊環提供作用中/備用交換器與成員交換器之間的互通性。該環可以以半容量或滿容量運行。
連線到堆疊拓撲的交換器使用堆疊探索通訊協定(SDP)進行鄰居探索和角色選擇。 啟動後,在交換機軟體完全載入之前,會有一個120秒的選擇視窗,在此視窗中會發現成員,並確定活動和備用角色。
活動選擇由最高優先順序和最低MAC地址決定。在選擇活動且發現所有成員後,將使用相同的條件選擇備用 — 下一個最高優先順序或下一個最低MAC。 以下是需要考慮的其他幾點:
新增或替換成員
實作新堆疊或將成員新增至建立的堆疊時,必須考慮多個因素。 重要的是,切勿將已開啟電源的交換器連線至已開啟電源的堆疊。關閉電源時連線新成員以避免堆疊合併。 以下是需要考慮的其他幾點:
新增交換器時,可利用自動升級功能解決這些衝突問題。使用以下命令實作:
C9300-Stack#config t
Enter configuration commands, one per line. End with CNTL/Z.
C9300-Stack(config)#software auto-upgrade enable
C9300-Stack(config)#end
C9300-Stack#
注意:自動升級功能僅在安裝模式下可用。套件組合模式不支援自動升級。 套件組合模式需要手動干預以解決版本授權不相符錯誤。
解決與Stackwise相關的操作問題
如果主用/備用和成員之間的通訊中斷,將重新載入。 長期不穩定性會導致堆疊分割和合併的情況。
大多數與堆疊相關的不穩定性源自物理堆疊介質(堆疊電纜和/或堆疊介面卡)未對齊。如果堆疊成員長期不穩定,請重新拔插堆疊硬體並確保手動擰緊電纜拇指螺釘。 使用本文檔稍後部分提供的驗證命令確定哪些成員受影響最大。
問題 — 意外重新載入一個或多個成員
活動和備用交換控制彼此之間以及與成員裝置之間的流量。 如果堆疊成員之間的通訊中斷且待命/作用中通訊中斷,則會發生重新載入。
最後重新載入的原因可在show version指令的輸出中看到:
C9300-Stack#show version
Cisco IOS XE Software, Version 16.12.05b
Cisco IOS Software [Gibraltar], Catalyst L3 Switch Software (CAT9K_IOSXE), Version 16.12.5b, RELEASE SOFTWARE (fc3)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2021 by Cisco Systems, Inc.
Compiled Thu 25-Mar-21 13:21 by mcpre
C9300-Stack uptime is 2 days, 1 hour, 18 minutes
Uptime for this control processor is 2 days, 1 hour, 20 minutes
System returned to ROM by Reload Command
System image file is "flash:packages.conf"
Last reload reason: stack merge
以下是堆疊不穩定發揮作用時常見的重新載入原因:
使用show logging onboard switch <number> uptime detail指令可檢視堆疊中特定交換器的正常運行時間歷史記錄:
C9300-Stack#show logging onboard switch 3 uptime detail
--------------------------------------------------------------------------------
UPTIME SUMMARY INFORMATION
--------------------------------------------------------------------------------
First customer power on : 06/23/2020 04:08:31
Total uptime : 1 years 0 weeks 6 days 23 hours 49 minutes
Total downtime : 0 years 12 weeks 6 days 11 hours 51 minutes
Number of resets : 84
Number of slot changes : 5
Current reset reason : Reload Command
Current reset timestamp : 09/26/2021 14:49:07
Current slot : 3
Chassis type : 22
Current uptime : 0 years 0 weeks 2 days 1 hours 0 minutes
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
UPTIME CONTINUOUS INFORMATION
--------------------------------------------------------------------------------
Time Stamp | Reset | Uptime
MM/DD/YYYY HH:MM:SS | Reason | years weeks days hours minutes
--------------------------------------------------------------------------------
09/06/2021 21:47:16 stack merge 0 0 0 14 0
09/06/2021 21:52:42 stack merge 0 0 0 0 0
09/06/2021 22:06:01 stack merge 0 0 0 0 10
09/20/2021 15:48:38 Reload Command 0 0 0 0 25
09/20/2021 16:11:59 Reload Command 0 0 0 0 20
09/26/2021 14:49:07 stack merge 0 0 5 22 0
--------------------------------------------------------------------------------
通過重新拔插堆疊硬體,可以解決與堆疊不穩定相關的過載問題。 使用驗證命令確定哪些交換機不穩定,以及它們重新載入的頻率,並重新拔插與此成員關聯的堆疊硬體。
show switch stack-ports summary指令可用於快速識別哪些裝置不穩定:
C9300-Stack#show switch stack-ports summary
Sw#/Port# Port Status Neighbor Cable Length Link OK Link Active Sync OK #Changes to LinkOK In Loopback
-------------------------------------------------------------------------------------------------------------------
1/1 OK 2 50cm Yes Yes Yes 1 No
1/2 OK 3 50cm Yes Yes Yes 6 No
2/1 OK 3 50cm Yes Yes Yes 8 No
2/2 OK 1 50cm Yes Yes Yes 6 No
3/1 OK 1 50cm Yes Yes Yes 6 No
3/2 OK 2 50cm Yes Yes Yes 1 No
在本例中,交換機2經歷慢性過載。您可以看到此交換器上的兩個堆疊連線埠顯示大量連結狀態變更。 交換器1和3也一樣,但這些值可能與交換器2的重新載入相關。重新拔插將交換機1連線到交換機2的堆疊硬體以及交換機2和3之間的硬體。交換機1和3之間的連線沒有翻動。
可以在堆疊運行時重新拔插堆疊連線,但請確保一次僅重新拔插一個鏈路。 重新引入時,成員交換機的完全斷開會導致堆疊合併。
與Stackwise相關的早期版本代碼中存在已知軟體缺陷。如果重新拔插堆疊硬體後問題仍然存在,請升級到推薦的版本和/或聯絡TAC。
相關錯誤ID:
還存在一個影響Stackwise平台的堆疊硬體的已知問題,該問題表現為身份驗證失敗。以下是C9200L的錯誤訊息範例:
Stack Adapter Auth Fail : SIF_SERDES_CABLE_EASTBOUND
*** Stack adapter authentication failed on stack port 1 on switch 1
Error-2:
*** Stack adapter authentication failed on stack port 2 on switch 1
Stack Adapter Auth Fail : SIF_SERDES_CABLE_WESTBOUND
相關錯誤ID:
如果遇到這種情況,並在重新載入後繼續存在,則元件本身可能會受到影響。如需協助,請聯絡技術協助中心(TAC)。
問題 — 無法向堆疊中新增/替換成員
如果成員未加入,則表示未滿足Stackwise的先決條件,或新成員與堆疊的其餘部分之間的連線出現問題。
確保滿足Stackwise的先決條件:
- 新成員的軟體版本必須與堆疊的軟體版本相符。
- 許可證級別必須匹配……
- 操作模式(安裝與套件組合)必須匹配
- 不支援混合PID開關堆疊(有關特定詳細資訊,請參閱產品手冊)。
確保正確安裝了堆疊套件。C9200L和C9300L需要堆疊介面卡。手動擰緊指旋螺釘以正確定向硬體。注意不要過度擰緊螺釘。
Stackwise-80堆疊套件(C9200L)
使用C9300堆疊套件STACK-T1-XXCM時,電纜的製作方式使其可以倒置放進機箱中。確保思科徽標朝上,並且您可以完全固定指旋螺釘以避免錯誤安裝。
Stackwise-480纜線連線
註:有一個思科徽標被銑削到金屬中。確保此徽標正面朝上,而不是顛倒,以便正確安裝。
如果滿足前提條件,且硬體安裝正確,請確認有問題的交換機能夠識別堆疊硬體。此輸出特定於C9200L:
Switch#show inventory
NAME: "c92xxL Stack", DESCR: "c92xxL Stack"
PID: C9200L-24P-4X , VID: V01 , SN: JAE2332006G
NAME: "Switch 1", DESCR: "C9200L-24P-4X" <<<---- This entry represents the chassis
PID: C9200L-24P-4X , VID: V01 , SN: JAE2332006G
NAME: "StackPort1/1", DESCR: "StackPort1/1" <<<--- This entry represents the 50CM cable connected in Stackport 1/1
PID: STACK-T4-50CM , VID: V01 , SN: LCC2325G3XW
NAME: "StackPort1/2", DESCR: "StackPort1/2" <<<--- This entry represents the 50CM cable connected in Stackport 1/2
PID: STACK-T4-50CM , VID: V01 , SN: LCC2325G410
NAME: "StackAdapter1/1", DESCR: "StackAdapter1/1"
PID: C9200-STACK , VID: V01 , SN: JAE2332133J <<<--- This entry represents the stack adapter in Stackport 1/1
NAME: "StackAdapter1/2", DESCR: "StackAdapter1/2"
PID: C9200-STACK , VID: V01 , SN: JAE23321DDK <<<--- This entry represents the stack adapter in Stackport 2/2
如果交換器無法識別堆疊套件中的一個或多個元件,則需要進一步調查。 聯絡TAC尋求協助。
問題 — C9300X混合堆疊分割為子環/堆疊速度不匹配
C9300X引入了高速(1TB)。雖然此案例中整個堆疊的堆疊環速度與最慢成員的速度相符,但支援混合堆疊C9300X和非高速堆疊。
堆疊介面速度不相符會導致堆疊分割。使用show switch stack-ring speed確認堆疊環速度。
Device#show switch stack-ring speed
Stack Ring Speed : 1000G
Stack Ring Configuration: Full
Stack Ring Protocol : StackWise
Stack Ring Next-boot Speed: 1000G
使用交換器堆疊速度變更堆疊環速度[高 | 低]。
Device# switch stack-speed high
驗證和驗證Stackwise
本節提供用於驗證和驗證的命令Stackwise以確保正確設定堆疊並操作 如預期.
show switch detail 指令會提供堆疊硬體、連線埠狀態和鄰居詳細資訊的相關資訊。它還會識別哪些是當前的主用和備用交換機,以及任何成員交換機。
C9300-Stack#show switch detail
Switch/Stack Mac Address : 9077.ee4a.6b00 - Local Mac Address
Mac persistency wait time: Indefinite
H/W Current
Switch# Role Mac Address Priority Version State
-------------------------------------------------------------------------------------
*1 Active 9077.ee4a.6b00 15 V03 Ready
2 Standby 7cad.4f5f.e000 1 V03 Ready
3 Member 9077.ee4a.6e00 1 V03 Ready
Stack Port Status Neighbors
Switch# Port 1 Port 2 Port 1 Port 2
--------------------------------------------------------
1 OK OK 2 3
2 OK OK 3 1
3 OK OK 1 2
show switch stack-ports summary指令提供堆疊環特性的詳細資訊。
提示:請注意對#Changes OK的關系,此列中大於1的值可能表示不穩定。
C9300-Stack#show switch stack-ports summary
Sw#/Port# Port Status Neighbor Cable Length Link OK Link Active Sync OK #Changes to LinkOK In Loopback
-------------------------------------------------------------------------------------------------------------------
1/1 OK 2 50cm Yes Yes Yes 1 No
1/2 OK 3 50cm Yes Yes Yes 1 No
2/1 OK 3 50cm Yes Yes Yes 1 No
2/2 OK 1 50cm Yes Yes Yes 1 No
3/1 OK 1 50cm Yes Yes Yes 1 No
3/2 OK 2 50cm Yes Yes Yes 1 No
show switch stack-bandwidth 指令可以快速識別交換器是以半容量還是全容量執行。
C9300-Stack#show switch stack-bandwidth
Stack Current
Switch# Role Bandwidth State
------------------------------------------------------------
*1 Active 480G Ready
2 Standby 480G Ready
3 Member 480G Ready
聯絡TAC
如果嘗試補救後問題仍然存在,請聯絡TAC。確保您的TAC案例已連同相關資料一起提交,以避免延誤。有用的資料集包括:
輸出 — show technical-support
此實用程式提供相關show命令集合的輸出。輸出是詳細的,因此在運行實用程式時請記住這一點。將輸出重新導向至檔案或以其他方式以文字格式儲存輸出並上傳至TAC案例。
C9300-Stack#show tech-support
存檔檔案 — 二進位制tracelog存檔
此實用程式利用平台的持久跟蹤功能。使用這些命令生成歸檔檔案,並將其儲存到本地快閃記憶體介質中。
C9300-Stack#request platform software trace slot switch 1 r0 archive
Creating archive file [flash:C9300-Stack_1_RP_0_trace_archive-20210929-151348.tar.gz]
Done with creation of the archive file: [flash:C9300-Stack_1_RP_0_trace_archive-20210929-151348.tar.gz]
C9300-Stack#request platform software trace slot switch 2 r0 archive
Creating archive file [flash-2:RP_0_trace_archive-20210929-151358.tar.gz]
Done with creation of the archive file: [flash-2:RP_0_trace_archive-20210929-151358.tar.gz]
C9300-Stack#request platform software trace slot switch 3 r0 archive
Creating archive file [flash-3:RP_0_trace_archive-20210929-151450.tar.gz]
Done with creation of the archive file: [flash-3:RP_0_trace_archive-20210929-151450.tar.gz]
該實用程式為每個成員運行。檔名和位置在實用程式的輸出中指定。檔案將寫入運行該實用程式的交換機的本地快閃記憶體介質。將檔案附加到TAC案例。
在意外重新載入之前,通常會先向本地介質進行二進位制跟蹤轉儲。這些存檔很有用,表示在手動建立的存檔中會丟失的資料。
檢查每個成員的flash/crashinfo內,檢視是否已寫入相關檔案。查詢系統恢復之前直接寫入的檔案。
使用命令show version或show logging onboard switch <number> detail確定系統重新啟動的時間。
C9300-Stack#show version
Cisco IOS XE Software, Version 16.12.01
Cisco IOS Software [Gibraltar], Catalyst L3 Switch Software (CAT9K_IOSXE), Version 16.12.1, RELEASE SOFTWARE (fc4)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2019 by Cisco Systems, Inc.
Compiled Tue 30-Jul-19 19:26 by mcpre
<snip>
<snip>
C9300-Stack uptime is 5 hours, 5 minutes
Uptime for this control processor is 4 hours, 50 minutes
System returned to ROM by SSO Switchover
System restarted at 14:04:40 EST Sun Feb 14 2021
System image file is "flash:packages.conf"
Last reload reason: stack merge
C9300-Stack#show logging onboard switch 2 uptime detail
--------------------------------------------------------------------------------
UPTIME SUMMARY INFORMATION
--------------------------------------------------------------------------------
First customer power on : 02/12/2020 00:56:09
Total uptime : 0 years 0 weeks 5 days 0 hours 28 minutes
Total downtime : 0 years 13 weeks 0 days 18 hours 31 minutes
Number of resets : 22
Number of slot changes : 1
Current reset reason : stack merge
Current reset timestamp : 02/14/2021 14:04:40
Current slot : 2
Chassis type : 52
Current uptime : 0 years 0 weeks 0 days 8 hours 0 minutes
--------------------------------------------------------------------------------
<snip>
查詢與系統重新載入對應或之前直接寫入的存檔。包括系統報告的檔名通常包含TAC可用於調查的可行資訊。
TAC可以識別其他重要的檔案。
C9300-Stack#dir crashinfo:
-#- --length-- ---------date/time--------- path
2 16384 Feb 14 2021 18:51:37.0000000000 +00:00 tracelogs
3 1623 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/flashutil_R0-0.7398_0.20210214190148.bin.gz
4 358 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/binos_R0-0.6831_0.20210214190148.bin.gz
5 63823 Feb 12 2021 06:45:15.0000000000 +00:00 tracelogs/dmesg
6 10 Feb 12 2021 06:45:15.0000000000 +00:00 tracelogs/timestamp
7 935 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/install_engine_R0-0.3330_0.20210214190144.bin.gz
8 730 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/tdl_boottime_R0-0.6801_0.20210214190148.bin.gz
9 1149 Feb 14 2021 14:02:08.0000000000 +00:00 tracelogs/issu_boottime_R0-0.6809_0.20210214190148.bin.gz
<snip>
271 2509408 Feb 14 2021 13:41:46.0000000000 +00:00 system-report_2_20210214-134145-EST.tar.gz
272 1813204 Feb 14 2021 14:00:24.0000000000 +00:00 system-report_2_20210214-140023-EST.tar.gz
摘要
通過重新拔插堆疊套件,立即解決一台或多台交換機每天多次重新載入的慢性不穩定問題。
對於一個或多個成員意外重新載入的堆疊相關重新載入,請確定哪些成員不穩定,並確保這些交換器正確連線到堆疊。如果問題仍然存在,請確保您的交換機運行推薦的代碼並聯絡TAC。
相關資訊
Catalyst 9200系列交換機上的Cisco StackWise架構白皮書
Catalyst 9300 Stackwise系統架構白皮書
堆疊和高可用性配置指南,Cisco IOS XE阿姆斯特丹版17.3.x(Catalyst 9200交換機)
堆疊和高可用性配置指南,Cisco IOS XE Bengaluru 17.5.x(Catalyst 9300交換機)
技術支援與文件 - Cisco Systems