O conjunto de documentação deste produto faz o possível para usar uma linguagem imparcial. Para os fins deste conjunto de documentação, a imparcialidade é definida como uma linguagem que não implica em discriminação baseada em idade, deficiência, gênero, identidade racial, identidade étnica, orientação sexual, status socioeconômico e interseccionalidade. Pode haver exceções na documentação devido à linguagem codificada nas interfaces de usuário do software do produto, linguagem usada com base na documentação de RFP ou linguagem usada por um produto de terceiros referenciado. Saiba mais sobre como a Cisco está usando a linguagem inclusiva.
A Cisco traduziu este documento com a ajuda de tecnologias de tradução automática e humana para oferecer conteúdo de suporte aos seus usuários no seu próprio idioma, independentemente da localização. Observe que mesmo a melhor tradução automática não será tão precisa quanto as realizadas por um tradutor profissional. A Cisco Systems, Inc. não se responsabiliza pela precisão destas traduções e recomenda que o documento original em inglês (link fornecido) seja sempre consultado.
Este documento descreve como solucionar problemas de placa de linha, estados defeituosos sob os quais a placa de linha fica presa, possíveis motivos e ações de recuperação em um Cisco 4000 Series Network Convergence System (NCS4016).
O NCS4016 é um chassi de 16 LC (de 0 a 15 slots) e cada capacidade de LC de 200G. Abaixo estão algumas sequências básicas de eventos enquanto o LC é inicializado no chassi do NCS4016.
Antes de iniciar a solução de problemas, é recomendável manter uma nota dos comandos abaixo.
Com todos os LC e RP operacionais, você deve ser capaz de ver a saída como abaixo.
sysadmin-vm:0_RP0# show platform
Terça-feira, 18 de agosto 19:57:02.631 UTC
Tipo de cartão de localização Estado de software de estado de hardware Estado de software
—
NCS4K-2H-O-K OPERACIONAL N/A NSHUT 0/0
NCS4K-24LR-O-S OPERACIONAL N/A NSHUT 0/5
NCS4K-20T-O-S OPERACIONAL N/A NSHUT 0/6
NCS4K-2H-O-K OPERACIONAL N/A NSHUT 0/8
NSHUT OPERACIONAL NCS4K-RP 0/RP0
NCS4016-FC-M OPERACIONAL N/A NSHUT 0/FC1
0/CI0 NCS4K-CRAFT OPERACIONAL N/A NSHUT
NCS4K-FTA OPERACIONAL N/A NSHUT 0/FT0
NCS4K-FTA OPERACIONAL N/A NSHUT 0/FT1
NCS4K-AC-PEM OPERACIONAL N/A NSHUT 0/PT0
NCS4K-AC-PEM OPERACIONAL N/A NSHUT 0/PT1
0/EC0 NCS4K-ECU OPERACIONAL N/A NSHUT
sysadmin-vm:0_RP0#
Abaixo estão alguns poucos estados de hardware e software com defeito comuns nos quais a LC pode estar presa e seus motivos.
Esse estado sugere que a placa não foi inicializada devido a alguns problemas de energia ou o interpretador de inicialização de CCC impediu a conclusão da sequência de inicialização.
Ações recomendadas:
Verifique a saída do comando abaixo.
# sysadmin-vm:0_RP1# show platform detail location <location of card>
No comando acima procure "Last Event" (Último evento) e "Last Event Reason:" (Último motivo do evento:), isso nos dirá o motivo da falha.
sysadmin-vm:0_RP1#show platform detail location 0/fc1
Sat 4 de julho 13:52:14.782 UTC
Informações da plataforma para 0/FC1
PID: NCS4016-FC-M
Descrição: "Conexão cruzada independente NCS 4016 - multichassi "
VID/SN: V01
HW Oper State: OPERACIONAL
Estado de operação do SW: N/A
Configuração: "NSHUT RST"
Versão do HW: 1.0
Último evento: HW_EVENT_FAILURE
Último motivo do evento: "FAIL EXIT0 da descoberta inicial, solicitação de energia ligada, mas não concluída ccc-pon startup power_control 0x00000001"
Para o estado de falha acima, você também pode verificar o status do controlador CCC para um local específico. Você deve estar verificando o status da zona de energia que é "SET". Como o LC diferente usa uma zona de energia diferente para inicializar.
sysadmin-vm:0_RP0# show controller cc power detail location 0/RP0
Terça-feira, 18 de agosto 18:33:30.245 UTC
Detalhe da potência: Informações de zona para 0/RP0:
—
| Zona de potência | Status de energia | Controle de energia | Falha de energia |
—
| 0 | OK | CONJUNTO |-- |
| 1 | OK |-- |-- |
| 2 | OK | SET |-- |
| 3 | OK |-- | —
| 4 | OK | CONJUNTO | — |
| 5 |-- |-- |-- |
| 6 | OK |-- |-- |
| 7 |-- |-- |-- |
| 8 | OK | SET | — |
sysadmin-vm:0_RP0#
Ações de recuperação:
# sysadmin-vm:0_RP1# hw-module location <location of card> reload
Esse estado é visto no LC, que é menor que a CPU, e todas as placas LC no NCS4k são menores que a CPU.
Ações recomendadas:
sysadmin-vm:0_RP1#show platform
NSHUT OPERACIONAL N/A 0/FC0 NC4K-FC
0/FC1 NC4K-FC POWERED_ON N/A NSHUT
NSHUT OPERACIONAL N/A 0/FC2 NC4K-FC
Nesse caso, o driver de estrutura tentará recuperar a placa sozinho, mas se não conseguir detectar o ASIC em 3 minutos, falhou, então a placa vai parar no estado POWERED_ON.
Verifique a saída abaixo, mostrando que todas as placas presentes no chassi estão ligadas com êxito.
sysadmin-vm:0_RP0# show controller cc power summary
Terça-feira, 18 de agosto 19:09:37.575 UTC
Resumo de energia CCC:
Estado de energia do tipo da placa de localização
—
0/0 NCS4K-2H-O-K LIGADO
0/FC1 NCS4016-FC-M ATIVADO
0/5 NCS4K-24LR-O-S ATIVADO
0/6 NCS4K-20T-O-S ATIVADO
0/RP0 NCS4K-RP ON
0/8 NCS4K-2H-O-K LIGADO
sysadmin-vm:0_RP0#
Ações de recuperação:
# sysadmin-vm:0_RP1# hw-module location <location of card> reload
Isso significa que a placa foi detectada e está no estado desligado. Esse pode ser o estado válido quando a placa tiver sido configurada para DESLIGAR na configuração. A placa pode ter sido forçada a desligar devido a um alarme ambiental, falha no driver CCC ao detectar a placa devido a falhas de I2C.
Ações recomendadas:
sysadmin-vm:0_RP1# show platform detail location <local da placa>
Na saída acima, marque "Last Event :" e "Last Event Reason :".
Para confirmar os alarmes, você também poderá executar o comando abaixo se a placa tiver sido desligada devido a qualquer condição de alarme. Abaixo da saída mostrando a condição de alarme para a respectiva localização da placa.
sysadmin-vm:0_RP0#show alarms
Terça-feira, 18 de agosto 18:03:35.421 UTC
—
Alarmes ativos
—
Descrição do tempo de definição do grupo de gravidade do local
—
0/PT0-PM0 grande ambiente 05/22/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).
0/PT0-PM0 grande ambiente 05/22/70 04:56:45 Saída do módulo de alimentação desativada (PM_OUTPUT_EN_PIN_HI).
0/PT0-PM2 no ambiente principal 05/22/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).
0/PT0-PM2 ambiente principal 05/22/70 04:56:45 Saída do módulo de alimentação desativada (PM_OUTPUT_EN_PIN_HI).
0/PT0-PM3 ambiente principal 05/22/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).
0/PT0-PM3 ambiente principal 05/22/70 04:56:45 Saída do módulo de alimentação desativada (PM_OUTPUT_EN_PIN_HI).
0/PT1-PM1 ambiente principal 22/05/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).
Você também pode executar o mesmo comando para verificar a saída da respectiva localização da placa.
sysadmin-vm:0_RP1#show alarms brief card location < local da placa>
Ações de recuperação:
# sysadmin-vm:0_RP1# hw-module location <location of card> reload
O motivo mais comum para esse estado é que o driver do CCC não leu o IDPROM da placa ou o driver do CCC detectou a corrupção do IDPROM que não conseguiu detectar a placa.
sysadmin-vm:0_RP1#show platform
Sat 4 de julho 15:27:50.478 UTC
Tipo de cartão de localização Estado de software de estado de hardware Estado de software
—
0/1 DESCONHECIDO NSHUT OPERACIONAL POWERED_ON
Ações de recuperação:
# sysadmin-vm:0_RP1# hw-module location <location of card> reload
Observe que para a placa entrar no estado SW_INATIVE, ela deve estar operacional no estado HW. Um motivo comum para a placa entrar nesse estado é que o HOST OS não consegue acessar o SSD.
Ações recomendadas:
Verifique se a placa tem conexão Ethernet de controle.
sysadmin-vm:0_RP1#show controller switch alcançável
Sat 4 de julho 16:31:33.690 UTC
Switch da placa de rack
—
0 RP0 RP-SW
0 RP1 RP-SW
0 LC0 LC-SW
0 LC1-SW
LC2-SW 0
LC4-SW 0
Se a placa não tiver a conexão Ethernet de controle, execute o comando abaixo para verificar o estado do protocolo Ethernet para a placa. O estado do protocolo deve ser "Ativo" ou "Em espera", caso contrário, qualquer outro estado exibido indica o problema de conexão.
sysadmin-vm:0_RP0# show controller switch mlap location 0/RP0/RP-SW
Terça-feira, 18 de agosto 18:08:22.343 UTC
Número de série do rack do switch da placa de rack
—
0 RP0 RP-SW SAL19058RDF
Protocolo Phys Admin
O Tipo De Estado Do Estado Do Estado Da Porta Se Conecta A
—
0 para baixo - LC15 interno
1 para baixo - LC7 interno
2 para baixo para cima - LC13 interno
3 para baixo - LC12 interno
4 Para Cima - LC14 Interno
5 Para Cima - LC11 Interno
6 Ative Forwarding Internal LC6 ativo ativo ativo ativo ativo
7 Up Ative Forwarding Internal LC5
8 para Cima - LC1 Interno
9 para Cima - LC4 Interno
10 Para Cima - LC3 Interno
11 para baixo - LC10 interno
16 Encaminhamento ativo ativo interno LC0
17 Encaminhamento ativo ativo interno LC8
26 para baixo - LC2 interno
27 para baixo - LC9 interno
32 Abaixo para Cima - MATESC Interno (RP0 Ctrl)
33 Abaixo para Cima - MATESC Interno (RP1 Ctrl)
36 Encaminhamento ativo interno CCC (RP0 Ctrl)
37 Up Rem Managed Forwarding Internal CCC (RP1 Ctrl)
52 para baixo - SFP+ externo 1
54 para baixo - SFP+ 0 externo
Ações de recuperação:
Se tiver confirmado que a porta está inoperante, você também pode tentar acessar o console da CPU da placa e verificar se a placa está respondendo ou não. Ao acessar o cartão, serão exibidas mensagens sugerindo por que ele entrou no estado SW_INATIVE.
sysadmin-vm:0_RP1#attach location <location of card>
O último salto de recurso deve ser a recriação da placa.
#reimage_chassis -s <slot id>, mas antes desta etapa, consulte o especialista técnico.
Links relacionados: