Troubleshooting de Alguns Problemas de Placa de Linha (LC - Line Card) no NCS4016

Opções de download

PDF (94.9 KB)
Ver no Adobe Reader em vários dispositivos
ePub (88.5 KB)
Ver em vários aplicativos no iPhone, iPad, Android, Sony Reader ou Windows Phone
Mobi (Kindle) (78.8 KB)
Ver no dispositivo Kindle ou no aplicativo Kindle em vários dispositivos

Atualizado:24 de novembro de 2015

ID do documento:200272

Linguagem imparcial

O conjunto de documentação deste produto faz o possível para usar uma linguagem imparcial. Para os fins deste conjunto de documentação, a imparcialidade é definida como uma linguagem que não implica em discriminação baseada em idade, deficiência, gênero, identidade racial, identidade étnica, orientação sexual, status socioeconômico e interseccionalidade. Pode haver exceções na documentação devido à linguagem codificada nas interfaces de usuário do software do produto, linguagem usada com base na documentação de RFP ou linguagem usada por um produto de terceiros referenciado. Saiba mais sobre como a Cisco está usando a linguagem inclusiva.

Sobre esta tradução

A Cisco traduziu este documento com a ajuda de tecnologias de tradução automática e humana para oferecer conteúdo de suporte aos seus usuários no seu próprio idioma, independentemente da localização. Observe que mesmo a melhor tradução automática não será tão precisa quanto as realizadas por um tradutor profissional. A Cisco Systems, Inc. não se responsabiliza pela precisão destas traduções e recomenda que o documento original em inglês (link fornecido) seja sempre consultado.

Troubleshooting de Alguns Problemas de Placa de Linha (LC - Line Card) no NCS4016

Introduction

Informações de Apoio

Antes de Começar:

Estado-1: HW_FAILED

Estado 2: POWERED_ON

Estado-3: PRESENTE

Estado-4: DESCONHECIDO

Estado 5: SW_INATIVE

Discussões relacionadas da comunidade de suporte da Cisco

Troubleshooting de Alguns Problemas de Placa de Linha (LC - Line Card) no NCS4016

Introduction

Este documento descreve como solucionar problemas de placa de linha, estados defeituosos sob os quais a placa de linha fica presa, possíveis motivos e ações de recuperação em um Cisco 4000 Series Network Convergence System (NCS4016).

Informações de Apoio

O NCS4016 é um chassi de 16 LC (de 0 a 15 slots) e cada capacidade de LC de 200G. Abaixo estão algumas sequências básicas de eventos enquanto o LC é inicializado no chassi do NCS4016.

A LC foi dividida em 9 zonas de energia, ou seja, 0 a 8. Todas essas zonas de energia são controladas pelo CCC (Card controller Chip).
A primeira zona a ser criada é a Zona 0, que ativaria o complexo de CPU e inicializaria a lógica básica de um LC.
Quando a zona 0 estiver ligada. O CCC executa o intérprete de ativação e configura os dispositivos básicos antes de remover a CPU do estado RESET. (Se a CPU estiver desligada, ela permanece no estado RESET).
Acima estão as funções básicas que são executadas durante a inicialização do LC. Se houvesse algum problema na Zona 1 a 8, apenas a fatia correspondente a eles não teria ligado. No entanto, se houver alguns problemas na Zona 0, todo o LC será desligado.

Antes de Começar:

Antes de iniciar a solução de problemas, é recomendável manter uma nota dos comandos abaixo.

Anexar (ou fazer login) à VM sysadmin (Calvados), já que a placa que falhou na inicialização não seria mostrada na VM XR, o status e o motivo da falha só podem ser vistos na VM sysadmin.
Somente as placas que têm CPU nelas devem ter o estado Software operacional. O outro estado seria N/A (não aplicável), mas seu hardware deve ser "operacional"

Com todos os LC e RP operacionais, você deve ser capaz de ver a saída como abaixo.

sysadmin-vm:0_RP0# show platform
Terça-feira, 18 de agosto 19:57:02.631 UTC
Tipo de cartão de localização Estado de software de estado de hardware Estado de software
—
NCS4K-2H-O-K OPERACIONAL N/A NSHUT 0/0
NCS4K-24LR-O-S OPERACIONAL N/A NSHUT 0/5
NCS4K-20T-O-S OPERACIONAL N/A NSHUT 0/6
NCS4K-2H-O-K OPERACIONAL N/A NSHUT 0/8
NSHUT OPERACIONAL NCS4K-RP 0/RP0
NCS4016-FC-M OPERACIONAL N/A NSHUT 0/FC1
0/CI0 NCS4K-CRAFT OPERACIONAL N/A NSHUT
NCS4K-FTA OPERACIONAL N/A NSHUT 0/FT0
NCS4K-FTA OPERACIONAL N/A NSHUT 0/FT1
NCS4K-AC-PEM OPERACIONAL N/A NSHUT 0/PT0
NCS4K-AC-PEM OPERACIONAL N/A NSHUT 0/PT1
0/EC0 NCS4K-ECU OPERACIONAL N/A NSHUT
sysadmin-vm:0_RP0#

Abaixo estão alguns poucos estados de hardware e software com defeito comuns nos quais a LC pode estar presa e seus motivos.

Estado-1: HW_FAILED

Esse estado sugere que a placa não foi inicializada devido a alguns problemas de energia ou o interpretador de inicialização de CCC impediu a conclusão da sequência de inicialização.

Ações recomendadas:

Verifique a saída do comando abaixo.

# sysadmin-vm:0_RP1# show platform detail location <location of card>

No comando acima procure "Last Event" (Último evento) e "Last Event Reason:" (Último motivo do evento:), isso nos dirá o motivo da falha.

sysadmin-vm:0_RP1#show platform detail location 0/fc1

Sat 4 de julho 13:52:14.782 UTC

Informações da plataforma para 0/FC1

PID: NCS4016-FC-M

Descrição: "Conexão cruzada independente NCS 4016 - multichassi "

VID/SN: V01

HW Oper State: OPERACIONAL

Estado de operação do SW: N/A

Configuração: "NSHUT RST"

Versão do HW: 1.0

Último evento: HW_EVENT_FAILURE

Último motivo do evento: "FAIL EXIT0 da descoberta inicial, solicitação de energia ligada, mas não concluída ccc-pon startup power_control 0x00000001"

Para o estado de falha acima, você também pode verificar o status do controlador CCC para um local específico. Você deve estar verificando o status da zona de energia que é "SET". Como o LC diferente usa uma zona de energia diferente para inicializar.

sysadmin-vm:0_RP0# show controller cc power detail location 0/RP0

Terça-feira, 18 de agosto 18:33:30.245 UTC

Detalhe da potência: Informações de zona para 0/RP0:

—

—

| 0 | OK | CONJUNTO |-- |

| 1 | OK |-- |-- |

| 2 | OK | SET |-- |

| 3 | OK |-- | —

| 4 | OK | CONJUNTO | — |

| 5 |-- |-- |-- |

| 6 | OK |-- |-- |

| 7 |-- |-- |-- |

| 8 | OK | SET | — |

sysadmin-vm:0_RP0#

Ações de recuperação:

Tente redefinir o LC de forma suave executando o comando abaixo.

# sysadmin-vm:0_RP1# hw-module location <location of card> reload

Se a redefinição parcial não ajudar a resolver o problema, uma OIR (Online Insertion and Removal) física da placa deve ser feita.

Estado 2: POWERED_ON

Esse estado é visto no LC, que é menor que a CPU, e todas as placas LC no NCS4k são menores que a CPU.

Ações recomendadas:

sysadmin-vm:0_RP1#show platform

NSHUT OPERACIONAL N/A 0/FC0 NC4K-FC

0/FC1 NC4K-FC POWERED_ON N/A NSHUT

NSHUT OPERACIONAL N/A 0/FC2 NC4K-FC

Nesse caso, o driver de estrutura tentará recuperar a placa sozinho, mas se não conseguir detectar o ASIC em 3 minutos, falhou, então a placa vai parar no estado POWERED_ON.

Verifique a saída abaixo, mostrando que todas as placas presentes no chassi estão ligadas com êxito.

sysadmin-vm:0_RP0# show controller cc power summary

Terça-feira, 18 de agosto 19:09:37.575 UTC

Resumo de energia CCC:

Estado de energia do tipo da placa de localização

—

0/0 NCS4K-2H-O-K LIGADO

0/FC1 NCS4016-FC-M ATIVADO

0/5 NCS4K-24LR-O-S ATIVADO

0/6 NCS4K-20T-O-S ATIVADO

0/RP0 NCS4K-RP ON

0/8 NCS4K-2H-O-K LIGADO

sysadmin-vm:0_RP0#

Ações de recuperação:

Tente redefinir suavemente o LC executando o comando abaixo se o estado-2(POWERED_ON) continuar existindo para qualquer LC/FC.

# sysadmin-vm:0_RP1# hw-module location <location of card> reload

Se a reinicialização parcial não ajudar a resolver o problema, deve ser feito um OIR físico da placa.

Estado-3: PRESENTE

Isso significa que a placa foi detectada e está no estado desligado. Esse pode ser o estado válido quando a placa tiver sido configurada para DESLIGAR na configuração. A placa pode ter sido forçada a desligar devido a um alarme ambiental, falha no driver CCC ao detectar a placa devido a falhas de I2C.

Ações recomendadas:

sysadmin-vm:0_RP1# show platform detail location <local da placa>

Na saída acima, marque "Last Event :" e "Last Event Reason :".

Para confirmar os alarmes, você também poderá executar o comando abaixo se a placa tiver sido desligada devido a qualquer condição de alarme. Abaixo da saída mostrando a condição de alarme para a respectiva localização da placa.

sysadmin-vm:0_RP0#show alarms

Terça-feira, 18 de agosto 18:03:35.421 UTC

—

Alarmes ativos

—

Descrição do tempo de definição do grupo de gravidade do local

—

0/PT0-PM0 grande ambiente 05/22/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).

0/PT0-PM0 grande ambiente 05/22/70 04:56:45 Saída do módulo de alimentação desativada (PM_OUTPUT_EN_PIN_HI).

0/PT0-PM2 no ambiente principal 05/22/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).

0/PT0-PM2 ambiente principal 05/22/70 04:56:45 Saída do módulo de alimentação desativada (PM_OUTPUT_EN_PIN_HI).

0/PT0-PM3 ambiente principal 05/22/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).

0/PT0-PM3 ambiente principal 05/22/70 04:56:45 Saída do módulo de alimentação desativada (PM_OUTPUT_EN_PIN_HI).

0/PT1-PM1 ambiente principal 22/05/70 04:56:45 Erro no módulo de alimentação (PM_NO_INPUT_DETECTED).

Você também pode executar o mesmo comando para verificar a saída da respectiva localização da placa.

sysadmin-vm:0_RP1#show alarms brief card location < local da placa>

Ações de recuperação:

Tente redefinir suavemente o LC executando o comando abaixo.

# sysadmin-vm:0_RP1# hw-module location <location of card> reload

Se a reinicialização parcial não ajudar na resolução do problema, deve ser feito um OIR físico da placa

Estado-4: DESCONHECIDO

O motivo mais comum para esse estado é que o driver do CCC não leu o IDPROM da placa ou o driver do CCC detectou a corrupção do IDPROM que não conseguiu detectar a placa.

sysadmin-vm:0_RP1#show platform

Sat 4 de julho 15:27:50.478 UTC

Tipo de cartão de localização Estado de software de estado de hardware Estado de software

—

0/1 DESCONHECIDO NSHUT OPERACIONAL POWERED_ON

Ações de recuperação:

Tente redefinir suavemente o LC executando o comando abaixo.

# sysadmin-vm:0_RP1# hw-module location <location of card> reload

Se a reinicialização parcial não ajudar na resolução do problema, deve ser feito um OIR físico da placa
Se o OIR físico não ajudar, sugerimos a RMA da placa.

Estado 5: SW_INATIVE

Observe que para a placa entrar no estado SW_INATIVE, ela deve estar operacional no estado HW. Um motivo comum para a placa entrar nesse estado é que o HOST OS não consegue acessar o SSD.

Ações recomendadas:

Verifique se a placa tem conexão Ethernet de controle.

sysadmin-vm:0_RP1#show controller switch alcançável

Sat 4 de julho 16:31:33.690 UTC

Switch da placa de rack

—

0 RP0 RP-SW

0 RP1 RP-SW

0 LC0 LC-SW

0 LC1-SW

LC2-SW 0

LC4-SW 0

Se a placa não tiver a conexão Ethernet de controle, execute o comando abaixo para verificar o estado do protocolo Ethernet para a placa. O estado do protocolo deve ser "Ativo" ou "Em espera", caso contrário, qualquer outro estado exibido indica o problema de conexão.

sysadmin-vm:0_RP0# show controller switch mlap location 0/RP0/RP-SW

Terça-feira, 18 de agosto 18:08:22.343 UTC

Número de série do rack do switch da placa de rack

—

0 RP0 RP-SW SAL19058RDF

Protocolo Phys Admin

O Tipo De Estado Do Estado Do Estado Da Porta Se Conecta A

—

0 para baixo - LC15 interno

1 para baixo - LC7 interno

2 para baixo para cima - LC13 interno

3 para baixo - LC12 interno

4 Para Cima - LC14 Interno

5 Para Cima - LC11 Interno

6 Ative Forwarding Internal LC6 ativo ativo ativo ativo ativo

7 Up Ative Forwarding Internal LC5

8 para Cima - LC1 Interno

9 para Cima - LC4 Interno

10 Para Cima - LC3 Interno

11 para baixo - LC10 interno

16 Encaminhamento ativo ativo interno LC0

17 Encaminhamento ativo ativo interno LC8

26 para baixo - LC2 interno

27 para baixo - LC9 interno

32 Abaixo para Cima - MATESC Interno (RP0 Ctrl)

33 Abaixo para Cima - MATESC Interno (RP1 Ctrl)

36 Encaminhamento ativo interno CCC (RP0 Ctrl)

37 Up Rem Managed Forwarding Internal CCC (RP1 Ctrl)

52 para baixo - SFP+ externo 1

54 para baixo - SFP+ 0 externo

Ações de recuperação:

Se tiver confirmado que a porta está inoperante, você também pode tentar acessar o console da CPU da placa e verificar se a placa está respondendo ou não. Ao acessar o cartão, serão exibidas mensagens sugerindo por que ele entrou no estado SW_INATIVE.

sysadmin-vm:0_RP1#attach location <location of card>

O último salto de recurso deve ser a recriação da placa.

#reimage_chassis -s <slot id>, mas antes desta etapa, consulte o especialista técnico.

Links relacionados:

http://www.cisco.com/c/en/us/products/collateral/optical-networking/network-convergence-system-4000-series/data_sheet_c78-729222.html#

http://www.cisco.com/c/en/us/td/docs/routers/ncs4000/software/install/guide/b_sysadmin-ig-ncs4k/b_sysadmin-ig-ncs4k_chapter_010.html

Colaborado por engenheiros da Cisco

Troubleshooting de Alguns Problemas de Placa de Linha (LC - Line Card) no NCS4016

Opções de download

Linguagem imparcial

Sobre esta tradução

Contents

Troubleshooting de Alguns Problemas de Placa de Linha (LC - Line Card) no NCS4016

Introduction

Informações de Apoio

Antes de Começar:

Estado-1: HW_FAILED

Estado 2: POWERED_ON

Estado-3: PRESENTE

Estado-4: DESCONHECIDO

Estado 5: SW_INATIVE

Colaborado por engenheiros da Cisco

Este documento lhe foi útil?

Contate a Cisco

Este documento se refere a estes produtos