Este documento fornece uma breve explicação das mensagens do Syslog e de erro comuns emitidas pelos Catalyst 6500/6000 Series Switches com o Catalyst OS (CatOS) Software.
Use a Error Message Decoder Tool (somente clientes registrados) se você receber uma mensagem de erro que não faça parte deste documento. Essa ferramenta fornece o significado das mensagens de erro geradas pelo Cisco IOS® Software e pelo CatOS Software.
Nota:O formato exato das mensagens do Syslog e de erro descritas neste documento pode variar ligeiramente. A variação depende do release do software executado no Supervisor Engine do switch.
Nota:A Cisco recomenda esta configuração mínima de log nos Catalyst 6500/6000 Series Switches:
Execute o comando set time para definir a data e a hora no switch. Você também pode configurar o switch para usar o Network Time Protocol (NTP) para obter a data e a hora de um servidor NTP.
Certifique-se de que o registro e as marcas de data e hora do registo estejam habilitadas, que é o padrão.
Configure o switch para registrar em um servidor syslog, se possível.
Não existem requisitos específicos para este documento.
Este documento não se restringe a versões de software e hardware específicas.
Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.
As mensagens desta seção são mensagens de erro comuns exibidas pelos Catalyst 6500/6000 Series Switches com o CatOS.
O switch gera mensagens %CDP-4-NVLANMISMATCH freqüentes no Syslog.
Este exemplo mostra a saída do console exibida quando esta mensagem de erro ocorre no switch:
2002 Jan 11 08:50:40 EST -05:00 %CDP-4-NVLANMISMATCH: Native vlan mismatch detected on port 4/1 2002 Jan 11 02:02:45 %CDP-4-NVLANMISMATCH: Native vlan mismatch detected on port 1/1
O switch gera essa mensagem sempre que a porta do switch está fisicamente conectada a outro switch ou roteador. Essa mensagem é mostrada no switch porque a VLAN nativa configurada na porta é diferente da VLAN nativa configurada na porta de conexão do switch/roteador.
Uma porta de tronco configurada com marcação IEEE 802.1Q pode receber tráfego marcado e não marcado. Por padrão, o switch encaminha o tráfego não marcado com a VLAN nativa configurada para a porta. Se um pacote possuir um ID de VLAN igual ao ID da VLAN nativa da porta de saída, o switch transmitirá o pacote sem marcação. Caso contrário, o Switch transmitirá o pacote com um caractere.
Certifique-se de que o VLAN nativo para um tronco 802.1q é o mesmo nas duas extremidades no enlace do tronco. Se uma VLAN nativa em uma extremidade do tronco for diferente da VLAN nativa na outra extremidade, o tráfego de VLANs nativas em ambos os lados não poderá ser transmitido corretamente no tronco. Isso poderá causar alguns problemas de conectividade na rede.
Execute o comando show trunk mod/port para verificar a VLAN nativa que está configurada em seu switch. Neste comando, mod/port é a porta de tronco. Aqui está o exemplo de saída:
Console> (enable) show trunk 5/24 Port Mode Encapsulation Status Native vlan -------- ----------- ------------- ------------ ----------- 5/24 desirable dot1q not-trunking 1 Port Vlans allowed on trunk -------- --------------------------------------------------------------------- 5/24 1-1005 Port Vlans allowed and active in management domain -------- --------------------------------------------------------------------- 5/24 1 Port Vlans in spanning tree forwarding state and not pruned -------- --------------------------------------------------------------------- 5/24 Console> (enable)
Execute o comando set vlan vlan_id mod/port para alterar a VLAN nativa que está configurada na porta do tronco. Neste comando, mod/port é a porta de tronco.
Nota:A mensagem de erro do Syslog "%CDP-4-NATIVE_VLAN_MISMATCH" é uma indicação de inconsistência de VLAN nativa em switches Catalyst com Cisco IOS Software.
Note: Se os switches estiverem conectados por portas que não são de tronco, certifique-se de configurá-las para pertencerem à mesma VLAN. Se as portas não estiverem na mesma VLAN, você receberá a mensagem de erro %CDP-4-NVLANMISMATCH: Incompatibilidade de vlan nativa detectada na porta [número da porta].
O switch gera erros DTP-1-ILGLCFG: Illegal config (on, isl--on,dot1q) on Port [mod/port].
Essa mensagem poderá ocorrer se ambos os lados do tronco estiverem definidos como on, mas os tipos de encapsulamento (isl, dot1q) não coincidirem. Se você definiu os modos de tronco como desirable, o tronco não é ativado devido a essa configuração incorreta. Verifique a saída do comando show trunk em ambas as extremidades para fazer o troubleshooting. Certifique-se de que os tipos de encapsulamento sejam os mesmos.
O switch gera mensagens do Syslog %IP-3-UDP_SOCKOVFL:UDP socket overflow periódicas.
Este exemplo mostra a saída do console que você vê quando este erro ocorre:
Observação: o número do soquete do User Datagram Protocol (UDP) exibido pode variar ou ser consistentemente o mesmo.
%IP-3-UDP_SOCKOVFL:UDP socket 2353 overflow %IP-3-UDP_SOCKOVFL:UDP socket 2353 overflow %IP-3-UDP_SOCKOVFL:UDP socket 2353 overflow %IP-3-UDP_SOCKOVFL:UDP socket 2353 overflow
O switch gera essa mensagem do Syslog quando o buffer alocado para os pacotes recebidos no soquete especificado (a porta de destino UDP) está cheio. O buffer enche porque a taxa do tráfego destinado ao soquete é alta demais. Por exemplo, essa condição pode ocorrer quando uma estação de gerenciamento de rede envia um grande número de consultas SNMP (Simple Network Management Protocol). Quando o estouro de UDP acontece, tente reduzir o número de consultas SNMP. Para reduzir o número de consultas, aumente o intervalo de polling na estação de gerenciamento de rede ou reduza o número de objetos MIB consultados pela estação de gerenciamento de rede.
No exemplo desta seção, o switch recebeu um número excessivo de pacotes destinados ao endereço IP do switch (ou o endereço de broadcast) com o soquete UDP de destino 2353. Como o buffer de entrada para esse soquete no switch está cheio, o switch gera uma mensagem syslog. Execute o comando show netstat udp para ver o número de vezes que o switch atingiu a condição de estouro.
Console> (enable) show netstat udp udp: 0 incomplete headers 0 bad data length fields 0 bad checksums 0 socket overflows 110483 no such ports Console> (enable)
Essas mensagens do Syslog indicam que uma ou mais estações estão enviando uma grande quantidade de tráfego de UDP para o switch nas portas UDP de destino especificadas. Se o switch gerar um número excessivo dessas mensagens, use um analisador de rede para identificar a origem do tráfego. Em seguida, reduza a taxa do tráfego. Como o tráfego de UDP é destinado à CPU do switch, você pode usar a função Switched Port Analyzer (SPAN) e definir a porta de origem como sc0. O SPAN identifica a interface interna para o Supervisor Engine. Consulte Exemplo de Configuração do Catalyst Switched Port Analyzer (SPAN) para obter mais informações.
Nota:Não se preocupe com o contador no such port. Esse contador mostra o número de pacotes de UDP recebidos pelo switch com destino a portas inexistentes.
O switch gera o %EC-SP-5-L3DONTBNDL1: TE(mod/port)suspenso: PAgP não ativado na mensagem de erro de porta remota .
Essa mensagem de erro geralmente ocorre quando o Port Aggregation Protocol (PAgP) está habilitado na interface da Camada 3 (L3) e a porta parceira não está habilitada para o PAgP. Aqui está um exemplo:
%EC-SP-5-L3DONTBNDL1: Te(mod/port)suspended: PAgP not enabled on the remote port. %EC-SP-5-L3DONTBNDL1: Te(mod/port)suspended: PAgP not enabled on the remote port. %EC-SP-5-L3DONTBNDL1: Te(mod/port)suspended: PAgP not enabled on the remote port.
A mensagem de erro ocorre provavelmente devido a problemas de configuração, mas ela também pode ser o resultado de problemas de hardware/cabeamento. Certifique-se de que a configuração esteja de acordo com o guia de configuração. Se o erro continuar, faça o troubleshooting do cabeamento e do hardware. Para fazer o troubleshooting do hardware, tente estes métodos:
Recoloque o conversor de interface Gigabit (GBIC).
Substitua o GBIC.
Teste o hardware com uma placa de linha diferente.
O switch gera mensagens do Syslog %IP-3-UDP_SOCKOVFL:UDP socket overflow periódicas.
Este exemplo mostra a saída do console que você vê quando este erro ocorre:
Observação: o número do soquete UDP exibido pode variar ou ser consistentemente o mesmo.
%IP-3-UDP_BADCKSUM:UDP bad checksum
O switch gera essa mensagem do Syslog ao detectar uma soma de verificação inválida em datagrama de UDP, como pacotes SNMP. O cabeçalho do datagrama de UDP transporta uma soma de verificação que o dispositivo de rede receptor examina para verificar se o datagrama foi corrompido durante o trânsito. Se a soma de verificação recebida não corresponder ao valor existente no cabeçalho, o dispositivo descartará o datagrama e registrará uma mensagem de erro. Execute o comando show netstat udp para ver o número de vezes que o switch detectou um datagrama de soma de verificação com erro.
Console> (enable) show netstat udp udp: 0 incomplete headers 0 bad data length fields 0 bad checksums 0 socket overflows 110483 no such ports Console> (enable)
Essa é uma mensagem meramente informativa. Um dispositivo de rede envia pacotes incorretos para o switch e causa a mensagem de erro. Use um analisador de rede para identificar a origem do tráfego. Como o tráfego de UDP é destinado à CPU do switch, você pode usar a função SPAN e definir a porta de origem como sc0. O SPAN identifica a interface interna para o Supervisor Engine. Consulte Exemplo de Configuração do Catalyst Switched Port Analyzer (SPAN) para obter mais informações.
Nota:Não se preocupe com o contador no such port. Esse contador mostra o número de pacotes de UDP recebidos pelo switch com destino a portas inexistentes.
O switch gera mensagens do Syslog %KERNEL-5-UNALIGNACCESS:Alignment correction made periódicas.
Este exemplo mostra a saída do Syslog exibida quando este erro ocorre:
%KERNEL-5-UNALIGNACCESS:Alignment correction made at 0x80056B3C reading 0x81B82F36 %KERNEL-5-UNALIGNACCESS:Alignment correction made at 0x80056B88 reading 0x81B82F36 %KERNEL-5-UNALIGNACCESS:Alignment correction made at 0x80056B3C reading 0x81BF1DB6 %KERNEL-5-UNALIGNACCESS:Alignment correction made at 0x80056B88 reading 0x81BF1DB6
Essas mensagens do Syslog indicam que a CPU do switch detectou e corrigiu um erro de alinhamento durante uma tentativa de acessar dados na DRAM. Essas mensagens são apenas informativas. Elas não indicam um problema no switch e não afetam o desempenho do sistema.
Em alguns casos, um número excessivo dessas mensagens pode ser exibido. Por exemplo, essas mensagens podem inundar o arquivo de log do seu servidor de Syslog ou o console do switch. Se você receber mensagens em excesso, considere atualizar o software do switch para o release de manutenção mais recente da sua linha de release de software. Outra opção é executar o comando set logging level kernel 4 default para modificar o nível de log do recurso Kernel para 4 ou inferior.
Se você atualizar para o release de manutenção mais recente e continuar a receber essas mensagens do Syslog, crie uma solicitação de serviço no Suporte Técnico da Cisco.
O switch gera mensagens Invalid traffic from multicast source address.
Este exemplo mostra a saída do Syslog exibida quando este erro ocorre:
%MCAST-4-RX_JNRANGE:IGMP: Rcvd Report in the range 01-00-5e-00-00-xx
A mensagem do Syslog Rcvd Report in the range é meramente informativa. O switch gera essa mensagem ao receber pacotes de relatório de Internet Group Management Protocol (IGMP) com um endereço MAC de multicast iniciado em 01-00-5e-00-00-xx. Essa faixa de endereços da Camada 2 (L2) é equivalente a uma faixa de endereços multicast L3 entre 224.0.0.0 e 224.0.0.255. Esses endereços são reservados para o uso de protocolos de roteamento e outros protocolos de descoberta de topologia ou manutenção de baixo nível. Exemplos desses protocolos incluem a descoberta de gateways e os relatórios de associação a grupos.
Use uma ferramenta de captura de pacotes, como um sniffer, e filtre as mensagens de IGMP para fazer o troubleshooting deste problema. Além disso, você pode usar a função Catalyst SPAN para copiar pacotes de uma porta que você suspeita estar recebendo essas mensagens de um dispositivo de rede. Para suprimir essas mensagens, execute o comando set logging level mcast 2 default. Esse comando altera o nível de registro de mensagens multicast para 2.
Use as portas mostradas pelo comando show multicast router e/ou qualquer uplink para o núcleo da rede como as portas de origem do SPAN. Caso essas portas sejam portas de tronco, configure também a porta de destino de SPAN como uma porta de tronco. Execute o comando show trunk para verificar se as portas são portas de tronco.
Um switch com rastreamento de IGMP habilitado exibe o comando %MCAST-2-IGMP_FALLBACK:IGMP: Executando no modo FALL BACK mensagem de erro.
Este exemplo mostra a saída do Syslog exibida quando este erro ocorre:
%MCAST-2-IGMP_ADDRAL:IGMP: Address Aliasing for 01-00-5e-00-00-01 %MCAST-2-IGMP_FALLBACK:IGMP: Running in FALL BACK mode
O switch gera essa mensagem do Syslog ao receber excesso de tráfego de multicast destinado a um endereço MAC de multicast no intervalo 01-00-5e-00-00-xx. O snooping de IGMP não oferece suporte a fluxos de multicast para endereços nesse intervalo de endereços MAC. Essa falta de suporte ocorre porque os endereços MAC desse intervalo são sempre usados para o controle de tráfego de IGMP, como abandonos, ingressos e consultas gerais. No exemplo desta seção, o switch recebe uma quantidade excessiva de tráfego com o endereço MAC de destino 01-00-5e-00-00-01. Essa mensagem indica que o NMP (Network Management Processor, processador de gerenciamento de rede) detecta um fluxo de dados multicast que desabilitou a lógica de escape de redirecionamento do protocolo. O fluxo é associado a um destes endereços de multicast especiais:
01-00-5e-00-00-01 01-00-5e-00-00-04 01-00-5e-00-00-05 01-00-5e-00-00-06 01-00-5e-00-00-0d
Ao detectar uma taxa elevada desse tipo de tráfego, o switch interrompe o snooping de pacotes com o endereço MAC de destino especificado por um breve período de tempo. Esse congelamento é chamado de modo fallback. Em seguida, o switch reinicia o snooping, o que é chamado de modo normal. O switch gera a mensagem do Syslog descrita por esta seção ao entrar no modo de fallback.
Use qualquer uma destas abordagens para detectar qual switch gerou tráfego para 01-00-5e-00-01:
Execute o comando set span sc0 mod/port para monitorar a porta sc0 e enviar o tráfego para um sniffer. O SPAN mostra todo o tráfego direcionado à CPU do switch.
Note:O tráfego para esses endereços MAC é redirecionado para a CPU somente quando o switch não está no modo de fallback. Quando o switch está no modo de falback, ele não permite que os pacotes sejam enviados diretamente para a CPU para evitar uma inundação de tráfego.
Se você executar o software versão 6.3(10), 7.4(3) ou posterior, mensagens do Syslog adicionais informarão o endereço MAC de origem, a porta de origem e o endereço IP de origem ofensivos. Consulte essas mensagens do Syslog semelhantes a:
2003 Jan 24 04:07:43 %MCAST-2-IGMP_ADDRAL:IGMP: Address Aliasing for 224.0.0.1 2003 Jan 24 04:07:43 %MCAST-2-IGMP_FALLBACK:IGMP: Running in FALL BACK mode 2003 Jan 24 04:07:43 %MCAST-2-IGMP_ADDRALDETAILS:IGMP: Multicast address aliasing: From 00-00-0c-11-22-33 (3.3.3.33) on 1/2 to 01-00-5e-00-00-01 (224.0.0.1)
A solução é isolar o host que gera este tipo de tráfego de multicast. Verifique qual endereço recebe alias. Tente não usar esse endereço para a alimentação de dados de transmissão múltipla. Na mensagem do Syslog, você poderá encontrar o local do host a fim de descobrir por que o host envia esse tráfego. Neste exemplo, o local do host é 3.3.3.33.
O switch gera as mensagens do Syslog MGMT-4-OUTOFNVRAM:Out of NVRAM space.
Uma mensagem semelhante a esta será exibida quando o espaço de NVRAM do sistema se esgotar:
%MGMT-4-OUTOFNVRAM:Out of NVRAM space: (62,39204,524288,24976)
Essa mensagem indica que a operação de gravação na NVRAM falha devido a uma ausência de espaço. Os quatro [dec] que aparecem entre parênteses indicam:
Primeiro [dec] — O bloco de configuração escrito na NVRAM
Segundo [dec]—O tamanho da configuração gravada na NVRAM
Terceiro [dec]—O tamanho total da NVRAM no sistema
Quarto [dec]—A quantidade de espaço de NVRAM disponível
A solução é alterar a configuração do sistema do modo binário padrão para o modo de texto. Use o modo de texto se a configuração for muito grande para armazenar em formato binário na NVRAM. O método baseado em texto não grava as alterações de configuração na NVRAM à medida que você às digita. Em vez disso, esse método armazena as alterações na DRAM até o comando write memory ser executado na linha de comando. Consulte a seção Definindo o Modo de Configuração de Arquivo de Texto do documento Trabalhando com o Sistema de Arquivos Flash para obter instruções adicionais de configuração.
Nota:Somente as configurações de QoS e de lista de controle de acesso (ACL) de segurança, além das configurações relacionadas a modo, são excluídas quando o modo de texto é usado. O restante da configuração é salvo na NVRAM em formato binário, como antes.
O switch gera a mensagem de erro Cannot enable text mode config if ACL config is cleared from nvram.
O switch gera essa mensagem durante uma tentativa de mudar de uma configuração de modo binário para a configuração de modo de texto em um instante em que a configuração de ACL confirmada atual não está salva na NVRAM.
Na maioria dos casos, você pode executar o comando set config acl nvram para resolver este problema. O comando copia a configuração de ACL confirmada atual de uma DRAM de volta para a NVRAM.
O switch gera erros MGMT-5-LOGIN_FAIL:User failed to log in from Console.
Possivelmente essa mensagem indica um problema com o servidor de terminal conectado à porta de console do switch. Quando o console do switch estiver conectado a uma linha assíncrona de um servidor de terminal e uma reinicialização por software for feita no switch, um fluxo de lixo (caracteres aleatórios) passará pela tela por vários minutos. Se o TACACS estiver habilitado no switch, os vários minutos poderão se transformar em muitos dias enquanto o TACACS coloca o lixo no buffer e o processa um pedaço de cada vez. A solução é executar o comando no exec na linha assíncrona à qual o switch está conectado.
Nota:Mesmo após a execução do comando no exec, as mensagens continuarão até o buffer ser limpo.
O switch gera mensagens do Syslog %PAGP-5-PORTFROMSTP and %PAGP-5-PORTTOSTP com freqüência.
Este exemplo mostra a saída do console quando o switch gera essas mensagens do Syslog:
%PAGP-5-PORTFROMSTP:Port 3/3 left bridge port 3/3 %PAGP-5-PORTTOSTP:Port 3/3 joined bridge port 3/3 %PM_SCP-SP-4-LCP_FW_ABLC
O recurso de registro PAgP relata eventos que envolvem PAgP. Use o PAgP para negociar links EtherChannel entre os switches. O switch gera a mensagem do Syslog %PAGP-5-PORTFROMSTP sempre que um link é perdido em uma porta do switch. O switch gera a mensagem do Syslog %PAGP-5-PORTTOSTP sempre que um link é detectado em uma porta do switch. Essas mensagens do Syslogs são mensagens informativas normais que indicam a adição ou remoção de uma porta da spanning tree.
Nota:Não é necessário habilitar os canais para que essas mensagens sejam exibidas.
No exemplo desta seção, o switch primeiro perdeu o link na porta 3/3, o que removeu a porta da spanning tree. Em seguida, o switch detectou novamente o link na porta, o que a adicionou de volta à spanning tree.
Se você vir essas mensagens freqüentemente para uma porta específica, o link está oscilando, o que significa que ele é perdido e recuperado constantemente. Investigue a causa. As causas típicas da não sincronização de enlace em uma porta de Switch incluem:
Incompatibilidade de velocidade/duplex
Colisão tardia
Cabo defeituoso
placa de interface de rede (NIC) defeituosa ou outro problema de estação final
Porta do Switch defeituosa
Outros erros de configurações
Para suprimir essas mensagens do Syslog, execute o comando set logging level pagp 4 default para modificar o nível de log do recurso PAgP para 4 ou menos. O nível de log padrão do PAgP é 5.
O switch gera mensagens do Syslog %SPANTREE-3-PORTDEL_FAILNOTFOUND periódicas.
Este exemplo mostra a saída do Syslog exibida quando este erro ocorre:
%SPANTREE-3-PORTDEL_FAILNOTFOUND:9/5 in vlan 10 not found (PAgP_Group_Rx)
Essas mensagens de syslog indicam que o PAgP tentou remover uma porta da extensão de árvore do VLAN especificado, mas a porta não estava na estrutura de dados de extensão de árvore daquele VLAN. Em geral, outro processo, como o Dynamic Trunking Protocol (DTP), já removeu a porta da spanning tree.
Essas mensagens normalmente acompanham as mensagens %PAGP-5-PORTFROMSTP. As mensagens destinam-se à depuração. Elas não indicam um problema no switch e não afetam o desempenho do switching. Além disso, essas mensagens não serão registradas a menos que você tenha alterado a configuração padrão de log do recurso SPANTREE. O nível de log padrão de SPANTREE é 2.
Em alguns casos, um número excessivo dessas mensagens pode ser exibido. Por exemplo, essas mensagens podem inundar o console do seu switch. Se você receber mensagens em excesso, considere atualizar o software do switch para o release de manutenção mais recente da sua linha de release de software. Na maioria dos casos, os releases de software mais recentes suprimem essas mensagens.
O switch gera as mensagens do Syslog %SYS-1-CFG_RESTORE.
Este exemplo mostra a saída do console exibida quando esta mensagem de erro ocorre no switch:
2005 Oct 14 14:36:26 %SYS-1-CFG_RESTORE:Global block restored from backup
Essas mensagens são apenas informativas. O recurso de monitoração da NVRAM, apresentado na versão 6.4(x), gera essas mensagens. Elas basicamente informam que há um bloco corrompido na NVRAM e que a configuração foi restaurada do backup. [chars] é o tipo de bloco que pode ser modificado pelo usuário ou processo. Verificações de blocos corrompidos na NVRAM são executadas por padrão. Qualquer bloco que esteja corrompido é restaurado com a cópia que está na DRAM. Portanto, a configuração não é perdida.
O switch gera mensagens do Syslog %SYS-1-SYS_OVERPWRRTNG periódicas.
Este exemplo mostra a saída do console exibida quando esta mensagem de erro ocorre no switch:
Oct 13 11:27:11 %SYS-1-SYS_OVERPWRRTNG:System drawing more power than the power supply rating Oct 13 11:27:11 %SYS-1-SYS_OVERPWRRTNG:System drawing more power than the power supply rating
A mensagem indica que o sistema consome mais energia do que a capacidade da fonte de alimentação. O LED de gerenciamento de energia está vermelho. Essa condição ocorre somente quando o sistema está totalmente configurado e os Supervisor Engines consomem quantidades desiguais de energia.
Uma solução é reinstalar as fontes de alimentação e atualizar o software do Supervisor Engine para uma versão que ofereça suporte ao hardware. Consulte a seção Hardware com Suporte das Release Notes dos Cisco Catalyst 6500 Series Switches para obter informações sobre o release relevante.
O switch gera mensagens do Syslog %SYS-1-MOD_DCPWRMISMATCH:Module[num]DC power failure detected during polling periódicas.
Este exemplo mostra a saída do console exibida quando esta mensagem de erro ocorre no switch:
%SYS-1-MOD_DCPWRMISMATCH:Module[num]DC power failure detected during polling
Esta mensagem ocorre devido a qualquer um destes problemas:
A placa de linha não está encaixada corretamente no chassi.
Reencaixe a placa de linha.
O slot do chassi está com defeito.
Verifique se há pinos tortos. Teste a placa de linha em um slot diferente.
A placa de linha está com defeito.
Entre em contato com o Suporte Técnico da Cisco.
Nos switches Catalyst 6000 com Supervisor Engines redundantes (Multilayer Switch Feature Card [MSFC] e Policy Feature Card [PFC]), essa incompatibilidade de sequência ASIC de barramento pode ocorrer em um switchover:
SYS-1-MOD_SEQMISMATCH: Bus asic sequence mismatch occurred on module [dec] (asic=[dec], srcidx=0x[hex], seq=[dec])
Este exemplo mostra a saída do console exibida quando esta mensagem de erro ocorre no switch:
%SYS-1-MOD_SEQMISMATCH:Bus asic sequence mismatch occurred on module 7 (asic=1, srcidx=0x0, seq=0)
O erro está no barramento do Protocolo de Configuração de Módulo de Switch (SCP - Switch-Module Configuration Protocol) que se comunica entre o Supervisor e as placas de linha. O Supervisor envia uma pulsação para as placas de linha e essas placas de linha não respondem adequadamente ao Supervisor.
Essas mensagens de erro podem ser causadas por qualquer um destes motivos:
O mecanismo supervisor está excessivamente ocupado
Os loops do Spanning Tree Protocol (STP)
As ACLs e os vigilantes de QoS limitam ou descartam o tráfego no canal de comunicação de banda
Problemas de sincronização de ASIC de porta ou problemas do módulo de matriz de comutação
Falha de hardware ou módulo instalado incorretamente
Em alguns casos, essas mensagens também são observadas em placas de linha: WS-X6348-RJ45 e WS-X6516-GBIC.
Esta mensagem não tem impacto e pode ser ignorada. Como solução alternativa, recoloque fisicamente o módulo e reinsira-o com firmeza. As placas de linha podem ser trocadas e removidas em operação e podem usar o mesmo slot dos locais originais de modo que todas as portas correspondam à configuração do Supervisor.
O switch gera mensagens do Syslog %SYS-3-EOBC_CHANNELREINIT.
Estes exemplos mostram a saída do Syslog exibida quando este erro ocorre:
CatOS versão 6.3.8, 7.3.2 e 7.5.1:
%SYS-3-EOBC_CHANNELREINIT:Ethernet out of band channel reinitialized (1)
CatOS versão 7.6(6):
%SYS-5-EOBC_CHANNELREINIT:Ethernet out of band channel reinitialized (1)
As versões 6.3.8, 7.3.2 e 7.5.1 do CatOS introduziram esta mensagem. Ela é exibida para uma condição de erro não fatal. Ela indica que ambas estas condições ocorreram:
O switch detectou uma condição de bloqueio de fila de transmissão (Tx) de canal out-of-band Ethernet (EOBC) no circuito integrado específico de aplicativo do controlador do sistema (ASIC).
O ASIC foi reinicializado sem que o switch tenha sido reiniciado.
Observação: a presença de uma placa com um buffer EOBC defeituoso também pode causar a mensagem.
O EOBC é uma conexão half-duplex de 100 Mbps que os supervisores e as placas de linha usam para se comunicar sobre o painel traseiro. Como são half-duplex, esperam-se colisões neste canal de comunicação. É normal que essas mensagens sejam reportadas ocasionalmente, pois fazem parte do processo de autorrecuperação.
O tráfego de dados continua fluindo pelo switch. Esta mensagem é apenas informativa e não requer nenhuma ação. Releases de software mais recentes incluem uma alteração no nível de severidade da mensagem para que sua severidade coincida com a severidade do erro. Se você vir essa mensagem com muita frequência, pode haver mais chances de quedas de tráfego de controle, o que é motivo de preocupação. Se mensagens reinicializadas aparecerem em um intervalo próximo, entre em contato com o Suporte Técnico da Cisco para obter mais informações.
Estas mensagens de erro são mostradas no Syslog:
%SYS-3-SYS_MEMERR:Bad magic number while freeing address 0x82175564
or
%SYS-3-SYS_MEMERR:Bad process id while allocating address 0x80ea51a4
Essas mensagens de erro indicam que o gerenciamento de memória detectou o corrompimento da memória. A primeira [caracteres] pode ser uma destas frases:
Out of range
Bad alignment
O bloco não está livre
Back pointer mismatch
Número mágico inválido
Succeeding block out of range
Succeeding block improperly aligned
Preceding block out of range
Preceding block improperly aligned
Bad process id
O segundo [caracteres] pode ser um destes:
liberação
alocação
O campo [hex] é o endereço de bloco a ser liberado ou alocado.
A mensagem de erro %SYS-3-SYS_MEMERR indica que, durante o acesso ao bloco de memória, o gerenciamento de memória descobriu que as informações foram corrompidas. Esse problema ocorre ocasionalmente, sem nenhum efeito sobre o switch. Se esse erro ocorrer várias vezes ao longo de um breve período de tempo, verifique se o endereço do bloco mencionado pelas mensagens de erro é o mesmo. Se o endereço do bloco for o mesmo, há uma possibilidade que esse setor específico no chip de memória esteja com defeito e precise ser substituído.
SYS-3-SYS_LCPERR3: Module [dec]: Coil [dec] Port [dec] travado [dec] vezes ([dec] devido a lcol; [dec] devido ao notx) mensagens de erro são exibidas no syslog.
Essas mensagens de erro indicam que o módulo detectou um problema com o ASIC de porta e que uma porta está travada.
Essas mensagens de erro não indicam necessariamente um problema de hardware. O erro ocorre pela primeira vez quando o switch sofre uma colisão tardia devido a uma incompatibilidade de duplex ou a um cabo longo. No entanto, há um bug de software no código do CatOS 7.2(2) que faz com que o switch falhe ao verificar se há erros incrementais. O mesmo erro é registrado repetidamente. Consulte o bug da Cisco ID CSCdx79107 (somente clientes registrados) para obter mais informações sobre este problema. O problema é corrigido na versão 7.3(1) do CatOS.
O erro de syslog gerado é semelhante a este:
2005 Ago 02 09:20:16 %SYS-3-SYS_LCPERR3:Módulo 5: Coil 3 Porta 1: 3 vezes(3 devido ao protocolo; 0 devido ao notx)
2005 Ago 02 10:10:45 %SYS-3-SYS_LCPERR3:Módulo 5: Coil 3 Porta 1: 3 vezes(3 devido ao protocolo; 0 devido ao notx)
Esta lista define os elementos da mensagem de erro:
Module [dec] é o módulo que relata o erro.
Coil [dec] é o número do ASIC que relata o erro.
Port [dec] é a porta do ASIC que apresenta o erro.
stuck [dec] é a duração do erro.
Os últimos dois [dec] são as contagens de lcol e notx.
Para desativar essas mensagens de erro do Syslog, execute o comando de modo privilegiado set errordetection portcounters disable.
Além disso, verifique o status físico da porta para qualquer um destes problemas:
Uma incompatibilidade duplex
NICs fora de sincronização nas estações de trabalho conectadas
A condição de desabilitação de erro
Colisões atrasadas
Qualquer erro no nível do link
Para resolver os problemas resultantes de qualquer um desses problemas, consulte estes documentos:
Troubleshooting de Compatibilidade entre Catalyst Switches e NIC Compatibility Issues
Recuperação de um estado de porta errDisable em plataformas CatOS
Se o erro ocorrer várias vezes, entre em contato com o Suporte Técnico da Cisco para abordar o problema de forma mais detalhada.
Essa mensagem indica que o módulo detectou frames com CRC de pacote inválido recebidos pelo ASIC de barramento do DBus. O primeiro [dec] é o número do módulo. O segundo [dec] é o número ASIC que relata o erro. O terceiro [dec] é a contagem de erros.
Os pacotes de CRC inválidos podem ser enviados de qualquer porta através do barramento de dados. As causas prováveis são módulos de linha mal encaixados ou defeituosos.
Durante a janela de manutenção, quando é possível fazer o troubleshooting do switch, recoloque todos os módulos, inclusive os Supervisors, e verifique se a mensagem de erro ocorre novamente. Em caso afirmativo, há dois procedimentos que podem ser usados para determinar qual dos módulos é a raiz dos pacotes incorretos e para substituir o módulo com problema.
Usar nível de diagnóstico:
Configure o switch para uma análise de POST completa.
set test diaglevel complete
Recoloque todos os módulos, inclusive os Supervisor Engines.
Obtenha os resultados da análise do POST.
show test all
Entre em contato com o Representante Técnico da Cisco com a saída do comando show test all.
Use os contadores ASIC de Pinnacle:
Remova um módulo de cada vez.
Use este comando e observe o contador 0xC7 em busca de erros incrementais.
show asicreg/ pinnacle errcounters
Este comando exibe todos os contadores para o ASIC do Pinnacle naquele módulo. O contador 0xC7 é exibido na terceira linha da saída. Toda vez que o comando é executado, os contadores são limpos. O número ideal são 0 erros.
C6500> (enable) show asicreg 3/1 pinnacle errcounters
00C5: PI_CI_S_HDR_FCS_REG = 0000
00C6: PI_CI_S_RBUS_FCS_REG = 0000
00C7: PI_CI_S_PKTCRC_ERR_REG = 0000
00C8: PI_CI_S_PKTLEN_ERR_REG = 0000
00C9: PI_CI_S_BPDU_OUTLOST_REG = 0000
00CE: PI_CI_S_HOLD_REG = 0000
00CA: PI_CI_S_QOS0_OUTLOST_REG = 0000
00CE: PI_CI_S_HOLD_REG = 0000
00CB: PI_CI_S_QOS1_OUTLOST_REG = 0000
00CE: PI_CI_S_HOLD_REG = 0000
00CC: PI_CI_S_QOS2_OUTLOST_REG = 0000
!--- Output elided.
Repita as etapas 1 e 2 até que o erro não ocorra. Entre em contato com o Representante Técnico da Cisco para substituir o módulo defeituoso.
Estas mensagens de erro são mostradas no Syslog:
%SYS-4-SUPERVISOR_ERR:Forwarding engine IP length error counter =4 %SYS-4-SUPERVISOR_ERR:Forwarding engine IP too short error counter =1 %SYS-4-SUPERVISOR_ERR:Forwarding engine IP check sum error counter = 38
Essas mensagens indicam que o mecanismo de encaminhamento do switch recebeu um pacote IP com comprimento inferior ao mínimo permitido e descartou o pacote. Nas versões de código anteriores à 7.x, o mecanismo de encaminhamento descarta silenciosamente o pacote e o contabiliza nas estatísticas do mecanismo. Nos códigos mais novos (7.x ou posterior), essa mensagem é gravada no Syslog uma vez a cada 30 minutos.
Isso não afeta o lado do Switch. O switch descarta o pacote incorreto, o qual deveria ter sido descartado pelo dispositivo de recebimento como conseqüência. A única preocupação é que há um dispositivo que está enviando pacotes incorretos. As causas possíveis incluem um driver de NIC incorreto, um bug no driver da NIC ou um aplicativo com problemas. O Supervisor Engine não controla o endereço IP de origem do dispositivo que envia os pacotes incorretos. A única forma de detectar esses dispositivos é usar um sniffer para identificar os endereços de origem.
Essa mensagem é meramente informativa e é um aviso do switch. Execute o comando set errordetection portcounters disable no switch para desativar essas mensagens de erro.
O switch gera mensagens Invalid traffic from multicast source address.
Este exemplo mostra a saída do Syslog exibida quando este erro ocorre:
SYS-4-P2_WARN: 1/Invalid traffic from multicast source address
Essa mensagem do Syslog de endereço de origem de multicast é gerada quando o switch recebe pacotes que possuem um endereço MAC de multicast como o endereço MAC de origem. A utilização de um endereço MAC de broadcast ou multicast como o MAC de origem para um frame não é um comportamento compatível com os padrões. No entanto, o switch ainda encaminhará o tráfego proveniente de um endereço MAC de multicast. A mensagem do Syslog indica o endereço MAC de multicast no campo de MAC de origem do frame, bem como a porta em que o tráfego foi recebido. A alternativa é tentar identificar a estação final que gera os frames com um endereço MAC de origem de multicast. Em geral, um destes dispositivos transmite tais frames:
Um gerador de tráfego, como o Spirent SmartBits
Dispositivos de terceiros que compartilham um endereço MAC de multicast, como produtos de firewall de balanceamento de carga ou de servidores
O erro não causa nenhum problema de desempenho. Para evitar as mensagens de erro, desabilite o log das mensagens. Outra solução é identificar o dispositivo que gera frames com um endereço MAC de origem de multicast. Em seguida, use um sniffer ou uma configuração de SPAN para encontrar o dispositivo. Em seguira, verifique suas configurações.
Estas mensagens de erro são mostradas no Syslog:
%SYS-4-PORT_ERR:Port 16/1 rxTotalDrops (7426859)
or
%SYS-4-PORT_ERR:Port 15/1 rxTotalDrops (2563127)
No exemplo desta seção, ERRORDETECTION PORTCOUNTERS foram ativados e erros de recepção (Rx) ocorrem na porta 1/1. Mas a mensagem syslog (SYS-4-PORT_ERR) relata rxTotalDrops em 15/1 em vez de 1/1.
Observação: ERRORDETECTION PORTCOUNTERS estão desabilitados por padrão.
Em algumas instalações, o software habilita o recurso, o qual permanece habilitado após os upgrades. Esse problema foi resolvido na versão 6.3(1) para instalações novas. Se essa mensagem for exibida, verifique a primeira porta de uplink (1/1 ou 2/1), mas não a porta informada pelo Syslog (15/1 ou 16/1). A saída do comando show counters mostra os erros que ocorrem. Se o único contador de erros a informar problemas é rxTotalDrops, os descartes que ocorrem são provavelmente descartes de CBL (Color Blocking Logic). Você poderá esperar esses descartes se a spanning tree estiver bloqueando para uma VLAN naquela porta. Os descartes de CBL são pacotes recebidos em um troco para a VLAN que está bloqueada nesse tronco. Por exemplo, broadcast, multicast ou unicast desconhecido ainda podem ser recebidos em uma porta bloqueada.
Se houver outros contadores de erros informando problemas, a causa necessitará de investigação adicional.
A solução é desabilitar o ERRORDETECTION PORTCOUNTERS. Execute o comando set errordetection portcounters disable.
O switch relata esta mensagem de erro para o console do switch e o Syslog para a placa de linha WS-X6608:
2002 Aug 26 09:22:58 %SYS-4-MODHPRESET: Host process (860) 3/5 got reset asynchronously
As portas de T1 ou E1 nos módulos WS-X6608 são reiniciadas de forma aleatória e ocasional. Isso causa o descarte de todas as chamadas ativas para redes telefônicas públicas comutadas (PSTNs). As portas que não estão configuradas mas estão habilitadas são reiniciadas continuamente em uma tentativa de se conectarem a um Cisco CallManager. Essas mensagens de reinicialização podem se sobrepor às portas do gateway ativo e causar o reinício indesejado. A sobreposição e a reinicialização são possíveis porque todas as oito portas compartilham o processador. Essa mensagem do sistema é mostrada continuamente na tela do console e em seus Syslogs, caso você os tenha configurado. Esse comportamento é esperado para este blade. O comportamento não afeta o desempenho do sistema.
A solução é desativar portas não utilizadas. Execute o comando set port disable mod/port. Adicione todas as portas ao banco de dados do Cisco CallManager. Essas portas podem ser configuradas como gateways, Media Termination Points (MTPs) ou bridges de conferência de hardware.
O syslog relata esta mensagem de erro no log:
2002 Aug 23 08:59:16 %SYS-4-NVLOG:SYNDIAGS: Bus ASIC sync error on Module 16, bus I/F register = 0xa0 2002 Aug 23 09:00:53 %SYS-4-NVLOG:SYNDIAGS: Bus ASIC sync error on Module 1, bus I/F register = 0x30
Essa mensagem pode indicar que o ASIC do Supervisor Engine não estava em sincronismo antes da execução do diagnóstico. Ao receber essa mensagem, tente recolocar o módulo ou movê-lo para um slot diferente e veja se a mensagem não é mais exibida. Se a mensagem continuar, execute o comando show test mod_number, grave a saída e entre em contato com o Suporte Técnico da Cisco. Esse problema é de hardware. A solução é substituir o módulo que apresentou a mensagem de erro.
Os módulos GBIC WS-G5484, WS-G5486 e WS-G5487 parecem estar funcionando normalmente, mas estão relatando os seguintes erros de software:
%SYS-4-PORT_GBICBADEEPROM: port bad gbic eeprom checksum %SYS-4-PORT_GBICNOTSUPP: port gbic not supported
Quando os módulos GBIC WS-G5484, WS-G5486 e WS-G5487 com uma placa WS-X6408-GBIC são usados, mensagens de erro são mostradas no log de software, embora não haja problema algum. Quando esses mesmos GBICs forem conectados em outros módulos ou Supervisor Engines, os erros poderão não ocorrer, desde que os GBICs possuam uma EEPROM de Supervisor Engine de GBIC Cisco (SEEPROM) válida. Essa mensagem de erro é somente visual. A mensagem não afeta o tráfego que passa pelo módulo ou GBIC.
Esse problema é apenas um problema de software cosmético. Não substitua o hardware. Estes releases do Catalyst Software disponíveis corrigiram esse problema que ocorre quando SEEPROMs estão disponíveis no GBIC Cisco:
CatOS 5.5(5) e posterior
CatOS 6.2(3) e posterior
Se um GBIC não possuir uma SEEPROM Cisco, um upgrade do CatOS Software não corrigirá a mensagem de erro. Nesse caso, o erro indica que um GBIC Cisco mais antigo ou não certificado ou um GBIC de outro fabricante está no lugar. Os GBICs Cisco certificados só podem ser substituídos sob um contrato de suporte ou na garantia. Observe a etiqueta na parte superior da caixa do GBIC para verificar se ele é um GBIC Cisco certificado. Procure estes itens:
Um logotipo da Cisco
Um número de peça da Cisco que começa com 30
nome do fornecedor do GBIC
Para obter mais detalhes, consulte Aviso de campo: Os GBICs G5484, G5486 e G5487 geram erros de EPROM incorretos.
O console ou Syslog informa estas mensagens de erro:
%SYS-4-SYS_LCPERR4:Module 12: Pinnacle #1 PB parity error. Tx path. Status=0x0046: Module needs troubleshooting or TAC assistance. %SYS-4-SYS_LCPERR4:Module 12: Pinnacle #1 PB parity error. Rx path. Status=0x0002: Module needs troubleshooting or TAC assistance.
Esta mensagem pode indicar um problema transiente do buffer de pacotes do ASIC Pinnacle. O primeiro [dec] é o número do módulo. O segundo [dec] é o número do ASIC. Se o erro estiver limitado a um único módulo, recoloque e ligue e desligue o módulo. Se esta mensagem for exibida com freqüência, entre em contato com o Suporte Técnico da Cisco para obter ajuda adicional.
O console ou Syslog informa estas mensagens de erro:
%SYS-5-SYS_LCPERR5:Module 7: Coil Pinnacle Header Checksum Error - Port #32: %SYS-5-SYS_LCPERR5:Module 7: Coil Mdtif Packet CRC Error - Port #32: %SYS-5-SYS_LCPERR5:Module 7: Coil Mdtif State Machine Error - Port #32:
Essa mensagem de erro é específica para placas de ingresso 6348. A mensagem de log na seção Problema pode ser o resultado de um problema de hardware ou software. Conclua as etapas desta seção para determinar se o problema é uma questão de hardware ou de software.
Siga as etapas se ambos os itens forem verdadeiros:
Apenas a mensagem da seção Problema é mostrada e não há outras mensagens correlacionadas nos Syslogs.
A transmissão foi bloqueada em uma porta, mas não em um grupo de 12 portas.
Execute o comando show mac mod/port duas vezes em intervalos de 2 segundos para confirmar que uma transmissão foi bloqueada.
Tente enviar o tráfego entre o problema de cada comando. Verifique se os contadores de transmissão aumentaram. Se os números foram incrementados, a transmissão não está bloqueada.
Desative/ative as portas e veja se elas se recuperam.
Execute o comando reset mod_number para reiniciar o módulo por software.
Veja se o módulo se recupera.
Emita o comando set module power {up comando | down} mod_number para reiniciar o módulo.
Veja se o módulo se recupera.
Provavelmente, se todos estes itens forem verdadeiros, trata-se de um problema de software:
Você desabilita/habilita as portas e reinicia o módulo por software ou hardware e todas as placas entram online.
Todas as portas passam no diagnóstico na saída do comando show test.
O tráfego começa a ser transmitido sem problemas.
Se todos esses itens forem verdadeiros, consulte o bug da Cisco ID CSCdu03935 (somente clientes registrados). O problema é corrigido nas versões 5.5(18), 6.3(10), 7.4(3) e posterior.
Em alguns casos, você verá %SYS-5-SYS_LCPERR5:Módulo 9: Coil Pinnacle Header Checksum Error - Mensagens de erro da porta nº 37 e uma ou mais destas mensagens:
Erro de máquina de estado de bobina Mdtif
Erro CRC de pacote de bobina Mdtif
Erro de baixo fluxo de Coil Pb Rx
Erro de paridade Pb Rx da bobina
Se alguma dessas mensagens for exibida, determine se alguns ou todos os itens a seguir são verdadeiros:
Depois que você redefinir o módulo por software ou/e redefini-lo por hardware, ele ainda não estará on-line.
O módulo entra online, mas um grupo de 12 portas falhou no diagnóstico da saída do comando show test.
O módulo trava no estado other ao ser inicializado.
Todos os LEDs da porta no módulo ficam âmbar.
Todas as portas estão no estado errdisabled quando o comando show port mod_number é executado.
Se você observar qualquer um dos problemas dessa lista, provavelmente há um problema de hardware. Você deve substituir a placa.
O switch gera mensagens do Syslog convert_post_SAC_CiscoMIB: periódicas.
Este exemplo mostra a saída do console que você vê quando esta mensagem ocorre:
SYS-4-NVLOG:convert_post_SAC_CiscoMIB:Nvram block 0 unconvertible: ) SYS-4-NVLOG:convert_post_SAC_CiscoMIB:Nvram block 1 unconvertible: ) SYS-4-NVLOG:convert_post_SAC_CiscoMIB:Nvram block 2 unconvertible: )
Essas mensagens do console são normalmente mostradas durante o upgrade ou downgrade de versões de código de CatOS. Elas também podem ocorrer durante o carregamento de uma configuração de switch gerada por outro switch ou quando uma configuração de switch de outra versão de código é usada. Um failover para o Supervisor Engine em standby também pode gerá-las.
Versões diferentes de código contêm variáveis que a NVRAM armazena. Quando o switch inicializa em uma versão mais recente ou mais antiga do CatOS, ele converte a configuração anterior em uma versão utilizável pela imagem de inicialização atual. Durante esse processo, um bloco de memória específico que não é necessário ou utilizável na forma atual é desalocado em vez de convertido. Essa função interna gera a mensagem de erro.
Esta mensagem é geralmente apenas informativa. Compare a configuração anterior com a configuração atual para verificar a conversão adequada de todas as informações de configuração.
Se essas mensagens forem exibidas quando nenhum upgrade de código, alteração de configuração ou failover de Supervisor Engine tiver ocorrido, crie uma solicitação de serviço no Suporte Técnico da Cisco.
O comutador gera %SYS-6-CFG_CHG:Module [dec] bloco periódico alterado por mensagens de syslog SecurityRx.
Este exemplo mostra a saída do console exibida quando esta mensagem de erro ocorre no switch:
%SYS-6-CFG_CHG:Module 3 block changed by SecurityRx %SYS-6-CFG_CHG:Module 4 block changed by SecurityRx
Essa mensagem indica que o bloco de configuração foi modificado. Essas mensagens são esperadas quando a segurança de porta está configurada no switch e o envelhecimento está ativado. Um MAC seguro é o endereço MAC que é aprendido do processo de segurança de porta e é adicionado à tabela CAM como uma entrada estática para proteger a porta. Quando você tem um tempo de envelhecimento na configuração de segurança da porta, o endereço MAC é removido da tabela CAM e da NVRAM (onde os MACs seguros PS são armazenados) no tempo de envelhecimento. O próximo pacote recebido da porta após esse envelhecimento ocorre auxilia no repovoamento da CAM e da NVRAM com o endereço MAC seguro da PS.
Estas mensagens de erro são mostradas na saída do comando show log:
InbandPingProcessFailure:Module 2 not responding over inband InbandPingProcessFailure:Module 2 not responding over inband
Essa mensagem indica que o módulo não está respondendo às solicitações do Supervisor Engine no canal de comunicação in-band. Um destes fatores pode causar o erro:
O Supervisor Engine está excessivamente ocupado.
Há loops de Spanning Tree Protocol (STP).
Os vigilantes de ACLs e QoS limitam ou descartam o tráfego no canal de comunicação in-band.
Há problemas de sincronização ASIC de porta.
Há problemas no módulo de switch fabric.
O Supervisor Engine consulta a Multilayer Switch Feature Card (MSFC) por meio de um ping especial a cada 10 segundos. O Supervisor Engine então reinicia a MSFC se ela falha ao responder três pings consecutivos. Além disso, no CatOS versão 6.2 ou posterior, os Supervisor Engines ativo e de standby consultam um ao outro via canal in-band e o switch executa o failover para o Supervisor Engine de standby.
Observação: se você tiver migrado recentemente para ou das versões 6.3(10), 7.4(2) ou 7.4(3), o switch poderá ser redefinido se você emitir o comando show log ou o comando show tech-support e se você tiver a mensagem de falha InbandPing no log. A solução é executar o comando clear log antes do comando show log. O bug da Cisco ID CSCdz32730 (somente clientes registrados) identifica essa falha. O problema é resolvido nas versões 6.4(1) , 7.5(1) e posterior.
Em geral, essa mensagem é causada por uma falha de ASIC de porta ou por uma conexão não confiável para o backplane. Conclua estes passos:
Remova o módulo de referência das mensagens.
Recoloque firmemente o módulo em seu slot.
Execute o comando set test diaglevel complete para garantir que o modo de diagnóstico completo seja habilitado.
Execute o comando show log mod_number e o comando show test mod_number para identificar qualquer teste com falha.
Se a etapa 2 não resolver o problema, crie uma solicitação de serviço no Suporte Técnico da Cisco.
Conclua estes passos para fornecer as informações necessárias:
Capture a saída dos comandos show apropriados do CatOS.
Se o módulo mencionado não for uma MSFC, capture a saída destes comandos:
show tech-support
show log
show logging buffer 1024
show test mod_number
Observação: emita este comando uma vez para cada placa de linha.
show scp mod mod_number
Observação: emita este comando uma vez para cada placa de linha.
show mod
Se o módulo mencionado for uma MSFC, capture a saída destes comandos:
show inband
show test 0
show scp stat
show scp failcnt
show scp mod
show scp process
Observação: os comandos show scp estão ocultos.
Além disso, verifique se há arquivos crashinfo no bootflash. Execute o comando show bootflash:. comando.
Determine quando e com que freqüência o problema ocorre.
O problema ocorre quando a conexão in-band está congestionada? Execute um teste de ping entre a interface sc0 no Supervisor Engine e uma interface de VLAN na MSFC para testar se há congestionamento in-band. Se seu Catalyst executar o CatOS System Software, execute estes passos:
Capture a saída do comando show inband na interface de linha de comando (CLI) do Supervisor Engine.
Abra uma sessão Telnet separada diretamente para o MSFC e execute ping de uma interface VLAN para a interface sc0.
Capture novamente a saída do comando show inband na CLI Supervisor Engine.
Se vários pings falharem ou sofrerem timeout, execute o comando set span sc0 mod/port both inpkts disable.
Esse comando configura uma sessão de SPAN para a interface sc0. Após iniciar o sniffer ou software similar, execute um teste de ping estendido entre sc0 e uma interface de VLAN.
Determine se sc0 está atribuída a uma VLAN de gerenciamento especial ou a uma VLAN com uma grande quantidade de tráfego, em especial, broadcasts e multicasts.
Monitore a saída do comando show errordetection inband.
O comando set errordetection ajuda a monitorar o switch. Na detecção de um erro, uma mensagem do Syslog o informará que há um problema antes que uma degradação significativa do desempenho ocorra. O comando show errordetection inband exibe o tipo de ocorrência de falha in-band, como um bloqueio in-band, erro de recurso, ou falha de in-band durante a inicialização.
A mensagem de erro Invalid feature index set for module é exibida quando um novo switching module é instalado em um Catalyst 6500/6000 Series Switch.
Este exemplo mostra a saída do console que você vê quando este erro ocorre:
%SYS-5-MOD_INSERT:Module 4 has been inserted Invalid feature index set for module 4
O erro Invalid feature index set for module ocorre quando a versão da imagem de software em execução no Supervisor Engine não oferece suporte ao hardware inserido.
No exemplo desta seção, um switching module de 48 portas 10/100 Mbps (WS-X6348-RJ-45) foi inserido em um switch Catalyst 6000 que executa o release de software 5.3(2)CSX. O release de software mínimo exigido para o módulo WS-X6348-RJ-45 é 5.4(2).
A solução é atualizar o software do Supervisor Engine para uma versão que ofereça suporte ao hardware. Consulte as Release Notes do Catalyst 6000/6500 Software Release 5.x para obter uma lista das versões mínimas de software para cada módulo.
A mensagem Pinnacle Synch Failed é exibida na inicialização.
Este exemplo mostra a saída do console que você vê quando este erro ocorre:
System Power On Diagnostics Complete Boot image: bootflash:cat6000-sup.5-4-4.bin In Local Test Mode, Synch Failed. Retries: 4 Local Test Mode encounters Minor hardware problem in Module # 1 Running System Diagnostics from this Supervisor (Module 1) This may take up to 2 minutes....please wait Pinnacle Synch Failed. Retries: 4 Minor hardware problem in Module # 1 Use 'show test 1' to see results of tests. Cisco Systems Console Enter password:
A solução é desligar o switch e verificar estes itens:
Os Supervisor Engines e todos os switching modules estão firmemente encaixados no backplane do chassi.
Você prendeu firmemente as alavancas de ejeção nos lados esquerdo e direito dos módulos. Certifique-se de pressionar as alavancas completamente contra a parte frontal do módulo.
Os parafusos borboleta dos lados esquerdo e direito dos módulos estão parafusados no gabinete da placa e apertados.
Após verificar se todos os módulos estão firmemente encaixados no chassi, ligue o chassi.
Se as mensagens Pinnacle Synch Failed ainda forem exibidas, pode haver um problema de hardware em um dos módulos.
Desligue o switch e remova todos os módulos de comutação. Ligue o switch apenas com o Supervisor Engine no chassi. Adicione um módulo de cada vez e repita o processo até identificar o módulo com problema.
Estas mensagens de erro são mostradas no Syslog:
RxSBIF_SEQ_NUM_ERROR:slot=9, pinnacleMask=0X1, errSeqNum=b,source Index=0X1, errorType=0X2 RxSBIF_SEQ_NUM_ERROR:slot=3, pinnacleMask=0X1, errSeqNum=b,source Index=0X1, errorType=0X2
As placas de linha Catalyst 6500/6000 e o módulo Supervisor Engine usam ASICs de porta ao trocarem pacotes entre as portas em velocidades elevadas. O pinnacle ASIC fornece uma interface Gigabit Ethernet para o barramento de dados Catalyst 6500/6000. Para suportar altas taxas de encaminhamento, o barramento de comutação do Catalyst 6500/6000 suporta pipelining. O pipelining permite que o Catalyst 6500/6000 faça o switching de vários quadros no barramento antes de obter os resultados para o primeiro nome. Cada quadro é precedido por um cabeçalho de barramento interno que inclui um número de sequência. O switch usa o número para controlar os vários quadros que aguardam uma decisão de encaminhamento. Todas as placas de linha e os Supervisor Engines devem ter um entendimento comum do número de sequência atual e seguinte. Esse entendimento é muito importante.
A mensagem de erro RXSBIF informa a aparência de um erro de sequência no barramento de switching. Tais erros incluem uma incompatibilidade de sequência e uma sequência inválida. Uma seqüência inválida significa que o pacote atual no barramento de switching possui um número de seqüência diferente do número esperado pelos ASICs. Alguns exemplos de mensagens de erro que relatam números de seqüência inválidos são:
%SYS-1-MOD_INVALIDSEQ:Bus asic invalid sequence occurred on module 1 (asic=1, srcidx=0x0, seq=14)
Um desses problemas normalmente causa as mensagens de erro:
Módulo assentado incorretamente — Recoloque os módulos em seus slots.
Nota:O módulo que detecta os erros de número de seqüência do barramento não é necessariamente o módulo com falha. Um módulo assentado incorretamente pode levar à detecção de problemas de número de seqüência de barramento por outro módulo. Assim, a recolocação de todos os módulos pode ser necessária.
Certifique-se de travar as alavancas de ejeção firmemente e de apertar os parafusos.
Hardware com defeito — Essa causa não é muito comum. Recoloque os módulos. Se você observar uma falha, inspecione as placas de linha quanto a danos no conector e verifique se há pinos tortos no slot do backplane no chassi. Se necessário, use uma lanterna ao examinar os pinos do conector no backplane do chassi.
Se o problema persistir após a recolocação de todas as placas, capture a saída do comando show tech-support e dos comandos ocultos show scp mod ou show scp failcnt. Crie uma solicitação de serviço no Suporte Técnico da Cisco e forneça estas informações.
Problema conhecido —Quando o sistema Catalyst 6500/6000 é carregado com a imagem do software do sistema CatOS versão 6.1(1b), mensagens de erro de sincronização podem ocorrer no Supervisor Engine 2. Consulte o Aviso de Campo: Erros de sincronização contínua com o mecanismo de supervisor 2 no Catalyst 6000 para obter mais informações.
O log da NVRAM exibe o erro de paridade da tabela de encaminhamento (ft_par_err).
lyra_ft_par_err_intr_hdlr: LKUPRAM, addr [hex], data [hex]
Essa mensagem de erro indica que um erro de paridade foi detectado na tabela de encaminhamento. A mensagem de erro indica a posição do erro na memória (primeiro [hex]) e os dados naquela posição (segundo [hex]).
A causa provável dessa mensagem de erro é quando uma placa de linha que substitui outra placa de linha no mesmo slot não foi inserida corretamente.
Conclua estes passos para resolver o problema:
Remova o módulo do switch.
Inspecione os pinos do backplane e insira o módulo novamente.
Se o problema persistir, entre em contato com o Representante Técnico da Cisco.
Para evitar o problema, execute o comando module clear-config antes de remover qualquer módulo. Este comando remove automaticamente a configuração pertencente a um módulo assim que o módulo é removido do chassi. Para obter mais informações, consulte a seção Mesmo Após a Remoção dos Módulos, o Comando show run Ainda Mostra Informações sobre as Interfaces dos Módulos Removidos de Troubleshooting de Problemas Comuns e de Hardware nos Catalyst 6500/6000 Series Switches com Cisco IOS System Software.
Nota:O comando não limpa as configurações do módulos que já foram removidos do slot.
Esta mensagem de erro aparece nos registros:
%KERNEL-1-CREATEPROCESSFAILED:Error in creating process: Unavailable free stack; stack type: 2; Name: tnetproc
FALHA NO %KERNEL-1-CREATEPROCESS: Erro ao criar processo: [carros]; tipo de pilha:[dec]; Nome: [chars] mensagem de erro indica que o processo de criação falhou; o sistema está sem processos. O sistema operacional Catalyst permite um número limitado de processos com base no número de pilhas disponíveis. Quando as pilhas não estão disponíveis, esta mensagem é gerada. O primeiro [caracteres] é o ID do processo; o [dec] é o tipo de pilha e o segundo [chars] é o nome do processo.
O switch CatOS permite apenas um número limitado de processos com uma pilha tipo 2 no sistema, por exemplo, Console, snmpdm, VtpRx, THREAD ou telnet145. O número máximo de processos com uma pilha tipo 2 é 13. Telnet ou Secure Shell (SSH) é um dos processos que exige uma pilha tipo 2. Quando todas as pilhas tipo 2 são usadas, qualquer tentativa de conexão via Telnet resulta nessa mensagem de erro.
Isso possivelmente ocorreu porque as sessões antigas de Telnet ou SSH não atingiram o tempo limite no switch ou consumiram o processo.
Para resolver esse problema, execute o comando show users para verificar quantas sessões Telnet foram abertas para o switch. Desconecte as sessões Telnet abertas pelo dispositivo remoto com o comando disconnect ip_address.
Switch> (enable) show asicreg 4/28 pinnacle err
00C7: PI_CI_S_PKTCRC_ERR_REG = FFFF
016F: PI_CI_S_CBL_DROP_REG = 1619
Este registro/contador não indica nenhum problema de hardware. Ele incrementa se um pacote com marcas de VLAN específicas for recebido na porta e essa VLAN específica não estiver configurada na porta. Como resultado, o pacote é descartado e o contador é incrementado. A Lógica de Bloqueio de Cores (CBL - Color Blocking Logic) refere-se à marcação de VLAN nos troncos. As VLANs que são removidas dos troncos têm o tráfego descartado. Esse estado ocorre quando um lado do tronco tem um número maior de VLANs no estado de encaminhamento de spanning tree.
Os contadores PI_CI_S_CBL_DROP_REG podem incrementar em qualquer modo; se a porta transitar pelos modos STP, você poderá ver acertos em uma porta de acesso. Se houver qualquer negociação na porta (padrão), isso também pode ser visto como um comportamento ou função normal do switch.
Este contador conta os pacotes descartados devido à pesquisa CBL em um bloco CBIC (Circuito Integrado Bipolar Complementar). O switch quer enviar um pacote para uma porta específica para alguma VLAN, e a lógica CBL diz que a porta está bloqueando/desabilitada/aprendendo. Isso não é um grande problema, pois esses pacotes são descartados na lógica do CBIC antes de consumirem qualquer buffer de pacote. Você pode desativar/ativar a porta para ver se ela limpa o contador.
Revisão | Data de publicação | Comentários |
---|---|---|
1.0 |
28-Nov-2008 |
Versão inicial |