Este documento fornece informações sobre como solucionar problemas de travamentos nos Cisco® ASR 1000 Series Aggregation Services Routers.
Não existem requisitos específicos para este documento.
As informações neste documento são baseadas nestas versões de software e hardware:
Todos os roteadores de serviços de agregação Cisco ASR 1000 Series, incluindo 1002, 1004 e 1006.
Todas as versões do software Cisco IOS XE que suportam os Cisco ASR 1000 Series Aggregation Services Routers.
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Consulte as Convenções de Dicas Técnicas da Cisco para obter mais informações sobre convenções de documentos.
Os Cisco ASR 1000 Series Aggregation Services Routers apresentam o software Cisco IOS XE como sua arquitetura de software. Baseado no Software Cisco IOS, o Software Cisco IOS XE é um sistema operacional modular construído em um kernel Linux em um Route Processor (RP), Embedded Services Processor (ESP) ou SPA Interface Processor (SIP). O daemon do IOS (IOSD) e outros processos do IOS XE são executados no kernel Linux, portanto, há vários tipos de travamentos mostrados na Tabela 1 nos Cisco ASR 1000 Series Aggregation Services Routers.
Tabela 1 - Tipos de travamentos
Tipos de travamento | Módulo | Descrição |
---|---|---|
Travamento de IOSD | RP | O Cisco IOS Software é executado como IOSD em um kernel Linux no RP. |
Travamento do driver SPA | SIP | O software Cisco IOS limitado é executado para controlar o SPA no SIP. |
Travamento do processo do Cisco IOS XE | RP ESP SIP | Vários processos do Cisco IOS XE são executados em um kernel Linux. Por exemplo, o gerenciador de chassi, o gerenciador de encaminhamento, o gerenciador de interface e assim por diante, são executados no RP. |
Travamento de microcódigo do processador de fluxo quântico (QFP) da Cisco | ESP | O microcódigo é executado no QFP. O QFP é um ASICs de encaminhamento de pacotes no ESP. |
Travamento do kernel Linux | RP ESP SIP | O kernel do Linux é executado em RP, ESP e SIP. |
Se você encontrar uma recarga inesperada do módulo, certifique-se de que a saída do console, o diretório do arquivo crashinfo e o diretório do arquivo de dump central estejam disponíveis para solução de problemas. Para determinar a causa, a primeira etapa é coletar o maior número possível de informações sobre o problema. Essas informações são necessárias para determinar a causa do problema:
Logs de console — Para obter mais informações, consulte Aplicando as configurações corretas do emulador de terminal para conexões de console.
Informações de Syslog — Se você configurou o roteador para enviar logs a um Servidor syslog, poderá obter informações sobre o que aconteceu. Para obter detalhes, consulte Como configurar dispositivos Cisco para Syslog.
show platform — O comando show platform exibe o status de RPs, ESPs, SPAs e fontes de alimentação.
show tech-support — O comando show tech-support é uma compilação de vários comandos diferentes que incluem show version e show running-config. Quando um roteador está com problemas, o engenheiro do Cisco Technical Assistance Center (TAC) geralmente solicita essas informações para solucionar o problema de hardware. Você deve coletar o comando show tech-support antes de recarregar ou desligar o ciclo, pois essas ações podem causar perda de informações sobre o problema.
Observação: o comando show tech-support não inclui os comandos show platform ou show logging.
Boot Sequence Information — A sequência de inicialização completa se o roteador apresentar erros de inicialização.
Arquivo crashinfo (se disponível) — Consulte a seção Crashinfo File.
Core Dump file (se disponível) — Consulte a seção Core Dump File.
Arquivo Tracelog (se disponível) — Nos Cisco ASR 1000 Series Aggregation Services Routers, os registros de rastreamento dos processos do Cisco IOS XE são gerados em harddisk:tracelogs (ASR 1006 ou ASR 1004) ou bootflash:tracelogs (ASR 10000 2) no RP ativo. Quando os processos do Cisco IOS XE travam, o engenheiro do Cisco TAC geralmente pede para coletar essas informações para solucionar o problema.
Quando o driver IOSD ou SPA trava, um arquivo crashinfo é gerado no local mostrado na Tabela 2.
Tabela 2 - Localização do arquivo Crashinfo
Modelos | Tipos de travamento | Localização do arquivo de informação de travamento |
---|---|---|
ASR 1002 | Travamento de driver SPA de travamento de IOSD | flash de inicialização: no RP |
ASR 1004 ASR 1006 | Travamento de IOSD | flash de inicialização: no RP |
Travamento do driver SPA | disco rígido: no RP |
A Tabela 3 exibe os nomes dos arquivos crashinfo.
Tabela 3 - Nome do arquivo Crashinfo
Tipos de travamento | Nome do arquivo Crashinfo | Exemplo |
---|---|---|
Travamento de IOSD | crashinfo_RP_SlotNumber_00_Date-Time-Zone | crashinfo_RP_00_00_20080807-063430-UTC |
Travamento do driver SPA | crashinfo_SIP_SlotNumber_00_Date-Time-Zone | crashinfo_SIP_00_00_20080828-084907-UTC |
Quando um processo trava, você pode encontrar um arquivo de dump central no local mostrado na Tabela 4. Um dump central é uma cópia completa da imagem de memória do processo. Recomenda-se que você salve os arquivos de dump central até que a solução de problemas seja concluída. Isso ocorre porque um dump central inclui muito mais informações sobre um problema de travamento do que um arquivo crashinfo e é necessário para uma investigação profunda. No caso do roteador Cisco ASR 1002, já que ele não tem um disco rígido: um arquivo de dump central é gerado em bootflash:core/.
Tabela 4 - Localização do arquivo de despejo principal
Modelos | Local do arquivo de despejo principal |
---|---|
ASR 1002 | bootflash:core/ no RP |
ASR 1004 ASR 1006 | disco rígido:núcleo/ no RP |
Não apenas o dump central do RP, mas o dump central dos processos ESP ou SIP são gerados no mesmo local. No caso do roteador Cisco ASR 1006, você deve verificar o mesmo local do RP em standby porque ele era o RP ativo quando o problema ocorreu.
Tabela 5 - Nome do arquivo de despejo principal
Tipos de travamento | Nome do arquivo de despejo principal | Exemplo |
---|---|---|
Travamento de IOSD | hostname_RP_SlotNumber_ppc_linux_iosd-_ProcessID.core.gz | Router_RP_0_ppc_linux_iosd-_17407.core.gz |
Travamento do driver SPA | hostname_SIP_SlotNumber_mcpcc-lc-ms_ProcessID.core.gz | Router_SIP_1_mcpcc-lc-ms_6098.core.gz |
Travamento do processo do IOS XE | hostname_FRU_SlotNumber_ProcessName_ProcessID.core.gz | Roteador_RP_0_fman_rp_2878.core.gz Roteador_ESP_1_cpp_cp_svr_4497.core.gz |
Travamento de QFP da Cisco | hostname_ESP_SlotNumber_cpp-mcplo-ucode_ID.core.gz | Router_ESP_0_cpp-mcplo-ucode_042308082102.core.gz |
Travamento do kernel Linux | hostname_FRU_SlotNumber_kernel.core | Router_ESP_0_kernel.core |
O IOS Daemon (IOSD) é executado como seu próprio processo Linux (ppc_linux_iosd-) no RP. No modo IOS duplo (Cisco ASR 1002 Router e Cisco ASR 1004 Router somente), dois IOSDs são executados no RP.
Para identificar um travamento de IOSD, localize a saída de exceção abaixo no console. No caso de um Cisco ASR 1002 Router ou Cisco ASR 1004 Crash sem modo IOS duplo, a caixa é recarregada. No caso de um Cisco ASR 1002 Router ou um Cisco ASR 1004 Router travar com modo IOS duplo, o IOSD é comutado no RP. No caso de um travamento do roteador Cisco ASR 1006, o RP é comutado e um novo RP em standby é recarregado.
Exception to IOS Thread: Frame pointer 2C111978, PC = 1029ED60 ASR1000-EXT-SIGNAL: U_SIGSEGV(11), Process = Exec -Traceback= 1#106b90f504fce8544ce4979667ec2d5d :10000000+29ED60 :10000000+29ECB4 :10000000+2A1A9C :10000000+2A1DAC :10000000+492438 :10000000+1C22DC0 :10000000+4BBBE0 Fastpath Thread backtrace: -Traceback= 1#106b90f504fce8544ce4979667ec2d5d c:BC16000+C2AF0 c:BC16000+C2AD0 iosd_unix:BD73000+111DC pthread:BA1B000+5DA0 Auxiliary Thread backtrace: -Traceback= 1#106b90f504fce8544ce4979667ec2d5d pthread:BA1B000+95E4 pthread:BA1B000+95C8 c:BC16000+D7294 iosd_unix:BD73000+1A83C pthread:BA1B000+5DA0 PC = 0x1029ED60 LR = 0x1029ECB4 MSR = 0x0002D000 CTR = 0x0BD83C2C XER = 0x20000000 R0 = 0x00000000 R1 = 0x2C111978 R2 = 0x2C057890 R3 = 0x00000034 R4 = 0x000000B4 R5 = 0x0000003C R6 = 0x2C111700 R7 = 0x00000000 R8 = 0x12B04780 R9 = 0x00000000 R10 = 0x2C05048C R11 = 0x00000050 R12 = 0x22442082 R13 = 0x13B189AC R14 = 0x00000000 R15 = 0x00000000 R16 = 0x00000000 R17 = 0x00000001 R18 = 0x00000000 R19 = 0x00000000 R20 = 0x00000000 R21 = 0x00000000 R22 = 0x00000000 R23 = 0x00000001 R24 = 0x00000001 R25 = 0x34409AD4 R26 = 0x00000000 R27 = 0x2CE88448 R28 = 0x00000001 R29 = 0x00000000 R30 = 0x3467A0FC R31 = 0x2C1119B8 Writing crashinfo to bootflash:crashinfo_RP_00_00_20080904-092940-UTC Buffered messages: (last 4096 bytes only) ...
Quando o IOSD trava, o arquivo crashinfo e o arquivo de dump central são gerados no RP.
Router#dir bootflash: Directory of bootflash: bootflash:crashinfo_RP_00_00_20080904-092940-UTC Router#dir harddisk:core Directory of harddisk:core/ 3620877 -rw- 10632280 Sep 4 2008 09:31:00 +00:00 Router_RP_0_ppc_linux_iosd-_17407.core.gz
Os drivers SPA têm funções IOS limitadas para controle SPA e são executados no SIP devido ao processo mcpcc-lc-ms e a um dos processos do Cisco IOS XE. Você pode identificar o travamento do driver SPA se descobrir que o processo mcpcc-lc-ms está suspenso. Após o travamento do driver SPA, o SPA é recarregado.
Aug 28 08:52:12.418: %PMAN-3-PROCHOLDDOWN: SIP0: pman.sh: The process mcpcc-lc-ms has been helddown (rc 142) Aug 28 08:52:12.425: %ASR1000_OIR-6-REMSPA: SPA removed from subslot 0/0, interfaces disabled Aug 28 08:52:12.427: %SPA_OIR-6-OFFLINECARD: SPA (SPA-1X10GE-L-V2) offline in subslot 0/0 Aug 28 08:52:13.131: %ASR1000_OIR-6-INSSPA: SPA inserted in subslot 0/0 Aug 28 08:52:19.060: %LINK-3-UPDOWN: SIP0/0: Interface EOBC0/1, changed state to up Aug 28 08:52:20.064: %SPA_OIR-6-ONLINECARD: SPA (SPA-1X10GE-L-V2) online in subslot 0/0
Quando o driver SPA trava, o arquivo crashinfo e o arquivo core dump são gerados no RP.
Router#dir harddisk: Directory of harddisk:/ 14 -rw- 224579 Aug 28 2008 08:52:06 +00:00 crashinfo_SIP_00_00_20080828-085206-UTC Router#dir harddisk:core Directory of harddisk:/core/ 4653060 -rw- 1389762 Aug 28 2008 08:52:12 +00:00 Router_SIP_0_mcpcc-lc-ms_6985.core.gz
Os processos do Cisco IOS XE são executados em um kernel Linux no RP, ESP e SIP. A Tabela 6 lista seus principais processos. Se ocorrer um travamento, o módulo será recarregado.
Tabela 6 - Principais processos do Cisco IOS XE
Título | Nome do processo | Módulo |
---|---|---|
Gestor de chassis | comando | RP |
cman_fp | ESP | |
cmcc | SIP | |
Monitoramento ambiental | emd | RP, ESP, SIP |
Gerenciador de Encaminhamento | fman_rp | RP |
fman_fp_image | ESP | |
Gerenciador de host | humano | RP, ESP, SIP |
Gerenciador de Interface | imã | RP |
imccd | SIP | |
Gerenciador de logs | projétil | RP, ESP, SIP |
Serviço conectável | psd | RP |
Processo de controle de cliente QFP | cpp_cr_svr | ESP |
Processo de driver QFP | cpp_driver | ESP |
Servidor QFP HA | cpp_ha_top_level_server | ESP |
Processo de serviço do cliente QFP | cpp_sp_server | ESP |
Gerenciador de Shell | sabor | RP |
Caso o processo cpp_cp_svr trave em um ESP do roteador Cisco ASR 1006, essa mensagem pode aparecer no console.
Jan 24 23:37:06.644 JST: %PMAN-3-PROCHOLDDOWN: F0: pman.sh: The process cpp_cp_svr has been helddown (rc 134) Jan 24 23:37:06.727 JST: %PMAN-0-PROCFAILCRIT: F0: pvp.sh: A critical processcpp_cp_svr has failed (rc 134) Jan 24 23:37:11.539 JST: %ASR1000_OIR-6-OFFLINECARD: Card (fp) offline in slot F0
Você pode encontrar o arquivo de despejo central no disco rígido:core/.
Router#dir harddisk:core Directory of harddisk:/core/ 1032194 -rw- 38255956 Jan 24 2009 23:37:06 +09:00 Router_ESP_0_cpp_cp_svr_4714.core.gz
O tracelog do processo pode incluir saídas úteis.
Router#dir harddisk:tracelogs/cpp_cp* Directory of harddisk:tracelogs/ 4456753 -rwx 24868 Jan 24 2009 23:37:15 +09:00 cpp_cp_F0-0.log.4714.20090124233714
A Cisco projetou o Cisco Quantum Flow Processor como arquitetura de hardware e software. A primeira geração reside em dois pedaços de silício; as gerações posteriores podem ser soluções de chip único que aderem à mesma arquitetura de software descrita aqui. O termo "processador Cisco QuantumFlow" refere-se somente à arquitetura geral de hardware e software do processador de rede.
Quando o código QFP trava, o ESP é recarregado. Para identificar o travamento do código QFP, localize essa saída no console ou no arquivo de dump central do código cpp-mcplo-ucode:
Dec 17 05:50:26.417 JST: %IOSXE-3-PLATFORM: F0: cpp_cdm: CPP crashed, core file /tmp/corelink/ Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz Dec 17 05:50:28.206 JST: %ASR1000_OIR-6-OFFLINECARD: Card (fp) offline in slot F0
Você pode encontrar o arquivo de despejo central.
Router#dir harddisk:core Directory of harddisk:core/ 3719171 -rw- 1572864 Dec 17 2008 05:50:31 +09:00 Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
No Cisco ASR 1000 Series, um kernel Linux é executado em RP, ESP e SIP. Quando um kernel do Linux trava, o módulo é recarregado sem a saída de travamento. Após a inicialização novamente, você pode identificar o travamento do kernel do Linux se encontrar o arquivo de dump central do kernel do Linux. O tamanho do arquivo núcleo do kernel pode ser superior a 100 MB.
Router#dir harddisk:core Directory of harddisk:/core/ 393230 ---- 137389415 Dec 19 2008 01:19:40 +09:00 Router_RP_0_kernel_20081218161940.core
Se você ainda precisar de assistência depois de seguir as etapas acima e desejar abrir uma solicitação de serviço no Cisco TAC, inclua estas informações para solucionar problemas de um travamento de roteador: |
---|
Observação: não recarregue ou desligue o roteador manualmente antes de coletar essas informações, a menos que seja necessário solucionar um travamento do roteador porque isso pode causar a perda de informações importantes necessárias para determinar a causa raiz do problema. |
Revisão | Data de publicação | Comentários |
---|---|---|
1.0 |
17-Mar-2009 |
Versão inicial |