Introducción
Este documento describe cómo resolver el problema de igual diámetro en el fallo de la migración de software en servicio (ISSM) en Cisco Policy Suite (CPS).
Prerequisites
Requirements
Cisco recomienda que tenga conocimiento sobre estos temas:
- Linux
- CPS
- Diámetro
- Marco de Open Service Gateway Initiative (OSGI)
Nota: Cisco recomienda que tenga acceso de raíz con privilegios a la CLI de CPS.
Componentes Utilizados
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
- CPS 19.4 y 21.1
- CentOS Linux versión 8.1.1911 (Core)
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
Antecedentes
Los usuarios tienen la opción de realizar el ISSM de un CPS 19.4.0/CPS 19.5.0 a CPS 21.1.0. Esta migración permite que el tráfico continúe sin ningún impacto mientras se completa.
ISSM a CPS 21.1.0 solo es compatible con instalaciones de alta disponibilidad móvil (HA) y redundancia geográfica (GR). No se pueden migrar otros tipos de instalación de CPS (mog|pats|arbiter|andsf|escef).
Problema
Se observa que, cuando el ISSM de CPS19.4 a CPS21.1 falla debido a un Hosts.csv
entrada, la conexión de todos los pares de diámetro con ambos Balanceo de Carga (LB) se desactiva y el reinicio normal no ayuda a restaurar.
[root@lab-lb02 ~]# ./show_peers.sh --all --summary
###############################################################################
[Wed Sep 21 01:57:47 CDT 2022]
SUMMARY of Peers in OKAY State:
| Gx | Re | Rx | Sh | Sy |
-------------|------|------|------|------|------|
lb01 peers | 0 | 0 | 0 | 0 | 0 |
-------------|------|------|------|------|------|
lb02 peers | 0 | 0 | 0 | 0 | 0 |
-------------|------|------|------|------|------|
Esta es la exención que puede ver en Consolidated-qns.log cuando habilita el registrador de nivel de depuración.
2022-09-21 08:25:00,188 [pool-3-thread-1] DEBUG c.b.d.i.server.DelayedStartManager.? - isWorkerConnected: true queueSystem.enabled: false queueSystem.available: true isUpgradeState: false
Después de la ejecución de este paso, el proceso se bloquea debido a una entrada no válida en el Hosts.csv
archivo.
/mnt/iso/migrate.sh disable set 1
2022-09-21 02:52:48,913 INFO [__main__.migrate_disable_set] Waiting for build init.d background task
Replica-set Configuration
-------------------------------------------------------------------------------
The progress of this script can be monitored in the following log:
/var/log/broadhop/scripts//build_set_21092022_024648_1663728408306850218.log
-------------------------------------------------------------------------------
[ Done ] file creation [ In Progress ]
2022-09-21 02:58:16,385 INFO [__main__.migrate_disable_set] build init.d successfully.
2022-09-21 02:58:16,385 INFO [__main__.run_recipe] Performing installation stage: QuiesceClusterSet
[lab-cc02 PSZ06PCRFCC02] Executing task 'DisableArbiterVipNode'
[lab-cc02 PSZ06PCRFCC02] run: /var/qps/bin/support/disable_arbiter_vip_node.sh
Fatal error: Name lookup failed for lab-cc02 PSZ06PCRFCC02 --> Error highlight. Invalid host entry is noticed.
Underlying exception:
Name or service not known
Aborting.
2022-09-21 02:58:16,967 ERROR [__main__.<module>] Error during installation
2022-09-21 02:58:16,970 INFO [__main__.<module>] =====================
2022-09-21 02:58:16,970 INFO [__main__.<module>] FAILURE
2022-09-21 02:58:16,970 INFO [__main__.<module>] ======== END ========
2022-09-21 02:58:16,970 INFO [__main__.<module>] To have the environment variable updated, please logout and login from all opened shell on the current system
[root@lab-cm csv]#
El guión trigger_silo.sh
, como parte de migrate.sh
la ejecución detiene todos los procesos qns en el LB seleccionado para la migración set1.
2022-09-21 03:11:34,885 INFO [migrate_traffic.run] running - ['bash', '-c', 'source /var/qps/install/current/scripts/migrate/trigger_silo.sh && trigger_silo_pre_set1_upgrade /var/tmp/cluster-upgrade-set-1.txt /var/tmp/cluster-upgrade-set-2.txt /var/log/trigger_silo.log']
2022-09-21 03:17:27,594 INFO [command.execute] (stdout): LB qns process count : 7
Running pause on lb02-1
checking JMX port 9045 ....
Done - Paused qns-1
Running pause on lb02-2
checking JMX port 9046 ....
Done - Paused qns-2
Running pause on lb02-3
checking JMX port 9047 ....
Done - Paused qns-3
Running pause on lb02-4
checking JMX port 9048 ....
Done - Paused qns-4
Running pause on lb02-5
checking JMX port 9049 ....
Done - Paused qns-5
Running pause on lb02-6
checking JMX port 9050 ....
Done - Paused qns-6
Running pause on lb02-7
checking JMX port 9051 ....
Done - Paused qns-7
Solución
La actualización no está completa y es parcial, el proceso ISSM mantiene el sistema CPS en isUpgradeState: false
.
Para recuperarse de esta condición, debe establecer el isUpgradeState: true
en el marco OSGI de CPS.
Procedimiento para establecer el estado de actualización correcto
Paso 1. Inicie sesión en el nodo Administrador de clústeres.
Paso 2. Conéctese al marco OSGI del sistema CPS.
[root@installer ~]# telnet qns01 9091
Trying 192.168.10.11...
Connected to qns01.
Escape character is '^]'.
osgi>
Paso 3. Ejecute este comando.
osgi> markNodeUpgraded
Upgraded status set to true
osgi>
Paso 4. Desconéctese de la estructura OSGI correctamente con este comando.
osgi> disconnect
Disconnect from console? (y/n; default=y) y
Connection closed by foreign host.
[root@installer ~]#
Una vez que aplique la solución, verifique el estado del par de diámetro con este comando y asegúrese de que todos los pares necesarios estén activos.
[root@lab-lb02 ~]# ./show_peers.sh --all --summary
###############################################################################
[Wed Sep 21 01:57:47 CDT 2022]
SUMMARY of Peers in OKAY State:
| Gx | Re | Rx | Sh | Sy |
-------------|------|------|------|------|------|
lb01 peers | 72 | 120 | 36 | 0 | 12 |
-------------|------|------|------|------|------|
lb02 peers | 72 | 120 | 36 | 0 | 12 |
-------------|------|------|------|------|------|