O conjunto de documentação deste produto faz o possível para usar uma linguagem imparcial. Para os fins deste conjunto de documentação, a imparcialidade é definida como uma linguagem que não implica em discriminação baseada em idade, deficiência, gênero, identidade racial, identidade étnica, orientação sexual, status socioeconômico e interseccionalidade. Pode haver exceções na documentação devido à linguagem codificada nas interfaces de usuário do software do produto, linguagem usada com base na documentação de RFP ou linguagem usada por um produto de terceiros referenciado. Saiba mais sobre como a Cisco está usando a linguagem inclusiva.
A Cisco traduziu este documento com a ajuda de tecnologias de tradução automática e humana para oferecer conteúdo de suporte aos seus usuários no seu próprio idioma, independentemente da localização. Observe que mesmo a melhor tradução automática não será tão precisa quanto as realizadas por um tradutor profissional. A Cisco Systems, Inc. não se responsabiliza pela precisão destas traduções e recomenda que o documento original em inglês (link fornecido) seja sempre consultado.
Este documento descreve como a automação de loop próximo funciona em redes definidas por software baseadas em nuvem em um cenário de implantação 5G.
A nuvem está revolucionando a forma como a tecnologia funciona no mundo tradicional. Com o advento da tecnologia 5G, o paradigma mudou nos ambientes dos provedores de serviços. A maioria das formas manuais e legadas de operar uma rede estão abrindo caminho para a automação completa, que oferece uma vantagem proativa para as redes, levando-as em uma rota de autorrecuperação. O documento fornece uma construção de automação de loop fechado baseada em SDN que combina diferentes produtos do ecossistema da Cisco para fornecer uma análise, visualização e correção em tempo real, tudo isso com as próprias soluções implantadas na nuvem.
A tecnologia 5G não está apenas transformando a tecnologia móvel, mas também criando grandes oportunidades para vários setores e preparando o terreno para a inovação em larga escala.
A tecnologia 5G está melhorando drasticamente o trabalho e a experiência diários com velocidade mais rápida, maior largura de banda e latência ultrabaixa.
Não apenas no mundo móvel, o 5G vai além da comunicação móvel para abordar todas as formas de serviços de comunicação; na verdade, ele está realmente apoiando o futuro do mundo digital, permitindo todos os tipos de serviços, promovendo a mudança econômica em todos os setores e utilizando diversas tecnologias (WIFI, 4G e tecnologias de rádio).
O documento não se concentra nas fases de implantação. O foco é a arquitetura de automação e orquestração 5G em termos de funcionalidade e observabilidade de ponta a ponta.
Neste estágio, a tecnologia 5G está principalmente no estágio inicial de teste e implantação, mas é necessário entender os desafios associados. O número de elementos de rede necessários para executar uma rede 5G em todos os domínios é enorme. A implantação da maioria das redes 5G exige automação para garantir uma implementação econômica e eficiente com operação contínua de todos os componentes envolvidos.
Em um cenário de implantação automatizada, a maior parte do trabalho manual pesado de pré-planejamento pode ser eliminada.
Os sistemas de inteligência artificial (AI), baseados em aprendizagem automática (ML), podem modelar o desempenho das funções de rede em condições normais e de alta carga.
Usando dados de desempenho em tempo de execução, o sistema pode garantir a implantação automática de novos elementos, conforme necessário. Para otimização contínua e garantia de serviço, o sistema pode coletar e analisar alimentações de equipamentos de todos os tipos e examinar seu desempenho, determinando se eles correspondem aos parâmetros que os provedores de serviços exigem e esperam.
Há três componentes essenciais para uma automação bem-sucedida.
O fundamental é ter certeza e, em seguida, é a aprendizagem automática, que pode prever o que a rede está tentando alcançar, o que leva à fundação da automação em loop próximo.
A solução proposta é uma solução de software que oferece recursos de automação e garantia líderes do setor, que incluem:
Embora a Vitria possa fazer o gerenciamento de desempenho também para a melhor solução, tanto a Matrix quanto a Vitria fazem parte da solução proposta, onde a Matrix é melhor para o gerenciamento de desempenho como uma ferramenta e a Vitria é melhor para sua capacidade de gerenciamento de falhas.
Matrix é uma estrutura de análise genérica desenvolvida pela Cisco que permite fácil adaptação a diferentes tipos de fontes de dados e permite funções de análise de aplicativos integradas à solução. A matriz tem esses recursos principais, que permitem criar ou personalizar os casos de uso de acordo com os requisitos.
Com a complexa rede de sistemas interconectados composta de infraestrutura virtual e física, redes internas e públicas e aplicativos interdependentes, o gerenciamento de falhas é um desafio constante.
O gerenciamento tradicional de falhas depende de ferramentas de monitoramento em silos, cada uma delas endereçando uma camada separada dentro da pilha de tecnologia. Cada sistema de monitoramento gera volumes de alarmes. Os Service Reliability Engineers (SRE) analisam os alarmes e determinam se um ticket deve ser aberto.
Problemas inter-relacionados entre sistemas resultam na abertura de vários tickets e equipes separadas adotam ações que podem não abordar a verdadeira causa principal, desperdiçando tempo e recursos. Quando finalmente se determina que os problemas aparentemente independentes podem ser relacionados, uma equipe multifuncional é formada para determinar a verdadeira causa raiz e envolver o agente ou tarefa de correção apropriado para resolver o problema. Enquanto esse processo tradicional de gerenciamento de falhas se desenrola, a frustração do cliente aumenta. Esse processo lento e trabalhoso não é mais eficaz. É excessivamente demorado e dispendioso.
Para reduzir o tempo de detecção de problemas, acelerar a resolução e reduzir custos, os sinais no ambiente operacional, dos elementos de TI à rede, e o aplicativo devem ser incluídos, correlacionados e analisados. O gerenciamento eficaz de falhas requer redução de ruídos nas camadas de serviço, automação para reduzir o nível de intervenção humana e integração com processos e sistemas de gerenciamento existentes.
Uma nova virada no mundo das redes foi o advento do roteamento de segmentos, que simplificou as operações substituindo as formas tradicionais como o Multi-Protocol Label Switching (MPLS). O roteamento de segmentos reduziu a complexidade das operações, eliminando um host de protocolos, e resultou em uma redução significativa nas despesas operacionais gerais.
A nova linha de soluções da Cisco chamada CNC é um controlador de SDN para redes de roteamento de segmentos. Uma vez que uma rede é habilitada para SR, o CNC entra em cena com uma matriz de soluções que ajudam a visualizar a rede, implantar serviços e políticas e uma série de outras funcionalidades.
O Cisco CNC permite que os clientes simplifiquem e automatizem o provisionamento, o monitoramento e a otimização de serviços de rede baseados em intenção em um ambiente de rede de vários fornecedores com uma GUI e uma API comuns.
A solução combina automação de rede baseada em intenção para fornecer recursos críticos para orquestração e execução de serviços, incluindo otimização de rede, computação de caminho de serviço, implantação e gerenciamento de dispositivos e detecção de anomalias com correção automática.
A solução totalmente integrada combina os principais recursos de vários produtos inovadores e líderes do setor, incluindo o Cisco Network Services Orchestrator (NSO), o Cisco Segment Routing Path Computation Element (SR-PCE), o Cisco Crosswork Data Gateway (CDG) e a infraestrutura do Cisco Crosswork e um conjunto de aplicativos. Sua interface de usuário unificada permite a visualização em tempo real da topologia e dos serviços de rede, bem como o provisionamento de serviços e transporte, através de um único painel de controle.
Os princípios do Crosswork podem ser resumidos em três princípios de automação:
O CNC, com seu poderoso conjunto de soluções, fornece um mecanismo abrangente para o controle geral da rede. As soluções variam de acordo com os espectros e fornecem capacidades abrangentes, que satisfazem os três princípios mencionados anteriormente.
1. Topologia Ativa
As redes tradicionais não tinham componentes que proporcionassem visualização das redes depois de implantadas. Os operadores tinham que fazer login fisicamente nos roteadores para verificar várias coisas. Com a Topologia Ativa do Crosswork, os operadores obtêm uma visualização em tempo real de toda a rede, juntamente com os links, a utilização, as taxas de tráfego, os nós e o status de integridade dos links, o Roteamento de Segmento (SR - Segment Routing) e o status das políticas de RSVP, juntamente com a visualização do caminho. Tudo o que o operador deve fazer agora é fazer login em uma GUI intuitiva e ter a rede à mão.
2. Crosswork Otimization Engine (COE)
Uma solução para fornecer otimização da rede em tempo real que ajuda os operadores a gerenciar a utilização de sua rede de forma eficiente. O objetivo final do COE é permitir redes de autocorreção sem muita intervenção manual.
3. Gateway de dados de trabalho cruzado (CDG)
Imagine ter redes enormes com milhares de dispositivos que geram uma tonelada de dados. Como os dados são o novo petróleo, o CDG fornece um mecanismo para coletar todos esses dados de dispositivos que podem ser aproveitados pela própria Crosswork ou até mesmo enviados para muitos outros aplicativos de terceiros para análise e outras transformações. O CDG suporta a coleta de dados através de vários protocolos como SNMP, CLI, gRPC Network Management Interface (GNMI), MDT, syslog, etc.
4. Ideias de saúde cruzadas (IH)
Com a rede em operação, o modo tradicional era tomar ações de forma reativa após a decorrência de um evento de rede específico. Isso geralmente tem um custo enorme para os clientes. O HI permite o desempenho automático do monitoramento de KPI ao vivo, a geração de alertas e a solução de problemas. O usuário pode definir sua própria lógica e o HI gera alertas com base em seu monitoramento. Isso permite uma visão automatizada da integridade da rede.
5. Automação de alterações de trabalho cruzado
As operações manuais rotineiras, como aplicação de alterações de configuração, instalação de novas versões de software, atualizações e outras, podem ser automatizadas e aceleradas com o uso da automação de alterações. Isso faz uso dos manuais de atividades da Ansible que estão incorporados a ele, e as alterações de configuração são então enviadas para os dispositivos aproveitando o Cisco NSO.
6. Provisionamento automatizado sem intervenção (ZTP)
Os clientes estão sempre a favor de reduzir o cronograma de implantação e operações. Quando você tem dezenas a milhares de novos dispositivos que devem ser implantados na rede, em vez do processo manual comum que pode ser crivado de erros e demorado, o Crosswork ZTP impulsiona todo o processo com uma solução completamente automatizada para provisionamento e para integrar novos dispositivos Cisco IOS® XR. Os dispositivos podem ser trazidos com uma configuração de dia 0 e, em seguida, rapidamente adicionados ao inventário de dispositivos CNC após o qual o monitoramento, bem como o gerenciamento desses dispositivos se torna mais fácil.
Há alguns outros giros de produtos que trabalham em conjunto com o CNC, a fim de alcançar os objetivos. O principal entre eles é o Segment Routing Path Computation Element (SR-PCE), que é um Cisco IOS XR PCE que suporta SR e RSVP. Na verdade, é o SR-PCE que facilita a coleta de topologias através do protocolo BGP-LS e calcula o caminho para permitir que o CNC funcione como um controlador.
O CNC também pode fazer interface com o NSO, o que ajuda a converter uma intenção de rede em configurações específicas de um dispositivo. O CNC, quando usado em conjunto com o NSO torna-se um multiplicador de força.
O monitoramento Kafka é ativado com a ajuda da ferramenta Burrow. Burrow é um companheiro de monitoramento para Apache Kafka que fornece verificação de defasagem do consumidor como um serviço sem a necessidade de especificar limites.
Ele monitora compensações comprometidas para todos os consumidores e calcula o status desses consumidores sob demanda. Um ponto de extremidade HTTP é fornecido a fim de solicitar o status sob demanda, bem como fornecer outras informações de cluster Kafka. Essas APIs são pesquisadas pela ferramenta de Monitoramento de Desempenho (PM) para gerar monitoramento de defasagem do consumidor e fornecer informações de cluster Kafka.
A utilização da CPU, a utilização do armazenamento e a utilização da memória dos nós Kafka também estão disponíveis na Matriz - que envia alarmes se os limites forem ultrapassados ou se forem detectadas anomalias.
Esse é o processo de ativação automatizada de novos dispositivos, geração de configuração e provisionamento de rede.
A estrutura avançada de automação de teste (TAF) oferece uma maneira de executar conjuntos de teste paralelamente em milhares de dispositivos ao mesmo tempo, eliminando assim a necessidade de validação manual. Uma implantação enorme de uma rede nunca pode ser dimensionada apenas com validação manual e uma estrutura automatizada como essa ajuda a validar as configurações do dispositivo e outras verificações da maneira mais eficiente e com limite de tempo.
Um operador pode iniciar centenas de testes em milhares de dispositivos com apenas um clique de botão. O conjunto de testes executa todos os testes configurados, valida os dados e mostra os resultados inteiros com critérios de APROVAÇÃO/FALHA em um relatório detalhado baseado na Web. Com base no relatório, o operador pode tomar outras medidas para aliviar esses erros nos dispositivos com a ajuda de outras soluções automatizadas.
Esta é uma interface do usuário aberta para todos os aplicativos, que oferece a flexibilidade de adicionar, remover e modificar aplicativos e ícones sem desenvolvimento.
Isso fornece suporte à autenticação LDAP e acesso à documentação do produto.
Para atingir os objetivos da automação 5G, é necessária uma orquestração entre domínios para conectar as partes entre diferentes domínios que compõem a rede.
Depois que os dispositivos de transporte são configurados e colocados na rede, em vez de buscar a forma antiga ou tradicional de gerenciamento manual de dispositivos, a orquestração entre domínios pode ser aproveitada para conduzir com simplicidade, agilidade e eficiência.
Os dispositivos ativos de rede podem ser integrados ao CNC com a especificação dos protocolos através dos quais o CDG pode coletar dados dos dispositivos. Quando os dispositivos são integrados ao CNC, a visualização em tempo real de toda a rede L2 e L3 fica fácil. O monitoramento dos dispositivos facilita a exibição na GUI relacionada a muitas facetas da integridade do dispositivo. A coleta de dados a partir dos dispositivos começa em intervalos predeterminados e esses dados são de grande valor analítico. Os dados são coletados através de SNMP, SSH, MDT, telemetria e vários outros modos conforme descrito anteriormente.
Esses dados podem então ser passados para outros aplicativos dentro do ecossistema. O CNC permite enviar os dados coletados para o sistema Matrix por meio de um barramento Kafka. A coleção está inscrita em um tópico Kafka e o CDG continua distribuindo os dados que coleta para este tópico, cujo ponto final é Matrix.
A matriz tem vários painéis intuitivos de onde esses dados podem ser visualizados, e várias operações analíticas também podem ser executadas. Esses dados podem ser reunidos pela solução Cisco Vitria AIOps para monitoramento de falhas. Sempre que qualquer falha ou anomalia é detectada, a ferramenta Vitria gera alarmes proativamente para que as correções necessárias possam ser tomadas, evitando assim falhas graves.
Dentro do conjunto de trabalho cruzado, alguns aplicativos podem orquestrar proativamente o tráfego em uma rede de transporte, reduzindo, assim, os períodos de inatividade significativos nos horários de pico de carga. Pacotes de recursos de COE, como o Local Congestion Mitigation (LCM) e o Bandwidth on Demand (BWoD), são resgatados nesses cenários.
O LCM é uma ferramenta muito útil para reduzir o congestionamento em uma rede e direcionar políticas que tomam caminhos alternativos liberando a interface sobrecarregada. Tudo isso acontece automaticamente sem que um usuário tente detectar um congestionamento depois que ele já tiver ocorrido. O LCM utiliza um limite configurável além do qual é considerado congestionado.
Quando a utilização de uma interface excede esse limite, o LCM fornece recomendações para atenuar o congestionamento em um nível de interface local. A solução tem o cuidado de direcionar apenas a quantidade necessária de tráfego que praticamente leva o congestionamento abaixo do limite. A vantagem disso é que todo o tráfego na interface não é desviado. O usuário pode analisar o conjunto de recomendações e, em seguida, escolher o mais adequado. Assim, as políticas táticas de engenharia de tráfego são iniciadas pelo LCM com a ajuda do componente SR-PCE que ajuda na eliminação automatizada de congestionamento em tempo real.
A solução BWoD pode funcionar em conjunto com o LCM. Se houver uma interface de alta prioridade transportando tráfego de voz ou vídeo, um operador deseja garantir que o caminho sempre tenha uma quantidade especificada de largura de banda disponível. O COE permite que um usuário crie um caminho de política BWoD e, quando o BWoD também é configurado com um limite, o monitoramento é iniciado a cada segundo. Assim que o limite da interface é violado, o BWoD entra em ação para criar novas políticas de SR ou reotimizar o caminho existente que se esforça para manter a largura de banda alocada.
Estes são alguns cenários que otimizam o caminho de transporte e facilitam a automação do transporte. Enquanto o CNC pode ser usado juntamente com outras soluções a fim de processar e analisar os dados, os componentes internos do CNC também podem desempenhar um papel importante no desenvolvimento da rede de transporte com automação de alta qualidade que escala a disponibilidade e confiabilidade da rede.
Em qualquer caso de uso de CLA, as etapas básicas envolvem:
Aqui está uma descrição do fluxo nesta solução da Cisco:
Um exemplo real de como a automação de loop próximo pode funcionar aproveitando os componentes da Cisco entre domínios é melhor ilustrado no caso de vazamento de memória dos dispositivos. O comandoshow processes memory detail fornece os detalhes do consumo de memória de todos os processos no roteador.
Um trabalho de coleta de CLI pode ser criado no CNC para permitir que o CDG faça login no roteador em cadências especificadas pelo usuário e execute o comando
show processes memory detail. O CDG obtém a saída desse comando e encaminha os dados para o barramento Kafka. A Matrix lê esses dados do barramento Kafka, e os analisa e transforma para exibir as informações de memória em seus painéis.
Sempre que o consumo de memória excede um limiar definido para os roteadores, a Matrix gera um alarme e encaminha a anomalia para o barramento Kafka. A Vitria AIOps gera um incidente em seu painel lendo a anomalia no ônibus Kafka. Isso pode ser visualizado no painel AIOps que exibe o nome de host do dispositivo onde a utilização da memória excedeu os limites seguros.
Na GUI do AIOps, é possível executar uma ação nesse alarme integrando uma API de redefinição de dispositivo do Network Service Orchestrator (NSO) - um sistema de gerenciamento de configuração que redefine o dispositivo.
Há também um período de arrefecimento em Vitria, onde o incidente ainda é mantido aberto por um período de tempo. Durante esse período, se não houver nenhum relatório de vazamento novamente no mesmo dispositivo pela Matrix, o incidente será fechado automaticamente. Caso contrário, o mesmo processo de reinicialização do dispositivo será repetido. No processo, não é necessária uma única intervenção manual e toda a correção é tratada pelos próprios componentes entre domínios que atuam como prova de como todo o loop é automatizado e resolvido proativamente da maneira mais coerente, em tempo real.
Desafios
1. Migração para a nuvem
Hospedar o aplicativo na nuvem traz seus desafios:
- São necessárias novas soluções de gerenciamento e segurança de operações
- Encontrar casos de uso e modelos de negócios por trás da borda da nuvem
- As nuvens devem suportar o alto throughput necessário
- Operações, processos, segurança e disponibilidade devem atender às expectativas dos provedores de serviço e de seus clientes
- Os provedores de nuvem oferecem suas soluções para facilitar o projeto de transferência de serviços para a nuvem, que às vezes é difícil de se adaptar
2. Hesitação por automação
- Não conseguir prever a necessidade de automação
- Complexidade das redes de provedores
Summary
A automação e a orquestração de uma rede 5G é uma tarefa complexa que deve ser planejada e implementada corretamente desde o início de um projeto de rede.
A complexidade das redes 5G exige automação e orquestração para simplificar tarefas e minimizar a probabilidade de erro durante o planejamento, a implementação e a operação.
Informações Relacionadas
- https://www.cisco.com/c/dam/m/en_us/customer-experience/collateral/5G-automation-architecture-white-paper.pdf
- https://www.cisco.com/c/dam/en/us/td/docs/cloud-systems-management/crosswork-network-controller/3-0/Solution-Workflow-Guide/CNC-3-0-Solution-workflow-guide.pdf
- Suporte técnico e downloads da Cisco
Revisão | Data de publicação | Comentários |
---|---|---|
2.0 |
01-Apr-2024 |
1. Componente mapeado: Funcionalidade/Capacidade nos cabeçalhos da Seção 3.
2. Caso de uso: introdução adicionada sobre caso de uso a ser identificado e, em seguida, codificado. |
1.0 |
15-Mar-2024 |
Versão inicial |