La supervision des chemins d’accès réseau des utilisateurs vers le cloud est un élément essentiel de la gestion des performances du réseau à l’ère du cloud. Il conditionne une grande partie de l’expérience numérique de vos utilisateurs et si les gens pensent que « parce que c’est hébergé dans le cloud, tout est géré, ce n’est pas toujours le cas et vous pouvez faire beaucoup pour l’optimiser… à condition d’avoir une bonne visibilité.

Cloud : Tout est géré, n’est-ce pas ? 

L’une des principales raisons de déplacer les ressources IT vers le cloud est d’externaliser complètement l’infrastructure de votre datacenter au profit d’une meilleure solution. Le cloud est plus sûr, plus stable, plus évolutif, plus automatisé et plus flexible (voir cet article pour en savoir plus). En gros, tout est géré et réalisé d’une façon bien meilleure que vous ne pourrez jamais le faire. Il élimine également beaucoup de choses de la liste de ce que vous deviez gérer jusqu’alors (exploitation du datacenter, systèmes, sauvegarde, virtualisation, planning de capacité, connectivité…).
Entre autres choses, vous vous appuyez sur vos fournisseurs de services cloud pour obtenir une connectivité satisfaisante sur les réseaux publics afin que vos utilisateurs puissent accéder à vos applications via Internet et depuis vos réseaux. En principe, ils monitorent le trafic et les performances du réseau dans le cadre de ce service. 

La plupart des gens comprennent qu’ils n’ont pas besoin de surveiller la connectivité de leurs utilisateurs au cloud. Ils supposent que leur fournisseur de cloud le fait conformément aux meilleures pratiques.  

Les performances réseau sur le chemin emprunté par l’utilisateur vers le cloud : qu’est-ce qui peut mal tourner ? 

Votre fournisseur de services cloud supervise évidemment son accessibilité à Internet. Mais ce monitoring ne reflète pas les événements qui peuvent toujours survenir quantà la connectivité entre vos utilisateurs et vos applications. 

Incidents sur les réseaux publics et cloud

Les pannes de réseau peuvent avoir un impact sur la disponibilité ou les performances de vos fournisseurs cloud. Ces incidents peuvent se produire à différents niveaux : FAI, points de peering / transit, réseaux Tier 1 ou sur les passerelles cloud elles-mêmes, ou encore affecter des services essentiels comme le DNS. 

Ils peuvent aussi être la conséquence d’attaques telles que les détournements BGP et les attaques DDoS visant l’infrastructure de votre CSP. 

En fonction de la cause et de la partie de l’infrastructure qui est touchée, l’ampleur de la dégradation peut varier de certains utilisateurs/zones géographiques à tous et de certains services à tou 

Par exemple, l’incident qui a touché IBM Cloud en juin 2020 : la panne de réseau a été causée par une défaillance de l’un des fournisseurs de réseau tiers d’IBM Cloud (détails ici). 

Changements imprévisibles à plusieurs niveaux

Le chemin entre vos utilisateurs et le cloud est influencé par une série d’infrastructures réseau dont les comportements peuvent être imprévisibles : 

  • Le comportement de l’utilisateur, la connectivité de son réseau local et les passerelles de sécurité utilisées.
  •  Comment les opérateurs des utilisateurs acheminent le trafic vers votre plateforme en fonction de leurs accords de peering/transit.
  • La politique BGP influence la route d’AS dans les deux sens (si vous êtes intéressé par ce sujet spécifique, nous vous recommandons de jeter un coup d’œil à cet article))
  • Tous les encombrements et les dégradations qui se produisent sur le chemin (soit à cause du trafic, soit à cause des dysfonctionnements des appareils).
  • La destination vers laquelle les serveurs DNS dirigeront vos utilisateurs (votre nom d’hôte peut être résolu par différentes adresses IP en fonction de votre configuration DNS).
  • Le comportement à l’intérieur de votre infrastructure cloud au niveau réseau, mais aussi la façon dont ils gèrent la charge côté serveur.

Monitoring the path from your users to the cloud is essential to digital experience and network performance management
All the uncertainty performance factors on the path from the users to the cloud platform.

Couverture cloud inégale

Selon l’endroit où se trouve chacun de vos utilisateurs, vos CDN (Content Delivery Network) et votre plateforme cloud peuvent être bien situés ou non. 

Si vous utilisez l’un des principaux fournisseurs de services cloud (par exemple GCP, Azure, AWS ou Alibaba). Vous avez la possibilité de répartir votre capacité de calcul dans plusieurs régions afin de rapprocher votre front-end (et éventuellement une partie du back-end) de vos utilisateurs. C’est un bon point de départ, mais tous les CSP ne sont pas égaux et cela vaut pour la couverture géographique. Le même raisonnement s’applique aux fournisseurs de CDN.  

Certaines régions sont particulièrement peu couvertes par les fournisseurs mondiaux (prenez les exemples de l’Afrique et de l’Amérique Latine comme les plus évidents) : 

AWS en 2020

AWS geographical coverage 2020Azure en 2020

Azure geographical coverage 2020

GCP en 2020

GCP geographical coverage 2020

Les prix des mêmes services dans différentes régions peuvent varier. Cela fait une différence considérable dans la couverture réelle, en rendant certaines zones assez prohibitives. 

Supposons que vous exploitiez une infrastructure multi-cloud. Vous pouvez réduire l’écart en exploitant les spécificités de chaque fournisseur à votre avantage. 

Néanmoins, en fonction de la région où se trouvent vos utilisateurs, votre CSP restera plus éloigné d’eux du point de vue de la latence. 

Que devez-vous faire pour optimiser le chemin réseau de l’utilisateur vers le cloud ? 

Quelles sont les étapes clés pour optimiser le chemin entre vos utilisateurs et votre plateforme cloud ? 

  1. Comprendre où se trouvent vos utilisateurs et, au-delà des chiffres approximatifs, quels sont les régions/pays qui génèrent la plus grande partie de vos revenus.
  2. Dressez la liste de tous les hôtes et services utilisés pour fournir votre service numérique (y compris votre CDN et les services de tiers), assurez-vous d’avoir une vision claire de la manière dont ils sont hébergés. 
  3. Identifier les lacunes de connectivité entre l’utilisateur et le cloud qui sont structurelles pour vos régions stratégiques.
  4. Connaître les événements/incidents qui ont un impact sur les performances des utilisateurs au quotidien et distinguer rapidement ceux pour lesquels vous et vos fournisseurs pouvez agir de ceux pour lesquels aucune action ne peut être entreprise. 

Obtenir la bonne observabilité : surveillance des chemins réseau

La toute première chose dont vous avez besoin est l’observabilité du chemin de l’utilisateur vers le cloud et des performances du réseau qui y sont liées. 

Vous devez

  1. savoir où se trouvent vos utilisateurs, avec quelle performance :
Geography of digital experience
Répartition géographique des utilisateurs par performance
Digital Experience Scope Analysis
Comprendre ce qui conditionne l’expérience numérique dans chaque région.

2. Comprendre quelle partie de votre application est proche ou éloignée (c’est-à-dire avec une latence courte ou élevée) des principaux ISP (fournisseurs d’accès à Internet) offrant une connectivité à vos utilisateurs. 

User Latency by Host and ISP
Comprendre la latence par ISP entre les utilisateurs et votre plateforme

3. surveiller cela 365 jours par an et localiser d’où proviennent les dégradations et les changements sur la route vers votre plateforme cloud : 

Example-network-path-degradation
Exemple de dégradation d’un chemin réseau vers une plateforme cloud

Voici un exemple de forte dégradation sur une route. La perte de paquets, la latence et le nombre de sauts entre les utilisateurs et la plateforme applicative ont augmenté pendant un certain temps. Il est bon de savoir si ces changements sont des événements ponctuels ou s’ils perdurent. 

Comprendre la cause profonde de la performance réseau vers le cloud

Une fois que vous avez identifié l’événement, vous devez définir s’il entre dans le cadre de ce que vous contrôlez directement ou indirectement :  

  • La destination cloud (hôte) a-t-elle changé d’emplacement ?  
  • La route a-t-elle changé ? 
  • Y a-t-il un encombrement sur le chemin ? Où se trouve-t-il ?
Network Path Visualization
Visualisation de plusieurs résolutions DNS conduisant à des chemins différents avec des niveaux de performance réseau différents.

Comparaison des performances des clouds dans les déploiements multi-clouds

S’il y a un changement dans la structure ou si les performances réseau sur le chemin ne sont pas correctes, quelles sont vos options ? 

Fournisseurs cloud

Si vous exploitez une architecture multi-cloud, vous pouvez envisager :

  • de passer à une autre passerelle pour la région considérée ou
  • utiliser un autre moyen d’accéder à votre cloud (par exemple, l’accélérateur de cloud global AWS) ou rediriger vers un autre fournisseur de cloud. 

Fournisseurs de CDN

De la même manière, les fournisseurs de CDN offrent une couverture régionale très différente. Pour le contenu statique, le passage à un autre fournisseur de CDN pour la région considérée peut être une excellente option. 

Prestataires de services de tiers

Vos fournisseurs tiers disposent également d’une infrastructure sous-jacente dont les performances varient régionalement.  

Pour prendre des décisions sur votre architecture, vous avez besoin de données concrètes sur

  • la performance depuis l’emplacement de vos utilisateurs jusqu’aux différents éléments de votre plateforme
  • la route empruntée et
  • les performances qui en découlent (latence du réseau, perte de paquets, nombre de sauts et stabilité). 

Pour en savoir plus sur la manière de gérer les performances des réseaux publics, consultez cet article.
Nous vous recommandons également de jeter un coup d’œil sur la façon de déployer des services cloud à l’échelle mondiale avec la meilleure expérience utilisateur possible : article.