Google explique comment il gère la divulgation des incidents de recherche

Le dernier podcast Search Off The Record de Google aborde des exemples d’incidents perturbateurs susceptibles d’affecter l’exploration et l’indexation, ainsi que les critères permettant de décider s’il convient ou non de divulguer les détails de l’incident.

Pour compliquer la question de la déclaration, il arrive que des référenceurs et des éditeurs signalent que la recherche est défaillante alors que, du point de vue de Google, elle fonctionne comme elle est censée le faire.

Le temps de disponibilité de Google Search est élevé

La partie intéressante du podcast a commencé par l’observation que Google Search (la page d’accueil avec la boîte de recherche) a un temps de disponibilité « extrêmement » élevé et qu’il est rare qu’il tombe en panne et devienne inaccessible. La plupart des problèmes signalés sont dus à des problèmes d’acheminement du réseau à partir de l’internet lui-même plutôt qu’à une défaillance au sein de l’infrastructure de Google.

Gary Illyes a commenté :

« Oui. Le service qui héberge la page d’accueil est le même que celui qui héberge le tableau de bord d’état, le tableau de bord d’état de la recherche Google, et il a un temps de disponibilité insensé. …le chiffre est de 99,999, peu importe. »

John Mueller a répondu en plaisantant par le mot « nein » (prononcé comme le chiffre neuf), qui signifie « non » en allemand :

« Nein. Il n’est jamais en panne. Nein. »

Les Googlers admettent que le reste de Google Search, au niveau du backend, subit des pannes et ils expliquent comment cela est géré.

Incidents d’exploration et d’indexation chez Google

La capacité de Google à explorer et à indexer les pages web est essentielle pour le référencement et les revenus. Une perturbation peut avoir des conséquences catastrophiques, en particulier pour les contenus sensibles au temps comme les annonces, les nouvelles et les événements commerciaux (pour n’en citer que quelques-uns).

Gary Illyes a expliqué qu’il existe au sein de Google une équipe appelée Site Reliability Engineering (SRE), chargée de veiller au bon fonctionnement des systèmes destinés au public. Il y a tout un Google consacré à la fiabilité des sites.où ils expliquent qu’ils abordent la tâche de maintenir les systèmes opérationnels de la même manière que les problèmes de logiciels. Ils veillent sur des services tels que Google Search, Ads, Gmail et YouTube.

La page SRE explique la complexité de leur mission comme étant très granulaire (réparer des choses individuelles) jusqu’à la résolution de problèmes à plus grande échelle qui affectent la « capacité de service au niveau continental » pour des utilisateurs qui se mesurent en milliards.

Gary Ilyes explique (à 3:18 minutes) :

« Site Reliability Engineering org publie son playbook sur la manière de gérer les incidents. Une grande partie des incidents sont liés à des problèmes de systèmes. Ils sont détectés par des processus automatisés, c’est-à-dire qu’il y a des sondes, par exemple, ou certaines règles qui sont définies sur le logiciel de surveillance qui examine les chiffres.

Ensuite, si le nombre dépasse une certaine valeur, il déclenche une alerte qui est ensuite saisie par un logiciel tel qu’un logiciel de gestion des incidents ».

Février 2024 Problème d’indexation

Gary explique ensuite que le problème d’indexation de février 2024 est un exemple de la manière dont Google surveille et réagit aux incidents susceptibles d’avoir un impact sur les utilisateurs dans le domaine de la recherche. Une partie de la réponse consiste à déterminer s’il s’agit d’un problème réel ou d’un faux positif.

Il explique :

« C’est ce qui s’est passé le 1er février également. En fait, un chiffre s’est détraqué, ce qui a entraîné l’ouverture automatique d’un incident en interne. Nous devons alors décider s’il s’agit d’un faux positif ou de quelque chose que nous devons examiner, comme nous, les gens du SRE.

Et, dans ce cas, ils ont décidé que, oui, c’est une chose valable. Et ils ont augmenté la priorité de l’incident d’un cran par rapport à ce qu’il était.

Je pense qu’il s’agissait d’un incident mineur au départ et qu’ils l’ont ensuite élevé au rang de priorité moyenne. Et lorsqu’il devient moyen, il se retrouve dans notre boîte de réception. Nous avons donc un seuil pour un incident moyen ou supérieur. Oui. »

Les incidents mineurs ne sont pas annoncés publiquement

Gary Ilyes explique ensuite qu’ils ne communiquent pas tous les petits incidents qui se produisent parce que, la plupart du temps, ils ne sont même pas remarqués par les utilisateurs. La considération la plus importante est de savoir si l’incident affecte les utilisateurs, qui recevront automatiquement un niveau de priorité plus élevé.

Un fait intéressant sur la manière dont Google décide de ce qui est important est que les problèmes qui affectent les utilisateurs sont automatiquement rehaussés à un niveau de priorité plus élevé. Gary a déclaré qu’il ne travaillait pas dans le domaine de l’évaluation des risques et qu’il n’était donc pas en mesure de se prononcer sur le nombre exact d’utilisateurs qui doivent être affectés avant que Google ne décide de faire une annonce publique.

Gary explique :

« Le SRE enquête sur tout. S’ils reçoivent une alerte de prober, par exemple, ou une alerte basée sur des chiffres quelconques, ils l’examinent et essaient de se l’expliquer.

Et s’il s’agit de quelque chose qui affecte les utilisateurs, alors cela signifie presque automatiquement qu’ils doivent augmenter la priorité parce que les utilisateurs sont réellement affectés. »

Incident de disparition d’images

Gary a donné un autre exemple d’incident, cette fois concernant des images qui n’apparaissaient pas pour les utilisateurs. Il a été décidé que, bien que l’expérience utilisateur ait été affectée, elle ne l’était pas au point d’empêcher les utilisateurs de trouver ce qu’ils cherchaient ; l’expérience utilisateur était dégradée, mais pas au point de rendre Google inutilisable. Ainsi, ce n’est pas seulement le fait que les utilisateurs soient affectés par un incident qui entraînera une escalade de la priorité, mais aussi l’ampleur de l’impact sur l’expérience de l’utilisateur.

Dans le cas des images qui ne s’affichaient pas, il a été décidé de ne pas faire de déclaration publique parce que les utilisateurs pouvaient toujours trouver les informations dont ils avaient besoin. Bien que Gary ne l’ait pas mentionné, cela ressemble à un problème que les blogueurs de recettes ont rencontré dans le passé lorsque les images ne s’affichaient plus.

Il a expliqué :

« Par exemple, il y a eu récemment un incident au cours duquel des images manquaient. Si je me souviens bien, je suis intervenu et j’ai dit : « C’est stupide, et nous ne devrions pas l’externaliser parce que l’impact sur l’utilisateur n’est en fait pas mauvais », n’est-ce pas ? Les utilisateurs n’obtiendront littéralement pas les images. Ce n’est pas comme si quelque chose était cassé. Ils ne verront tout simplement pas certaines images sur les pages de résultats de recherche.

Pour moi, c’est un retour à 1990 ou à 2008. C’est comme si le site était encore utilisable et que tout allait bien, sauf certaines images ».

Les éditeurs et les référenceurs sont-ils pris en compte ?

John Mueller, de Google, a demandé à Gary si le seuil pour faire une annonce publique était celui de la dégradation de l’expérience de l’utilisateur ou si l’expérience des éditeurs et des référenceurs était également prise en compte.

Gary a répondu (à environ 8 minutes) :

« Il s’agit donc de relations avec les moteurs de recherche, et non avec les propriétaires de sites, du point de vue de la recherche.

Mais par extension, comme les propriétaires de sites, ils se soucient également de leurs utilisateurs. Donc, si nous nous soucions de leurs utilisateurs, il s’agit du même groupe de personnes, n’est-ce pas ? Ou est-ce trop positif ? »

Gary considère apparemment que son rôle est avant tout de s’occuper des relations avec les moteurs de recherche dans un sens général de leurs utilisateurs. Cela peut surprendre de nombreux membres de la communauté des référenceurs, car la documentation de Google concernant le podcast Search Off The Record explique ce qui suit rôle de l’équipe chargée des relations avec les moteurs de recherche différemment :

« En tant qu’équipe chargée des relations avec les moteurs de recherche chez Google, nous sommes là pour aider les propriétaires de sites web à réussir avec leurs sites dans Google Search.

En écoutant l’intégralité du podcast, il est clair que les Googlers John Mueller et Lizzi Sassman se concentrent fortement sur l’engagement avec la communauté de la recherche. Peut-être y a-t-il donc un problème de langue qui fait que sa remarque peut être interprétée différemment de ce qu’il voulait ?

Que signifient les relations avec les moteurs de recherche ?

Google a expliqué qu’il disposait d’une procédure pour décider de ce qu’il convenait de divulguer en cas de perturbation des recherches et que cette approche était tout à fait sensée. Mais il faut tenir compte du fait que la définition de « relations » est qu’il s’agit d’un lien entre deux ou plusieurs personnes.

La recherche est une relation. Il s’agit d’un écosystème dans lequel deux partenaires, les créateurs (référenceurs et propriétaires de sites), créent du contenu et Google le met à la disposition de ses utilisateurs.

Image présentée par Shutterstock/Khosro