On les utilise tous les jours, on crois savoir ce que c’est...
En réalité, c’est une jungle, avec des tas de concepts qui méritent des clarifications, comme SEO, Moteurs de recherche "écologiques", Index, , pollution numérique..
Pour le terme SERPs et Algoritmes, je renvoie à Wikipedia [1] et au petit résumé introductif que j’ai fait ICI.
En guise d’introduction :
Frustrante, la recherche sur Internet
Le coût de l’IA au service de la recherche en ligne reste prohibitif pour la mettre entre les mains de milliards de consommateurs.
Extraits d’un article paru le 5 mars 2023 [2]
Le processus de traitement des requêtes de recherche alimentées par l’Intelligence Artificielle est connu sous le nom d’“inférence”, dans lequel un “réseau neuronal” librement modelé sur la biologie du cerveau humain déduit la réponse à une question à partir d’un entraînement préalable.
Dans une recherche traditionnelle, les robots d’exploration de Google parcourent l’Internet pour compiler un index d’informations. Lorsqu’un utilisateur tape une requête, Google lui propose les réponses les plus pertinentes stockées dans son index. Google pourrait être confronté à une augmentation de 6 milliards de dollars de ses dépenses d’ici 2024 si l’Intelligence Artificielle de type ChatGPT devait traiter la moitié des requêtes qu’elle reçoit avec des réponses de 50 mots, selon les analystes.
Le fait de devoir payer une telle facture explique pourquoi les géants de la recherche, qui comptent des milliards d’utilisateurs, ne vont pas déployer leurs solutions du jour au lendemain. L’électricité ajoute également des coûts et une pression sur les entreprises ayant des objectifs en matière d’empreinte carbone.
le vaste monde du web représente à lui seul presque 10% des émissions de gaz à effet de serre, et les nouvelles technologies qui envahissent notre quotidien sont aujourd’hui de plus en plus connectées. Les centres de données et les serveurs étant pour la plupart alimentés grâce à des énergies fossiles comme le charbon et le nucléaire, on remarque une réelle prise de conscience de la part des internautes qui se dirigent davantage vers des solutions de navigation de plus en plus écologiques.
Si de simples gestes comme celui de désactiver les notifications, vider la boîte mail régulièrement ou encore envoyer des mails sans pièces jointes offrent la possibilité de réduire la pollution numérique, certains voient encore plus loin pour permettre aux utilisateurs la possibilité de réduire leur empreinte carbone sur internet. La création de moteurs de recherches écologiques fait partie de ces initiatives solidaires qui visent à développer l’écologie numérique. Voyons tout cela de plus près.
Et pour commencer, que signifie « SEO » ?
SEO signifie Search Engine Optimization. SEO est le processus d’amélioration de votre site Web afin qu’il se classe plus haut dans les résultats des moteurs de recherche pour certains mots clés. Généralement, les gens se concentrent sur le fait d’apparaître dans Google, mais il y a aussi Bing.
Il s’agit d’un ensemble de stratégies et de tactiques qui visent à augmenter le trafic des moteurs de recherche vers un site et à améliorer le classement d’un site dans les pages de résultats des moteurs de recherche.
Les recherches montrent que les sites Web sur la première page de Google reçoivent la majorité des clics. Le nombre de personnes qui cliquent sur un site Web dans Google diminue régulièrement au fur et à mesure que l’on descend dans la page qu’elles classent.
L’une des principales raisons pour lesquelles les gens choisissent d’utiliser un moteur de recherche alternatif est la vie privée, car Google est connu pour suivre les données des utilisateurs à la fois pour son propre usage et celui de tiers.
Qu’est-ce qu’un moteur de recherche ?
Un moteur de recherche est un outil qui permet de parcourir le web à la recherche de pages et de documents correspondant à un ou plusieurs mots-clés.
L’utilisateur, qui cherche des informations ou à effectuer un achat, est censé trouver rapidement la réponse à sa question grâce au moteur de recherche.
Celui-ci possède un index d’une gigantesque quantité de documents web (pages, images, vidéos, etc.), et propose des résultats qui sont classés en fonction de critères qu’il a mis en place dans un algorithme [3].
Ces résultats de recherche s’affichent en général sur une ou plusieurs pages (les SERPs) [4] , sous forme de liste de liens cliquables.
Dans ce domaine, c’est Google qui a réussi à imposer un quasi monopole ces 20 dernières années.
Il subsiste cependant des alternatives…
Parmi les moteurs de recherches alternatifs au géant américain, on trouve des entreprises implantées régionalement pour des raisons linguistiques ou même politiques.
En dehors des géants russe ou chinois, la plupart des alternatives à Google proposent deux choses majeures que Google n’est pas en mesure d’apporter :
– La confidentialité et la protection des informations personnelles.
– Le reversement de bénéfices publicitaires issus des résultats de recherche à des associations écologiques et / ou solidaires.
Allons voir de plus près qui sont ces moteurs de recherche alternatifs.
Quel est l’impact en CO2 de vos recherches en ligne ?
Internet est un outil formidable qui nous permet d’accéder à toutes les informations possibles et imaginables en quelques clics. Aujourd’hui profondément ancré dans notre routine quotidienne, la crise sanitaire que nous traversons depuis décembre 2019 n’a d’ailleurs fait que consolider encore davantage l’expérience que nous avons sur le web : courses en ligne, cours de sport en ligne, rencontres en ligne, réseaux sociaux et visionnage de vidéos, télétravail, etc. Pourtant, chaque fois que nous sommes sur le web, nous participons, sans forcément en avoir conscience, à la pollution numérique.
D’après Green IT, la quantité d’émissions de gaz à effet de serre générée par internet varie de la façon suivante :
• Les utilisateurs du web contribuent à hauteur de 47% des émissions.
• Le réseau à 28%.
• Le Data Center, ou centre de données, à hauteur de 25%.
Quelles sont les origines de la pollution numérique ?
La pollution numérique représente toute la pollution générée par les nouvelles technologies (smartphones, tablettes, ordinateurs, objets connectés, etc.). Mais saviez-vous que bien que les émissions de CO2 de toute cette industrie soient dues pour moitié à la fabrication des équipements, l’autre moitié est causée par l’usage d’internet ? Pour faire court, le web représente un réseau de quasiment un million de kilomètres de câbles et plus de 3000 centres de données (mails, pages web, photos, musiques, vidéos, etc.) répartis à travers la planète.
Le streaming vidéo représente à lui seul 60% des flux de données sur internet. En cause, le poids du fichier. Prenons l’exemple d’un film sur Netflix en très haute résolution (4K), celui-ci représente environ 10 GO, soit 200 000 fois plus qu’un email envoyé sans pièce jointe. Chaque année, la consommation mondiale de streaming vidéo affiche un triste record de 300 millions de tonnes de CO2 !
Par ailleurs, selon l’Agence de l’Environnement et de la Maîtrise de l’Énergie (l’ADEME), si internet devait être un pays à lui tout seul, il serait le 6ème plus grand consommateur d’énergie de la planète. Toujours selon l’ADEME, la forte augmentation des usagers à l’échelle mondiale et la consommation personnelle de données laissent présager le doublement de l’empreinte carbone d’ici 2025. Pas très glorieux comme constat prévisionnel…
Quelles sont les sources d’énergie les plus couramment utilisées ?
Si de plus en plus d’entreprises s’engagent ou pensent s’engager vers une utilisation d’énergies 100% renouvelables telles que les énergies solaires, éoliennes, géothermiques et hydrauliques, certaines en revanche comme Netflix, Twitter ou encore Amazon sont à la traîne et continuent d’utiliser les énergies fossiles telles que le gaz, le charbon et le nucléaire.
Qu’est-ce qu’un moteur de recherche écologique ? [5]
Si vous vous attendez à lire qu’un moteur de recherche écologique pollue moins que les plus connus à l’image de Bing, Google ou encore Yahoo, vous risquez d’être déçu. Peu importe de quel moteur de recherche il s’agira, il demeurera malgré tout un métamoteur qui utilisera sensiblement les mêmes technologies que n’importe quelle autre application.
Il faut tout de même un élément spécifique pour pouvoir parler de moteur de recherche solidaire, et celui-ci réside dans la manière de reverser les bénéfices. Nés du constat que les revenus générés par les publicités sur les moteurs de recherche sont relativement importants, ces moteurs dits écologiques choisissent de reverser une partie de ces revenus à des causes humanitaires, sociales ou environnementales afin de compenser leur empreinte carbone.
Les moteurs de recherche écolos compensent-ils donc réellement la pollution ?
Comme nous l’indiquions plus haut, certaines entreprises visent l’écologie numérique et souhaitent permettre aux internautes de réduire leur empreinte carbone. Parmi les moteurs de recherche écologiques ou solidaires, nous avons retenu :
ECOSIA
L’utilisation intensive des moteurs de recherche a un impact environnemental sur les émissions de CO². C’est là qu’Ecosia entre en scène : le moteur de recherche alternatif neutre en CO².
Pour chaque recherche effectuée (alimentée par Bing), les revenus générés vont à son programme de plantation d’arbres. En moyenne, environ 45 recherches sont nécessaires pour faire un seul arbre.
Ecosia est le moteur de recherche vert le plus connu sur le marché des métamoteurs écologiques. Séduisant les internautes pour son programme de reforestation, cette association à but non lucratif se fait fournir ses publicités ainsi que ses résultats de recherche par Bing.
ECOGINE
Si votre métier vous impose des recherches régulières sur le web, ce moteur de recherche éthique est fait pour vous. Utilisant des résultats de recherche fournis par Google, Ecogine permet ainsi de profiter des algorithmes de ce géant du web tout en soutenant une cause écologique. Cerise sur le gâteau, il s’agit d’un moteur de recherche français !
Le système est simple, chaque clic effectué sur une publicité présente sur Ecogine génère des revenus reversés à hauteur de 10% à des associations à but environnemental élues par…. Vous !
LILO ?
Autre moteur de recherche écologique français, Lilo n’est pas une association comme les deux premiers que nous venons d’évoquer. SAS à but lucratif, ce moteur de recherche éthique offre la possibilité aux internautes de soutenir des actions sociales ou environnementales à hauteur de 50% du chiffre d’affaires de la société, dont 10% exclusivement réservés à des initiatives de compensation carbone.
Les résultats de recherche de ce métamoteur provenant de Yahoo, Google et Bing, il est impossible de déterminer la part que chacun d’entre eux représente même si Yahoo semble être celui qui utilise davantage d’énergies renouvelables comparé à Google et Bing.
Le bilan carbone de Lilo contraste toutefois avec son choix d’hébergeurs (OVH et Online) qui ne semblent pas particulièrement préoccupés par l’environnement, mais l’objectif de la société visant davantage les actions humanitaires plutôt que la préservation de la nature.
voir https://larcenciel.be/ecrire/?exec=article&id_article=1454
Conclusion. Les moteurs de recherche “écologiques”
Ces moteurs de recherche écologiques que nous venons de vous présenter utilisent en effet tous la régie publicitaire de leur partenaire (Google, Yahoo et Bing). La publicité étant leur moyen de générer des revenus, ces dernières doivent être ciblées, ce qui nécessite, même partiellement et temporairement l’utilisation de certaines de vos données confidentielles.
Sauf que... depuis lors, il y a Neeva...
NEEVA
"La recherche est la passerelle vers Internet, mais pendant trop longtemps, Google et d’autres l’ont fait à propos d’eux plutôt que de l’utilisateur."
Parce qu’il considère de manière générale que "le moteur de recherche ne sert plus les meilleurs intérêts des utilisateurs", Sridhar Ramaswamy, un ex-homme fort de Google, s’est associé à Vivek Raghunathan (ex-YouTube) pour créer et lancer Neeva.
Neeva est un moteur de recherche privé créé par ces deux anciens de Google et de YouTube, lancé ce 6 octobre en France et en Europe.
Neeva présente un modèle qui supprime toute dépendance à l’égard du revenu publicitaire en s’alignant sur l’utilisateur.
Enfin une alternative crédible au géant du secteur ?
Neeva a réussi le tour de force d’être « l’un des seuls moteurs de recherche alternatifs à Google et à Bing (Ndlr : et à Brave) à avoir investi dans la construction de sa propre technologie indépendante », nous assure son cofondateur. Il fait notamment référence à l’exploration de centaines de millions de pages par jour, à l’indexation de milliards de pages web et à un service à l’échelle. « Un défi incroyablement complexe sur lequel nous travaillons depuis quelques années », reconnaît Sridhar Ramaswamy.
« UNE DIFFÉRENCE ENTRE GOOGLE ET NEEVA ? POUR COMMENCER, LE PREMIER RÉSULTAT DANS GOOGLE EST UNE PUBLICITÉ. »
Dans le cas où vous vous connectez à une source externe via Neeva, par exemple Office 365, Dropbox ou G Suite, le moteur se charge de traiter les données obtenues de tel ou tel service, et ne les utilise que pour vous présenter des résultats personnalisés lorsque vous effectuerez une recherche depuis Neeva, et uniquement pour cela.
Conformément au processus de chiffrement dont nous parlions un peu plus haut, « nous ne montrons rien qui soit à vous à quelqu’un d’autre. Nous protégeons vos données en maintenant des normes de sécurité strictes et en testant en permanence les vulnérabilités de nos systèmes », ajoute Sridhar Ramaswamy.
Voir dans LARCENCIEL, l’article sur Neeva et dans mes "peartrees", ICI.
Et puis, aussi à signaler :
Le moteur de recherche Qwant lance une version pour enfants
(AFP - Publié le 04-12-2015) - La start-up française Qwant, qui veut défier Google avec un moteur de recherche alternatif sur internet, a lancé vendredi une version pour enfants sans sexe ni violence, qui fait la part belle aux contenus pédagogiques.
Destiné aux enfants et préadolescents, Qwant Junior — https://www.qwantjunior.com/ — propose des recherches sur internet, dans l’actualité en ligne et sur des sites éducatifs, et propose classiquement des images et des vidéos, sans traçage ni publicité.
Qwant Junior met à l’écart les informations et les images jugées inadaptées à un public jeune, qu’il s’agisse de sexe, de violence ou de drogue, avec une "liste noire" de plus de 4 millions de sites, et exclut le plus possible les résultats commerciaux.
"Nous avons tout fait pour éviter qu’en tapant Syrie, on trouve des images de décapitations ou de morts avec du sang partout", a précisé vendredi Jean-Manuel Rozan, le président de la compagnie, lors d’une conférence de presse.
A contrario, une "liste blanche" de sites fournie par les enseignants et le ministère de l’Education nationale est mis en avant pour favoriser les recherches des enfants.
Le site garantit également l’impossibilité de tracer les requêtes des enfants, a fortiori sur une version spéciale destinée aux écoles qui permet les travaux en commun.
"Bienvenue à http://junior.qwant.com (la version écoles, NDLR) le moteur de recherche français pour les enfants désormais disponible dans les écoles pour les 6/13 ans", a tweeté vendredi la ministre de l’Education nationale Najat Vallaud-Belkacem, pour saluer le lancement du site.
Ayant pour vocation de "fournir une alternative européenne crédible et fluide dans le domaine de la recherche sur internet", sans filtrer son contenu ni tracer les utilisateurs, Qwant a été lancé en 2013.
Disponible en 15 langues, le moteur de recherche présente sur une même page, pour chaque recherche, des liens internet des images, des définitions tirées de l’encyclopédie en ligne Wikipedia, des actualités et des mentions récentes sur les réseaux sociaux.
Le groupe d’édition allemand Axel Springer est entré en 2014 au capital de la jeune société, basée à Paris, qui a aussi bénéficié en novembre d’une injection de 25 millions d’euros de la Banque européenne d’investissement (BEI).