L'IA redéfinit le navigateur : la veille de la troisième guerre des navigateurs
La troisième guerre des navigateurs est en train de se dérouler discrètement. Depuis Netscape et Internet Explorer de Microsoft dans les années 90, jusqu'au Firefox de l'esprit open source et au Chrome de Google, la lutte des navigateurs a toujours été une représentation concentrée du contrôle de la plateforme et des changements de paradigme technologique. Chrome a pris une position dominante grâce à sa rapidité de mise à jour et à l'interconnexion de son écosystème, tandis que Google a formé un cercle fermé d'accès à l'information grâce à sa structure de "duopole" entre la recherche et le navigateur.
Mais aujourd'hui, ce schéma est en train de vaciller. L'émergence des modèles de langage de grande taille (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches sur la page de résultats de recherche sans cliquer, ce qui réduit le comportement traditionnel de clic sur les pages web. Parallèlement, des rumeurs circulent selon lesquelles Apple envisage de remplacer le moteur de recherche par défaut dans Safari, menaçant davantage les bases des profits d'Alphabet, et le marché commence à montrer des signes d'inquiétude face à la "orthodoxie de la recherche".
Le navigateur lui-même est également en train de se redéfinir. Il n'est pas seulement un outil d'affichage des pages web, mais un conteneur qui regroupe diverses capacités telles que l'entrée de données, le comportement des utilisateurs et l'identité privée. L'Agent AI est puissant, mais pour réaliser des interactions complexes sur les pages, appeler des données d'identité locales et contrôler les éléments de la page web, il doit toujours s'appuyer sur les limites de confiance et le bac à sable fonctionnel du navigateur. Le navigateur est en train de passer d'une interface humaine à une plateforme d'appels système pour les Agents.
Ce qui pourrait vraiment bouleverser le marché actuel des navigateurs, ce n'est pas un "Chrome meilleur", mais une nouvelle structure d'interaction : ce n'est pas une présentation de l'information, mais un appel aux tâches. Les navigateurs de demain doivent être conçus pour les agents IA - capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré appelable par LLM, réalisant une cartographie des pages vers des instructions, réduisant considérablement le coût d'interaction.
Les projets dominants sur le marché ont commencé à expérimenter : Perplexity construit un navigateur natif Comet, utilisant l'IA à la place des résultats de recherche traditionnels ; Brave combine protection de la vie privée et raisonnement local, renforçant les fonctionnalités de recherche et de blocage avec LLM ; tandis que des projets natifs Crypto comme Donut visent à créer une nouvelle porte d'entrée pour l'interaction entre l'IA et les actifs en chaîne. Ces projets ont en commun de tenter de reconstruire le côté entrée du navigateur, plutôt que d'embellir sa couche de sortie.
Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde pour le futur Agent, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et dignes de confiance deviendront une partie intégrante de la nouvelle génération de plateformes. De l'SEO à l'AEO (Agent Engine Optimization), du trafic de page à l'appel de chaîne de tâches, la forme du produit et la pensée de conception sont en cours de reconstruction. La troisième guerre des navigateurs se déroule sur "l'entrée" plutôt que sur "l'affichage" ; ce qui décide du vainqueur n'est plus qui attire l'attention de l'utilisateur, mais qui gagne la confiance de l'Agent et obtient l'entrée de l'appel.
Histoire du développement des navigateurs
Au début des années 90, alors qu'Internet n'était pas encore devenu une partie intégrante de la vie quotidienne, Netscape Navigator a fait son apparition, tel un voilier ouvrant un nouveau continent, offrant à des millions d'utilisateurs une porte d'entrée vers le monde numérique. Ce navigateur n'était pas le premier, mais c'était le premier produit à vraiment s'adresser au grand public et à façonner l'expérience Internet. À cette époque, les gens pouvaient enfin naviguer sur le web si facilement grâce à une interface graphique, comme si le monde entier devenait soudainement à portée de main.
Cependant, la gloire est souvent éphémère. Microsoft a rapidement réalisé l'importance des navigateurs et a décidé de forcer Internet Explorer à être intégré dans le système d'exploitation Windows, en faisant de lui le navigateur par défaut. Cette stratégie est considérée comme un "coup de maître de la plateforme", qui a directement anéanti la position dominante de Netscape sur le marché. De nombreux utilisateurs n'ont pas choisi IE de leur propre gré, mais l'ont accepté simplement parce qu'il était par défaut dans le système. Grâce à la capacité de distribution de Windows, IE est rapidement devenu le leader du secteur, tandis que Netscape est tombé sur la voie de la déclin.
Dans l'adversité, les ingénieurs de Netscape ont choisi une voie radicale et idéaliste - ils ont rendu le code source du navigateur public, appelant la communauté open source à se mobiliser. Cette décision ressemblait à un "sacrifice macédonien" dans le monde de la technologie, annonçant la fin d'une époque et l'émergence de nouvelles forces. Ce code est devenu la base du projet de navigateur Mozilla, initialement nommé Phoenix (signifiant la renaissance du phénix), mais a été renommé plusieurs fois en raison de problèmes de marque, pour finalement être appelé Firefox.
Firefox n'est pas une simple copie de Netscape, il a réalisé plusieurs percées en matière d'expérience utilisateur, d'écosystème de plugins et de sécurité. Sa naissance marque la victoire de l'esprit open source et insuffle une nouvelle vitalité à l'ensemble de l'industrie. Certains décrivent Firefox comme le "héritier spirituel" de Netscape, tout comme l'Empire ottoman a hérité des derniers rayons de la Byzantin. Cette métaphore est peut-être exagérée, mais elle a du sens.
Mais des années avant la sortie officielle de Firefox, Microsoft avait déjà lancé six versions d'IE, profitant de son avantage temporel et de sa stratégie de bundling système, plaçant Firefox en position de rattrapage dès le départ, ce qui rendait cette compétition inégale dès le départ.
Pendant ce temps, un autre joueur précoce faisait son apparition discrète. En 1994, le navigateur Opera a été lancé, il vient de Norvège et était à l'origine un projet expérimental. Mais à partir de la version 7.0 en 2003, il a introduit son propre moteur Presto, soutenant en premier CSS, les mises en page réactives, le contrôle vocal et l'encodage Unicode, entre autres technologies de pointe. Bien que le nombre d'utilisateurs soit limité, il a toujours été à la pointe de la technologie, devenant "le favori des geeks".
La même année, Apple a lancé le navigateur Safari. C'était un tournant plein de signification. À l'époque, Microsoft avait investi 150 millions de dollars dans Apple, alors au bord de la faillite, pour maintenir l'apparence de la concurrence et éviter un examen antitrust. Bien que Google ait été le moteur de recherche par défaut de Safari depuis sa création, cette histoire de relations compliquées avec Microsoft symbolise la relation complexe et subtile entre les géants de l'internet : coopération et concurrence vont toujours de pair.
En 2007, IE7 a été lancé avec Windows Vista, mais les retours du marché étaient mitigés. En revanche, Firefox, grâce à un rythme de mise à jour plus rapide, un mécanisme d'extension plus convivial et un attrait naturel pour les développeurs, a vu sa part de marché augmenter régulièrement pour atteindre environ 20 %. La domination d'IE s'est progressivement relâchée, le vent est en train de changer.
Google représente une autre approche. Bien qu'ils aient commencé à concevoir leur propre navigateur dès 2001, il a fallu six ans pour convaincre le PDG Eric Schmidt d'approuver ce projet. Chrome a été lancé en 2008, basé sur le projet open source Chromium et le moteur WebKit utilisé par Safari. Il a été qualifié de "navigateur encombrant", mais grâce à l'expertise de Google en matière de publicité et de construction de marque, il a rapidement émergé.
L'arme clé de Chrome n'est pas sa fonctionnalité, mais le rythme de mises à jour fréquentes (toutes les six semaines) et une expérience unifiée sur toutes les plateformes. En novembre 2011, Chrome a dépassé Firefox pour la première fois, atteignant une part de marché de 27 % ; six mois plus tard, il a de nouveau dépassé IE, complétant ainsi sa transformation de challenger à maître.
Pendant ce temps, l'internet mobile en Chine est également en train de former son propre écosystème. Un navigateur d'une entreprise bien connue a rapidement gagné en popularité au début des années 2010, en particulier sur des marchés émergents comme l'Inde, l'Indonésie et la Chine, grâce à son design léger, à la compression des données pour économiser de la bande passante, et a gagné la faveur des utilisateurs d'appareils bas de gamme. En 2015, sa part de marché mondiale des navigateurs mobiles a dépassé 17 %, atteignant même 46 % en Inde à un moment donné. Mais cette victoire n'a pas duré. Avec le renforcement par le gouvernement indien des contrôles de sécurité sur les applications chinoises, ce navigateur a été contraint de quitter un marché clé, perdant progressivement son ancienne gloire.
Entrant dans les années 2020, la domination de Chrome est désormais établie, avec une part de marché mondiale stable d'environ 65 %. Il convient de noter que, bien que le moteur de recherche Google et le navigateur Chrome appartiennent tous deux à Alphabet, ils représentent en termes de marché deux systèmes hégémoniques indépendants - le premier contrôlant environ 90 % des points d'entrée de recherche dans le monde, tandis que le second détient la majorité des "premiers fenêtres" par lesquelles les utilisateurs accèdent à Internet.
Pour maintenir cette double structure de monopole, Google n'hésite pas à investir des sommes considérables. En 2022, Alphabet a payé environ 20 milliards de dollars à Apple juste pour que Google conserve sa position de moteur de recherche par défaut dans Safari. Des analyses ont indiqué que cette dépense représente 36 % des revenus publicitaires que Google tire du trafic de Safari. En d'autres termes, Google paie une "redevance" pour sa protection.
Mais le vent a encore changé. Avec l'émergence des grands modèles de langage (LLM), la recherche traditionnelle commence à être perturbée. En 2024, la part de marché de Google dans la recherche est tombée de 93 % à 89 %. Bien qu'il reste dominant, des fissures commencent à apparaître. Plus perturbante encore, la rumeur selon laquelle Apple pourrait lancer son propre moteur de recherche AI - si Safari change son moteur de recherche par défaut pour rejoindre son propre camp, cela ne réécrira pas seulement le paysage écologique, mais pourrait également ébranler le pilier de profit d'Alphabet. La réaction du marché a été rapide, l'action d'Alphabet passant de 170 dollars à 140 dollars, reflétant non seulement la panique des investisseurs, mais aussi une profonde inquiétude quant à l'avenir de l'ère de la recherche.
De Navigator à Chrome, de l'idéal open source à la commercialisation de la publicité, du navigateur léger à l'assistant de recherche AI, la guerre des navigateurs a toujours été une bataille sur la technologie, la plateforme, le contenu et le contrôle. Le champ de bataille se déplace constamment, mais l'essence n'a jamais changé : celui qui contrôle l'entrée définit l'avenir.
Aux yeux des VC, s'appuyant sur la nouvelle demande des utilisateurs pour les moteurs de recherche à l'ère des LLM et de l'IA, la troisième guerre des navigateurs est en train de se dérouler progressivement.
L'architecture obsolète des navigateurs modernes
En ce qui concerne l'architecture des navigateurs, l'architecture traditionnelle classique est illustrée dans l'image ci-dessous :
Client - Entrée Frontale
Interroger le Google Front End le plus proche via HTTPS, accomplir le déchiffrement TLS, l'échantillonnage QoS et le routage géographique. Si un trafic anormal (DDoS, scraping automatique) est détecté, il est possible de limiter le débit ou de lancer un défi à ce niveau.
Compréhension de la requête
Le front-end doit comprendre le sens des mots saisis par l'utilisateur, en trois étapes : correction orthographique neuronale, corrigeant "recpie" en "recipe" ; extension de synonymes, étendant "how to fix bike" à "repair bicycle". Analyse de l'intention, déterminant si la requête est une intention d'information, de navigation ou de transaction, et assignant une demande Vertical.
Rappel des candidats
La technique de requête utilisée par un moteur de recherche bien connu est appelée : index inversé. Dans un index direct, nous pouvons indexer un fichier simplement en fournissant un ID. Cependant, les utilisateurs ne peuvent pas connaître le numéro du contenu qu'ils souhaitent parmi des milliards de fichiers, c'est pourquoi un index inversé traditionnel est utilisé, permettant de rechercher quels fichiers contiennent des mots-clés correspondants. Ensuite, l'indexation vectorielle est adoptée pour traiter la recherche sémantique, c'est-à-dire trouver des contenus ayant un sens similaire à la requête. Elle convertit des contenus tels que des textes et des images en vecteurs de haute dimension (embedding) et effectue des recherches en fonction de la similarité entre ces vecteurs. Par exemple, même si un utilisateur recherche "comment faire de la pâte à pizza", le moteur de recherche peut retourner des résultats liés à "guide de fabrication de pâte à pizza", car ils sont sémantiquement similaires. Après le filtrage par index inversé et indexation vectorielle, environ cent mille pages web seront pré-sélectionnées.
Tri multi-niveaux
Le système filtre généralement des centaines de milliers de pages candidates à environ 1000 pages, formant un ensemble de candidats préliminaire, à l'aide de milliers de caractéristiques légères telles que BM25, TF-IDF, et le score de qualité des pages. Ces systèmes sont appelés moteurs de recommandation. Ils s'appuient sur une multitude de caractéristiques massives générées par divers entités, y compris le comportement des utilisateurs, les attributs des pages, l'intention de recherche et les signaux contextuels. Par exemple, ils intègrent des informations sur l'historique des utilisateurs, les retours d'autres utilisateurs, la sémantique des pages, la signification des requêtes, etc., tout en tenant compte d'éléments contextuels tels que le temps (moment de la journée, jours spécifiques de la semaine) et des événements externes comme les nouvelles en temps réel.
Apprentissage profond pour le tri principal
Au stade de la recherche préliminaire, des technologies telles que RankBrain et Neural Matching sont utilisées pour comprendre la sémantique des requêtes et filtrer les résultats préliminaires pertinents parmi une vaste quantité de documents. RankBrain est un système d'apprentissage automatique introduit en 2015, conçu pour mieux comprendre le sens des requêtes des utilisateurs, en particulier celles qui apparaissent pour la première fois. Il convertit les requêtes et les documents en représentations vectorielles, puis calcule leur similarité pour trouver les résultats les plus pertinents. Par exemple, pour la requête "comment faire une pâte à pizza", même si le document ne contient pas...
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Révolution du navigateur propulsée par l'IA : la troisième guerre des navigateurs est arrivée
L'IA redéfinit le navigateur : la veille de la troisième guerre des navigateurs
La troisième guerre des navigateurs est en train de se dérouler discrètement. Depuis Netscape et Internet Explorer de Microsoft dans les années 90, jusqu'au Firefox de l'esprit open source et au Chrome de Google, la lutte des navigateurs a toujours été une représentation concentrée du contrôle de la plateforme et des changements de paradigme technologique. Chrome a pris une position dominante grâce à sa rapidité de mise à jour et à l'interconnexion de son écosystème, tandis que Google a formé un cercle fermé d'accès à l'information grâce à sa structure de "duopole" entre la recherche et le navigateur.
Mais aujourd'hui, ce schéma est en train de vaciller. L'émergence des modèles de langage de grande taille (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches sur la page de résultats de recherche sans cliquer, ce qui réduit le comportement traditionnel de clic sur les pages web. Parallèlement, des rumeurs circulent selon lesquelles Apple envisage de remplacer le moteur de recherche par défaut dans Safari, menaçant davantage les bases des profits d'Alphabet, et le marché commence à montrer des signes d'inquiétude face à la "orthodoxie de la recherche".
Le navigateur lui-même est également en train de se redéfinir. Il n'est pas seulement un outil d'affichage des pages web, mais un conteneur qui regroupe diverses capacités telles que l'entrée de données, le comportement des utilisateurs et l'identité privée. L'Agent AI est puissant, mais pour réaliser des interactions complexes sur les pages, appeler des données d'identité locales et contrôler les éléments de la page web, il doit toujours s'appuyer sur les limites de confiance et le bac à sable fonctionnel du navigateur. Le navigateur est en train de passer d'une interface humaine à une plateforme d'appels système pour les Agents.
Ce qui pourrait vraiment bouleverser le marché actuel des navigateurs, ce n'est pas un "Chrome meilleur", mais une nouvelle structure d'interaction : ce n'est pas une présentation de l'information, mais un appel aux tâches. Les navigateurs de demain doivent être conçus pour les agents IA - capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré appelable par LLM, réalisant une cartographie des pages vers des instructions, réduisant considérablement le coût d'interaction.
Les projets dominants sur le marché ont commencé à expérimenter : Perplexity construit un navigateur natif Comet, utilisant l'IA à la place des résultats de recherche traditionnels ; Brave combine protection de la vie privée et raisonnement local, renforçant les fonctionnalités de recherche et de blocage avec LLM ; tandis que des projets natifs Crypto comme Donut visent à créer une nouvelle porte d'entrée pour l'interaction entre l'IA et les actifs en chaîne. Ces projets ont en commun de tenter de reconstruire le côté entrée du navigateur, plutôt que d'embellir sa couche de sortie.
Pour les entrepreneurs, les opportunités se cachent dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde pour le futur Agent, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et dignes de confiance deviendront une partie intégrante de la nouvelle génération de plateformes. De l'SEO à l'AEO (Agent Engine Optimization), du trafic de page à l'appel de chaîne de tâches, la forme du produit et la pensée de conception sont en cours de reconstruction. La troisième guerre des navigateurs se déroule sur "l'entrée" plutôt que sur "l'affichage" ; ce qui décide du vainqueur n'est plus qui attire l'attention de l'utilisateur, mais qui gagne la confiance de l'Agent et obtient l'entrée de l'appel.
Histoire du développement des navigateurs
Au début des années 90, alors qu'Internet n'était pas encore devenu une partie intégrante de la vie quotidienne, Netscape Navigator a fait son apparition, tel un voilier ouvrant un nouveau continent, offrant à des millions d'utilisateurs une porte d'entrée vers le monde numérique. Ce navigateur n'était pas le premier, mais c'était le premier produit à vraiment s'adresser au grand public et à façonner l'expérience Internet. À cette époque, les gens pouvaient enfin naviguer sur le web si facilement grâce à une interface graphique, comme si le monde entier devenait soudainement à portée de main.
Cependant, la gloire est souvent éphémère. Microsoft a rapidement réalisé l'importance des navigateurs et a décidé de forcer Internet Explorer à être intégré dans le système d'exploitation Windows, en faisant de lui le navigateur par défaut. Cette stratégie est considérée comme un "coup de maître de la plateforme", qui a directement anéanti la position dominante de Netscape sur le marché. De nombreux utilisateurs n'ont pas choisi IE de leur propre gré, mais l'ont accepté simplement parce qu'il était par défaut dans le système. Grâce à la capacité de distribution de Windows, IE est rapidement devenu le leader du secteur, tandis que Netscape est tombé sur la voie de la déclin.
Dans l'adversité, les ingénieurs de Netscape ont choisi une voie radicale et idéaliste - ils ont rendu le code source du navigateur public, appelant la communauté open source à se mobiliser. Cette décision ressemblait à un "sacrifice macédonien" dans le monde de la technologie, annonçant la fin d'une époque et l'émergence de nouvelles forces. Ce code est devenu la base du projet de navigateur Mozilla, initialement nommé Phoenix (signifiant la renaissance du phénix), mais a été renommé plusieurs fois en raison de problèmes de marque, pour finalement être appelé Firefox.
Firefox n'est pas une simple copie de Netscape, il a réalisé plusieurs percées en matière d'expérience utilisateur, d'écosystème de plugins et de sécurité. Sa naissance marque la victoire de l'esprit open source et insuffle une nouvelle vitalité à l'ensemble de l'industrie. Certains décrivent Firefox comme le "héritier spirituel" de Netscape, tout comme l'Empire ottoman a hérité des derniers rayons de la Byzantin. Cette métaphore est peut-être exagérée, mais elle a du sens.
Mais des années avant la sortie officielle de Firefox, Microsoft avait déjà lancé six versions d'IE, profitant de son avantage temporel et de sa stratégie de bundling système, plaçant Firefox en position de rattrapage dès le départ, ce qui rendait cette compétition inégale dès le départ.
Pendant ce temps, un autre joueur précoce faisait son apparition discrète. En 1994, le navigateur Opera a été lancé, il vient de Norvège et était à l'origine un projet expérimental. Mais à partir de la version 7.0 en 2003, il a introduit son propre moteur Presto, soutenant en premier CSS, les mises en page réactives, le contrôle vocal et l'encodage Unicode, entre autres technologies de pointe. Bien que le nombre d'utilisateurs soit limité, il a toujours été à la pointe de la technologie, devenant "le favori des geeks".
La même année, Apple a lancé le navigateur Safari. C'était un tournant plein de signification. À l'époque, Microsoft avait investi 150 millions de dollars dans Apple, alors au bord de la faillite, pour maintenir l'apparence de la concurrence et éviter un examen antitrust. Bien que Google ait été le moteur de recherche par défaut de Safari depuis sa création, cette histoire de relations compliquées avec Microsoft symbolise la relation complexe et subtile entre les géants de l'internet : coopération et concurrence vont toujours de pair.
En 2007, IE7 a été lancé avec Windows Vista, mais les retours du marché étaient mitigés. En revanche, Firefox, grâce à un rythme de mise à jour plus rapide, un mécanisme d'extension plus convivial et un attrait naturel pour les développeurs, a vu sa part de marché augmenter régulièrement pour atteindre environ 20 %. La domination d'IE s'est progressivement relâchée, le vent est en train de changer.
Google représente une autre approche. Bien qu'ils aient commencé à concevoir leur propre navigateur dès 2001, il a fallu six ans pour convaincre le PDG Eric Schmidt d'approuver ce projet. Chrome a été lancé en 2008, basé sur le projet open source Chromium et le moteur WebKit utilisé par Safari. Il a été qualifié de "navigateur encombrant", mais grâce à l'expertise de Google en matière de publicité et de construction de marque, il a rapidement émergé.
L'arme clé de Chrome n'est pas sa fonctionnalité, mais le rythme de mises à jour fréquentes (toutes les six semaines) et une expérience unifiée sur toutes les plateformes. En novembre 2011, Chrome a dépassé Firefox pour la première fois, atteignant une part de marché de 27 % ; six mois plus tard, il a de nouveau dépassé IE, complétant ainsi sa transformation de challenger à maître.
Pendant ce temps, l'internet mobile en Chine est également en train de former son propre écosystème. Un navigateur d'une entreprise bien connue a rapidement gagné en popularité au début des années 2010, en particulier sur des marchés émergents comme l'Inde, l'Indonésie et la Chine, grâce à son design léger, à la compression des données pour économiser de la bande passante, et a gagné la faveur des utilisateurs d'appareils bas de gamme. En 2015, sa part de marché mondiale des navigateurs mobiles a dépassé 17 %, atteignant même 46 % en Inde à un moment donné. Mais cette victoire n'a pas duré. Avec le renforcement par le gouvernement indien des contrôles de sécurité sur les applications chinoises, ce navigateur a été contraint de quitter un marché clé, perdant progressivement son ancienne gloire.
Entrant dans les années 2020, la domination de Chrome est désormais établie, avec une part de marché mondiale stable d'environ 65 %. Il convient de noter que, bien que le moteur de recherche Google et le navigateur Chrome appartiennent tous deux à Alphabet, ils représentent en termes de marché deux systèmes hégémoniques indépendants - le premier contrôlant environ 90 % des points d'entrée de recherche dans le monde, tandis que le second détient la majorité des "premiers fenêtres" par lesquelles les utilisateurs accèdent à Internet.
Pour maintenir cette double structure de monopole, Google n'hésite pas à investir des sommes considérables. En 2022, Alphabet a payé environ 20 milliards de dollars à Apple juste pour que Google conserve sa position de moteur de recherche par défaut dans Safari. Des analyses ont indiqué que cette dépense représente 36 % des revenus publicitaires que Google tire du trafic de Safari. En d'autres termes, Google paie une "redevance" pour sa protection.
Mais le vent a encore changé. Avec l'émergence des grands modèles de langage (LLM), la recherche traditionnelle commence à être perturbée. En 2024, la part de marché de Google dans la recherche est tombée de 93 % à 89 %. Bien qu'il reste dominant, des fissures commencent à apparaître. Plus perturbante encore, la rumeur selon laquelle Apple pourrait lancer son propre moteur de recherche AI - si Safari change son moteur de recherche par défaut pour rejoindre son propre camp, cela ne réécrira pas seulement le paysage écologique, mais pourrait également ébranler le pilier de profit d'Alphabet. La réaction du marché a été rapide, l'action d'Alphabet passant de 170 dollars à 140 dollars, reflétant non seulement la panique des investisseurs, mais aussi une profonde inquiétude quant à l'avenir de l'ère de la recherche.
De Navigator à Chrome, de l'idéal open source à la commercialisation de la publicité, du navigateur léger à l'assistant de recherche AI, la guerre des navigateurs a toujours été une bataille sur la technologie, la plateforme, le contenu et le contrôle. Le champ de bataille se déplace constamment, mais l'essence n'a jamais changé : celui qui contrôle l'entrée définit l'avenir.
Aux yeux des VC, s'appuyant sur la nouvelle demande des utilisateurs pour les moteurs de recherche à l'ère des LLM et de l'IA, la troisième guerre des navigateurs est en train de se dérouler progressivement.
L'architecture obsolète des navigateurs modernes
En ce qui concerne l'architecture des navigateurs, l'architecture traditionnelle classique est illustrée dans l'image ci-dessous :
Client - Entrée Frontale
Interroger le Google Front End le plus proche via HTTPS, accomplir le déchiffrement TLS, l'échantillonnage QoS et le routage géographique. Si un trafic anormal (DDoS, scraping automatique) est détecté, il est possible de limiter le débit ou de lancer un défi à ce niveau.
Compréhension de la requête
Le front-end doit comprendre le sens des mots saisis par l'utilisateur, en trois étapes : correction orthographique neuronale, corrigeant "recpie" en "recipe" ; extension de synonymes, étendant "how to fix bike" à "repair bicycle". Analyse de l'intention, déterminant si la requête est une intention d'information, de navigation ou de transaction, et assignant une demande Vertical.
Rappel des candidats
La technique de requête utilisée par un moteur de recherche bien connu est appelée : index inversé. Dans un index direct, nous pouvons indexer un fichier simplement en fournissant un ID. Cependant, les utilisateurs ne peuvent pas connaître le numéro du contenu qu'ils souhaitent parmi des milliards de fichiers, c'est pourquoi un index inversé traditionnel est utilisé, permettant de rechercher quels fichiers contiennent des mots-clés correspondants. Ensuite, l'indexation vectorielle est adoptée pour traiter la recherche sémantique, c'est-à-dire trouver des contenus ayant un sens similaire à la requête. Elle convertit des contenus tels que des textes et des images en vecteurs de haute dimension (embedding) et effectue des recherches en fonction de la similarité entre ces vecteurs. Par exemple, même si un utilisateur recherche "comment faire de la pâte à pizza", le moteur de recherche peut retourner des résultats liés à "guide de fabrication de pâte à pizza", car ils sont sémantiquement similaires. Après le filtrage par index inversé et indexation vectorielle, environ cent mille pages web seront pré-sélectionnées.
Tri multi-niveaux
Le système filtre généralement des centaines de milliers de pages candidates à environ 1000 pages, formant un ensemble de candidats préliminaire, à l'aide de milliers de caractéristiques légères telles que BM25, TF-IDF, et le score de qualité des pages. Ces systèmes sont appelés moteurs de recommandation. Ils s'appuient sur une multitude de caractéristiques massives générées par divers entités, y compris le comportement des utilisateurs, les attributs des pages, l'intention de recherche et les signaux contextuels. Par exemple, ils intègrent des informations sur l'historique des utilisateurs, les retours d'autres utilisateurs, la sémantique des pages, la signification des requêtes, etc., tout en tenant compte d'éléments contextuels tels que le temps (moment de la journée, jours spécifiques de la semaine) et des événements externes comme les nouvelles en temps réel.
Apprentissage profond pour le tri principal
Au stade de la recherche préliminaire, des technologies telles que RankBrain et Neural Matching sont utilisées pour comprendre la sémantique des requêtes et filtrer les résultats préliminaires pertinents parmi une vaste quantité de documents. RankBrain est un système d'apprentissage automatique introduit en 2015, conçu pour mieux comprendre le sens des requêtes des utilisateurs, en particulier celles qui apparaissent pour la première fois. Il convertit les requêtes et les documents en représentations vectorielles, puis calcule leur similarité pour trouver les résultats les plus pertinents. Par exemple, pour la requête "comment faire une pâte à pizza", même si le document ne contient pas...