La IA remodela el navegador: la víspera de la tercera guerra de los navegadores
La tercera guerra de los navegadores está ocurriendo silenciosamente. Desde Netscape y el IE de Microsoft en los años 90, hasta Firefox con su espíritu de código abierto y Chrome de Google, la lucha entre navegadores ha sido una representación concentrada del control de la plataforma y la transformación de los paradigmas tecnológicos. Chrome ha alcanzado una posición dominante gracias a su velocidad de actualización y la vinculación de su ecosistema, mientras que Google ha formado un ciclo cerrado de entrada a la información a través de la estructura de "duopolio" entre la búsqueda y el navegador.
Pero hoy, este patrón está siendo sacudido. El auge de los modelos de lenguaje de gran tamaño (LLM) está haciendo que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que reduce el comportamiento tradicional de clics en páginas web. Al mismo tiempo, hay rumores de que Apple tiene la intención de reemplazar el motor de búsqueda predeterminado en Safari, lo que amenaza aún más la base de ganancias de Alphabet, y el mercado ya ha comenzado a mostrar inquietud por la "ortodoxia de la búsqueda".
El navegador también se enfrenta a una reestructuración de su rol. No solo es una herramienta para mostrar páginas web, sino que se ha convertido en un contenedor que agrupa múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad de la privacidad. Aunque el Agente de IA es potente, para realizar interacciones complejas en las páginas, invocar datos de identidad locales y controlar elementos de la página web, aún necesita aprovechar los límites de confianza y el sandbox de funciones del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas del sistema para Agentes.
Lo que realmente podría romper el actual mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no se trata de la presentación de información, sino de la invocación de tareas. Los navegadores del futuro deben ser diseñados para AI Agents - no solo para leer, sino también para escribir y ejecutar. Proyectos como Browser Use están intentando semanticizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando una mapeo de página a comandos y reduciendo enormemente los costos de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity ha construido el navegador nativo Comet, utilizando IA en lugar de resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es que intentan reconstruir la interfaz de entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agente. El navegador, como la interfaz que llama al mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma y el diseño del producto están siendo reestructurados. La tercera guerra de navegadores ocurre en la "entrada" y no en la "exhibición"; lo que decide el resultado ya no es quién capta la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada a la invocación.
Breve historia del desarrollo del navegador
A principios de la década de 1990, cuando Internet aún no era parte de la vida cotidiana, Netscape Navigator apareció como un barco de vela que abría un nuevo continente, abriendo la puerta al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí el primero en el verdadero sentido de llevarse a las masas y moldear la experiencia de Internet. En ese momento, la gente podía navegar por la web a través de una interfaz gráfica con una facilidad nunca antes vista, como si de repente todo el mundo se volviera accesible.
Sin embargo, el esplendor a menudo es efímero. Microsoft se dio cuenta rápidamente de la importancia de los navegadores y decidió integrar Internet Explorer de manera forzada en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se puede considerar un "arma secreta de la plataforma", que desmanteló directamente la posición de liderazgo en el mercado de Netscape. Muchos usuarios no eligieron IE de forma activa, sino que simplemente lo aceptaron porque era la opción predeterminada del sistema. IE, aprovechando la capacidad de distribución de Windows, rápidamente se convirtió en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.
En medio de la adversidad, los ingenieros de Netscape eligieron un camino radical y idealista: hicieron público el código fuente del navegador, lanzando un llamado a la comunidad de código abierto. Esta decisión fue como una "cesión macedónica" en el mundo tecnológico, presagiando el final de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, que originalmente se llamó Phoenix (que significa renacer de las cenizas), pero debido a problemas de marca cambió de nombre varias veces, hasta que finalmente se denominó Firefox.
Firefox no es una simple copia de Netscape, ha logrado múltiples avances en la experiencia del usuario, el ecosistema de complementos y la seguridad. Su nacimiento marca la victoria del espíritu de código abierto y también inyecta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, al igual que el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene mucho significado.
Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja de tiempo y la estrategia de empaquetado del sistema, lo que hizo que Firefox empezara en una posición de desventaja, lo que significa que esta competencia no era una competencia justa en igualdad de condiciones.
Mientras tanto, otro jugador temprano también está apareciendo silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, tecnológicamente siempre ha estado a la vanguardia de la industria, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Fue un giro de gran significado. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener las apariencias de competencia y evitar una revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su nacimiento es Google, esta historia de enredos con Microsoft simboliza la relación compleja y sutil entre los gigantes de Internet: cooperación y competencia, siempre van de la mano.
En 2007, IE7 se lanzó con Windows Vista, pero la respuesta del mercado fue mediocre. En comparación, Firefox, gracias a un ritmo de actualización más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su cuota de mercado aumentaba constantemente hasta aproximadamente el 20%. El dominio de IE se estaba debilitando, y la marea estaba cambiando.
Google es otro enfoque. Aunque comenzó a gestar su propio navegador en 2001, le tomó seis años convencer al CEO Eric Schmidt para aprobar este proyecto. Chrome fue lanzado en 2008, construido sobre el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó "el navegador pesado", pero gracias a la profunda habilidad de Google en publicidad y construcción de marcas, rápidamente se elevó.
La clave del éxito de Chrome no son sus funciones, sino el ritmo de actualizaciones frecuentes (cada seis semanas) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, superó nuevamente a IE, completando la transformación de retador a dominante.
Al mismo tiempo, el internet móvil en China también está formando su propio ecosistema. Un conocido navegador de una empresa famosa ganó rápidamente popularidad a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, gracias a su diseño ligero y características como la compresión de datos para ahorrar tráfico, lo que le valió la preferencia de los usuarios de dispositivos de gama baja. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando en India un 46% en un momento dado. Sin embargo, esta victoria no fue duradera. A medida que el gobierno indio intensificó la revisión de seguridad de las aplicaciones chinas, el navegador se vio obligado a retirarse de un mercado clave, perdiendo gradualmente su antiguo esplendor.
A medida que entramos en la década de 2020, la posición dominante de Chrome ya está establecida, con una cuota de mercado global que se mantiene en aproximadamente el 65%. Es notable que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla aproximadamente el noventa por ciento de los puntos de acceso a la búsqueda global, mientras que el segundo tiene el control de la "primera ventana" a través de la cual la mayoría de los usuarios acceden a la red.
Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición como motor de búsqueda predeterminado en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por anuncios de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "tasa de protección" para su foso.
Pero el viento ha cambiado una vez más. Con el auge de los modelos de lenguaje de gran tamaño (LLM), la búsqueda tradicional ha comenzado a sufrir. En 2024, la participación de mercado de Google en la búsqueda cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Lo más disruptivo son los rumores sobre que Apple podría lanzar su propio motor de búsqueda de IA; si Safari cambia su búsqueda predeterminada a su propio ecosistema, esto no solo reescribirá el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y el precio de las acciones de Alphabet cayó de 170 dólares a 140 dólares, reflejando no solo el pánico de los inversores, sino también una profunda inquietud sobre la dirección futura de la era de búsqueda.
Desde Navigator hasta Chrome, desde el ideal de código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda AI, la lucha por los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla sigue cambiando, pero la esencia nunca ha cambiado: quien controla la entrada, define el futuro.
En la opinión de los VC, apoyándose en la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores está comenzando a desarrollarse gradualmente.
La arquitectura obsoleta de los navegadores modernos
Al hablar de la arquitectura del navegador, la arquitectura tradicional clásica se muestra en la siguiente imagen:
Cliente - Entrada del Frontend
Consulta el Google Front End más cercano a través de HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, scraping automático), se puede limitar o desafiar en esta capa.
Consulta de comprensión
El front-end necesita entender el significado de las palabras que el usuario escribe, y hay tres pasos: corrección ortográfica neural, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intención, determinando si la consulta es de información, navegación o intención de transacción, y asignando la solicitud Vertical.
Recuperación de candidatos
La técnica de consulta utilizada por un conocido motor de búsqueda se llama: índice invertido. En el índice directo, simplemente se proporciona un ID para acceder al archivo. Sin embargo, los usuarios no pueden conocer el número del contenido que desean entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional, que permite buscar qué archivos contienen las palabras clave correspondientes. A continuación, se utiliza el índice de vectores para manejar la búsqueda semántica, es decir, buscar contenidos que sean semánticamente similares a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y realiza búsquedas basadas en la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa para pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza" porque son semánticamente similares. Después de pasar por el índice invertido y el índice de vectores, se filtran aproximadamente cien mil páginas web.
Ordenamiento multicriterio
Los sistemas generalmente filtran cientos de miles de páginas candidatas a unas 1000, formando un conjunto inicial de candidatos, utilizando características ligeras de miles de dimensiones como BM25, TF-IDF y puntajes de calidad de página. Estos sistemas se conocen colectivamente como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y señales contextuales. Por ejemplo, se integran la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la consulta, así como factores contextuales como el tiempo (períodos del día, días específicos de la semana) y eventos externos como noticias en tiempo real.
Aprendizaje profundo para la clasificación principal
En la fase de búsqueda preliminar, se utilizan tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar los resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático introducido en 2015, diseñado para comprender mejor el significado de las consultas de los usuarios, especialmente aquellas que aparecen por primera vez. Convierte las consultas y los documentos en representaciones vectoriales y calcula la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa para pizza", incluso si el documento no contiene...
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
13 me gusta
Recompensa
13
3
Compartir
Comentar
0/400
SignatureDenied
· hace10h
Esta batalla no es fácil de ganar.
Ver originalesResponder0
GasFeeCrier
· hace10h
¿Ah, ah, finalmente Google se va a condenar?
Ver originalesResponder0
OnlyOnMainnet
· hace11h
Seguir usando Google está realmente pasado de moda.
Revolución de navegadores impulsada por IA: llega la tercera guerra de navegadores
La IA remodela el navegador: la víspera de la tercera guerra de los navegadores
La tercera guerra de los navegadores está ocurriendo silenciosamente. Desde Netscape y el IE de Microsoft en los años 90, hasta Firefox con su espíritu de código abierto y Chrome de Google, la lucha entre navegadores ha sido una representación concentrada del control de la plataforma y la transformación de los paradigmas tecnológicos. Chrome ha alcanzado una posición dominante gracias a su velocidad de actualización y la vinculación de su ecosistema, mientras que Google ha formado un ciclo cerrado de entrada a la información a través de la estructura de "duopolio" entre la búsqueda y el navegador.
Pero hoy, este patrón está siendo sacudido. El auge de los modelos de lenguaje de gran tamaño (LLM) está haciendo que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que reduce el comportamiento tradicional de clics en páginas web. Al mismo tiempo, hay rumores de que Apple tiene la intención de reemplazar el motor de búsqueda predeterminado en Safari, lo que amenaza aún más la base de ganancias de Alphabet, y el mercado ya ha comenzado a mostrar inquietud por la "ortodoxia de la búsqueda".
El navegador también se enfrenta a una reestructuración de su rol. No solo es una herramienta para mostrar páginas web, sino que se ha convertido en un contenedor que agrupa múltiples capacidades como la entrada de datos, el comportamiento del usuario y la identidad de la privacidad. Aunque el Agente de IA es potente, para realizar interacciones complejas en las páginas, invocar datos de identidad locales y controlar elementos de la página web, aún necesita aprovechar los límites de confianza y el sandbox de funciones del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas del sistema para Agentes.
Lo que realmente podría romper el actual mercado de navegadores no es otro "Chrome mejor", sino una nueva estructura de interacción: no se trata de la presentación de información, sino de la invocación de tareas. Los navegadores del futuro deben ser diseñados para AI Agents - no solo para leer, sino también para escribir y ejecutar. Proyectos como Browser Use están intentando semanticizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que puede ser invocado por LLM, logrando una mapeo de página a comandos y reduciendo enormemente los costos de interacción.
Los proyectos principales en el mercado han comenzado a experimentar: Perplexity ha construido el navegador nativo Comet, utilizando IA en lugar de resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con el razonamiento local, mejorando las funciones de búsqueda y bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a una nueva entrada para la interacción entre IA y activos en cadena. La característica común de estos proyectos es que intentan reconstruir la interfaz de entrada del navegador, en lugar de embellecer su capa de salida.
Para los emprendedores, las oportunidades se esconden en la relación triangular entre entrada, estructura y agente. El navegador, como la interfaz que llama al mundo en el futuro, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y confiables, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, la forma y el diseño del producto están siendo reestructurados. La tercera guerra de navegadores ocurre en la "entrada" y no en la "exhibición"; lo que decide el resultado ya no es quién capta la atención del usuario, sino quién gana la confianza del agente y obtiene la entrada a la invocación.
Breve historia del desarrollo del navegador
A principios de la década de 1990, cuando Internet aún no era parte de la vida cotidiana, Netscape Navigator apareció como un barco de vela que abría un nuevo continente, abriendo la puerta al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí el primero en el verdadero sentido de llevarse a las masas y moldear la experiencia de Internet. En ese momento, la gente podía navegar por la web a través de una interfaz gráfica con una facilidad nunca antes vista, como si de repente todo el mundo se volviera accesible.
Sin embargo, el esplendor a menudo es efímero. Microsoft se dio cuenta rápidamente de la importancia de los navegadores y decidió integrar Internet Explorer de manera forzada en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se puede considerar un "arma secreta de la plataforma", que desmanteló directamente la posición de liderazgo en el mercado de Netscape. Muchos usuarios no eligieron IE de forma activa, sino que simplemente lo aceptaron porque era la opción predeterminada del sistema. IE, aprovechando la capacidad de distribución de Windows, rápidamente se convirtió en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.
En medio de la adversidad, los ingenieros de Netscape eligieron un camino radical y idealista: hicieron público el código fuente del navegador, lanzando un llamado a la comunidad de código abierto. Esta decisión fue como una "cesión macedónica" en el mundo tecnológico, presagiando el final de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, que originalmente se llamó Phoenix (que significa renacer de las cenizas), pero debido a problemas de marca cambió de nombre varias veces, hasta que finalmente se denominó Firefox.
Firefox no es una simple copia de Netscape, ha logrado múltiples avances en la experiencia del usuario, el ecosistema de complementos y la seguridad. Su nacimiento marca la victoria del espíritu de código abierto y también inyecta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, al igual que el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene mucho significado.
Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja de tiempo y la estrategia de empaquetado del sistema, lo que hizo que Firefox empezara en una posición de desventaja, lo que significa que esta competencia no era una competencia justa en igualdad de condiciones.
Mientras tanto, otro jugador temprano también está apareciendo silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 en 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios es limitada, tecnológicamente siempre ha estado a la vanguardia de la industria, convirtiéndose en "el favorito de los geeks".
Ese mismo año, Apple lanzó el navegador Safari. Fue un giro de gran significado. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener las apariencias de competencia y evitar una revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su nacimiento es Google, esta historia de enredos con Microsoft simboliza la relación compleja y sutil entre los gigantes de Internet: cooperación y competencia, siempre van de la mano.
En 2007, IE7 se lanzó con Windows Vista, pero la respuesta del mercado fue mediocre. En comparación, Firefox, gracias a un ritmo de actualización más rápido, un mecanismo de extensiones más amigable y su atractivo natural para los desarrolladores, vio cómo su cuota de mercado aumentaba constantemente hasta aproximadamente el 20%. El dominio de IE se estaba debilitando, y la marea estaba cambiando.
Google es otro enfoque. Aunque comenzó a gestar su propio navegador en 2001, le tomó seis años convencer al CEO Eric Schmidt para aprobar este proyecto. Chrome fue lanzado en 2008, construido sobre el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó "el navegador pesado", pero gracias a la profunda habilidad de Google en publicidad y construcción de marcas, rápidamente se elevó.
La clave del éxito de Chrome no son sus funciones, sino el ritmo de actualizaciones frecuentes (cada seis semanas) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, superó nuevamente a IE, completando la transformación de retador a dominante.
Al mismo tiempo, el internet móvil en China también está formando su propio ecosistema. Un conocido navegador de una empresa famosa ganó rápidamente popularidad a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, gracias a su diseño ligero y características como la compresión de datos para ahorrar tráfico, lo que le valió la preferencia de los usuarios de dispositivos de gama baja. En 2015, su participación en el mercado global de navegadores móviles superó el 17%, alcanzando en India un 46% en un momento dado. Sin embargo, esta victoria no fue duradera. A medida que el gobierno indio intensificó la revisión de seguridad de las aplicaciones chinas, el navegador se vio obligado a retirarse de un mercado clave, perdiendo gradualmente su antiguo esplendor.
A medida que entramos en la década de 2020, la posición dominante de Chrome ya está establecida, con una cuota de mercado global que se mantiene en aproximadamente el 65%. Es notable que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde el punto de vista del mercado son dos sistemas hegemónicos independientes: el primero controla aproximadamente el noventa por ciento de los puntos de acceso a la búsqueda global, mientras que el segundo tiene el control de la "primera ventana" a través de la cual la mayoría de los usuarios acceden a la red.
Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó alrededor de 20 mil millones de dólares a Apple solo para que Google mantuviera su posición como motor de búsqueda predeterminado en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por anuncios de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "tasa de protección" para su foso.
Pero el viento ha cambiado una vez más. Con el auge de los modelos de lenguaje de gran tamaño (LLM), la búsqueda tradicional ha comenzado a sufrir. En 2024, la participación de mercado de Google en la búsqueda cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Lo más disruptivo son los rumores sobre que Apple podría lanzar su propio motor de búsqueda de IA; si Safari cambia su búsqueda predeterminada a su propio ecosistema, esto no solo reescribirá el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y el precio de las acciones de Alphabet cayó de 170 dólares a 140 dólares, reflejando no solo el pánico de los inversores, sino también una profunda inquietud sobre la dirección futura de la era de búsqueda.
Desde Navigator hasta Chrome, desde el ideal de código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda AI, la lucha por los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla sigue cambiando, pero la esencia nunca ha cambiado: quien controla la entrada, define el futuro.
En la opinión de los VC, apoyándose en la nueva demanda de las personas hacia los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores está comenzando a desarrollarse gradualmente.
La arquitectura obsoleta de los navegadores modernos
Al hablar de la arquitectura del navegador, la arquitectura tradicional clásica se muestra en la siguiente imagen:
Cliente - Entrada del Frontend
Consulta el Google Front End más cercano a través de HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, scraping automático), se puede limitar o desafiar en esta capa.
Consulta de comprensión
El front-end necesita entender el significado de las palabras que el usuario escribe, y hay tres pasos: corrección ortográfica neural, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intención, determinando si la consulta es de información, navegación o intención de transacción, y asignando la solicitud Vertical.
Recuperación de candidatos
La técnica de consulta utilizada por un conocido motor de búsqueda se llama: índice invertido. En el índice directo, simplemente se proporciona un ID para acceder al archivo. Sin embargo, los usuarios no pueden conocer el número del contenido que desean entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional, que permite buscar qué archivos contienen las palabras clave correspondientes. A continuación, se utiliza el índice de vectores para manejar la búsqueda semántica, es decir, buscar contenidos que sean semánticamente similares a la consulta. Convierte textos, imágenes y otros contenidos en vectores de alta dimensión (embedding) y realiza búsquedas basadas en la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa para pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza" porque son semánticamente similares. Después de pasar por el índice invertido y el índice de vectores, se filtran aproximadamente cien mil páginas web.
Ordenamiento multicriterio
Los sistemas generalmente filtran cientos de miles de páginas candidatas a unas 1000, formando un conjunto inicial de candidatos, utilizando características ligeras de miles de dimensiones como BM25, TF-IDF y puntajes de calidad de página. Estos sistemas se conocen colectivamente como motores de recomendación. Dependen de una gran cantidad de características generadas por diversas entidades, incluyendo el comportamiento del usuario, las propiedades de la página, la intención de búsqueda y señales contextuales. Por ejemplo, se integran la historia del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la consulta, así como factores contextuales como el tiempo (períodos del día, días específicos de la semana) y eventos externos como noticias en tiempo real.
Aprendizaje profundo para la clasificación principal
En la fase de búsqueda preliminar, se utilizan tecnologías como RankBrain y Neural Matching para comprender el significado de las consultas y filtrar los resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático introducido en 2015, diseñado para comprender mejor el significado de las consultas de los usuarios, especialmente aquellas que aparecen por primera vez. Convierte las consultas y los documentos en representaciones vectoriales y calcula la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa para pizza", incluso si el documento no contiene...