Revolução do navegador impulsionada por IA: a terceira guerra dos navegadores chegou

A IA remodela o navegador: a véspera da terceira guerra dos navegadores

A terceira guerra dos navegadores está se desenrolando silenciosamente. Desde o Netscape e o IE da Microsoft nos anos 90, até o espírito de código aberto do Firefox e o Chrome do Google, a disputa entre navegadores tem sido uma expressão concentrada do controle da plataforma e da mudança dos paradigmas tecnológicos. O Chrome conquistou a posição dominante graças à sua velocidade de atualização e à interconexão do ecossistema, enquanto o Google, através da estrutura "duopólio" entre busca e navegador, formou um ciclo fechado de entrada de informações.

Mas hoje, esse padrão está em mudança. A ascensão dos modelos de linguagem de grande escala (LLM) está fazendo com que cada vez mais usuários realizem tarefas nas páginas de resultados de busca com "zero cliques", reduzindo o comportamento tradicional de clicar em páginas da web. Ao mesmo tempo, há rumores de que a Apple pretende substituir o mecanismo de busca padrão no Safari, ameaçando ainda mais a base de lucros da Alphabet, e o mercado já começou a mostrar inquietação em relação à "ortodoxia da busca".

O próprio navegador também está enfrentando uma reconfiguração de funções. Ele não é apenas uma ferramenta para exibir páginas da web, mas sim um recipiente que reúne várias capacidades, como entrada de dados, comportamento do usuário e identidade de privacidade. Embora o Agente de IA seja poderoso, ainda é necessário contar com as fronteiras de confiança e a sandbox de funcionalidades do navegador para realizar interações complexas em páginas, invocar dados de identidade locais e controlar elementos da página. O navegador está se transformando de uma interface humana para uma plataforma de chamadas de sistema para Agentes.

O que realmente pode quebrar o atual padrão do mercado de navegadores não é outro "Chrome melhor", mas sim uma nova estrutura de interação: não a exibição de informações, mas a convocação de tarefas. O futuro dos navegadores deve ser projetado para Agentes de IA - que não só conseguem ler, mas também escrever e executar. Projetos como o Browser Use estão tentando semantizar a estrutura da página, transformando a interface visual em texto estruturado que pode ser chamado por LLM, realizando um mapeamento de página para instruções e reduzindo significativamente os custos de interação.

Os projetos principais no mercado já começaram a experimentar: a Perplexity está a construir o navegador nativo Comet, substituindo os resultados de pesquisa tradicionais por IA; a Brave combina proteção de privacidade com raciocínio local, usando LLM para melhorar a pesquisa e as funcionalidades de bloqueio; enquanto os projetos nativos de Crypto, como o Donut, visam uma nova entrada para a interação entre IA e ativos em cadeia. A característica comum destes projetos é: tentam reestruturar a entrada do navegador, em vez de embelezar a sua camada de saída.

Para os empreendedores, as oportunidades estão escondidas na relação triangular entre entrada, estrutura e agente. O navegador, como a interface que invoca o mundo no futuro, significa que quem pode fornecer "blocos de capacidade" estruturados, invocáveis e confiáveis, pode se tornar parte da nova geração de plataformas. Desde SEO até AEO (Otimização de Motores de Agentes), desde tráfego de página até invocação de cadeias de tarefas, a forma do produto e o pensamento de design estão sendo reconstruídos. A terceira guerra dos navegadores ocorre na "entrada" e não na "exibição"; o que decide o vencedor não é mais quem chama a atenção do usuário, mas quem conquista a confiança do Agente, obtendo a entrada para a invocação.

Breve História do Desenvolvimento dos Navegadores

No início da década de 90, quando a internet ainda não era parte da vida cotidiana, o Netscape Navigator surgiu como um barco à vela que abriu novas terras, permitindo a milhões de usuários acessar o mundo digital. Este navegador não foi o primeiro, mas foi o primeiro a realmente se tornar popular e moldar a experiência da internet. Naquela época, as pessoas podiam navegar na web de forma tão fácil através de uma interface gráfica, como se todo o mundo de repente se tornasse acessível.

No entanto, o brilho é muitas vezes efémero. A Microsoft rapidamente percebeu a importância dos navegadores e decidiu forçar a integração do Internet Explorer no sistema operativo Windows, tornando-o o navegador padrão. Essa estratégia é considerada uma "arma secreta da plataforma", que desmantelou diretamente a posição dominante da Netscape no mercado. Muitos usuários não escolheram ativamente o IE, mas aceitaram-no porque era o padrão do sistema. O IE, aproveitando a capacidade de distribuição do Windows, rapidamente se tornou o líder do setor, enquanto a Netscape caiu em uma trajetória de declínio.

Em tempos de crise, os engenheiros da Netscape escolheram um caminho radical e idealista - tornaram o código-fonte do navegador público, fazendo um chamado à comunidade de código aberto. Esta decisão foi como uma "cede de Macedônia" no mundo da tecnologia, sinalizando o fim de uma era e o surgimento de novas forças. Este código mais tarde tornou-se a base do projeto do navegador Mozilla, inicialmente nomeado Phoenix (que significa renascimento da fênix), mas devido a problemas de marca, passou por várias mudanças de nome, até ser finalmente chamado de Firefox.

O Firefox não é uma simples cópia do Netscape; ele alcançou vários avanços em experiência do usuário, ecossistema de plugins, segurança, entre outros. Seu surgimento marca a vitória do espírito de código aberto e injetou nova vitalidade em toda a indústria. Alguns descrevem o Firefox como o "herdeiro espiritual" do Netscape, assim como o Império Otomano herdou o crepúsculo bizantino. Embora essa metáfora seja exagerada, é bastante significativa.

Mas nos anos que antecederam o lançamento oficial do Firefox, a Microsoft já havia lançado seis versões do IE, aproveitando a vantagem de tempo e a estratégia de bundling do sistema, fazendo com que o Firefox começasse em uma posição de perseguição, o que tornava esta competição um jogo desigual desde o início.

Entretanto, outro jogador inicial também está surgindo discretamente. Em 1994, o navegador Opera foi lançado, vindo da Noruega, inicialmente como um projeto experimental. Mas a partir da versão 7.0 em 2003, ele introduziu o motor Presto, desenvolvido internamente, sendo o primeiro a suportar CSS, layouts responsivos, controle por voz e codificação Unicode, entre outras tecnologias de ponta. Embora o número de usuários seja limitado, a tecnologia sempre esteve à frente da indústria, tornando-se "o favorito dos geeks".

No mesmo ano, a Apple lançou o navegador Safari. Esta foi uma reviravolta cheia de significado. Naquela época, a Microsoft havia investido 150 milhões de dólares na Apple, que estava à beira da falência, para manter as aparências de concorrência e evitar a revisão antitruste. Embora o mecanismo de busca padrão do Safari desde o seu nascimento seja o Google, essa história de envolvimento com a Microsoft simboliza a relação complexa e sutil entre os gigantes da internet: cooperação e competição, sempre caminhando lado a lado.

Em 2007, o IE7 foi lançado com o Windows Vista, mas a resposta do mercado foi morna. Em contraste, o Firefox, com um ritmo de atualizações mais rápido, um mecanismo de extensões mais amigável e um apelo natural para os desenvolvedores, viu sua participação de mercado subir para cerca de 20%. O domínio do IE começou a enfraquecer, e a maré estava mudando.

O Google adotou uma abordagem diferente. Embora tenha começado a desenvolver seu próprio navegador em 2001, levou seis anos para convencer o CEO Eric Schmidt a aprovar o projeto. O Chrome foi lançado em 2008, construído com base no projeto open-source Chromium e no motor WebKit usado pelo Safari. Ele foi apelidado de "navegador pesado", mas, graças à profunda experiência do Google em publicidade e construção de marcas, rapidamente se destacou.

A arma chave do Chrome não é a funcionalidade, mas sim o ritmo frequente de atualizações de versão (a cada seis semanas) e a experiência unificada em todas as plataformas. Em novembro de 2011, o Chrome superou pela primeira vez o Firefox, alcançando uma quota de mercado de 27%; seis meses depois, superou novamente o IE, completando a transição de desafiante a dominador.

Ao mesmo tempo, a internet móvel da China também está formando seu próprio ecossistema. Um navegador sob uma empresa conhecida rapidamente se tornou popular no início da década de 2010, especialmente em mercados emergentes como a Índia, a Indonésia e a China, conquistando o favor dos usuários de dispositivos de baixo custo devido ao seu design leve e características como compressão de dados para economizar tráfego. Em 2015, sua participação no mercado global de navegadores móveis ultrapassou 17%, chegando a 46% na Índia em um determinado momento. No entanto, essa vitória não foi duradoura. Com o governo indiano intensificando a revisão de segurança de aplicativos chineses, o navegador foi forçado a sair de um mercado chave, perdendo gradualmente seu antigo brilho.

Entrando na década de 2020, a posição dominante do Chrome já está estabelecida, com uma quota de mercado global estável em cerca de 65%. É importante notar que, embora o motor de busca Google e o navegador Chrome pertençam à Alphabet, do ponto de vista do mercado, eles são dois sistemas hegemônicos independentes - o primeiro controla cerca de noventa por cento das entradas de pesquisa globais, enquanto o segundo detém a maior parte das "primeiras janelas" pelas quais os usuários acessam a internet.

Para manter essa estrutura de duopólio, o Google não hesitou em investir uma quantia considerável. Em 2022, a Alphabet pagou cerca de 20 bilhões de dólares à Apple apenas para garantir que o Google mantivesse a posição de pesquisa padrão no Safari. Análises apontam que esse gasto representa 36% da receita de anúncios de pesquisa que o Google obtém do tráfego do Safari. Em outras palavras, o Google está pagando uma "taxa de proteção" para sua muralha.

Mas a direção do vento mudou novamente. Com a ascensão dos grandes modelos de linguagem (LLM), as buscas tradicionais começaram a ser impactadas. Em 2024, a participação de mercado de busca do Google caiu de 93% para 89%, embora ainda domine, as fissuras já aparecem. O que é ainda mais disruptivo são os rumores sobre a Apple lançar seu próprio motor de busca de IA - se o Safari mudar sua busca padrão para seu próprio ecossistema, isso não apenas reescreverá o cenário ecológico, mas poderá também abalar o pilar de lucros da Alphabet. O mercado reagiu rapidamente, com as ações da Alphabet caindo de 170 dólares para 140 dólares, refletindo não apenas o pânico dos investidores, mas também uma profunda insegurança sobre a direção futura da era de busca.

Desde o Navigator até ao Chrome, desde a idealização de código aberto até à comercialização de anúncios, desde navegadores leves até assistentes de busca com IA, a disputa entre navegadores tem sido sempre uma guerra sobre tecnologia, plataformas, conteúdo e controle. O campo de batalha está em constante mudança, mas a essência nunca mudou: quem controla a entrada, define o futuro.

Na visão dos VC, apoiados pela nova demanda das pessoas por motores de busca na era do LLM e da IA, a terceira guerra dos navegadores está se desenrolando gradualmente.

A arquitetura antiga dos navegadores modernos

Falando sobre a arquitetura do navegador, a arquitetura tradicional clássica é mostrada na figura abaixo:

Cliente - Entrada do Frontend

Consultar a entrega mais recente do Google Front End via HTTPS, completando a descriptografia TLS, amostragem de QoS e roteamento geográfico. Se for detectado tráfego anômalo (DDoS, scraping automático), é possível limitar ou desafiar neste nível.

Compreensão da consulta

A interface precisa entender o significado das palavras digitadas pelo usuário, e existem três etapas: correção ortográfica neural, corrigindo "recpie" para "recipe"; expansão de sinônimos, expandindo "how to fix bike" para "repair bicycle". Análise de intenção, determinando se a consulta é de informação, navegação ou intenção de transação, e atribuindo a solicitação Vertical.

Recall de candidatos

Uma técnica de consulta utilizada por um conhecido motor de busca é chamada de: índice invertido. No índice direto, podemos indexar um arquivo simplesmente fornecendo um ID. No entanto, o usuário não pode saber o número do conteúdo desejado entre bilhões de arquivos, por isso utiliza um índice invertido muito tradicional, que busca quais arquivos contêm as palavras-chave correspondentes. Em seguida, utiliza-se o índice vetorial para lidar com a busca semântica, ou seja, encontrar conteúdos que tenham significados semelhantes à consulta. Isso converte textos, imagens e outros conteúdos em vetores de alta dimensão (embedding) e realiza a busca com base na similaridade entre esses vetores. Por exemplo, mesmo que o usuário procure "como fazer massa de pizza", o motor de busca pode retornar resultados relacionados a "guia de preparação de massa de pizza", uma vez que eles são semanticamente semelhantes. Após passar pelo índice invertido e pelo índice vetorial, cerca de cem mil páginas da web são pré-selecionadas.

Classificação em múltiplos níveis

Os sistemas geralmente filtram milhares de características leves em várias dimensões, como BM25, TF-IDF e pontuação de qualidade da página, reduzindo uma escala de centenas de milhares de páginas candidatas para cerca de 1000, formando um conjunto inicial de candidatos. Esses sistemas são coletivamente chamados de motores de recomendação. Eles dependem de uma vasta gama de características geradas por várias entidades, incluindo comportamento do usuário, atributos da página, intenção de pesquisa e sinais de contexto. Por exemplo, eles combinam informações sobre o histórico do usuário, feedback de comportamento de outros usuários, semântica da página, significado da pesquisa, entre outros, e também levam em consideração elementos contextuais, como tempo (períodos do dia, dias específicos da semana) e eventos externos, como notícias em tempo real.

Aprendizado profundo para classificação principal

Na fase de pesquisa inicial, são utilizadas tecnologias como RankBrain e Neural Matching para entender o significado da consulta e filtrar resultados preliminarmente relevantes de um vasto conjunto de documentos. O RankBrain é um sistema de aprendizado de máquina introduzido em 2015, destinado a compreender melhor o significado das consultas dos usuários, especialmente aquelas que aparecem pela primeira vez. Ele converte consultas e documentos em representações vetoriais, calculando a similaridade entre eles para encontrar os resultados mais relevantes. Por exemplo, para a consulta "como fazer massa de pizza", mesmo que o documento não contenha

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 3
  • Compartilhar
Comentário
0/400
SignatureDeniedvip
· 6h atrás
Esta batalha não é fácil de vencer.
Ver originalResponder0
GasFeeCriervip
· 6h atrás
Ah ah, o velho Google finalmente vai ser condenado?
Ver originalResponder0
OnlyOnMainnetvip
· 6h atrás
Ainda estás completamente desatualizado ao usar o Google.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)