Cuộc cách mạng trình duyệt do AI điều khiển: Cuộc chiến trình duyệt lần thứ ba đã đến

AI tái định hình trình duyệt: Đêm trước của cuộc chiến trình duyệt lần thứ ba

Cuộc chiến trình duyệt lần thứ ba đang âm thầm diễn ra. Từ Netscape và IE của Microsoft vào những năm 90, đến Firefox mang tinh thần mã nguồn mở và Chrome của Google, cuộc chiến trình duyệt luôn là biểu hiện tập trung của quyền kiểm soát nền tảng và sự thay đổi trong các mô hình công nghệ. Chrome đã chiếm lĩnh vị trí thống trị nhờ tốc độ cập nhật và sự liên kết hệ sinh thái, trong khi Google thông qua cấu trúc "đôi độc quyền" giữa tìm kiếm và trình duyệt, đã hình thành nên vòng khép kín của cửa ngõ thông tin.

Nhưng hôm nay, cấu trúc này đang bị rung chuyển. Sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM) đã khiến ngày càng nhiều người dùng hoàn thành nhiệm vụ trên trang kết quả tìm kiếm mà không cần nhấp chuột, hành vi nhấp chuột vào trang web truyền thống đang giảm. Đồng thời, có tin đồn rằng Apple có ý định thay thế công cụ tìm kiếm mặc định trong Safari, làm tăng thêm mối đe dọa đối với nền tảng lợi nhuận của Alphabet, thị trường đã bắt đầu thể hiện sự bất an đối với "chính thống tìm kiếm".

Trình duyệt cũng đang đối mặt với việc tái định hình vai trò. Nó không chỉ là công cụ hiển thị trang web, mà còn là một container tập hợp nhiều khả năng như nhập dữ liệu, hành vi người dùng, danh tính riêng tư và hơn thế nữa. AI Agent tuy mạnh mẽ, nhưng để hoàn thành các tương tác phức tạp trên trang, gọi dữ liệu danh tính địa phương, và điều khiển các yếu tố trang web, vẫn cần dựa vào ranh giới tin cậy và sandbox chức năng của trình duyệt. Trình duyệt đang chuyển từ giao diện con người thành nền tảng gọi hệ thống cho Agent.

Điều thực sự có thể phá vỡ cấu trúc thị trường trình duyệt hiện tại không phải là một "Chrome tốt hơn", mà là một cấu trúc tương tác mới: không phải là việc trình bày thông tin, mà là việc gọi các nhiệm vụ. Trình duyệt tương lai cần được thiết kế cho AI Agent - không chỉ có thể đọc, mà còn có thể viết và thực thi. Các dự án như Browser Use đang cố gắng ngữ nghĩa hóa cấu trúc trang, biến giao diện trực quan thành văn bản có cấu trúc có thể gọi từ LLM, đạt được sự ánh xạ từ trang đến lệnh, giảm thiểu chi phí tương tác một cách đáng kể.

Các dự án chính trên thị trường đã bắt đầu thử nghiệm: Perplexity xây dựng trình duyệt gốc Comet, sử dụng AI thay thế cho kết quả tìm kiếm truyền thống; Brave kết hợp bảo vệ quyền riêng tư với suy luận địa phương, sử dụng LLM để tăng cường chức năng tìm kiếm và chặn; trong khi các dự án gốc Crypto như Donut thì nhắm đến một lối vào mới cho tương tác giữa AI và tài sản trên chuỗi. Những dự án này có điểm chung là: cố gắng tái cấu trúc phần nhập liệu của trình duyệt, thay vì làm đẹp phần đầu ra của nó.

Đối với các nhà khởi nghiệp, cơ hội nằm trong mối quan hệ tam giác giữa đầu vào, cấu trúc và đại lý. Trình duyệt như một giao diện gọi thế giới của các Agent trong tương lai, có nghĩa là ai có thể cung cấp các "khối năng lực" có thể cấu trúc, có thể gọi và đáng tin cậy, người đó sẽ trở thành một phần của nền tảng thế hệ mới. Từ SEO đến AEO (Tối ưu hóa động cơ đại lý), từ lưu lượng trang đến gọi chuỗi nhiệm vụ, hình thái sản phẩm và tư duy thiết kế đang được tái cấu trúc. Cuộc chiến trình duyệt lần thứ ba diễn ra ở "đầu vào" chứ không phải "trình bày"; người quyết định thắng thua không còn là ai thu hút được sự chú ý của người dùng, mà là ai giành được lòng tin của Agent, nhận được lối vào để gọi.

Lịch sử phát triển trình duyệt

Vào đầu những năm 90, khi internet chưa trở thành một phần của cuộc sống hàng ngày, Netscape Navigator đã ra đời, như một con thuyền mở ra vùng đất mới, mở cửa dẫn dắt hàng triệu người dùng đến với thế giới kỹ thuật số. Trình duyệt này không phải là sản phẩm đầu tiên, nhưng lại là sản phẩm đầu tiên thực sự tiếp cận đại chúng và định hình trải nghiệm internet. Vào thời điểm đó, mọi người lần đầu tiên có thể dễ dàng duyệt web qua giao diện đồ họa, như thể cả thế giới bỗng trở nên dễ dàng tiếp cận.

Tuy nhiên, sự huy hoàng thường ngắn ngủi. Microsoft nhanh chóng nhận ra tầm quan trọng của trình duyệt và quyết định buộc Internet Explorer vào hệ điều hành Windows, để nó trở thành trình duyệt mặc định. Chiến lược này được coi là "đòn chí mạng của nền tảng", trực tiếp làm sụp đổ vị thế thống trị của Netscape trên thị trường. Nhiều người dùng không phải tự nguyện chọn IE, mà là vì hệ thống mặc định đã chấp nhận nó. IE đã nhanh chóng trở thành ông trùm ngành nhờ khả năng phân phối của Windows, trong khi Netscape rơi vào con đường suy tàn.

Trong hoàn cảnh khó khăn, các kỹ sư của Netscape đã chọn một con đường mạnh mẽ và lý tưởng - họ đã công khai mã nguồn của trình duyệt và kêu gọi cộng đồng mã nguồn mở. Quyết định này giống như một "sự nhượng bộ kiểu Macedonia" trong giới công nghệ, báo hiệu sự kết thúc của thời đại cũ và sự trỗi dậy của sức mạnh mới. Đoạn mã này sau đó trở thành nền tảng cho dự án trình duyệt Mozilla, ban đầu được đặt tên là Phoenix (nghĩa là Phượng Hoàng hồi sinh), nhưng đã trải qua nhiều lần đổi tên do vấn đề thương hiệu, cuối cùng được đặt tên là Firefox.

Firefox không chỉ đơn thuần là bản sao của Netscape, mà đã đạt được nhiều đột phá về trải nghiệm người dùng, hệ sinh thái plugin, và độ an toàn. Sự ra đời của nó đánh dấu chiến thắng của tinh thần mã nguồn mở, đồng thời tiếp thêm sinh lực cho toàn ngành. Có người mô tả Firefox là "người kế thừa tinh thần" của Netscape, như Đế chế Ottoman đã kế thừa ánh sáng còn sót lại của Đế chế Byzantine. So sánh này tuy có phần phóng đại, nhưng chứa đựng nhiều ý nghĩa.

Nhưng trong vài năm trước khi Firefox chính thức ra mắt, Microsoft đã phát hành sáu phiên bản IE, nhờ vào lợi thế thời gian và chiến lược gói hệ thống, khiến Firefox ngay từ đầu đã ở vị trí chạy đuổi, định sẵn cuộc đua này không phải là một cuộc cạnh tranh công bằng với điểm xuất phát ngang nhau.

Trong khi đó, một người chơi sớm khác cũng đã âm thầm xuất hiện. Vào năm 1994, trình duyệt Opera ra đời, nó đến từ Na Uy và ban đầu chỉ là một dự án thử nghiệm. Nhưng từ phiên bản 7.0 vào năm 2003, nó đã giới thiệu động cơ Presto tự phát triển, đi đầu trong việc hỗ trợ CSS, bố cục thích ứng, điều khiển bằng giọng nói và mã hóa Unicode cũng như các công nghệ tiên tiến khác. Mặc dù số lượng người dùng hạn chế, nhưng về mặt công nghệ, nó luôn đi đầu trong ngành công nghiệp, trở thành "sự yêu thích của các tín đồ công nghệ".

Cùng năm đó, Apple đã ra mắt trình duyệt Safari. Đây là một bước ngoặt đầy ý nghĩa. Thời điểm đó, Microsoft đã đầu tư 150 triệu đô la vào Apple đang bên bờ vực phá sản, nhằm duy trì hình thức cạnh tranh và tránh sự kiểm tra chống độc quyền. Mặc dù công cụ tìm kiếm mặc định của Safari từ khi ra đời là Google, nhưng mối quan hệ lịch sử với Microsoft tượng trưng cho mối quan hệ phức tạp và tinh tế giữa các ông lớn internet: hợp tác và cạnh tranh, luôn luôn song hành.

Năm 2007, IE7 được phát hành cùng với Windows Vista, nhưng phản hồi từ thị trường khá bình thường. Ngược lại, Firefox, nhờ vào nhịp độ cập nhật nhanh hơn, cơ chế mở rộng thân thiện hơn và sức hấp dẫn tự nhiên đối với các nhà phát triển, đã dần nâng thị phần lên khoảng 20%. Sự thống trị của IE đang dần bị lung lay, xu hướng đang thay đổi.

Google là một cách tiếp cận khác. Mặc dù đã bắt đầu lên kế hoạch để phát triển trình duyệt của riêng mình từ năm 2001, nhưng phải mất sáu năm để thuyết phục CEO Eric Schmidt phê duyệt dự án này. Chrome ra mắt vào năm 2008, được xây dựng dựa trên dự án mã nguồn mở Chromium và engine WebKit mà Safari sử dụng. Nó được gọi một cách châm biếm là trình duyệt "cồng kềnh", nhưng nhờ vào sức mạnh của Google trong quảng cáo và xây dựng thương hiệu, nó đã nhanh chóng nổi lên.

Vũ khí then chốt của Chrome không phải là chức năng, mà là nhịp độ cập nhật phiên bản thường xuyên (mỗi sáu tuần một lần) và trải nghiệm đồng nhất trên toàn nền tảng. Vào tháng 11 năm 2011, Chrome lần đầu tiên vượt qua Firefox, chiếm 27% thị phần; sau sáu tháng, lại vượt qua IE, hoàn thành chuyển đổi từ kẻ thách thức thành người thống trị.

Trong khi đó, internet di động của Trung Quốc cũng đang hình thành hệ sinh thái riêng. Một trình duyệt thuộc về một công ty nổi tiếng đã nhanh chóng nổi bật vào đầu những năm 2010, đặc biệt là ở các thị trường mới nổi như Ấn Độ, Indonesia và Trung Quốc, nhờ vào thiết kế nhẹ, nén dữ liệu tiết kiệm băng thông, đã giành được cảm tình của người dùng thiết bị giá rẻ. Năm 2015, thị phần trình duyệt di động toàn cầu của nó đã vượt qua 17%, có lúc lên tới 46% ở Ấn Độ. Nhưng chiến thắng này không kéo dài. Khi chính phủ Ấn Độ tăng cường kiểm tra an ninh đối với các ứng dụng Trung Quốc, trình duyệt này buộc phải rút lui khỏi thị trường quan trọng, dần dần đánh mất ánh hào quang ngày xưa.

Bước vào thập kỷ 2020, vị thế thống trị của Chrome đã được thiết lập, với thị phần toàn cầu ổn định khoảng 65%. Đáng chú ý, mặc dù công cụ tìm kiếm Google và trình duyệt Chrome đều thuộc về Alphabet, nhưng từ góc độ thị trường, chúng lại là hai hệ thống độc quyền tách biệt - cái trước kiểm soát khoảng chín phần mười lối vào tìm kiếm toàn cầu, trong khi cái sau nắm giữ "cửa sổ đầu tiên" mà hầu hết người dùng sử dụng để vào mạng.

Để bảo vệ cấu trúc độc quyền kép này, Google không tiếc tiền đầu tư. Năm 2022, Alphabet đã chi khoảng 20 tỷ USD cho Apple chỉ để Google duy trì vị trí tìm kiếm mặc định trong Safari. Một số phân tích chỉ ra rằng chi phí này tương đương với 36% doanh thu quảng cáo tìm kiếm mà Google thu được từ lưu lượng truy cập Safari. Nói cách khác, Google đang trả "phí bảo vệ" cho bức tường thành.

Nhưng hướng gió lại một lần nữa thay đổi. Với sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM), tìm kiếm truyền thống bắt đầu bị ảnh hưởng. Năm 2024, thị phần tìm kiếm của Google giảm từ 93% xuống 89%, dù vẫn chiếm ưu thế, nhưng vết nứt đã xuất hiện. Điều gây rối loạn hơn là tin đồn về việc Apple có thể ra mắt công cụ tìm kiếm AI riêng - nếu Safari chuyển sang sử dụng công cụ tìm kiếm của chính họ, điều này không chỉ sẽ thay đổi cấu trúc sinh thái mà còn có thể làm lung lay trụ cột lợi nhuận của Alphabet. Thị trường phản ứng nhanh chóng, giá cổ phiếu của Alphabet đã giảm từ 170 đô la xuống 140 đô la, phản ánh không chỉ sự hoảng loạn của nhà đầu tư mà còn là sự bất an sâu sắc về hướng đi của thời đại tìm kiếm trong tương lai.

Từ Navigator đến Chrome, từ lý tưởng nguồn mở đến thương mại hóa quảng cáo, từ trình duyệt nhẹ đến trợ lý tìm kiếm AI, cuộc chiến trình duyệt luôn là một cuộc chiến về công nghệ, nền tảng, nội dung và quyền kiểm soát. Chiến trường không ngừng di chuyển, nhưng bản chất chưa bao giờ thay đổi: ai nắm giữ lối vào, người đó định nghĩa tương lai.

Trong mắt các VC, dựa vào LLM và nhu cầu mới của con người đối với công cụ tìm kiếm trong thời đại AI, cuộc chiến trình duyệt lần thứ ba đang dần được khai màn.

Kiến trúc cũ của trình duyệt hiện đại

Khi nói về kiến trúc của trình duyệt, kiến trúc truyền thống cổ điển như hình dưới đây:

Khách hàng - Cổng vào phía trước

Tra cứu qua HTTPS gửi đến Google Front End gần nhất, hoàn thành giải mã TLS, lấy mẫu QoS và định tuyến địa lý. Nếu phát hiện lưu lượng bất thường (DDoS, tự động thu thập), có thể giới hạn lưu lượng hoặc thách thức tại tầng này.

Hiểu biết truy vấn

Phía trước cần hiểu ý nghĩa của từ mà người dùng nhập vào, có ba bước: Sửa lỗi chính tả bằng mạng nơ-ron, sửa "recpie" thành "recipe"; Mở rộng từ đồng nghĩa, mở rộng "how to fix bike" thành "repair bicycle". Phân tích ý định, xác định truy vấn là thông tin, điều hướng hay ý định giao dịch, và phân bổ yêu cầu Vertical.

Khôi phục ứng viên

Công nghệ truy vấn được sử dụng bởi một công cụ tìm kiếm nổi tiếng được gọi là: chỉ mục đảo ngược. Trong chỉ mục theo thứ tự, chúng ta có thể chỉ định một ID để truy cập vào tệp. Tuy nhiên, người dùng không thể biết nội dung mình muốn nằm ở số hiệu nào trong hàng trăm tỷ tệp, vì vậy họ đã sử dụng chỉ mục đảo ngược rất truyền thống, cho phép tìm kiếm các tệp chứa từ khóa tương ứng thông qua nội dung. Tiếp theo, chỉ mục vector được sử dụng để xử lý tìm kiếm ngữ nghĩa, tức là tìm kiếm nội dung có nghĩa tương tự với truy vấn. Nó chuyển đổi văn bản, hình ảnh và các nội dung khác thành các vector nhiều chiều (embedding) và tiến hành tìm kiếm dựa trên sự tương đồng giữa các vector này. Ví dụ, ngay cả khi người dùng tìm kiếm "cách làm bột pizza", công cụ tìm kiếm cũng có thể trả về kết quả liên quan đến "hướng dẫn làm bột pizza" vì chúng có ý nghĩa tương tự. Sau khi trải qua chỉ mục đảo ngược và chỉ mục vector, khoảng một trăm nghìn trang web sẽ được sàng lọc ban đầu.

Sắp xếp đa cấp

Hệ thống thường thông qua BM25, TF-IDF, điểm chất lượng trang và hàng nghìn đặc trưng nhẹ, lọc hàng trăm nghìn trang ứng cử viên xuống khoảng 1000 bài, tạo thành tập ứng cử viên ban đầu. Các hệ thống này được gọi chung là công cụ gợi ý. Nó phụ thuộc vào hàng triệu đặc trưng được tạo ra từ nhiều thực thể, bao gồm hành vi người dùng, thuộc tính trang, ý định truy vấn và tín hiệu ngữ cảnh. Ví dụ, nó sẽ tổng hợp lịch sử người dùng, phản hồi hành vi của những người dùng khác, ngữ nghĩa trang, ý nghĩa truy vấn, v.v., đồng thời cũng xem xét các yếu tố ngữ cảnh như thời gian (thời điểm trong ngày, ngày cụ thể trong tuần) và các sự kiện bên ngoài như tin tức thời sự.

Học sâu thực hiện phân loại chính

Trong giai đoạn tìm kiếm ban đầu, sử dụng các công nghệ như RankBrain và Neural Matching để hiểu ngữ nghĩa của truy vấn và lọc ra những kết quả liên quan ban đầu từ khối lượng tài liệu khổng lồ. RankBrain là một hệ thống học máy được giới thiệu vào năm 2015, nhằm mục đích hiểu rõ hơn ý nghĩa của truy vấn của người dùng, đặc biệt là những truy vấn xuất hiện lần đầu. Nó thông qua việc chuyển đổi truy vấn và tài liệu thành các biểu diễn vector, tính toán sự tương đồng giữa chúng, từ đó tìm ra những kết quả liên quan nhất. Ví dụ, với truy vấn "làm thế nào để làm bột pizza", ngay cả khi tài liệu không có...

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • 3
  • Chia sẻ
Bình luận
0/400
SignatureDeniedvip
· 10giờ trước
Trận chiến này không dễ dàng.
Xem bản gốcTrả lời0
GasFeeCriervip
· 10giờ trước
À à, ông Google cuối cùng cũng chết tiệt rồi sao?
Xem bản gốcTrả lời0
OnlyOnMainnetvip
· 10giờ trước
Còn đang dùng Google thì thật sự đã lỗi thời.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)