
# Giới thiệu
Nhiều chuyên gia công nghệ sẽ nói với bạn rằng trình duyệt AI là tương lai của công việc. Thực tế phức tạp hơn nhiều. Sau nhiều tuần thử nghiệm Comet của Perplexity cùng với Atlas của ChatGPT, tôi đã phát hiện ra một điều không thoải mái. Những công cụ này có thể giúp bạn tiết kiệm thời gian cho các nhiệm vụ nghiên cứu cụ thể, nhưng chúng lại không hiệu quả với bất kỳ tác vụ phức tạp nào. Đối với các nhà khoa học dữ liệu và nhà phân tích vốn đã bị choáng ngợp bởi nhiều tab đang mở, điều này rất quan trọng. Nhưng trước khi bạn chọn Chrome thay vì một trình duyệt AI, bạn cần hiểu rõ những công cụ này thực sự làm được gì và quan trọng hơn là chúng không thể làm được gì.
# Tìm hiểu về trình duyệt AI
Một trình duyệt AI nghe có vẻ là trình duyệt tốt nhất cho đến khi bạn thực sự sử dụng nó. Về cơ bản, nó là một trình duyệt web, tương tự như Chrome hoặc Safari, nhưng có một trợ lý trí tuệ nhân tạo (AI) được tích hợp vào thanh bên. Trợ lý này có thể đọc bất kỳ trang web nào bạn đang xem, trả lời các câu hỏi về trang đó, tóm tắt bài viết, hoặc thậm chí cố gắng tự động hóa các tác vụ — ví dụ: điền biểu mẫu hoặc so sánh giá giữa các trang web.
Comet của Perplexity khác với trình duyệt truyền thống ở chỗ nó hiểu ngữ cảnh trên nhiều tab cùng lúc. Nếu bạn mở đồng thời các bài nghiên cứu, bảng điều khiển dữ liệu và báo cáo đối thủ cạnh tranh, trợ lý của Comet có thể đọc tất cả chúng cùng nhau và tổng hợp những gì nó tìm thấy. Trình duyệt này được xây dựng trên Chromium, cùng nền tảng với Google Chrome, vì vậy nó hỗ trợ các tiện ích mở rộng mà bạn đã sử dụng.

Ảnh của tác giả
Điểm mấu chốt là tự động hóa. Trợ lý Comet nằm trong một bảng điều khiển phụ và có thể thực hiện các thao tác trên nhiều tab. Thay vì sao chép dữ liệu thủ công từ năm trang web vào một bảng tính, bạn chỉ cần yêu cầu Comet làm điều đó cho bạn.
# Áp dụng Comet vào quy trình làm việc của nhà khoa học dữ liệu
Để hiểu liệu trình duyệt AI có quan trọng đối với quy trình làm việc của bạn hay không, hãy cùng tôi xem điều gì đã thực sự xảy ra khi một chuyên gia khoa học dữ liệu dành một ngày với Comet.
// Sử dụng Comet cho nghiên cứu thị trường
Nếu một nhà nghiên cứu cần dữ liệu cạnh tranh về các nền tảng học máy, thông thường, việc này bao gồm mở 10 đến 15 tab và trích xuất thủ công giá cả, tính năng và chỉ số hiệu suất vào một bảng tính.
Với Comet, nhà nghiên cứu đã tạo một không gian làm việc (Comet gọi là Space) và mở các tab cho sáu nền tảng cạnh tranh. Sau đó, họ hỏi trợ lý:
"Tạo một bảng so sánh với tên nền tảng, giá mỗi tháng, các tính năng miễn phí và ngày cập nhật mới nhất."
Trợ lý sẽ đọc đồng thời cả sáu trang web và cung cấp một bảng được định dạng đúng trong ba phút. Tác vụ này nếu làm thủ công sẽ mất khoảng 45 phút.
// Sử dụng Comet để tổng hợp nghiên cứu
Tiếp theo là phân tích ba bài báo học thuật về thuật toán phát hiện bất thường. Giả sử nhiệm vụ là trích xuất các khái niệm toán học chính, so sánh các phương pháp luận và xác định cách tiếp cận nào có thể hoạt động tốt nhất cho bộ dữ liệu của họ.
Với trình duyệt truyền thống, điều này có nghĩa là mở từng tệp PDF, đọc, ghi chú, chuyển đổi giữa các tab và so sánh thủ công. Họ đã hỏi Comet:
"Tóm tắt sự khác biệt toán học cốt lõi giữa ba bài báo này và xếp hạng chúng theo mức độ phù hợp với dữ liệu tài chính thời gian thực."
Trợ lý đã tổng hợp tất cả ba bài báo đang mở và cung cấp một bản tóm tắt được xếp hạng với các trích dẫn trực tiếp từ mỗi nguồn. Trợ lý thậm chí còn hiểu ngữ cảnh từ các câu hỏi trước đó của họ, vì vậy nó đã ưu tiên các ứng dụng dữ liệu tài chính mà không cần phải hỏi lại.
Thời gian thủ công thường mất 2 giờ. Thời gian thực tế: 18 phút.
// Xác định giới hạn của Comet trong tổng hợp nghiên cứu
Đây là lúc Comet gặp khó khăn. Họ cần trợ lý tự động trích xuất dữ liệu từ một bảng điều khiển nặng JavaScript, xác thực nó với cơ sở dữ liệu SQL và gắn cờ các mục không khớp. Đây là lúc các trình duyệt AI dường như không còn hữu ích nữa.
Comet không thể tương tác đúng cách với bảng điều khiển động. Nó đã cố gắng nhấp vào các nút, nhưng trang không phản hồi như mong đợi. Trợ lý đã bị nhầm lẫn bởi các yếu tố tương tác và từ bỏ. Nhà nghiên cứu của chúng tôi phải tự làm thủ công.
Đây là sự thật. Các trình duyệt AI vượt trội trong việc đọc và tổng hợp thông tin tĩnh. Chúng gặp khó khăn với các tương tác phức tạp, đa bước trong các ứng dụng web hiện đại.
# Comet so với ChatGPT Atlas: Nên chọn trình duyệt nào?
Nếu bạn đã theo dõi tin tức AI, bạn biết rằng OpenAI đã phát hành ChatGPT Atlas, trình duyệt AI của riêng họ. Nó hoạt động nhanh hơn trong một số tác vụ nhưng có những hạn chế khác nhau.
ChatGPT Atlas mạnh mẽ hơn trong tự động hóa. Trong các bài kiểm tra tốc độ, nó đã hoàn thành một bản tóm tắt nghiên cứu trong 47 giây so với 58 giây của Comet. Đối với việc trích xuất CSV, Atlas nhanh hơn đáng kể, ở mức 36 giây, so với 52 giây của Comet.
Tuy nhiên, Atlas có một điểm yếu chí mạng: hiện tại nó chỉ hoạt động trên macOS. Nếu nhóm của bạn sử dụng Windows hoặc Linux, bạn chưa thể sử dụng nó.
Quan trọng hơn, Atlas bị khóa trong hệ sinh thái của OpenAI. Nếu bạn muốn sử dụng nó với các công cụ hoặc quy trình làm việc khác, bạn sẽ không gặp may. Comet tích hợp với Perplexity Pro, cho phép nó hoạt động cùng với quy trình nghiên cứu AI hiện có của bạn.
Đối với các nhà khoa học dữ liệu, lựa chọn phụ thuộc vào tác vụ chính của bạn. Nếu bạn đang tổng hợp thông tin từ nhiều nguồn, Comet tốt hơn vì nó duy trì nhận thức ngữ cảnh mạnh mẽ hơn trên các tab. Nếu bạn đang tự động hóa các tác vụ điền biểu mẫu lặp đi lặp lại hoặc trích xuất dữ liệu web, Atlas có thể giúp bạn tiết kiệm thêm một chút thời gian, nhưng chỉ khi bạn sử dụng máy Mac.
Sự khác biệt về hiệu suất không đủ lớn để làm cho một trong hai trình duyệt trở nên thiết yếu. Cả hai đều có cùng một hạn chế cơ bản: chúng gặp khó khăn với các trang web phức tạp, tương tác.
| Chỉ số | Perplexity Comet | ChatGPT Atlas | Brave Leo |
|---|---|---|---|
| Tóm tắt nghiên cứu (giây) | 58 | 47 | 62 |
| Trích xuất CSV (giây) | 52 | 36 | 48 |
| So sánh đa bước (giây) | 185 | 132 | 161 |
| Mức độ hữu ích tổng thể | Cao | Rất cao | Cao |
# Giải thích lý do trình duyệt AI có hiệu suất không đồng đều
Việc hiểu công nghệ cơ bản giúp giải thích tại sao các trình duyệt AI lại thể hiện hiệu suất không đồng đều như vậy.
Khi bạn yêu cầu một trình duyệt AI tóm tắt một trang web, nó nhận toàn bộ nội dung văn bản và xử lý bằng mô hình ngôn ngữ. Đây về cơ bản là những gì ChatGPT làm, nhưng với một trang web duy nhất thay vì một lời nhắc chung. Đối với tác vụ này, AI thực sự mạnh.
Nhưng khi một trang web sử dụng JavaScript để tải nội dung động, mọi thứ đều bị phá vỡ. Trình duyệt có thể xem trang được hiển thị, nhưng AI không nhất thiết phải xác định được các yếu tố nào là tương tác, dữ liệu nằm ở đâu, hoặc cách kích hoạt nội dung động một cách chính xác. Khi Comet cố gắng sử dụng bảng điều khiển JavaScript trong thử nghiệm buổi chiều của chúng tôi, về cơ bản nó đang cố gắng giải một câu đố mà nó không được thiết kế cho.
Đây không phải là một lỗi cụ thể của Comet hay Atlas. Đây là một hạn chế cơ bản về cách hoạt động của các ứng dụng web hiện đại. Cho đến khi các hệ thống AI có thể giải thích đáng tin cậy các giao diện tương tác, phức tạp trong thời gian thực, các trình duyệt AI sẽ vẫn hữu ích hơn cho việc nghiên cứu và đọc hơn là tự động hóa.
# Giải quyết vấn đề quyền riêng tư và bảo mật của trình duyệt AI
Đây là lúc các công ty trình duyệt AI trở nên dè dặt. Để hữu ích, trợ lý trình duyệt AI yêu cầu quyền đọc email của bạn, xem lịch, truy cập danh bạ và tương tác với tài khoản của bạn. Perplexity và OpenAI cần quyền truy cập rộng rãi để thực sự thực hiện các lời hứa tự động hóa.
Quyền truy cập đó tạo ra cơ hội tấn công. Các nhà nghiên cứu an ninh mạng đã xác định một loại tấn công được gọi là tấn công tiêm nhiễm lời nhắc (prompt injection attacks) như một rủi ro hệ thống trên tất cả các trình duyệt AI. Đây là cách nó hoạt động: một trang web độc hại ẩn các chỉ dẫn trong mã trang của nó để lừa AI thực hiện các hành động mà nó không nên thực hiện. Kẻ tấn công có thể thao túng Comet để tiết lộ email của bạn hoặc thực hiện các giao dịch mua trái phép.
Hiện tại không có biện pháp phòng thủ hoàn chỉnh nào chống lại việc tiêm nhiễm lời nhắc. Đây là một vấn đề mới nổi mà toàn bộ ngành công nghiệp đang phải vật lộn.
Đối với các nhà khoa học dữ liệu làm việc với dữ liệu nghiên cứu nhạy cảm, điều này đáng được cân nhắc trước khi cấp cho trình duyệt của bạn quyền truy cập rộng rãi như vậy. Nhiều tổ chức có yêu cầu tuân thủ nghiêm ngặt (các công ty luật, tổ chức tài chính, công ty chăm sóc sức khỏe) sẽ không cho phép các công cụ này trên mạng nội bộ vì rủi ro này.
# Những lợi ích năng suất thực tế và giới hạn thực tế
Đây là những gì thử nghiệm trung thực thực sự cho thấy.
Các tác vụ mà trình duyệt AI mang lại hiệu quả tiết kiệm thời gian đáng kể bao gồm:
- Tóm tắt các bài báo hoặc báo cáo dài (tiết kiệm 15 đến 30 phút mỗi tài liệu)
- So sánh thông tin giữa nhiều trang web tĩnh (tiết kiệm 30 đến 60 phút)
- Trích xuất thông tin chính từ các tệp PDF (tiết kiệm 20 đến 45 phút)
- Tạo bảng nghiên cứu từ nhiều nguồn (tiết kiệm 30 đến 60 phút)
Các tác vụ mà trình duyệt AI hoạt động kém hiệu quả hoặc thất bại:
- Làm việc với các bảng điều khiển nặng JavaScript hoặc API tương tác
- Thực hiện các tương tác đa bước, phức tạp trên các trang web khác nhau đòi hỏi ra quyết định động
- Xử lý các tác vụ liên quan đến API nhạy cảm của công ty hoặc mạng nội bộ
Một nhà nghiên cứu trên Reddit đã thử nghiệm Comet một cách chuyên sâu đã báo cáo rằng nó thực sự tăng gấp đôi năng suất của họ trong việc tổng hợp nghiên cứu, tiết kiệm cho họ khoảng một giờ mỗi ngày. Nhưng điều này dành cho những người thực hiện công việc chuyên sâu về thông tin. Đối với việc duyệt web thông thường hoặc làm việc với các ứng dụng phức tạp, việc tiết kiệm thời gian sẽ biến mất.
CEO của Perplexity tuyên bố rằng Comet có thể tăng năng suất lên 20 phần trăm, có khả năng bổ sung hàng nghìn tỷ vào GDP. Đây là lời nói của giới đầu tư mạo hiểm, không phải thực tế kỹ thuật. Việc sử dụng trong thế giới thực cho thấy mức tăng khiêm tốn hơn — có thể tiết kiệm 5 đến 10 phần trăm thời gian cho các quy trình làm việc cụ thể, không tiết kiệm phần trăm nào cho các quy trình khác.
# Xác định xem bạn có nên chuyển sang trình duyệt AI hay không
Câu trả lời trung thực là, điều đó phụ thuộc vào quy trình làm việc thực tế của bạn.
Nếu công việc của bạn chủ yếu liên quan đến việc đọc, phân tích và tổng hợp thông tin từ nhiều nguồn trực tuyến, một trình duyệt AI sẽ giúp bạn tiết kiệm đáng kể thời gian. Các nhà khoa học dữ liệu thực hiện đánh giá tài liệu, phân tích cạnh tranh hoặc tổng hợp nghiên cứu thuộc loại này.
Nếu công việc của bạn liên quan đến việc tương tác với các ứng dụng web, điền biểu mẫu hoặc làm việc với các công cụ nặng JavaScript, tốt nhất bạn nên gắn bó với trình duyệt hiện tại của mình. Trình duyệt AI sẽ không hỗ trợ bạn và thậm chí có thể làm bạn chậm lại.
Chi phí cũng quan trọng. Comet yêu cầu gói đăng ký Perplexity Pro Max, có giá khoảng 20 USD mỗi tháng. Nếu bạn tiết kiệm được ba mươi phút mỗi ngày cho công việc nghiên cứu, thì khoản đó gần như tự bù đắp. Nếu bạn tiết kiệm được năm phút mỗi tuần, thì không.
ChatGPT Atlas hiện đang miễn phí trong giai đoạn thử nghiệm, nhưng có lẽ cuối cùng nó sẽ có giá. Đối với người dùng macOS thực hiện công việc nghiên cứu chuyên sâu, nó có thể trở nên đáng giá. Đối với những người khác, phương trình ít rõ ràng hơn.
# Cân nhắc quyền riêng tư, bảo mật và sự thật không mấy thoải mái
Trước khi sử dụng bất kỳ trình duyệt AI nào, bạn cần hiểu rõ những gì bạn đang đánh đổi.
Các trình duyệt AI yêu cầu gửi nội dung trang web đến các máy chủ đám mây để xử lý. Điều này có nghĩa là dữ liệu bạn đang xem sẽ đi qua các hệ thống bên ngoài trước khi được tóm tắt hoặc phân tích. Đối với hầu hết các công việc nghiên cứu, điều này không sao. Đối với thông tin nhạy cảm hoặc độc quyền, đây là một vấn đề.
Một số tổ chức xử lý vấn đề này bằng cách chỉ sử dụng trình duyệt AI cho nghiên cứu công khai và giữ công việc độc quyền trong các trình duyệt truyền thống. Điều này là hợp lý, nhưng nó cũng làm mất đi một phần mục đích của việc có một trình duyệt AI.
Rủi ro tấn công tiêm nhiễm lời nhắc là có thật, nhưng không gây thảm họa ngay lập tức nếu bạn sử dụng ý thức chung. Không sử dụng các tác nhân trình duyệt AI để tương tác với các trang web có rủi ro cao, ví dụ: cổng ngân hàng hoặc hệ thống công ty nhạy cảm. Hãy sử dụng chúng cho nghiên cứu, phân tích và tổng hợp thông tin, nơi hậu quả của một lỗi tương đối thấp.
# Kết luận
Tóm lại, các trình duyệt AI sẽ không biến mất, nhưng chúng sẽ không thay thế các trình duyệt truyền thống trong thời gian tới. Công nghệ sẽ cải thiện. Các vấn đề về hiệu suất với các ứng dụng JavaScript có thể sẽ được cải thiện. Các tiêu chuẩn bảo mật mới cuối cùng sẽ giải quyết các cuộc tấn công tiêm nhiễm lời nhắc.
Điều quan trọng bây giờ là khớp công cụ với nhiệm vụ. Đối với các nhà khoa học dữ liệu, trường hợp sử dụng thực tế tốt nhất chính là những gì chúng tôi đã thử nghiệm: tổng hợp thông tin nghiên cứu từ nhiều nguồn. Đây là nơi các trình duyệt AI thực sự mang lại lợi ích năng suất có thể đo lường được mà không ảnh hưởng đến bảo mật hoặc đối phó với sự phức tạp quá mức.
Nếu bạn dành hàng giờ mỗi tuần để đọc, so sánh và tổng hợp thông tin, hãy thử Comet hoặc Atlas trong một tuần. Việc tiết kiệm thời gian thôi cũng có thể biện minh cho chi phí. Nếu công việc của bạn chủ yếu tập trung vào ứng dụng hoặc liên quan đến các tác vụ tương tác phức tạp, hãy tiết kiệm tiền và gắn bó với những gì bạn biết là hiệu quả.
Shittu Olumide là một kỹ sư phần mềm và nhà văn kỹ thuật đam mê tận dụng các công nghệ tiên tiến để tạo ra những câu chuyện hấp dẫn, với con mắt tinh tường về chi tiết và khả năng đơn giản hóa các khái niệm phức tạp. Bạn cũng có thể tìm Shittu trên Twitter.
"