Chuyển đến nội dung chính

Gemini Spark: Tác nhân AI luôn hoạt động của Google, giải thích

Spark chạy 24/7 trên Google Cloud và xâu chuỗi tác vụ giữa các ứng dụng Workspace. Tìm hiểu chức năng, so sánh với Claude và ChatGPT, và những điều cần lưu ý.
Đã cập nhật 20 thg 5, 2026  · 11 phút đọc

Tại Google I/O 2026, Google công bố Gemini Spark, một tác nhân AI cá nhân tiếp tục chạy trên hạ tầng đám mây của Google ngay cả khi bạn đóng laptop hoặc khóa điện thoại. Nó theo dõi Gmail, quản lý Calendar, soạn thảo tài liệu trong Google Docs và, trong tương lai gần, sẽ mua hàng thay bạn.

Thông báo này xuất hiện giữa giai đoạn cạnh tranh gay gắt với OpenAI, Anthropic và Microsoft về cách tích hợp tác nhân. Canh bạc của Google với Spark khác với Claude Cowork hay ChatGPT Agent: thực thi liên tục trên đám mây kết hợp tích hợp sâu với chính các dịch vụ tiêu dùng của họ, từ Gmail đến Google Slides.

Trong bài viết này, tôi sẽ trình bày Gemini Spark thực sự làm gì, những đánh đổi về quyền riêng tư mà chính Google lưu ý, cách nó so sánh với các tác nhân cạnh tranh, và liệu mức giá AI Ultra 100 USD/tháng có hợp lý cho một sản phẩm beta hay không. Bạn cũng có thể đọc bài viết của chúng tôi về Gemini 3.5 Flash, mô hình vận hành Spark, và bài viết trước đó về Gemini Personal Intelligence để có bối cảnh rộng hơn về chiến lược cá nhân hóa của Google.

Gemini Spark là gì?

Gemini Spark là một tác nhân AI cá nhân hoạt động 24/7, chạy trên Gemini 3.5 Flash và bộ khung Antigravity của Google. Không giống một chatbot bạn mở rồi đóng, Spark chạy trên các máy ảo chuyên dụng trên Google Cloud và tiếp tục làm việc ở chế độ nền ngay cả khi bạn đóng laptop hoặc khóa điện thoại.

Nó kết nối với Gmail, Docs, Slides và các công cụ Workspace khác thông qua các tích hợp API có cấu trúc thay vì đọc màn hình, giúp nó dự đoán được hơn so với các tác nhân điều hướng máy tính theo từng điểm ảnh.

Tích hợp Gemini Spark

Các tác vụ lặp lại và kích hoạt

Spark có thể xử lý các tác vụ lặp lại theo lịch hoặc kích hoạt khi đáp ứng điều kiện. Một vài ví dụ về mức độ phức tạp mà nó hướng tới:

  • Yêu cầu Spark lấy số giờ đã chấm trong Google Sheet, tạo hóa đơn trong Docs và email cho khách hàng vào ngày đầu mỗi tháng
  • Để nó phân tích sao kê thẻ tín dụng nhằm tự động gắn cờ các khoản phí đăng ký ẩn

Kỹ năng có thể dạy

Bạn có thể dạy Spark các hành vi dùng lại được bằng cách mô tả điều bạn muốn bằng ngôn ngữ tự nhiên. Ví dụ, nếu bạn thường viết email tiếp cận, bạn có thể để Spark phân tích 50 thư đã gửi gần nhất, chắt lọc phong cách viết của bạn thành một kỹ năng "viết hộ", và áp dụng mỗi khi bạn nhờ nó soạn thảo. Kỹ năng tồn tại qua nhiều phiên, nên bạn xây dựng một lần và Spark sẽ áp dụng về sau.

Quy trình đầu-cuối

Spark có thể xâu chuỗi nhiều bước trên các ứng dụng. Nếu bạn là trưởng nhóm vừa kết thúc cuộc họp lập kế hoạch, bạn có thể nhờ Spark lấy các hạng mục hành động từ đoạn chat cuộc họp trong Gmail, tạo bảng theo dõi dự án trong Sheets với người phụ trách và hạn chót, soạn email khởi động gửi cho đội ngũ, và lên lịch nhắc nhở theo dõi trong Calendar — tất cả chỉ từ một lời nhắc.

CEO Google Sundar Pichai mô tả tại bài phát biểu I/O rằng đây là một tác nhân không bao giờ ngừng làm việc vì "bạn không cần phải mở laptop để đảm bảo nó đang chạy."

Tích hợp bên thứ ba qua MCP

Các kết nối MCP mới ra mắt song hành với Spark, với nhiều đối tác đang tích hợp. Khi ra mắt, các ứng dụng bên thứ ba được hỗ trợ gồm:

  • Canva
  • OpenTable
  • Instacart

Trong vài tuần tới, Spark sẽ dùng các kết nối đó để thực hiện hành động bên trong ứng dụng của bên thứ ba, không chỉ các dịch vụ của Google. Google cũng có một số tính năng khác trong lộ trình:

  • Khả năng nhắn tin và email trực tiếp cho Spark
  • Các tác nhân phụ tùy chỉnh bạn có thể tự tạo
  • Điều khiển trình duyệt cục bộ từ ứng dụng desktop

Gemini Spark trên macOS

Google sẽ đưa Spark lên ứng dụng desktop Gemini cho macOS vào mùa hè này, cho phép nó hỗ trợ các tác vụ liên quan đến tệp cục bộ và tự động hóa quy trình trên máy tính của bạn. Ứng dụng cũng bổ sung tính năng giọng nói mới chuyển lời nói tự do thành bản nháp chính xác, sử dụng ngữ cảnh trên màn hình để nắm bắt ý định. Ứng dụng macOS có thể tải xuống ngay hôm nay, với Spark và các tính năng giọng nói sẽ phát hành vào cuối mùa hè.

Những điều cần lưu ý về quyền riêng tư

Spark là một tác nhân liên tục kết nối với Gmail, Calendar, Docs của bạn và các dịch vụ bên thứ ba như OpenTable và Instacart. Để làm việc, nó cần chia sẻ thông tin liên quan với các dịch vụ đó. Nếu bạn yêu cầu đặt chỗ ăn tối, nó sẽ chuyển tên và sở thích của bạn. Đó không phải chi phí ẩn; đó là cách sản phẩm vận hành.

Google khá minh bạch về điều này. Trang sản phẩm chính thức của Spark khuyên người dùng "kiểm tra phản hồi" và "giám sát chặt chẽ, can thiệp khi cần." Google cũng nói Spark "được thiết kế để hỏi bạn trước" khi thực hiện các hành động rủi ro cao như chi tiền hoặc gửi email. Quyền truy cập mặc định là tắt; bạn chọn ứng dụng nào nó được kết nối, và có thể tắt hoàn toàn.

Điểm rộng hơn đáng lưu ý là một tác nhân đám mây 24/7 có quyền truy cập hộp thư và lịch của bạn có mô hình tin cậy khác với chatbot bạn mở, hỏi một câu, rồi đóng. Bạn đang cấp quyền truy cập thường trực, không phải quyền theo từng lần. Điều đó không khiến nó nguy hiểm, nhưng có nghĩa là các lựa chọn cài đặt quan trọng hơn bình thường.

Cách tiếp cận hợp lý là bắt đầu với danh sách trắng thận trọng. Kết nối một hai dịch vụ nơi bạn thực sự muốn Spark hành động, quan sát cách nó vận hành, rồi mở rộng dần. Không có lý do gì để cấp quyền cho mọi thứ ngay ngày đầu, và giao diện của chính Google giúp bạn dễ dàng chọn lọc.

Có gì khác thay đổi trong ứng dụng Gemini?

Bản cập nhật I/O 2026 ảnh hưởng đến nhiều phần khác của ứng dụng Gemini ngoài Spark. Google cũng phát hành giao diện được thiết kế lại gọi là Neural Expressive, một mô hình tạo video mới tên là Gemini Omni, và bản tin buổi sáng chủ động Daily Brief. Dưới đây là chức năng của từng cái.

Daily Brief: tóm tắt buổi sáng chủ động

Daily Brief là một tác nhân riêng chạy qua đêm và gửi bản tóm tắt buổi sáng được cá nhân hóa. Nó kéo email và sự kiện trong lịch, suy luận dựa trên mục tiêu của bạn, rồi sắp xếp chúng thành một bản tóm tắt dễ lướt kèm các bước gợi ý tiếp theo.

Nó được xây dựng trên thử nghiệm CC của Google Labs. Bạn có thể điều chỉnh theo thời gian với phản hồi thích/không thích. Daily Brief đang được triển khai hôm nay cho người đăng ký Google AI Plus, Pro và Ultra tại Mỹ.

Neural Expressive: giao diện được thiết kế lại

Google đã thiết kế lại toàn bộ giao diện ứng dụng Gemini theo ngôn ngữ thiết kế mới gọi là Neural Expressive, với hoạt ảnh, kiểu chữ cập nhật và micro hỗ trợ lời nói dài, không bị ngắt quãng. Thay đổi thực tế hơn là Gemini nay tạo phản hồi đa định dạng (như dòng thời gian, đồ họa tương tác, video thuyết minh) thay vì mặc định văn bản thuần, giúp câu trả lời dễ quét và hành động hơn.

Neural Expressive đang được triển khai toàn cầu hôm nay trên web, Android và iOS.

Gemini Omni: tạo video từ mọi đầu vào

Gemini Omni là mô hình mới chấp nhận mọi kết hợp văn bản, hình ảnh và video làm đầu vào và tạo video đầu ra. Bạn có thể áp dụng hiệu ứng thu phóng điện ảnh, thay nền, hoặc tạo avatar AI tùy chỉnh thông qua hội thoại. Chúng tôi đã đề cập chi tiết Omni trong bài viết Gemini Omni, bao gồm các thử nghiệm thực tế về mô phỏng vật lý và khả năng chuyển phong cách.

Omni đang được triển khai hôm nay cho người đăng ký Google AI Plus, Pro và Ultra trên toàn thế giới.

Tại sao điều này quan trọng?

Chuyển dịch từ "trợ lý trả lời câu hỏi" sang "tác nhân hoàn thành tác vụ" là hướng đi của mọi nền tảng AI lớn hiện nay. Tác nhân ChatGPT của OpenAI hoạt động chủ yếu qua trình duyệt. Claude Cowork của Anthropic làm việc trực tiếp trên máy tính người dùng. Copilot Cowork của Microsoft dựa trên dữ liệu Office 365. Apple đang chuẩn bị Siri phiên bản mới cho WWDC 2026, một phần được vận hành bởi chính các mô hình Gemini của Google thông qua thỏa thuận nhiều năm.

Điểm khác của Spark so với các tác nhân cạnh tranh là nó chạy trên máy chủ của Google suốt ngày đêm và kết nối trực tiếp với các ứng dụng của Google. Vì kết nối với Gmail, Docs và Calendar qua API chuẩn thay vì cố đọc nội dung trên màn hình, nó đáng tin cậy hơn, nhưng cũng hạn chế hơn. Hiện tại, Spark chỉ làm việc với các dịch vụ đã được kết nối, nên nó hữu ích nhất nếu bạn vốn dùng công cụ của Google cho phần lớn công việc.

Nếu bạn là nhà khoa học dữ liệu hoặc kỹ sư ML, hạ tầng phía sau Spark cũng đáng chú ý riêng. Spark chạy trên bộ khung Antigravity của Google, có thể vận hành nhiều tác nhân phụ song song và xử lý các nhiệm vụ kéo dài. Spark là sản phẩm tiêu dùng xây dựng trên đó, nhưng cùng kiến trúc nền tảng này có sẵn qua Gemini API. 

Làm sao để truy cập Gemini Spark?

Để truy cập Spark cần đăng ký Google AI Ultra. Google tái cấu trúc các gói đăng ký cùng với thông báo tại I/O, hiện tình hình như sau:

  • AI Ultra với 100 USD/tháng: Giới hạn sử dụng cao gấp 5 lần so với gói Pro, 20TB lưu trữ đám mây, YouTube Premium, quyền truy cập ưu tiên Antigravity và Gemini Spark (chỉ Mỹ, beta)
  • AI Ultra với 200 USD/tháng: Giới hạn sử dụng cao gấp 20 lần Pro, quyền truy cập Spark tương tự, cộng Project Genie và đầy đủ bộ khả năng. Mức này giảm từ 250 USD/tháng.
  • AI Plus và Pro: Truy cập Daily Brief và Gemini Omni, nhưng không có Spark

Spark sẽ được phát hành cho nhóm thử nghiệm đáng tin cậy trong tuần này. Bản beta rộng hơn cho người đăng ký Google AI Ultra tại Mỹ dự kiến vào tuần kế tiếp. Không có cách tự đăng ký vào nhóm thử nghiệm đáng tin cậy; bạn sẽ cần chờ đợt phát hành beta.

Khi đã có quyền truy cập, thiết lập như sau:

  1. Mở ứng dụng Gemini và điều hướng đến cài đặt Spark
  2. Chọn các ứng dụng Spark có thể kết nối (Gmail, Docs, Slides và các đối tác MCP mới, gồm Canva, OpenTable và Instacart)
  3. Đặt tùy chọn khi nào Spark cần hỏi trước khi hành động so với tự động thực hiện
  4. Giao nhiệm vụ bằng cách mô tả bằng ngôn ngữ tự nhiên; Spark xử lý thực thi ở nền

Ứng dụng desktop macOS có thể tải xuống ngay hôm nay tại gemini.google/mac. Hỗ trợ Spark cho ứng dụng desktop, cùng các tính năng giọng nói mới chuyển lời nói tự do thành bản nháp chính xác, dự kiến vào cuối mùa hè này.

Mức giá 100 USD/tháng có xứng đáng?

Google, Anthropic và OpenAI giờ đều có gói 100 USD/tháng. Dưới đây là so sánh, tập trung vào khả năng tác nhân:

  Google AI Ultra (100 USD/tháng) Claude Max (100 USD/tháng) ChatGPT Pro (100 USD/tháng)
Tác nhân luôn hoạt động Gemini Spark (24/7, dựa trên đám mây, chạy khi thiết bị tắt) Không có tác nhân liên tục Không có tác nhân liên tục
Lập trình mang tính tác nhân Antigravity (truy cập ưu tiên, dùng gấp 5 lần so với Pro) Claude Code (dựa trên terminal, dùng gấp 5 lần so với Pro) Codex (sandbox đám mây, dùng gấp 5 lần so với Plus)
Tác nhân desktop Spark trên macOS (ra mắt mùa hè 2026) Claude Cowork (nhận biết màn hình, tác vụ nhiều bước) ChatGPT Agent (nghiên cứu chuyên sâu qua trình duyệt)
Tích hợp bên thứ ba MCP (Canva, OpenTable, Instacart khi ra mắt) MCP + tín dụng Agent SDK cho tác nhân ngoài Hơn 1.000 GPT và plugin tùy chỉnh
Quyền truy cập mô hình Gemini 3.5 Flash Claude Opus 4.7, Sonnet 4.6 GPT-5.5 Pro, GPT-5.3-Codex
Giới hạn sử dụng Gấp 5 lần Pro Gấp 5 lần Pro Gấp 5 lần Plus
Lưu trữ đám mây 20TB (Google One) Không Không
Phần bổ sung Bao gồm YouTube Premium Không Tạo ảnh không giới hạn
Khả dụng Spark: chỉ Mỹ (beta) Khả dụng rộng rãi Khả dụng rộng rãi

Gói 100 USD của Google là gói duy nhất có tác nhân đám mây liên tục, điều này thực sự tạo khác biệt so với Anthropic và OpenAI. Ngoài ra, nó còn gồm một số ưu đãi đặc trưng của Google, như 20TB lưu trữ và YouTube Premium đi kèm. Trên lý thuyết, đây là gói nhiều tính năng nhất. Nhưng Spark là beta chỉ ở Mỹ với các cảnh báo mang tính thử nghiệm, trong khi Claude Max và ChatGPT Pro khả dụng rộng rãi với bộ công cụ tác nhân đã trưởng thành.

Nếu bạn đã gắn bó sâu với hệ sinh thái Google (Gmail, Docs, Sheets là công cụ hằng ngày), gói 100 USD có lý nhất. Tự động hóa luôn bật cho Workspace của Spark là điều hai đối thủ kia đơn giản là chưa có, và 20TB lưu trữ cùng YouTube Premium càng khiến đề nghị hấp dẫn.

Nếu bạn là nhà phát triển quan tâm đến Antigravity và hạn mức Gemini API cao hơn, giá trị nằm ở quyền truy cập hạ tầng, không phải bản thân Spark.

Nếu bạn chủ yếu muốn một tác nhân AI mạnh ngay hôm nay, Claude Max và ChatGPT Pro là lựa chọn an toàn hơn. Chúng khả dụng rộng rãi, không ở trạng thái beta, và công cụ tác nhân chín muồi hơn. Thực thi liên tục của Spark là điểm khác biệt thực sự, nhưng khó khuyến nghị trả 100 USD/tháng cho một tính năng vẫn chỉ ở Mỹ và mang tính thử nghiệm.

Kết luận

Gemini Spark là câu trả lời trực diện nhất của Google cho câu hỏi trợ lý AI thực sự nên làm gì. Mô hình thực thi liên tục trên đám mây là khác biệt kiến trúc thực sự so với chatbot, và độ sâu tích hợp với Workspace là điều khó đối thủ sao chép nhanh.

Câu hỏi lớn hơn với Spark không hẳn về riêng Google, mà là về ý nghĩa của việc trao cho bất kỳ tác nhân AI nào quyền truy cập thường trực vào hộp thư, lịch và sau này là phương thức thanh toán của bạn. Chúng ta vẫn đang ở giai đoạn đầu tìm ra mức độ tự chủ mặc định của các công cụ này và mức độ người dùng cần quản lý chủ động. Cách tiếp cận của Google với việc mặc định tắt quyền và cho phép bạn lập danh sách trắng dịch vụ là một điểm khởi đầu hợp lý, nhưng các chuẩn mực quanh tác nhân luôn bật đang được định hình theo thời gian thực trên toàn ngành.

Nếu bạn muốn khám phá những gì có thể làm với Gemini trong các ứng dụng Workspace của Google như Gmail, Docs và Drive, tôi khuyến nghị khóa học Practical AI with Google Gemini and NotebookLM. Để tìm hiểu các khái niệm đằng sau AI mang tính tác nhân, hãy đăng ký lộ trình kỹ năng AI Agent Fundamentals.

Câu hỏi thường gặp về Gemini Spark

Gemini Spark có khả dụng ngoài Mỹ không?

Chưa. Spark hiện là bản beta chỉ dành cho Mỹ, giới hạn cho người đăng ký Google AI Ultra ở mức 100 USD/tháng. Google chưa công bố mốc thời gian triển khai quốc tế. Nếu bạn ngoài Mỹ, bạn vẫn có thể truy cập các tính năng I/O 2026 khác như Daily Brief và Gemini Omni ở các gói thấp hơn.

Gemini Spark khác gì so với chatbot thông thường?

Một chatbot phản hồi khi bạn mở và dừng khi bạn đóng. Spark chạy liên tục trên máy chủ đám mây của Google, thực thi tác vụ ở nền ngay cả khi thiết bị của bạn tắt. Nó có thể theo dõi hộp thư, chạy quy trình theo lịch và hành động trên Google Workspace mà không cần bạn hiện diện.

Gemini Spark có thể mua hàng mà không cần phép của tôi không?

Google nói Spark "được thiết kế để hỏi bạn trước" với các hành động rủi ro cao như chi tiền. Quyền truy cập mặc định là tắt, và bạn kiểm soát ứng dụng nào Spark có thể truy cập. Dẫu vậy, sản phẩm vẫn đang ở giai đoạn beta, nên đáng để bắt đầu với bộ quyền hạn chế và mở rộng khi bạn thấy rõ cách nó vận hành.

Gemini Spark có hoạt động với ứng dụng ngoài Google Workspace không?

Có, thông qua các tích hợp MCP (Model Context Protocol). Khi ra mắt, Spark hỗ trợ Canva, OpenTable và Instacart, với nhiều đối tác bên thứ ba sẽ được bổ sung. Tuy nhiên, phạm vi ứng dụng được hỗ trợ vẫn còn hạn chế so với hệ sinh thái plugin của ChatGPT hoặc tích hợp MCP của Claude.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom là một nhà khoa học dữ liệu và giảng viên kỹ thuật. Anh viết và quản lý các bài hướng dẫn và bài blog về khoa học dữ liệu của DataCamp. Trước đây, Tom làm việc trong lĩnh vực khoa học dữ liệu tại Deutsche Telekom.

Chủ đề

Học AI với DataCamp

Tracks

Cơ bản về Trợ lý Trí tuệ Nhân tạo

6 giờ
Khám phá cách các tác nhân trí tuệ nhân tạo (AI) có thể thay đổi cách làm việc của quý vị và mang lại giá trị cho tổ chức của quý vị!
Xem chi tiếtRight Arrow
Bắt đầu khóa học
Xem thêmRight Arrow
Có liên quan

blogs

Claude Opus 4.6: Tính năng, điểm chuẩn, các bài kiểm tra thực hành và hơn thế nữa

Mô hình mới nhất của Anthropic dẫn đầu bảng xếp hạng về mã hóa theo hướng tác nhân và suy luận phức tạp. Thêm nữa, nó có cửa sổ ngữ cảnh 1M.
Matt Crabtree's photo

Matt Crabtree

10 phút

Xem thêmXem thêm