Chuyển đến nội dung chính

Google I/O 2026: Khởi đầu kỷ nguyên Gemini hướng tác vụ (Agentic)

Từ Gemini 3.5 Flash và Gemini Omni đến Antigravity 2.0 và Gemini Spark, đây là những điểm quan trọng nhất từ bài keynote I/O 2026 tập trung vào agent của Google.
Đã cập nhật 20 thg 5, 2026  · 12 phút đọc

Sợi chỉ xuyên suốt gần như mọi thông báo trong ngày đầu tiên của hội nghị Google I/O 2026 đều giống nhau: agent. Không phải chatbot, không phải trợ lý, mà là các agent bền bỉ, thực thi tác vụ chạy nền và tích hợp trên toàn bộ hệ sản phẩm của Google. CEO Sundar Pichai gọi thẳng đây là “kỷ nguyên Gemini hướng tác vụ (agentic)”, và các thông báo đã củng cố cách định vị đó.

Google cũng phản hồi trước các gói đăng ký Claude Max của Anthropic và ChatGPT Pro của OpenAI bằng cách giới thiệu hạng Google AI Ultra mới tại I/O, có cùng mức giá 100 USD/tháng và khóa một số tính năng agentic được đề cập bên dưới.

Trong bài viết này, tôi sẽ điểm qua những thông báo quan trọng nhất đối với người làm AI và nhà phát triển. Tôi tập trung vào các bản cập nhật đã có sẵn ngay bây giờ hoặc sẽ ra mắt trong thời gian ngắn.

Gemini 3.5 Flash

Gemini 3.5 Flash là bản phát hành mô hình tiêu điểm từ I/O 2026. Mô hình vượt trội so với Gemini 3.1 Pro trên các tiêu chuẩn đánh giá agentic và lập trình, trong khi Google cho biết nó chạy nhanh hơn 4 lần về tốc độ sinh token đầu ra so với các mô hình hàng đầu khác. Dù chúng tôi chưa thể xác nhận, đây chắc chắn là một tuyên bố táo bạo.

Về điểm chuẩn, mức cải thiện thể hiện rõ, đặc biệt ở MCP Atlas, CharXiV Reasoning và Finance Agent v2, nơi Gemini 3.5 Flash dẫn đầu. Nhìn chung, 3.5 Flash có vẻ cạnh tranh với Claude Opus 4.7GPT-5.5.

Tiêu chuẩn đánh giá

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

Khía cạnh chi phí đáng chú ý ở đây. Google cho biết các doanh nghiệp xử lý khoảng 1 nghìn tỷ token mỗi ngày có thể tiết kiệm hơn 1 tỷ USD mỗi năm bằng cách chuyển 80% khối lượng công việc từ các mô hình hàng đầu khác sang 3.5 Flash. Đây là lời chào hàng trực diện tới khách hàng doanh nghiệp của OpenAI và Anthropic. Gemini 3.5 Flash hiện có sẵn trên Gemini API, Google AI Studio và ứng dụng Gemini. Gemini 3.5 Pro đã được dùng nội bộ và dự kiến ra mắt tháng sau.

Để biết chi tiết hơn, tôi khuyến nghị đọc bài viết về Gemini 3.5 Flash của chúng tôi, nơi chúng tôi phân tích sâu hơn về mô hình mới.

Gemini Omni

Gemini Omni là mô hình tạo sinh phương tiện đa phương thức gốc mới của Google, có thể nhận mọi kết hợp giữa văn bản, hình ảnh, âm thanh và video làm đầu vào và tạo đầu ra là video. Mô hình đầu tiên trong họ, Gemini Omni Flash, hiện có sẵn trong ứng dụng Gemini, Google Flow và YouTube Shorts.

Điểm kiến trúc then chốt là Omni hợp nhất những gì trước đây là một ngăn xếp tách rời (Veo cho video, Imagen cho hình ảnh, hệ thống âm thanh riêng) thành một mô hình duy nhất. Điều đó đồng nghĩa với các chỉnh sửa mạch lạc hơn và ít lỗi pipeline hơn khi làm việc xuyên phương thức. Google chưa công bố điểm chuẩn số cho Omni khi ra mắt, vì vậy đánh giá độc lập vẫn đang chờ. Quyền truy cập API cho nhà phát triển và khách hàng doanh nghiệp sẽ đến trong vài tuần sau I/O.

Chúng tôi đã thử nghiệm và viết đầy đủ trong bài viết về Gemini Omni. Kết quả tạo video đầu tiên còn trồi sụt (ít nhất so với tiêu chuẩn cao mà các công cụ như Seedance 2.0 đã thiết lập), nhưng một phiên bản mạnh hơn là Gemini Omni Pro dự kiến sẽ ra mắt sớm.

Antigravity 2.0

Antigravity là nền tảng phát triển ưu tiên agent của Google, và bản 2.0 ra mắt tại I/O là một bước mở rộng đáng kể. Trước đây định vị như một môi trường viết mã, nay nó là nền tảng đầy đủ để phát triển, triển khai và quản lý các nhóm agent AI tự chủ. Trọng tâm là một ứng dụng desktop độc lập mới đóng vai trò trung tâm điều phối agent, cho phép bạn chạy nhiều agent song song trên các tác vụ khác nhau cùng lúc.

Hệ sinh thái hiện có bốn bề mặt dành cho nhà phát triển:

  • Ứng dụng desktop Antigravity 2.0: Điều phối nhiều agent song song và hỗ trợ tác vụ nền theo lịch. Tích hợp với Google AI Studio, Android và Firebase.
  • Antigravity CLI: Giao diện thuần terminal để tạo và chạy agent không cần GUI. Google đề nghị người dùng Gemini CLI chuyển sang công cụ này.
  • Antigravity SDK: Truy cập theo lập trình vào cùng bộ khung agent đang vận hành sản phẩm của Google, hỗ trợ hành vi agent tùy chỉnh trên hạ tầng của bạn.
  • Antigravity trong Gemini Enterprise Agent Platform: Kết nối trực tiếp Antigravity với các dự án Google Cloud cho khối lượng công việc doanh nghiệp.

Cũng có một vài tính năng mới rất hữu ích cho agent cốt lõi. Lớn nhất: giờ đây nó có thể sinh các subagent theo mô-đun ngay lập tức, mỗi subagent chạy song song với vùng làm việc tách biệt và thừa hưởng cấu hình công cụ, quyền hạn của agent cha. Các thao tác chạy dài hoạt động bất đồng bộ, nên không còn chặn vòng lặp agent.

Tương tự Claude Code Hooks, JSON Hooks cho phép người dùng gắn script shell tùy chỉnh ở các giai đoạn then chốt của quá trình thực thi (trước/sau lời gọi công cụ, lời gọi mô hình, hoặc tại điều kiện dừng) để ghi log, tùy chỉnh tham số, hoặc chèn hướng dẫn. Nhiệm vụ theo lịch cho phép bạn đặt lời nhắc theo cron cho các lần chạy định kỳ như tóm tắt PR hằng ngày hoặc kiểm tra triển khai theo giờ, với kết quả hiển thị ở thanh bên để bàn giao mượt mà cho người dùng trong vòng lặp.

Ở phía quản lý, Antigravity giới thiệu "dự án" như nguyên thủy tổ chức, phạm vi hóa cài đặt, tài nguyên và quyền theo nhóm agent, thay vì yêu cầu quyền toàn cục rộng nhất cho mọi thứ. Bảng bên được làm mới hỗ trợ nhóm hội thoại theo dự án, trạng thái hoặc độ gần đây, với hỗ trợ native cho Git worktree tích hợp. Bố cục dựa trên dự án này tương đương quản lý không gian làm việc đa cửa sổ của Cursor và hàng đợi tác vụ của Codex, nhưng có phạm vi quyền theo dự án chặt hơn.

Có thể tạo Git worktree gốc một cách dễ dàng khi bắt đầu cuộc hội thoại mới.

Nhập liệu giọng nói qua các mô hình Gemini Audio và các lệnh gạch chéo mới (/goal cho các lần chạy tự chủ, /grill-me để làm rõ trước tác vụ, /schedule cho nhắc cron, /browser để bật dùng trình duyệt) hoàn thiện trải nghiệm.

Antigravity 2.0 bắt đầu khả dụng cho người dùng ngay hôm nay. Gói Google AI Ultra (100 USD/tháng) bao gồm hạn mức sử dụng Antigravity cao hơn 5 lần so với gói Google AI Pro.

Managed Agents trong Gemini API

Cùng với Antigravity 2.0, Google công bố Managed Agents trong Gemini API, đưa khả năng agentic trực tiếp vào lớp API cho các nhà phát triển muốn xây ứng dụng chạy bằng agent mà không phải tự quản hạ tầng điều phối. Đây là phần bổ trợ ở cấp API cho trải nghiệm desktop Antigravity.

Hệ quả thực tế cho nhà phát triển là giờ bạn có thể định nghĩa hành vi agent, tích hợp công cụ và quy trình nhiều bước qua Gemini API và để hạ tầng của Google xử lý thực thi. Điều này có tiềm năng thật sự thay đổi cuộc chơi cho các đội ngũ xây dựng ứng dụng sản xuất cần thực thi tác vụ dài hạn mà không phải tự dựng và quản khung agent. Truy cập khả dụng qua Google AI Studio, và khách hàng doanh nghiệp có thể dùng qua Gemini Enterprise Agent Platform.

Một lưu ý thẳng thắn: phản hồi sớm của nhà phát triển từ các bài đưa tin I/O cho biết tài liệu cho luồng agent phức tạp và xử lý lỗi còn thưa thớt. Giới hạn tốc độ và quản lý hạn ngạch cũng bị xem là điểm vướng. Đây đều là vấn đề có thể giảm dần theo thời gian, nhưng đáng lưu ý trước khi bạn cam kết xây dựng trên ngăn xếp này.

Gemini Spark

Gemini Spark (không nên nhầm với LLM mới nhất của Meta, Muse Spark) là agent AI cá nhân mới của Google, và là thông báo mang tính tiêu dùng nhất trong nhóm agentic. Nó chạy 24/7 trên các máy ảo chuyên dụng trong Google Cloud, nghĩa là không cần mở laptop của bạn để tiếp tục làm việc. Spark được vận hành bởi Gemini 3.5 và bộ khung Antigravity, cho phép xử lý các tác vụ dài hạn ở chế độ nền.

Bộ tính năng khi ra mắt bao gồm:

  • Tích hợp với các công cụ của Google (Workspace, Gmail, Calendar) ngay khi ra mắt, hỗ trợ công cụ bên thứ ba qua MCP sẽ đến trong vài tuần tiếp theo.
  • Tương tác qua ứng dụng Gemini, và sắp tới qua email và chat.
  • Hoạt động trực tiếp trong Chrome như một lớp trình duyệt agentic, dự kiến ra mắt cuối mùa hè này.
  • Tiến độ tác vụ trực tiếp hiển thị qua Android Halo, không gian UI mới trên Android, ra mắt cuối năm nay.

So sánh trực tiếp với hệ sinh thái agent của OpenAI và khả năng dùng công cụ của Anthropic là điều đáng làm. Điểm khác biệt của Spark là khả năng thực thi liên tục 24/7 trên hạ tầng Google Cloud, kết hợp tích hợp sâu với bộ công cụ năng suất của Google. Nếu công việc của bạn đã ở trong Google Workspace, đó là lợi thế đáng kể. Nếu không, giá trị mang lại kém rõ ràng hơn.

Riêng tư là mối quan ngại chính đáng ở đây. Một agent liên tục giám sát hộp thư, lịch và tài liệu của bạn đặt ra câu hỏi thực sự về nơi lưu trữ dữ liệu và tuân thủ trong các ngành chịu quy định. Một câu hỏi tôi tự đặt ra, chẳng hạn, “Điều gì xảy ra với bộ nhớ của agent khi một nhân viên rời đi?” Google chưa cung cấp câu trả lời chi tiết cho những câu hỏi này.

Spark sẽ được triển khai cho người thử nghiệm tin cậy trong tuần này, với bản Beta cho thuê bao Google AI Ultra (100 USD/tháng) tại Mỹ vào tuần kế tiếp. Chúng tôi đang đưa tin chi tiết hơn trong bài viết về Gemini Spark.

Managed Agents so với Gemini Spark

Agent tìm kiếm và Chế độ AI

Chế độ AI trong Tìm kiếm được giới thiệu tại I/O năm trước. Sau một năm, nó đã vượt mốc một tỷ người dùng hoạt động hằng tháng. Nay Google tiến xa hơn với hai khả năng agentic mới.

Đầu tiên là các agent thông tin trong Tìm kiếm: các agent chạy nền được cá nhân hóa do bạn cấu hình để theo dõi chủ đề và hiển thị thông tin phù hợp vào đúng thời điểm. Sẽ triển khai mùa hè này, bắt đầu với thuê bao Google AI Pro và Ultra.

Thứ hai là giao diện sinh (generative UI) trong Tìm kiếm, được vận hành bởi Gemini 3.5 Flash và Antigravity. Tìm kiếm sẽ xây dựng bố cục tùy chỉnh, đồ họa tương tác, thậm chí là bảng điều khiển hay mini-app bền bỉ cho các truy vấn phức tạp, kéo dài. Khả năng generative UI sẽ đến miễn phí cho tất cả người dùng mùa hè này. Tính năng bảng điều khiển bền bỉ và ứng dụng tùy chỉnh sẽ có trước cho thuê bao Pro và Ultra tại Mỹ.

Đây là mối lo thực sự với nhà xuất bản và chuyên gia SEO (như khi AI Overview và Chế độ AI ra mắt). Khi câu trả lời do AI tạo giải quyết trọn vẹn truy vấn của người dùng ngay trong Tìm kiếm, không còn lý do để nhấp vào trang nguồn. Điều này đã xảy ra: cả AI Overviews và đợt triển khai ban đầu của Chế độ AI đều dẫn tới sụt giảm lưu lượng đáng kể trên toàn ngành. Google vẫn chưa đưa ra cách rõ ràng để chia sẻ doanh thu hoặc đảm bảo lưu lượng cho các nhà xuất bản có nội dung nuôi dưỡng những câu trả lời này.

Google Flow

Google Flow, ra mắt tại I/O 2025 như một công cụ làm phim bằng AI, đã có bước tiến lớn với ba cập nhật then chốt:

  • Agent lập kế hoạch thông minh hơn. Agent Flow được cập nhật giờ có thể lập kế hoạch và suy luận qua các dự án sáng tạo nhiều bước. Bạn đưa vào đầu vào (ví dụ ý tưởng, vài ảnh tham chiếu, kịch bản nháp) và nó giúp bạn đi từ giai đoạn động não đến sáng tạo và chỉnh sửa, tất cả trong một môi trường. Agent mới hiện khả dụng cho mọi người dùng.
  • Video gốc qua Gemini Omni. Flow giờ xử lý tạo và chỉnh sửa video gốc qua mô hình Omni. Bạn có thể mô tả thay đổi cho một đoạn từ thư viện ảnh bằng ngôn ngữ tự nhiên và lặp lại theo hội thoại. Tính nhất quán nhân vật cũng được cải thiện, nên danh tính và giọng nói được giữ xuyên suốt các cảnh. Điều này đặc biệt hữu ích khi bạn sản xuất phim ngắn hay chiến dịch quảng cáo có nhân vật lặp lại.
  • Lập trình Vibe cho công cụ tùy chỉnh. Thay vì bị giới hạn trong các công cụ Flow cung cấp sẵn, giờ bạn có thể tự xây công cụ ngay trên nền tảng. Google đã minh họa các ví dụ như thiết kế hiệu ứng video tùy chỉnh, tạo công cụ hoạt hình vẽ tay, và xây luồng ghép lớp văn bản, tất cả mà không cần rời Flow.

Nhìn tổng thể, các cập nhật này định vị Flow không chỉ là trợ lý sáng tạo. Nó đang trở thành nền tảng để xây dựng quy trình sáng tạo, với ứng dụng di động đang beta trên Android và sắp có trên iOS.

Mở rộng SynthID

SynthID, hệ thống đóng dấu nước AI vô hình của Google, đến nay đã đóng dấu hơn 100 tỷ hình ảnh và video và tương đương 60.000 năm tài sản âm thanh kể từ khi ra mắt ba năm trước. Điều đáng chú ý trong thông báo tại I/O không phải là quy mô, mà là các đối tác: OpenAI, Kakao và Eleven Labs đang áp dụng SynthID cùng với Nvidia, đơn vị đã tham gia năm ngoái.

Việc chấp nhận liên ngành mới là điều tạo ý nghĩa. Một tiêu chuẩn đóng dấu chỉ hiệu quả nếu đủ phổ biến để “không có đóng dấu” trở thành tín hiệu hữu ích. Google cũng đang mở rộng xác minh Content Credentials (tiêu chuẩn C2PA) sang Tìm kiếm và Chrome, hiển thị cho người dùng liệu nội dung bắt nguồn từ AI hay máy ảnh và liệu nó có được chỉnh sửa bằng công cụ tạo sinh hay không. Sự kết hợp giữa SynthID và C2PA mang lại hai lớp độc lập về nguồn gốc, là cách tiếp cận đúng đắn khi mỗi lớp đều có thể bị loại bỏ riêng lẻ khá dễ dàng.

Đáng chú ý khác

Một số thông báo khác từ I/O cũng đáng nhắc nhanh:

  • Docs Live: Tính năng ưu tiên giọng nói mới cho Google Docs cho phép bạn “xả” ý tưởng bằng lời và để Gemini cấu trúc thành tài liệu. Triển khai cho thuê bao mùa hè này, với khả năng giọng nói cũng đến với Gmail và Keep cùng thời điểm.
  • Google Pics: Công cụ tạo và chỉnh sửa hình ảnh AI mới xây trên mô hình Nano Banana, coi mỗi phần tử là một đối tượng riêng thay vì ảnh phẳng. Hiện có cho người thử nghiệm tin cậy, sẽ triển khai cho thuê bao Google AI Pro và Ultra cuối mùa hè.
  • Android Halo: Không gian UI mới trên Android để xem cập nhật trực tiếp và tiến độ tác vụ từ các agent như Gemini Spark. Ra mắt cuối năm nay.
  • Daily Brief: Một agent dựng sẵn trong ứng dụng Gemini, tổng hợp bản tin buổi sáng cá nhân hóa từ hộp thư, lịch và tác vụ của bạn, kèm đề xuất bước tiếp theo. Không công bố giá riêng; dự kiến là một phần của trải nghiệm ứng dụng Gemini.
  • TPU 8t và 8i: TPU thế hệ thứ 8 của Google áp dụng cách tiếp cận hai chip, với 8t tối ưu cho huấn luyện tiền xử lý quy mô lớn (gần gấp 3 lần năng lực tính toán thô so với thế hệ trước, có thể mở rộng trên hơn 1 triệu TPU toàn cầu) và 8i tối ưu cho suy luận. Cả hai mang lại hiệu năng trên mỗi watt cao gấp đến 2 lần thế hệ trước.
  • Gemini for Science: Bộ công cụ AI kết nối Antigravity với hơn 30 cơ sở dữ liệu khoa học sự sống lớn. Science Skills hiện khả dụng trên GitHub và trực tiếp trong Antigravity.

Ý kiến cuối

Google I/O 2026 đặt cược vào agent như hướng đi chính của AI, với Gemini 3.5 Flash và Antigravity 2.0 là hạ tầng bên dưới gần như mọi thứ khác được công bố. Những gì bạn có thể dùng ngay bây giờ là Gemini 3.5 Flash (qua Gemini API và AI Studio), agent Flow mới, Gemini Omni Flash và ứng dụng desktop Antigravity 2.0. Gemini Spark, các agent trong Tìm kiếm và tính năng giao diện sinh trong Tìm kiếm sẽ triển khai suốt mùa hè, phần lớn được khóa sau hạng AI Ultra 100 USD/tháng (ít nhất là ban đầu).

Với tôi, nâng cấp Antigravity là bản phát hành thú vị nhất, vì nó vận hành trên hai tầng đồng thời: như một ứng dụng nhà phát triển độc lập, nó cạnh tranh trực tiếp với Codex và Claude Code; như một nền tảng, ADK nền tảng và Managed Agents API của nó thách thức các khung điều phối như LangChain, AutoGen và Agents SDK của OpenAI. Tích hợp Gemini và lớp triển khai Google Cloud là điểm khác biệt (và rủi ro bị khóa chặt) ở cả hai mặt.

Google I/O 2026 FAQs

Gemini 3.5 Flash so với GPT-5.5 và Claude Opus 4.7 như thế nào?

Gemini 3.5 Flash dẫn đầu ở một số bài đánh giá agentic như MCP Atlas (83,6%) và Finance Agent v2 (57,9%), trong khi GPT-5.5 nhỉnh hơn ở SWE-Bench Pro và ARC-AGI-2. Claude Opus 4.7 vẫn mạnh nhất ở Humanity's Last Exam (46,9%). Kết luận chính là nó cạnh tranh với các mô hình hàng đầu trong khi chạy nhanh hơn và rẻ hơn đáng kể ở quy mô lớn, đúng như cái tên gợi ý. Biến thể Pro mạnh hơn dự kiến sắp phát hành.

Google Antigravity khác gì so với Claude Code hoặc Codex?

Google Antigravity 2.0 là nền tảng phát triển ưu tiên agent cho phép bạn điều phối nhiều agent AI song song qua ứng dụng desktop, CLI, SDK và API doanh nghiệp. Khác với Claude Code (agent viết mã thuần terminal) hay Codex (hệ thống dựa trên hàng đợi tác vụ), Antigravity cung cấp phạm vi quyền theo dự án chặt chẽ hơn, khả năng sinh subagent và tích hợp trực tiếp với Google Cloud và Firebase. Vai trò kép vừa là công cụ nhà phát triển vừa là SDK nền tảng khiến nó gần với một khung điều phối hơn là trợ lý viết mã độc lập.

Gói Google AI Ultra 100 USD/tháng có đáng so với ChatGPT Pro hoặc Claude Max không?

Cả ba gói đều có giá 100 USD/tháng, nhưng giá trị phụ thuộc vào hệ sinh thái bạn dùng. Điểm khác biệt của Google AI Ultra là quyền truy cập Gemini Spark (agent bền bỉ 24/7), hạn mức sử dụng Antigravity cao gấp 5 lần và tích hợp sâu với Google Workspace. Nếu quy trình của bạn đã nằm trong Gmail, Docs và Calendar, Ultra có lợi thế tự nhiên. Nếu bạn chủ yếu cần trợ lý viết mã hoặc sự linh hoạt ở cấp API, ChatGPT Pro hoặc Claude Max có thể phù hợp hơn.

Gemini Omni là gì và nó xử lý tạo video như thế nào?

Gemini Omni là mô hình đa phương thức gốc của Google chấp nhận mọi kết hợp giữa văn bản, hình ảnh, âm thanh và video làm đầu vào và tạo đầu ra là video. Nó hợp nhất các hệ thống vốn tách rời (Veo cho video, Imagen cho hình ảnh) thành một mô hình duy nhất, giúp chỉnh sửa xuyên phương thức mạch lạc hơn. Phiên bản đầu tiên, Omni Flash, đã khả dụng, với Omni Pro mạnh hơn dự kiến sớm ra mắt. Chưa có điểm chuẩn độc lập được công bố, nên chất lượng thực tế vẫn đang được đánh giá.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom là một nhà khoa học dữ liệu và giảng viên kỹ thuật. Anh viết và quản lý các bài hướng dẫn và bài blog về khoa học dữ liệu của DataCamp. Trước đây, Tom làm việc trong lĩnh vực khoa học dữ liệu tại Deutsche Telekom.

Chủ đề

Tìm hiểu về hệ sinh thái AI của Google

Tracks

Google Workspace with Gemini

4 giờ
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Xem chi tiếtRight Arrow
Bắt đầu khóa học
Xem thêmRight Arrow
Có liên quan

blogs

Claude Opus 4.6: Tính năng, điểm chuẩn, các bài kiểm tra thực hành và hơn thế nữa

Mô hình mới nhất của Anthropic dẫn đầu bảng xếp hạng về mã hóa theo hướng tác nhân và suy luận phức tạp. Thêm nữa, nó có cửa sổ ngữ cảnh 1M.
Matt Crabtree's photo

Matt Crabtree

10 phút

Xem thêmXem thêm