Chuyển đến nội dung chính

Composer 2: Điểm chuẩn, Giá thành và So sánh

Mô hình độc quyền mới nhất của Cursor, Composer 2, giới thiệu tiếp tục tiền huấn luyện, tự tóm tắt được huấn luyện bằng RL và cắt giảm mạnh giá token.
Đã cập nhật 17 thg 4, 2026  · 15 phút đọc

Cursor đã ra mắt Composer 2 vào ngày 19 tháng 3 năm 2026, thế hệ thứ ba của mô hình lập trình độc quyền. Bản phát hành này đến chỉ sáu tuần sau Composer 1.5, vốn đã mở rộng học tăng cường (RL) gấp 20 lần trên cùng mô hình nền tảng mà không thay đổi kiến trúc cơ bản. Đợt mở rộng RL đó thực tế đã vượt quá ngân sách tính toán tiền huấn luyện ban đầu, cho thấy họ đã đẩy nền tảng hiện có đến giới hạn. Composer 2 chọn cách tiếp cận khác: tiếp tục tiền huấn luyện trước để xây nền tảng mạnh hơn, rồi mới áp RL lên trên. Đó là lý do mức nhảy điểm chuẩn lớn như vậy dù khoảng cách thời gian ngắn.

Sản phẩm cũng có cửa sổ ngữ cảnh 200.000 token và hai biến thể giá: Standard với $0,50 cho mỗi triệu token đầu vào (rẻ hơn khoảng 86% so với Composer 1.5) và Fast dành cho phiên tương tác thời gian thực.

Trong bài viết này, chúng tôi sẽ phân tích Composer 2 là gì, so sánh với Composer 1.5 về điểm chuẩn và chi phí, và so kè với Claude Opus 4.6GPT-5.4. Chúng tôi cũng sẽ hướng dẫn cách dùng trong Cursor và các hạn chế đã biết.

Nếu bạn quan tâm đến các mô hình tuyến đầu mà Composer 2 cạnh tranh, hãy xem các hướng dẫn của chúng tôi về:

Composer là gì?

Composer là họ mô hình AI lập trình độc quyền của Cursor, được thiết kế cho lập trình tác tử trong Cursor IDE. Khác với các mô hình đa dụng như Claude Opus 4.6 hay GPT-5.4, các mô hình Composer được xây riêng cho chỉnh sửa đa tệp, thực thi lệnh terminal và tái cấu trúc toàn bộ codebase. Chúng không nhằm viết email, trả lời đố vui hay các tác vụ không liên quan đến code.

Dòng sản phẩm khởi đầu với nguyên mẫu nội bộ tên Cheetah, rồi phát triển qua ba bản phát hành công khai:

Model

Release Date

Key Innovation

Composer 1

October 29, 2025

Mô hình tự xây đầu tiên; kiến trúc MoE với huấn luyện RL

Composer 1.5

February 9, 2026

Tính toán RL nhiều hơn 20 lần trên cùng nền tảng; tư duy thích ứng; giới thiệu tự tóm tắt

Composer 2

March 19, 2026

Lần đầu tiếp tục tiền huấn luyện tạo nền tảng mới; tự tóm tắt cải thiện; chi phí giảm mạnh

Mỗi thế hệ xây tiếp trên thế hệ trước, nhưng Composer 2 đánh dấu thay đổi kiến trúc lớn nhất đến nay.

Dòng thời gian cho thấy sự phát triển của các mô hình Cursor Composer từ nguyên mẫu Cheetah đến Composer 2 giữa tháng 10/2025 và tháng 3/2026

Hình hoá dòng thời gian tiến hóa của mô hình Composer. Ảnh: Tác giả.

Composer 2 là gì?

Composer 2 là mô hình lập trình tác tử độc quyền thế hệ thứ ba của Cursor, và là mô hình đầu tiên trong họ trải qua giai đoạn tiếp tục tiền huấn luyện.

Kiến trúc và cách tiếp cận huấn luyện

Các mô hình Composer trước đây được xây bằng cách xếp lớp học tăng cường lên trên một mô hình nền bị đóng băng. Hãy hình dung như dạy kỹ năng mới mà không cải thiện hiểu biết nền tảng. Composer 2 thay đổi điều này bằng cách trước tiên cập nhật trọng số nền tảng của mô hình với dữ liệu đặc thù lập trình, rồi mới áp RL lên trên.

Mô hình dùng kiến trúc Mixture-of-Experts (MoE), nghĩa là chỉ một phần tham số được kích hoạt cho mỗi đầu vào. Điều này giữ suy luận nhanh trong khi vẫn duy trì số tham số tổng lớn. Cursor chưa công bố số tham số chính xác.

Danh tính mô hình nền không được tiết lộ khi ra mắt, nhưng công khai vào ngày 20 tháng 3 năm 2026, sau khi một người dùng tìm thấy trong header yêu cầu API. Lee Robinson, Phó Chủ tịch mảng Giáo dục Lập trình viên tại Cursor, xác nhận Composer 2 được xây trên Kimi K2.5, một mô hình mã nguồn mở từ Moonshot AI. Ông cho biết khoảng ba phần tư tổng compute đến từ chính quá trình huấn luyện của Cursor (tiếp tục tiền huấn luyện và RL), không phải từ mô hình nền, điều này giải thích vì sao kết quả đánh giá khác với một lần chạy Kimi K2.5 thô.

Moonshot AI sau đó xác nhận thỏa thuận là một hợp tác thương mại được ủy quyền thông qua Fireworks AI, đơn vị phụ trách cả hạ tầng huấn luyện RL và suy luận. Đồng sáng lập Aman Sanger cho biết nhóm đã đánh giá nhiều mô hình nền bằng điểm chuẩn dựa trên perplexity trước khi chọn Kimi K2.5, và mô tả giai đoạn hậu nền tảng là tiếp tục tiền huấn luyện theo sau bởi mở rộng compute RL gấp 4 lần.

Hạ tầng huấn luyện chạy trên PyTorch và Ray, sử dụng kernel lượng tử hóa MXFP8 tùy biến tối ưu cho GPU NVIDIA Blackwell.

Tự tóm tắt

Tự tóm tắt, hay Cursor gọi là "compaction-in-the-loop RL", hoạt động như sau: Khi cửa sổ ngữ cảnh 200.000 token bắt đầu đầy, mô hình tạm dừng, nén ngữ cảnh của chính nó xuống khoảng 1.000 token, rồi tiếp tục làm việc. Vì hành vi nén này là một phần của hàm thưởng RL, mô hình học được nên giữ biến, quyết định kiến trúc, và log lỗi nào, và nên loại bỏ gì.

Theo blog nghiên cứu của Cursor, cách tiếp cận này giảm lỗi nén 50% so với tóm tắt dựa trên prompt, đồng thời dùng khoảng một phần năm số token. Trong một minh chứng thực tế, Composer 2 đã giải bài toán "make-doom-for-mips" từ Terminal-Bench 2.0 trong 170 lượt, nén hơn 100.000 token ngữ cảnh trong quá trình.

Năng lực cốt lõi

Trong một phiên làm việc, Composer 2 có quyền truy cập:

  • Tìm kiếm ngữ nghĩa trên toàn codebase để tìm code liên quan trong dự án
  • Đọc, chỉnh sửa và tạo đa tệp với độ chính xác đến từng dòng
  • Thực thi lệnh terminal và diễn giải đầu ra
  • MCP (Model Context Protocol) để tích hợp dịch vụ bên ngoài
  • Công cụ trình duyệt gốc để thử nghiệm thay đổi UI trực tiếp trong trình soạn thảo

Kết hợp lại, các thành phần này giúp tác tử làm việc qua nhiều tệp và bước trong một phiên duy nhất.

Các biến thể Composer 2

Cursor phát hành Composer 2 với hai biến thể, cùng chia sẻ năng lực cốt lõi.

Composer 2 Fast

Biến thể Fast là mặc định khi bạn chọn Composer 2 trong danh sách mô hình. Nó được xây cho các phiên tương tác độ trễ thấp, nơi bạn lập trình thời gian thực và muốn phản hồi gần như tức thì.

Composer 2 Standard

Biến thể Standard chạy chậm hơn nhưng chi phí mỗi token thấp đáng kể, phù hợp hơn cho các tác vụ nền, tái cấu trúc hàng loạt hoặc vòng lặp tác tử dài nơi bạn không cần phản hồi ngay.

Dưới đây là phân tích giá:

Variant

Input (per 1M tokens)

Cache Read (per 1M tokens)

Output (per 1M tokens)

Composer 2 Standard

$0.50

$0.20

$2.50

Composer 2 Fast (default)

$1.50

$0.35

$7.50

Bạn có thể dùng biến thể Fast khi đang lập trình tích cực và chuyển sang Standard cho tác vụ qua đêm hay hàng loạt để giảm tiêu hao tín dụng. Chúng tôi sẽ nói kỹ hơn về khác biệt giá ở phần sau.

Điểm chuẩn Composer 2

Cursor đánh giá Composer 2 qua ba bộ điểm chuẩn, mỗi bộ bao phủ một khía cạnh hiệu năng lập trình khác nhau.

Hiểu về các điểm chuẩn

CursorBench là điểm chuẩn nội bộ độc quyền của Cursor, hiện ở phiên bản CursorBench-3. Nhiệm vụ đến từ các phiên Cursor thực tế và được truy xuất nguồn bằng công cụ Cursor Blame, công cụ lần theo code đã commit về yêu cầu tác tử đã tạo ra nó. Bộ điểm chuẩn đo độ đúng lời giải, chất lượng code, hiệu quả và hành vi tương tác; phạm vi vấn đề đã tăng gấp đôi từ bản đầu đến CursorBench-3 cả về số dòng code và số tệp. Cursor cũng bổ sung thử nghiệm lưu lượng trực tiếp có kiểm soát để bắt hồi quy mà chấm điểm ngoại tuyến có thể bỏ lỡ. Lưu ý hiển nhiên: CursorBench không thể tái lập công khai, nên các điểm số này không thể được xác minh độc lập.

Terminal-Bench 2.0 do Viện Laude duy trì và kiểm tra khả năng của tác tử AI thực hiện tác vụ thực tế trong môi trường terminal. Bao gồm di chuyển thư mục, chạy script, diễn giải lỗi và lặp hướng tới lời giải. Cursor dùng khung đánh giá Harbor chính thức với thiết lập mặc định và chạy năm lần cho mỗi mô hình, báo cáo trung bình.

SWE-bench Multilingual là một tập con của SWE-bench gồm 300 tác vụ trên 9 ngôn ngữ lập trình. Nó đo khả năng xử lý các issue GitHub thực, là phép thử hợp lý cho lập trình đa ngôn ngữ.

Kết quả điểm chuẩn qua các thế hệ Composer

Điểm số đã cải thiện qua từng thế hệ:

Benchmark

Composer 1

Composer 1.5

Composer 2

CursorBench

38.0

44.2

61.3

Terminal-Bench 2.0

40.0

47.9

61.7

SWE-bench Multilingual

56.9

65.9

73.7

Biểu đồ cột so sánh điểm CursorBench, Terminal-Bench 2.0 và SWE-bench Multilingual giữa Composer 1, Composer 1.5 và Composer 2

Điểm chuẩn qua ba thế hệ Composer. Ảnh: Tác giả.

Lưu ý về hạn chế của điểm chuẩn

  • CursorBench là mã nguồn đóng và không thể tái lập độc lập. Cursor không công bố điểm trên các điểm chuẩn đã được thừa nhận như SWE-bench Verified, điều mà một số thành viên cộng đồng cho là thiếu nhất quán.
  • SWE-bench Verified không còn được OpenAI báo cáo sau khi phát hiện các mô hình tuyến đầu có thể tái tạo bản vá kiểm thử từ trí nhớ và gần 60% vấn đề chưa giải quyết có bộ kiểm thử lỗi.
  • Terminal-Bench bao gồm các tác vụ kiểu câu đố (như tìm nước đi cờ vua tốt nhất từ thế cờ) không phản ánh công việc phát triển thực tế. Dù vậy, đây vẫn là bộ minh bạch nhất trong ba vì dùng khung công khai với phương pháp đánh giá được ghi chép.

Composer 2 tốt hơn Composer 1.5 bao nhiêu?

Mức cải thiện từ Composer 1.5 lên Composer 2 lớn hơn bất kỳ thế hệ trước nào, cả về hiệu năng lẫn chi phí.

Như bảng trên cho thấy, Composer 2 đạt 61,3 trên CursorBench so với 44,2 của Composer 1.5, tăng khoảng 39%. Khoảng cách Terminal-Bench 2.0 là khoảng 29% (61,7 so với 47,9), và SWE-bench Multilingual tăng khoảng 12% (73,7 so với 65,9).

Mức giảm chi phí còn lớn hơn mức tăng điểm chuẩn. Theo blog ra mắt của Cursor, Composer 2 Standard rẻ hơn khoảng 86% so với Composer 1.5 trên token đầu vào và rẻ hơn khoảng 57% ngay cả với biến thể Fast. Cursor chưa công bố trang giá riêng cho Composer 1.5, nên các tỷ lệ phần trăm này đến từ so sánh của chính Cursor khi ra mắt.

Khác biệt kỹ thuật chính gồm:

  • Cách tiếp cận huấn luyện: Composer 1.5 mở rộng RL thêm 20 lần trên cùng nền tảng đóng băng, và compute RL sau huấn luyện thực tế vượt compute dùng để tiền huấn luyện chính mô hình nền. Composer 2 đi lộ trình khác: tạo nền tảng mới mạnh hơn qua tiếp tục tiền huấn luyện, sau đó áp compute RL mở rộng 4 lần lên trên.
  • Chất lượng tự tóm tắt: Composer 1.5 giới thiệu tự tóm tắt nhưng dùng nén dựa trên prompt với hàng nghìn token hướng dẫn, tạo tóm tắt trung bình khoảng 5.000 token. Nén được huấn luyện bằng RL của Composer 2 tạo ra khoảng 1.000 token với ít lỗi hơn 50% và cũng tái sử dụng bộ nhớ đệm KV từ token trước, càng giảm chi phí suy luận.
  • Khả năng tầm xa: Composer 2 xử lý các tác vụ đòi hỏi hàng trăm hành động tuần tự. Như đã đề cập, đây là bước vượt ngoài những gì 1.5 làm ổn định.

Cộng đồng đón nhận Composer 1.5 ở mức độ trái chiều. Một số nhà phát triển mô tả nó chỉ hữu ích cho tác vụ nhỏ như commit và chỉnh sửa đơn giản. Các con số điểm chuẩn cho thấy đã cải thiện ở những điểm họ phàn nàn nhiều nhất.

Composer 2 vs. Claude Opus 4.6 vs. GPT-5.4

Đây là phép so sánh nhiều người tìm kiếm. Composer 2 vượt Claude Opus 4.6 ở một số điểm chuẩn lập trình, kém GPT-5.4 ở đa số, và rẻ hơn nhiều so với cả hai.

So sánh điểm chuẩn

Các con số nói lên phần lớn câu chuyện:

Benchmark

Composer 2

Claude Opus 4.6

GPT-5.4

CursorBench

61.3

~58.2

~63.9

Terminal-Bench 2.0

61.7

58.0

75.1

SWE-bench Verified

Không báo cáo

~80.8%

~80.0%

Composer 2 vs. Claude Opus 4.6 vs. GPT-5.4

Composer 2 nhỉnh hơn Opus 4.6 ở cả CursorBench và Terminal-Bench 2.0, nhưng GPT-5.4 dẫn đầu rõ rệt ở cả hai. Khoảng cách Terminal-Bench 2.0 giữa Composer 2 (61,7) và GPT-5.4 (75,1) là 13 điểm.

Một điều cần lưu ý: điểm Terminal-Bench 2.0 đo cặp tác tử-cộng-mô hình, không phải mô hình thô. Cursor dùng khung đánh giá Harbor cho điểm của mình, trong khi 75,1 của GPT-5.4 tương ứng với mục Simple Codex harness trên bảng xếp hạng chính thức. Khác khung có thể cho kết quả khác nhau cho cùng mô hình.

So sánh giá

Dưới đây là so sánh giá:

Model

Input (per 1M tokens)

Output (per 1M tokens)

Composer 2 Standard

$0.50

$2.50

Composer 2 Fast

$1.50

$7.50

Claude Opus 4.6

$5.00

$25.00

GPT-5.4

$2.50

$15.00

Biểu đồ kết hợp hiển thị điểm CursorBench và Terminal-Bench 2.0 cho Composer 2, Claude Opus 4.6 và GPT-5.4, kèm biểu đồ thanh ngang so sánh chi phí đầu vào mỗi triệu token

So sánh điểm chuẩn và giá token. Ảnh: Tác giả.

Composer 2 Standard rẻ hơn khoảng 90% so với Opus 4.6 và khoảng 80% so với GPT-5.4 tính theo mỗi token. Với các đội ngũ chạy hàng nghìn yêu cầu tác tử mỗi ngày, chênh lệch đó cộng dồn rất nhanh.

Điểm mạnh của từng mô hình

Composer 2 là mô hình chỉ dành cho code và bị khóa trong Cursor IDE. Nó xử lý nhanh các tác vụ lập trình thường nhật với chi phí thấp, nhưng không làm được gì ngoài code.

Claude Opus 4.6 có cửa sổ ngữ cảnh 200.000 token (bản beta 1 triệu token với chi phí cao hơn), xuất sắc trong lập kế hoạch kiến trúc đa tệp, và hỗ trợ điều phối đa tác tử qua Agent Teams. Đây là mô hình đa dụng tình cờ rất giỏi về code.

GPT-5.4 dẫn đầu ở các điểm chuẩn lập trình khó nhất, có khả năng sử dụng máy tính gốc, và hỗ trợ cửa sổ ngữ cảnh thử nghiệm 1,05 triệu token. Đây là mô hình đơn lẻ mạnh nhất nhưng cũng đắt nhất khi vận hành ở quy mô lớn.

Điểm nhấn của Cursor là giá trị theo từng tác vụ trong IDE, không phải dẫn đầu điểm chuẩn thô.

Composer 2 vs. Claude Code vs. GitHub Copilot

Phần trên so sánh Composer 2 với các mô hình thô. Dưới đây là góc nhìn ở cấp sản phẩm.

Claude Code là tác tử lập trình dựa trên terminal của Anthropic. Theo một khảo sát nhà phát triển năm 2026, công cụ này hiện dẫn đầu là công cụ AI lập trình được dùng nhiều nhất trong giới chuyên nghiệp, với 46% gọi đây là công cụ họ yêu thích nhất so với 19% cho Cursor. Nhiều nhà phát triển dùng Cursor cho chỉnh sửa IDE hằng ngày và chuyển sang Claude Code cho tác vụ tự chủ phức tạp. Hai công cụ bổ trợ nhau nhiều hơn là cạnh tranh.

GitHub Copilot vẫn là công cụ được áp dụng rộng nhất với hơn 20 triệu người dùng mọi thời đại và mức giá khởi điểm thấp hơn là $10/tháng. Gần đây họ bổ sung chế độ Agent cho hành động nhiều bước, nhưng nhiều nhà phát triển cho biết chỉnh sửa đa tệp của Cursor đi sâu hơn.

Khoảng 70% nhà phát triển giờ dùng đồng thời hai đến bốn công cụ AI. Câu hỏi ít còn là "dùng công cụ nào?" mà là "kết hợp nào?"

Cách sử dụng Composer 2

Composer 2 hoạt động hoàn toàn trong Cursor IDE, nên không cần cài đặt riêng.

Thiết lập từng bước

Để bắt đầu dùng Composer 2, hãy tải hoặc cập nhật Cursor từ cursor.com. Composer 2 có trên mọi gói trả phí (Pro, Pro+, Ultra, Teams, Enterprise). Mở bảng tác tử bằng Cmd+I trên Mac hoặc Ctrl+I trên Windows và Linux, rồi chọn "Composer 2" hoặc "Composer 2 Fast" từ danh sách mô hình. Biến thể Fast được chọn mặc định.

Ảnh chụp màn hình giao diện Cursor IDE hiển thị danh sách chọn mô hình với Composer 2 Fast được chọn mặc định

Vị trí danh sách chọn mô hình trong Cursor. Ảnh: Tác giả.

Từ đó, hãy nhập mô tả bằng ngôn ngữ tự nhiên cho tác vụ bạn muốn thực hiện. Composer 2 mặc định chạy ở chế độ Agent, nghĩa là nó có thể tự động khám phá codebase, thực hiện thay đổi, chạy lệnh terminal và dùng mọi công cụ sẵn có. Bạn xem xét và chấp nhận hoặc từ chối thay đổi khi tác tử làm việc.

Phím tắt chính

Dưới đây là các phím tắt bạn sẽ dùng thường xuyên với Composer 2:

Action

Mac

Windows/Linux

Open Agent/Composer

Cmd+I

Ctrl+I

New conversation

Cmd+N

Ctrl+N

Switch modes (Agent/Ask/Edit)

Cmd+.

Ctrl+.

Ask mode (read-only)

Cmd+L

Ctrl+L

Inline edit

Cmd+K

Ctrl+K

Open history

Cmd+Opt+L

Ctrl+Alt+L

Làm việc với ngữ cảnh

Composer 2 hỗ trợ nhiều cách kiểm soát ngữ cảnh nó thấy. Gõ @ theo sau là tên tệp, thư mục, hoặc URL để đưa ngữ cảnh cụ thể vào prompt. Ký hiệu # tập trung vào một tệp cụ thể. Các "viên ngữ cảnh" ở đầu khung chat hiển thị những gì tác tử đang tham chiếu.

Với dự án lớn, bật Autocontext trong Cài đặt cho phép Cursor tự động lấy code liên quan qua embeddings. Bạn cũng có thể thêm tài liệu tùy chỉnh qua Cài đặt cho ngữ cảnh theo framework.

Tự tóm tắt trong thực tế

Với tác vụ dài, tự tóm tắt sẽ tự động kích hoạt khi cửa sổ ngữ cảnh đầy. Bạn cũng có thể chủ động kích hoạt nén bằng lệnh /compress . Nếu tác tử đề xuất bắt đầu cuộc trò chuyện mới, thường là do ngữ cảnh đã quá lớn để tóm tắt hiệu quả.

Giá Composer 2

Chúng tôi đã đề cập chi phí theo token ở phần Biến thể, nên sẽ không lặp lại số. Thay vào đó, đây là cách giá vận hành trong thực tế.

Các bậc thuê bao Cursor

Cursor dùng hệ thống thuê bao theo bậc với tín dụng xác định mức bạn có thể dùng mô hình bên thứ ba. Phân bổ hiện tại như sau:

Plan

Price

Key Inclusions

Hobby

Free

Yêu cầu tác tử và gợi ý tab hạn chế

Pro

$20/tháng ($16/tháng trả năm)

Gói tín dụng $20, gợi ý tab không giới hạn, tác tử đám mây

Pro+

$60/tháng ($48/tháng trả năm)

Sử dụng gấp 3 lần trên mọi mô hình

Ultra

$200/tháng

Sử dụng gấp 20 lần trên mọi mô hình, quyền truy cập ưu tiên

Teams

$40/người dùng/tháng ($32 trả năm)

Thanh toán tập trung, SSO SAML/OIDC, phân tích

Enterprise

Custom

SOC 2, rà soát pháp lý, kiểm soát bảo mật nâng cao

Cách tín dụng hoạt động với Composer 2

Đây là phần dễ gây nhầm. Việc dùng Composer trên gói cá nhân lấy từ một pool sử dụng độc lập, tách biệt với pool tín dụng dùng cho mô hình bên thứ ba như Claude hoặc GPT. Cursor mô tả pool này là "bao gồm mức sử dụng hào phóng", dù họ chưa công bố hạn mức cụ thể.

Khi bạn dùng chế độ "Auto", cho phép Cursor chọn mô hình cho mỗi yêu cầu, mức sử dụng từ các mô hình Composer là không giới hạn trên gói trả phí và không trừ tín dụng. Tự chọn mô hình bên thứ ba cao cấp sẽ trừ vào pool tín dụng hàng tháng của bạn. Khi pool đó hết, bạn có thể bật tính phí vượt mức theo mức dùng.

Bối cảnh giá

Giá của Cursor đã thay đổi vài lần trong năm qua. Tháng 6/2025, họ thay hệ thống cố định "500 yêu cầu nhanh/tháng" bằng tính phí theo tín dụng, hiệu quả làm số yêu cầu giảm từ khoảng 500 xuống khoảng 225 mỗi tháng ở bậc Pro.

Tính đến tháng 3/2026, các mô hình tuyến đầu như GPT-5.4 và Opus 4.6 tính vào pool tín dụng hàng tháng của bạn theo giá động theo token. Việc dùng Composer 2 vẫn ở pool riêng. Nếu bạn lập ngân sách cho đội nhóm, hãy ưu tiên Composer 2 cho công việc thường nhật và để dành tín dụng bên thứ ba cho tác vụ cần hơn.

Các hạn chế đã biết của Composer 2

Như đã đề cập ở phần so sánh, Composer 2 chỉ dành cho code. Đồng sáng lập Aman Sanger nói thẳng: "Nó sẽ không giúp bạn làm thuế. Nó sẽ không thể viết thơ." Với các tác vụ đa dụng, bạn vẫn cần Claude hoặc GPT trong Cursor.

Người dùng báo cáo rằng trong các kế hoạch thực thi cứng nhắc, nhiều bước, Composer 2 đôi khi bỏ qua các bước xác minh trung gian và vội vã triển khai. Nhiều khả năng đây là di chứng huấn luyện khiến mô hình ưu tiên hoàn tất hơn là xác minh.

Một số người dùng báo cáo rằng trên macOS, trình giám sát tệp nền của Cursor bỏ qua chỉ thị .gitignore trong các monorepo rất lớn, khiến tác tử lập chỉ mục cả thư mục phụ thuộc như node_modules và làm cạn hạn mức token ngoài dự kiến.

CursorBench vẫn là mã đóng. Với Terminal-Bench 2.0, Cursor đã "lấy điểm tối đa giữa điểm trên bảng xếp hạng chính thức và điểm ghi nhận khi chạy trên hạ tầng của chúng tôi" cho các mô hình không phải Composer, một lựa chọn phương pháp cần được lưu tâm.

Về tính minh bạch: Cursor không tiết lộ mô hình nền Kimi K2.5 trong bài blog ra mắt. Thiếu sót này lộ ra vào ngày 20/3/2026 khi một người dùng tìm thấy ID mô hình trong header yêu cầu API, làm dấy lên tranh luận công khai ngắn về tuân thủ giấy phép. Lin Qiao, CEO của Fireworks AI, làm rõ rằng Cursor tuân thủ ngay từ đầu thông qua nền tảng của Fireworks. Moonshot AI xác nhận thỏa thuận là hợp tác thương mại được ủy quyền. Cả Lee Robinson và đồng sáng lập Aman Sanger đều thừa nhận việc không công bố là "một thiếu sót" và cam kết minh bạch hơn về mô hình nền trong tương lai.

Kết luận

Cursor đã nói rõ: Composer 2 không cố trở thành mô hình mạnh nhất tổng thể. Trọng tâm là chi phí thấp cho công việc IDE hằng ngày.

Các điểm chuẩn đã nêu củng cố điều đó: Composer 2 vượt Claude Opus 4.6 trên Terminal-Bench 2.0 với chi phí mỗi token thấp hơn khoảng 90%, nhưng vẫn kém GPT-5.4 trên các điểm chuẩn khó hơn.

Thị trường đang hướng đến quy trình đa mô hình, và cách Cursor định giá Composer 2 cho thấy họ xây dựng dựa trên giả định đó.

Nếu bạn muốn tìm hiểu thêm về các công cụ AI định hình bức tranh phát triển phần mềm, hãy xem so sánh GPT-5.4 vs. Claude Opus 4.6.


Khalid Abdelaty's photo
Author
Khalid Abdelaty
LinkedIn

Tôi là một kỹ sư dữ liệu và người xây dựng cộng đồng, làm việc với pipeline dữ liệu, đám mây và công cụ AI, đồng thời viết các hướng dẫn thực hành, tác động cao cho DataCamp và các nhà phát triển mới nổi.

Composer 2 FAQs

Composer 2 có sẵn trên gói miễn phí không?

Blog của Cursor đề cập đến "gói cá nhân" mà không nêu rõ bậc Hobby có bao gồm hay không. Trên thực tế, gói Hobby có pool yêu cầu tác tử hạn chế và hết rất nhanh, nên bạn có thể thử vài tác vụ trước khi chạm trần. Nếu bạn muốn dùng Composer 2 ngoài các thử nghiệm nhanh, gói Pro ở mức $20/tháng là điểm khởi đầu thực tế.

Composer 2 nhanh cỡ nào so với Composer bản gốc?

Cursor chưa công bố số token mỗi giây chính xác cho Composer 2. Composer 1 chạy khoảng 250 TPS khi ra mắt. Với Composer 2, biến thể Fast nhanh hơn thấy rõ cho phiên tương tác, trong khi Standard đánh đổi tốc độ để có chi phí thấp hơn và phù hợp hơn cho tác vụ nền dài nơi bạn không chờ theo thời gian thực. Chưa có số liệu so sánh chính thức được công bố.

Tôi có thể chạy Composer 2 trên nhiều tệp cùng lúc không?

Có, chỉnh sửa đa tệp là một trong những mục đích cốt lõi. Trong một phiên, Composer 2 có thể đọc, tạo và chỉnh sửa tệp trên toàn bộ codebase của bạn. Nếu bạn cần làm hai hoặc ba tính năng độc lập cùng lúc, Cursor cũng hỗ trợ chạy tối đa 8 tác tử song song bằng git worktrees, mỗi tác tử làm việc trong một nhánh cách ly riêng. Điều này hữu ích khi các tác vụ không phụ thuộc nhau.

Điều gì xảy ra khi cửa sổ ngữ cảnh của Composer 2 đầy?

Tự tóm tắt kích hoạt tự động. Mô hình nén ngữ cảnh làm việc xuống khoảng 1.000 token và tiếp tục. Bạn cũng có thể kích hoạt thủ công với /compress nếu muốn giải phóng không gian ngữ cảnh giữa chừng. Nếu tác tử khuyên bắt đầu cuộc trò chuyện mới, thường nghĩa là tác vụ đã vượt quá mức nén xử lý gọn, và một phiên mới sẽ đáng tin cậy hơn.

Tôi nên dùng Composer 2 hay Claude Opus 4.6 trong Cursor?

Quy tắc ước chừng: nếu tác vụ gói gọn trong vài tệp và bạn mô tả rõ ràng, Composer 2 nhanh hơn và chi phí chỉ bằng một phần so với Opus 4.6. Nếu bạn làm việc cần suy luận trên codebase lớn, cân nhắc đánh đổi thiết kế, hoặc tạo đầu ra nơi độ chính xác quan trọng hơn tốc độ, Opus 4.6 đáng chi phí thêm. Nhiều nhà phát triển dùng cả hai tuỳ tác vụ, đúng với mục đích của bộ chuyển mô hình trong Cursor.

Chủ đề

Học với DataCamp

Courses

Triển khai Giải pháp AI trong Doanh nghiệp

2 giờ
49.8K
Xem chi tiếtRight Arrow
Bắt đầu khóa học
Xem thêmRight Arrow