Composer 2.5: Điểm chuẩn, giá và so sánh

Mẫu độc quyền mới nhất của Cursor, Composer 2.5, bổ sung phản hồi RL có mục tiêu, nhiều tác vụ huấn luyện tổng hợp hơn và giá token thấp hơn so với các mẫu tuyến đầu.

Đã cập nhật 22 thg 5, 2026 · 13 phút đọc

Cursor đã phát hành Composer 2.5 vào ngày 18 tháng 5, 2026, tức khoảng hai tháng sau khi Composer 2 ra mắt vào tháng 3. Khoảng cách ngắn giữa các phiên bản cho thấy Cursor đang cập nhật dòng mô hình riêng của mình rất nhanh.

Cursor cho biết Composer 2.5 đạt điểm gần với Claude Opus 4.7 và GPT-5.5 trên một số điểm chuẩn lập trình. Giá token của nó cũng thấp hơn các mẫu tuyến đầu. Việc huấn luyện cũng thay đổi: nhiều tác vụ tổng hợp hơn, môi trường huấn luyện khó hơn và phương pháp phản hồi nhắm vào các lỗi cụ thể trong các phiên lập trình dài.

Trong bài viết này, tôi xem Composer 2.5 không chỉ như một bản cập nhật điểm chuẩn. Tôi sẽ đề cập Composer 2.5 là gì, những gì đã thay đổi, các điểm chuẩn trông ra sao, mức giá so với các mẫu tuyến đầu, và nó phù hợp ở đâu trong quy trình làm việc lập trình. Cũng có những hạn chế đáng lưu ý trước khi bạn coi điểm số là toàn bộ câu chuyện.

Để có thêm bối cảnh về các mô hình khác trong so sánh này, hãy xem các hướng dẫn của chúng tôi về Claude Opus 4.7 và GPT-5.5.

Composer 2.5 của Cursor là gì?

Composer 2.5 là mô hình mới nhất trong họ Composer của Cursor, được xây dựng cho công việc lập trình bên trong Cursor IDE. Nó theo sau Composer 1, Composer 1.5 và Composer 2.

Dòng thời gian Composer từ khi ra mắt đến 2.5. Ảnh: Tác giả.

Đây không phải chatbot đa dụng. Composer 2.5 được huấn luyện cho các chỉnh sửa xuyên tệp, lệnh terminal, sử dụng công cụ và các phiên lập trình dài hơn. Mục tiêu huấn luyện và điểm chuẩn của nó tập trung vào các tác vụ kỹ thuật phần mềm.

Bài đăng ra mắt cho biết mô hình đạt điểm cao hơn Composer 2 ở các tác vụ lập trình và có hành vi khác trong các phiên dài. Hiện nó là tùy chọn mặc định trong bộ chọn mô hình của Cursor, dù Composer 2 vẫn còn. Nó cũng chỉ chạy bên trong Cursor. Không có API công khai, không có thẻ mô hình trên Hugging Face và không thể truy cập qua cổng của nhà cung cấp khác.

Những thay đổi trong Composer 2.5

Các thay đổi trong Composer 2.5 rơi vào hai nhóm: hiệu năng tác vụ lập trình và hành vi cộng tác. Vế đầu dễ đo lường hơn vế sau, nên đáng tách bạch điều Cursor có thể chứng minh bằng con số với phần mô tả định tính hơn.

Hiệu năng ở các tác vụ dài

Composer 2.5 nhắm tới các phiên lập trình dài, nơi mô hình cần đọc tệp, chạy lệnh terminal, sửa lỗi và lặp lại. Điều này quan trọng vì phát triển thực tế hiếm khi gói gọn trong một nhắc lệnh và một phản hồi.

Cursor đã huấn luyện mô hình trong các môi trường reinforcement learning khó hơn cho kiểu công việc này. Tác vụ được tạo trong quá trình huấn luyện và độ khó tăng dần theo thời gian.

Tuân thủ hướng dẫn và cộng tác

Bản phát hành cũng mô tả khả năng tuân thủ hướng dẫn đáng tin cậy hơn. Nó đề cập hiệu chuẩn nỗ lực: mô hình dành nhiều tài nguyên tính toán hơn cho tác vụ khó và tránh suy nghĩ quá mức cho tác vụ đơn giản.

Có một lưu ý: Cursor cho biết những thay đổi hành vi này "không được các điểm chuẩn hiện có phản ánh tốt." Vì vậy phần này chủ yếu dựa trên đánh giá của Cursor và phản hồi người dùng sớm, không dựa trên điểm số công khai.

Môi trường RL khó hơn

Bài đăng ra mắt mô tả thay đổi huấn luyện là "mở rộng quy mô huấn luyện, tạo môi trường RL phức tạp hơn và giới thiệu phương pháp học mới." Việc huấn luyện dùng số tác vụ tổng hợp gấp 25 lần so với Composer 2.

Cách Cursor huấn luyện Composer 2.5

Chi tiết huấn luyện giải thích vì sao mô hình thay đổi dù kiến trúc nền không mới. Composer 2.5 dùng cùng nền tảng với Composer 2, nhưng phần công việc sau huấn luyện nền đã thay đổi. Không phải chi tiết hạ tầng nào cũng quan trọng như nhau với độc giả, nhưng một vài phần giúp lý giải sự dịch chuyển điểm chuẩn.

Xây dựng trên Kimi K2.5

Composer 2.5 được xây trên cùng checkpoint nguồn mở như Composer 2: Kimi K2.5 của Moonshot AI. Cursor nói rõ điều này trong bài đăng ra mắt, điều quan trọng vì mô hình nền từng là điểm gây tranh luận quanh Composer 2.

Kimi K2.5 dùng kiến trúc Mixture of Experts. Cursor áp dụng tiền huấn luyện tiếp diễn và reinforcement learning trên nền đó, và cho biết khoảng 85% tổng chi phí tính toán cho mô hình cuối đến từ phần công việc riêng sau huấn luyện nền.

RL có mục tiêu với phản hồi văn bản

Đây là thay đổi kỹ thuật chính trong Composer 2.5. RL tiêu chuẩn cung cấp cho mô hình một tín hiệu thưởng ở cuối một chuỗi dài. Trong một phiên lập trình dài, phần thưởng cuối có thể quá nhiễu để chỉ ra mô hình sai ở đâu.

Giáo viên và học viên chia sẻ một lượt. Ảnh: Tác giả.

Phương pháp của Cursor chèn một gợi ý ngắn tại điểm mô hình đưa ra quyết định sai. Ví dụ, nếu mô hình gọi một công cụ không tồn tại, quy trình huấn luyện có thể chèn lời nhắc với danh sách công cụ đúng. Phiên bản có gợi ý đóng vai "giáo viên", còn mô hình gốc là "học viên". Mất mát chưng cất sau đó điều chỉnh hành vi của học viên tiến gần giáo viên chỉ ở lượt đó.

Kết quả là huấn luyện có mục tiêu hơn: có thể sửa lỗi riêng lẻ mà không coi cả một rollout dài là chung chung đúng hay sai. Cursor áp dụng phương pháp này trên phong cách mã, sử dụng công cụ và giao tiếp mô hình trong quá trình huấn luyện Composer 2.5.

Dữ liệu tổng hợp ở quy mô lớn hơn

Composer 2.5 được huấn luyện với số tác vụ tổng hợp gấp 25 lần Composer 2. Các tác vụ này dựa trên mã nguồn thực, không phải ví dụ đồ chơi.

Một cách tiếp cận Cursor mô tả là xóa tính năng. Một tác tử bắt đầu với một codebase thực và bộ kiểm thử lớn, rồi loại bỏ mã và tệp trong khi giữ phần còn lại của dự án hoạt động. Tác vụ tổng hợp là triển khai lại tính năng đã xóa, và các bài kiểm thử cung cấp tín hiệu thưởng có thể kiểm chứng.

Quy mô huấn luyện tổng hợp cũng mang rủi ro riêng. Cursor ghi nhận các trường hợp Composer 2.5 tìm lối tắt, gồm khôi phục thông tin đã xóa từ bộ nhớ đệm kiểm tra kiểu Python và dịch ngược bytecode Java để tái tạo API bên ngoài. Công ty cho biết đã phát hiện bằng công cụ giám sát, nhưng thừa nhận rằng huấn luyện ở quy mô này đòi hỏi "càng thận trọng hơn".

Thay đổi hạ tầng

Về phía hạ tầng, Cursor dùng Sharded Muon và dual mesh HSDP cho tiền huấn luyện tiếp diễn. Những thay đổi này giảm một phần chi phí và thời gian khi huấn luyện trên cụm GPU lớn.

Kết quả điểm chuẩn Composer 2.5: Terminal-Bench, SWE-Bench và CursorBench

Điểm chuẩn hữu ích, nhưng không phản ánh toàn bộ bức tranh. Tôi sẽ coi chúng là điểm khởi đầu để so sánh, không phải phán quyết đầy đủ về cảm nhận mô hình trong công việc hằng ngày.

Cursor đánh giá Composer 2.5 trên ba điểm chuẩn:

Điểm chuẩn	Composer 2.5	Claude Opus 4.7	GPT-5.5	Composer 2
SWE-Bench Multilingual	79.8%	80.5%	77.8%	73.7%
Terminal-Bench 2.0	69.3%	69.4%	82.7%	61.7%
CursorBench v3.1 (tác vụ khó hơn)	63.2%	64.8% (max) / 61.6% (default)	64.3% (xhigh) / 59.2% (default)	52.2%

SWE-Bench Multilingual kiểm tra liệu một mô hình có thể giải quyết các issue GitHub thực tế trên nhiều ngôn ngữ lập trình hay không. Mỗi tác vụ cung cấp cho mô hình một repository và mô tả vấn đề, sau đó kiểm tra bản vá có vượt qua bài test liên quan không.

Terminal-Bench 2.0 đo lường liệu một tác tử AI có thể vận hành trong quy trình terminal thực: kiểm tra tệp, chạy lệnh, gỡ lỗi khi thất bại và hoàn tất tác vụ qua nhiều bước.

CursorBench v3.1 là điểm chuẩn nội bộ riêng của Cursor. Nó đánh giá tác tử trên các tác vụ mơ hồ, đa tệp từ phiên Cursor thực, bao gồm hiểu codebase, tìm lỗi, lập kế hoạch và review mã. Hạn chế là CursorBench không thể được kiểm chứng hay tái lập bởi nhà nghiên cứu bên ngoài, và điểm số chỉ nên so sánh trong cùng phiên bản eval.

Có một lưu ý quan trọng trước khi đọc quá sâu vào các con số này. So sánh điểm chuẩn giữa các mô hình không phải lúc nào cũng "sạch". Thiết lập đánh giá và mức nỗ lực khác nhau có thể làm thay đổi điểm, và Cursor lưu ý rằng Opus 4.7 và GPT-5.5 dùng điểm tự báo cáo cho các đánh giá công khai. Hãy coi đây là so sánh định hướng, không phải kiểm thử trực tiếp dưới điều kiện giống hệt nhau.

Một điểm chuẩn bên ngoài sau đó từ Artificial Analysis cũng chỉ ra hướng tương tự, dù dùng tập điểm chuẩn khác. Composer 2.5 đạt 62 trên Artificial Analysis Coding Agent Index, sau Claude Opus 4.7 ở mức nỗ lực tối đa (66) và GPT-5.5 ở mức xhigh reasoning (65).

Khoảng cách chi phí là phần tôi sẽ chú ý: Artificial Analysis ước tính Composer 2.5 là $0.07 mỗi tác vụ cho Standard và $0.44 cho Fast, so với $4.10 cho Opus 4.7 max và $4.82 cho GPT-5.5 xhigh.

Composer 2.5 so với Composer 2 và Composer 1.5: So sánh điểm số

Họ Composer có ba lần phát hành trong thời gian ngắn. Composer 1.5 ra mắt tháng 2/2026, Composer 2 vào tháng 3, và Composer 2.5 vào tháng 5. Mỗi phiên bản thay đổi một khía cạnh khác nhau của cách huấn luyện.

Composer 2.5 so với Composer 2

Bước nhảy từ Composer 2 lên 2.5 thấy rõ nhất ở Terminal-Bench 2.0, nơi điểm tăng từ 61.7% lên 69.3%, và ở SWE-Bench Multilingual, từ 73.7% lên 79.8%. Mức tăng ở CursorBench nhỏ hơn, và phiên bản điểm chuẩn đổi từ v3 sang v3.1, nên so sánh kém trực tiếp hơn.

Khác biệt lớn hơn nằm ở pipeline huấn luyện. Composer 2 giới thiệu tiền huấn luyện tiếp diễn trên Kimi K2.5. Composer 2.5 giữ nền tảng đó và thêm phản hồi văn bản có mục tiêu, số tác vụ tổng hợp gấp 25 lần, cùng thay đổi hạ tầng. Giá Standard giữ nguyên.

Composer 2.5 so với Composer 1.5

Composer 1.5 được xây dựng bằng cách mở rộng reinforcement learning thêm 20 lần trên cùng mô hình tiền huấn luyện như Composer 1. Nó giới thiệu tư duy thích ứng và tự tóm tắt, cho phép mô hình nén bối cảnh của chính mình khi phiên làm việc kéo dài.

Khoảng cách từ Composer 1.5 đến 2.5 là lớn trên mọi điểm chuẩn. Nó cũng đi kèm giá token thấp hơn: Composer 1.5 có giá $3.50 mỗi triệu token đầu vào và $17.50 mỗi triệu token đầu ra, đắt hơn khoảng 7 lần so với Composer 2.5 Standard.

Thay đổi thực tế ra sao

Qua các phiên bản, xu hướng khá rõ: mỗi thế hệ đều thay đổi hành vi trong các phiên dài và tuân thủ hướng dẫn, trong khi Composer 2 và 2.5 giảm chi phí cho các phiên tác tử kéo dài.

Composer 2.5 so với Claude Opus 4.7 và GPT-5.5: Điểm chuẩn, giá và đánh đổi

Đây là so sánh nhiều độc giả sẽ quan tâm trước tiên. Composer 2.5 có điểm chuẩn lập trình tương tự ở một số mảng, giá token thấp hơn các mẫu tuyến đầu dưới đây, và có những đánh đổi rõ ràng.

So sánh điểm chuẩn

GPT-5.5 dẫn đầu ở Terminal-Bench 2.0 với 82.7%, hơn Composer 2.5 khoảng 13 điểm. Khoảng cách này quan trọng với công việc phụ thuộc nặng vào terminal.

Claude Opus 4.7 nhỉnh hơn chút trên SWE-Bench Multilingual (80.5% so với 79.8%), chưa đến một điểm. Trên CursorBench, Composer 2.5 đạt 63.2% cao hơn Opus 4.7 ở thiết lập mặc định (61.6%) nhưng thấp hơn Opus 4.7 ở mức nỗ lực tối đa (64.8%). GPT-5.5 cũng đạt 64.3% ở xhigh, trong khi điểm mặc định là 59.2%.

Những mô hình này không làm cùng một việc. Opus 4.7 và GPT-5.5 là các mẫu tuyến đầu rộng. Composer 2.5 là mô hình lập trình chỉ chạy trong Cursor. Điểm chuẩn gần nhau ở một số tác vụ lập trình, nhưng ranh giới sản phẩm khác nhau.

So sánh giá

Khác biệt chi phí là đường ranh rõ ràng nhất so với các mô hình tuyến đầu.

Mô hình	Đầu vào (mỗi 1M token)	Đầu ra (mỗi 1M token)
Composer 2.5 Standard	$0.50	$2.50
Composer 2.5 Fast (mặc định)	$3.00	$15.00
Claude Opus 4.7	$5.00	$25.00
GPT-5.5	$5.00	$30.00

Composer 2.5 Standard có mức giá vào khoảng một phần mười so với Opus 4.7 và GPT-5.5 tính theo token. Biến thể Fast cũng có giá thấp hơn bậc tiêu chuẩn của cả hai mẫu tuyến đầu.

Các mức giá này cập nhật đến tháng 5/2026, nên hãy kiểm tra giá mô hình của Cursor, giá Opus của Anthropic và giá API của OpenAI trước khi dựa vào so sánh.

Một lưu ý hay bị bỏ sót: giá Composer 2.5 Fast đã tăng gấp đôi so với Composer 2 Fast. Giá Standard giữ nguyên, nhưng Fast là mặc định, nên việc nâng cấp vẫn có thể làm tăng chi phí cho một số người dùng.

Bạn nên chọn mô hình nào?

Việc chọn mô hình phụ thuộc vào yếu tố nào quan trọng nhất: chi phí, công việc trong terminal hay lập kế hoạch sâu:

Composer 2.5 phù hợp cho lập trình hằng ngày trong Cursor, đặc biệt là chỉnh sửa xuyên tệp, tái cấu trúc, gỡ lỗi và các phiên tác tử nơi chi phí quan trọng.
GPT-5.5 phù hợp cho tác vụ mà hiệu năng terminal là ưu tiên hàng đầu.
Claude Opus 4.7 phù hợp cho tác vụ cần lý luận cẩn trọng, lập kế hoạch kiến trúc hoặc cửa sổ ngữ cảnh 1 triệu token.

Đó là mô thức tôi rút ra từ số liệu: Composer 2.5 bao phủ công việc lập trình thường nhật, trong khi các mẫu tuyến đầu vẫn có vai trò cho bài toán cần lý luận rộng hơn hoặc điểm terminal cao hơn.

Composer 2.5 Standard vs. Fast: Tốc độ, giá và khi nào dùng mỗi loại

Cursor cung cấp Composer 2.5 với hai biến thể, như với Composer 2. Theo Cursor, cả hai chia sẻ cùng nền tảng trí tuệ. Khác biệt chủ yếu là tốc độ phản hồi và chi phí.

Bộ chọn mô hình của Cursor với Composer được chọn. Ảnh: Tác giả.

Fast là mặc định và có giá $3.00 mỗi triệu token đầu vào và $15.00 mỗi triệu token đầu ra. Nó hướng tới phiên tương tác nơi độ trễ thấp quan trọng. Standard có giá $0.50 và $2.50, phù hợp cho tác vụ nền hoặc vòng lặp tác tử dài nơi phản hồi tức thì ít quan trọng hơn.

Việc sử dụng Composer 2.5 nằm trong nhóm "Auto + Composer" của Cursor, tách biệt với nhóm API dùng cho mô hình bên ngoài như Claude và GPT. Cursor cũng cung cấp gấp đôi hạn mức sử dụng trong tuần đầu sau khi ra mắt.

Hạn chế và lưu ý của Composer 2.5

Các lưu ý xoay quanh quyền truy cập, điểm chuẩn và rủi ro huấn luyện. Chúng không làm Composer 2.5 trở nên bất thường, nhưng ảnh hưởng đến mức độ tin cậy đối với tuyên bố của Cursor.

Chỉ có trong Cursor. Như đã đề cập, Composer 2.5 không có API công khai. Nếu quy trình của bạn cần gọi mô hình từ script hay pipeline riêng, Composer 2.5 không phải lựa chọn.

CursorBench không độc lập. Như đã trình bày ở phần điểm chuẩn, CursorBench v3.1 là nội bộ của Cursor. Phương pháp luận không hoàn toàn công khai và tác vụ không thể được tái lập bởi nhà nghiên cứu bên ngoài.

Biến thiên thiết lập điểm chuẩn. Điểm của các mô hình tuyến đầu trong biểu đồ điểm chuẩn của Cursor không phải đều đo theo cùng cách. Hãy coi so sánh là định hướng, không phải kết luận dứt khoát.

Reward hacking trong huấn luyện. Cursor tiết lộ các trường hợp mô hình tìm lối tắt khéo léo trong tác vụ tổng hợp thay vì giải quyết bình thường. Đây là rủi ro cố hữu của RL ở quy mô này, ngay cả khi giám sát bắt được ví dụ rõ ràng.

Hiệu chuẩn nỗ lực chưa được xác minh. Các tuyên bố của Cursor về phong cách giao tiếp và hiệu chuẩn nỗ lực không được hậu thuẫn bằng dữ liệu điểm chuẩn, như đã nêu. Điều đó khiến khó kiểm chứng từ bên ngoài.

Khi nào nên dùng Composer 2.5

Điều này phụ thuộc vào tác vụ. Tôi sẽ coi Composer 2.5 ít là lựa chọn mô hình phổ quát, mà là mô hình lập trình cho những người vốn đã làm việc trong Cursor.

Nếu bạn dành phần lớn thời gian lập trình trong Cursor và chú ý chi phí token, Composer 2.5 Standard có giá thấp nhất trong dòng Composer 2.5. Điều này áp dụng cho các công việc chỉnh sửa, tái cấu trúc, gỡ lỗi và phiên dài như đã mô tả.

Nếu tốc độ phản hồi quan trọng hơn, Composer 2.5 Fast là tùy chọn mặc định.

Nếu tác vụ cần lý luận rộng hơn, cửa sổ ngữ cảnh lớn hơn, hoặc điểm chuẩn cao hơn ở một mảng cụ thể, Claude Opus 4.7 hoặc GPT-5.5 có thể phù hợp với tác vụ đó.

Một cách diễn đạt: Composer 2.5 xử lý công việc lập trình thường nhật như đã đề cập, trong khi một mô hình tuyến đầu có thể phù hợp với tác vụ cần lý luận rộng hơn hoặc điểm terminal cao hơn. Cách này giữ so sánh thực tế mà không biến nó thành khuyến nghị một mô hình cho mọi trường hợp.

Lời kết

Dễ coi Composer 2.5 như một câu chuyện điểm chuẩn, nhưng theo tôi điểm hữu ích hơn là hướng đi. Cursor không chỉ bọc các mô hình tuyến đầu trong một trình soạn thảo. Họ đang xây dựng một dòng mô hình xoay quanh kiểu công việc tác tử của họ vốn làm: chỉnh sửa xuyên tệp, bước terminal, phiên dài và phục hồi sau lỗi.

Như đã nói, đánh đổi là Composer 2.5 được thiết kế hẹp mục đích. Nó không thay thế Claude Opus 4.7 hay GPT-5.5 như mô hình đa dụng, và không giúp nếu bạn cần API ngoài Cursor. Nhưng trong Cursor, sự tập trung hẹp chính là điểm mạnh. Mô hình rẻ hơn để chạy so với các lựa chọn tuyến đầu, được tinh chỉnh cho tác vụ lập trình, và nằm gần lớp sản phẩm nơi các tác vụ đó diễn ra.

Câu hỏi tiếp theo là Cursor muốn tự nắm bao nhiêu. Công ty cho biết đang hợp tác với SpaceXAI để huấn luyện một mô hình lớn hơn từ đầu, dùng tổng compute gấp 10 lần và hạ tầng Colossus 2. Chưa có ngày phát hành, nên chưa có nhiều điều để phân tích. Dẫu vậy, hình hài cơ bản đã khá rõ: Cursor đang chuyển từ việc sử dụng mô hình tốt sang tự xây dựng nhiều phần của ngăn xếp mô hình.

Tôi có thể dùng Composer 2.5 ngoài Cursor không?

Composer 2.5 có sẵn trong gói Hobby miễn phí không?

Tại sao Composer 2.5 được xây trên một mô hình nguồn mở của Trung Quốc?

Composer 2.5 tốn bao nhiêu cho mỗi tác vụ?

Biến thể Fast có cho chất lượng đầu ra khác Standard không?

Author

Khalid Abdelaty

Chủ đề

Trí tuệ Nhân tạo

Mô hình Ngôn ngữ Lớn

Các khóa học AI hàng đầu

Courses

Introduction to Claude Models

3 giờ

11.2K

Learn how to work with Claude using the Anthropic API to solve real-world tasks and build AI-powered applications.

Xem chi tiết

Bắt đầu khóa học

Courses

AI-Assisted Coding for Developers

1 giờ 30 phút

6.5K

Boost your coding with AI—guide your coding assistant to write, test, and document code effectively.

Xem chi tiết

Bắt đầu khóa học

Courses

Software Development with Cursor

1 giờ 30 phút

3.4K

Build production-ready code with Cursor. Learn AI prompts, refactoring, testing, and advanced workflows.

Xem chi tiết

Bắt đầu khóa học

Xem thêm

Có liên quan

blogs

Claude Opus 4.6: Tính năng, điểm chuẩn, các bài kiểm tra thực hành và hơn thế nữa

Mô hình mới nhất của Anthropic dẫn đầu bảng xếp hạng về mã hóa theo hướng tác nhân và suy luận phức tạp. Thêm nữa, nó có cửa sổ ngữ cảnh 1M.

Matt Crabtree

10 phút

Xem thêm Xem thêm

Composer 2.5 của Cursor là gì?

Những thay đổi trong Composer 2.5

Hiệu năng ở các tác vụ dài

Tuân thủ hướng dẫn và cộng tác

Môi trường RL khó hơn

Cách Cursor huấn luyện Composer 2.5

Xây dựng trên Kimi K2.5

RL có mục tiêu với phản hồi văn bản

Dữ liệu tổng hợp ở quy mô lớn hơn

Thay đổi hạ tầng

Kết quả điểm chuẩn Composer 2.5: Terminal-Bench, SWE-Bench và CursorBench

Composer 2.5 so với Composer 2 và Composer 1.5: So sánh điểm số

Composer 2.5 so với Composer 2

Composer 2.5 so với Composer 1.5

Thay đổi thực tế ra sao

Composer 2.5 so với Claude Opus 4.7 và GPT-5.5: Điểm chuẩn, giá và đánh đổi

So sánh điểm chuẩn

So sánh giá

Bạn nên chọn mô hình nào?

Composer 2.5 Standard vs. Fast: Tốc độ, giá và khi nào dùng mỗi loại

Hạn chế và lưu ý của Composer 2.5

Khi nào nên dùng Composer 2.5

Lời kết

Composer 2.5 FAQs

Tại sao Composer 2.5 được xây trên một mô hình nguồn mở của Trung Quốc?

Composer 2.5 tốn bao nhiêu cho mỗi tác vụ?

Biến thể Fast có cho chất lượng đầu ra khác Standard không?

Claude Opus 4.6: Tính năng, điểm chuẩn, các bài kiểm tra thực hành và hơn thế nữa

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Introduction to Claude Models

AI-Assisted Coding for Developers

Software Development with Cursor

Claude Opus 4.6: Tính năng, điểm chuẩn, các bài kiểm tra thực hành và hơn thế nữa

Introduction to Claude Models