Cursor Composer AI：革命性的軟體工程智能與速度

在快速迭代的軟體開發世界中，效率與智能是決勝的關鍵。Cursor，一個致力於為軟體工程打造先進工具的平台，最近發佈了一項重大突破——全新的 Agent 模型：Composer。這不僅僅是一個語言模型，而是專為提升軟體工程的智能與速度而設計的革命性智能體，承諾將開發者的工作流程推向新的高度。

Composer 的誕生：軟體工程智能的演進

Cursor 的開發團隊在打造自家產品的過程中，深刻體會到開發者對高效、互動式AI助手的需求。從早期基於自訂補全模型 Tab 的經驗，到探索更快速的代理模型原型 Cheetah，他們發現，能支援互動、讓開發者保持專注與流暢是至關重要的。Composer 正是基於這些洞察而生，它不僅比 Cheetah 更為智能，更具備了支援無縫互動體驗的速度，讓寫程式的過程依然順暢而愉悅。

Composer 的核心是一個混合專家（MoE）語言模型，這意味著它能夠處理長脈絡的生成與理解，這對於理解複雜的程式碼庫和工程專案至關重要。透過在各式開發環境中進行強化學習（RL），Composer 專精於軟體工程的各種任務。在訓練過程中，它被賦予解決真實世界軟體工程難題的能力，並能夠存取生產級的搜尋與編輯工具，以高效率解決多樣且棘手的問題。

Cursor Bench：衡量真實價值的基準測試

為了精確衡量 Composer 的效能，Cursor 開發了一套獨特的評估基準測試——Cursor Bench。這套測試不僅僅是學術上的比較，更是由 Cursor 的工程師與研究人員實際提出的 Agent 請求，並經過人工精選的最佳解法所組成。這種貼近真實開發場景的設計，確保了評估能夠真實反映模型對軟體開發者的實用價值。

Cursor Bench 不僅檢驗 Agent 的正確性，更重要的是，它衡量 Agent 對既有程式碼庫的抽象理解能力，以及對軟體工程實務的遵循程度。這意味著 Composer 不僅能夠生成程式碼，更能理解現有專案的脈絡，並與團隊的開發規範保持一致。

Composer 的核心能力與訓練機制

Composer 的訓練圍繞著兩個核心要素：大規模軟體工程難題的處理和高效的工具使用。

專精於軟體工程： 透過強化學習（RL），Composer 被訓練成一個軟體工程的專家。在每次訓練迭代中，它會接收問題描述，並被指示產生最佳回應，無論是程式碼編輯、規劃方案，還是提供資訊豐富的解答。
強大的工具支援： Composer 不僅是一個語言模型，它還能有效運用各種工具。這些工具從簡單的讀取和編輯檔案，到更強大的終端機指令和針對整個程式碼庫的語意搜尋，使其能夠在複雜的開發環境中執行任務。
速度與效率的追求： 由於回應速度是互動式開發的關鍵，Cursor 在訓練 Composer 時，積極鼓勵模型做出高效率的工具使用選擇，並盡可能提高平行化。這使得 Composer 在生成速度上表現出色，比同類模型快四倍。

透過 RL 過程，Composer 學會了許多實用的行為，例如：

進行複雜的程式碼搜尋。
自動修正 linter 錯誤。
撰寫並執行單元測試。

這些能力的培養，使得 Composer 成為一個更像人類開發者的智能助手，能夠主動解決問題，而非被動回應指令。

底層技術：高效訓練大型 MoE 模型

要實現 Composer 這樣大規模且高效的模型，離不開底層基礎設施與系統研究的大量投入。Cursor 在這方面展現了卓越的工程實力：

客製化訓練基礎設施： 使用 PyTorch 與 Ray 打造的客製化訓練基礎設施，支援大規模非同步強化學習。
MXFP8 MoE kernels： 結合自家 MXFP8 MoE kernels 與 expert parallelism 和混合分片式資料並行，實現了原生以低精度訓練模型，極大降低了通訊成本，並能擴展至上萬個 NVIDIA GPU。
更快推論速度： 以 MXFP8 訓練不僅提高了訓練效率，還能在無需訓練後量化的情況下，提供更快的推論速度，這對於 Composer 提供的即時互動體驗至關重要。

為開發者而生：Cursor 的自研與自用

Cursor 開發 Composer 的動機，是打造一個連他們自己都優先採用的 Agent。這種「自研自用」的理念，保證了 Composer 的設計初衷始終圍繞著提升開發者的實際體驗。事實上，在 Composer 發佈前，Cursor 的許多同事已經在日常軟體開發中積極使用 Composer，並對其價值給予了高度肯定。

這也意味著，當你使用 Composer 時，你所獲得的將是一個經過真實世界開發者檢驗、並且不斷被優化的工具。它不僅僅是一個技術產品，更是 Cursor 工程團隊對軟體開發未來的一種願景的實踐。

Cursor Composer 的性能亮點與對標

在實際效能上，Composer 展現了令人印象深刻的表現。根據 Cursor 工具環境中的內部基準測試：

頂尖的程式設計表現： Composer 在程式設計上的表現達到了頂尖水準。
四倍的生成速度： 相較於同類模型，Composer 的生成速度快了四倍，這對於需要即時反饋的開發者而言是巨大的優勢。

為了提供更清晰的性能對照，Cursor 將模型分級並進行比較：

「Fast Frontier」：包含為高效推論設計的模型，如 Haiku 4.5 與 Gemini Flash 2.5。
「Best Open」：包含近期開放權重的模型發佈，如 Qwen Coder 與 GLM 4.6。
「Frontier 7/2025」：指今年 7 月可用的最佳模型。
「Best Frontier」：包含 GPT-5 與 Sonnet 4.5，這兩者均優於 Composer。

值得注意的是，針對每秒權杖數（Tokens per Second, TPS）的計算，Cursor 將各模型的權杖統一以最新的 Anthropic tokenizer 進行標準化，確保了比較的公平性。雖然 Composer 在「Best Frontier」類別中並非最強，但其在速度和綜合性能上的平衡，使其成為軟體工程領域極具競爭力的選擇。

結論：迎接更智能、更快速的開發未來

Composer 的出現，標誌著 AI 在軟體工程領域的又一次飛躍。它不僅以其卓越的程式設計能力和驚人的生成速度，重新定義了開發者對 AI 助手的期待，更透過其強大的工具整合能力和對真實世界開發難題的深入理解，成為了開發者不可或缺的夥伴。

Cursor 以開放和創新的精神，不斷推動技術的邊界。Composer 這一強大的 Agent 模型，正為我們開啟一個更智能、更高效、也更愉悅的軟體開發未來。無論你是正在尋找提升開發效率的工具，或是對 AI 在程式設計中的應用充滿好奇，Composer 都值得你深入探索。

立即加入🚀🔥Mentalok 慢得樂 Vibe-Coding & Tech Startup創業課程官方頻道，取得更多即時AI，創業及Funding資訊。
立即加入🚀🔥Mentalok 慢得樂 Vibe-Coding & Tech Startup創業課程官方頻道，取得更多即時AI，創業及Funding資訊。

Source：https://cursor.com/zh-Hant/blog/composer