在快速迭代的軟體開發世界中,效率與智能是決勝的關鍵。Cursor,一個致力於為軟體工程打造先進工具的平台,最近發佈了一項重大突破——全新的 Agent 模型:Composer。這不僅僅是一個語言模型,而是專為提升軟體工程的智能與速度而設計的革命性智能體,承諾將開發者的工作流程推向新的高度。
Composer 的誕生:軟體工程智能的演進
Cursor 的開發團隊在打造自家產品的過程中,深刻體會到開發者對高效、互動式AI助手的需求。從早期基於自訂補全模型 Tab 的經驗,到探索更快速的代理模型原型 Cheetah,他們發現,能支援互動、讓開發者保持專注與流暢是至關重要的。Composer 正是基於這些洞察而生,它不僅比 Cheetah 更為智能,更具備了支援無縫互動體驗的速度,讓寫程式的過程依然順暢而愉悅。
Composer 的核心是一個混合專家(MoE)語言模型,這意味著它能夠處理長脈絡的生成與理解,這對於理解複雜的程式碼庫和工程專案至關重要。透過在各式開發環境中進行強化學習(RL),Composer 專精於軟體工程的各種任務。在訓練過程中,它被賦予解決真實世界軟體工程難題的能力,並能夠存取生產級的搜尋與編輯工具,以高效率解決多樣且棘手的問題。
>
Cursor Bench:衡量真實價值的基準測試
為了精確衡量 Composer 的效能,Cursor 開發了一套獨特的評估基準測試——Cursor Bench。這套測試不僅僅是學術上的比較,更是由 Cursor 的工程師與研究人員實際提出的 Agent 請求,並經過人工精選的最佳解法所組成。這種貼近真實開發場景的設計,確保了評估能夠真實反映模型對軟體開發者的實用價值。
Cursor Bench 不僅檢驗 Agent 的正確性,更重要的是,它衡量 Agent 對既有程式碼庫的抽象理解能力,以及對軟體工程實務的遵循程度。這意味著 Composer 不僅能夠生成程式碼,更能理解現有專案的脈絡,並與團隊的開發規範保持一致。
Composer 的核心能力與訓練機制
Composer 的訓練圍繞著兩個核心要素:大規模軟體工程難題的處理和高效的工具使用。
- 專精於軟體工程: 透過強化學習(RL),Composer 被訓練成一個軟體工程的專家。在每次訓練迭代中,它會接收問題描述,並被指示產生最佳回應,無論是程式碼編輯、規劃方案,還是提供資訊豐富的解答。
- 強大的工具支援: Composer 不僅是一個語言模型,它還能有效運用各種工具。這些工具從簡單的讀取和編輯檔案,到更強大的終端機指令和針對整個程式碼庫的語意搜尋,使其能夠在複雜的開發環境中執行任務。
- 速度與效率的追求: 由於回應速度是互動式開發的關鍵,Cursor 在訓練 Composer 時,積極鼓勵模型做出高效率的工具使用選擇,並盡可能提高平行化。這使得 Composer 在生成速度上表現出色,比同類模型快四倍。
透過 RL 過程,Composer 學會了許多實用的行為,例如:
- 進行複雜的程式碼搜尋。
- 自動修正 linter 錯誤。
- 撰寫並執行單元測試。
這些能力的培養,使得 Composer 成為一個更像人類開發者的智能助手,能夠主動解決問題,而非被動回應指令。
>
底層技術:高效訓練大型 MoE 模型
要實現 Composer 這樣大規模且高效的模型,離不開底層基礎設施與系統研究的大量投入。Cursor 在這方面展現了卓越的工程實力:
- 客製化訓練基礎設施: 使用 PyTorch 與 Ray 打造的客製化訓練基礎設施,支援大規模非同步強化學習。
- MXFP8 MoE kernels: 結合自家 MXFP8 MoE kernels 與 expert parallelism 和混合分片式資料並行,實現了原生以低精度訓練模型,極大降低了通訊成本,並能擴展至上萬個 NVIDIA GPU。
- 更快推論速度: 以 MXFP8 訓練不僅提高了訓練效率,還能在無需訓練後量化的情況下,提供更快的推論速度,這對於 Composer 提供的即時互動體驗至關重要。
為開發者而生:Cursor 的自研與自用
Cursor 開發 Composer 的動機,是打造一個連他們自己都優先採用的 Agent。這種「自研自用」的理念,保證了 Composer 的設計初衷始終圍繞著提升開發者的實際體驗。事實上,在 Composer 發佈前,Cursor 的許多同事已經在日常軟體開發中積極使用 Composer,並對其價值給予了高度肯定。
這也意味著,當你使用 Composer 時,你所獲得的將是一個經過真實世界開發者檢驗、並且不斷被優化的工具。它不僅僅是一個技術產品,更是 Cursor 工程團隊對軟體開發未來的一種願景的實踐。
Cursor Composer 的性能亮點與對標
在實際效能上,Composer 展現了令人印象深刻的表現。根據 Cursor 工具環境中的內部基準測試:
- 頂尖的程式設計表現: Composer 在程式設計上的表現達到了頂尖水準。
- 四倍的生成速度: 相較於同類模型,Composer 的生成速度快了四倍,這對於需要即時反饋的開發者而言是巨大的優勢。
為了提供更清晰的性能對照,Cursor 將模型分級並進行比較:
- 「Fast Frontier」:包含為高效推論設計的模型,如 Haiku 4.5 與 Gemini Flash 2.5。
- 「Best Open」:包含近期開放權重的模型發佈,如 Qwen Coder 與 GLM 4.6。
- 「Frontier 7/2025」:指今年 7 月可用的最佳模型。
- 「Best Frontier」:包含 GPT-5 與 Sonnet 4.5,這兩者均優於 Composer。
值得注意的是,針對每秒權杖數(Tokens per Second, TPS)的計算,Cursor 將各模型的權杖統一以最新的 Anthropic tokenizer 進行標準化,確保了比較的公平性。雖然 Composer 在「Best Frontier」類別中並非最強,但其在速度和綜合性能上的平衡,使其成為軟體工程領域極具競爭力的選擇。
結論:迎接更智能、更快速的開發未來
Composer 的出現,標誌著 AI 在軟體工程領域的又一次飛躍。它不僅以其卓越的程式設計能力和驚人的生成速度,重新定義了開發者對 AI 助手的期待,更透過其強大的工具整合能力和對真實世界開發難題的深入理解,成為了開發者不可或缺的夥伴。
Cursor 以開放和創新的精神,不斷推動技術的邊界。Composer 這一強大的 Agent 模型,正為我們開啟一個更智能、更高效、也更愉悅的軟體開發未來。無論你是正在尋找提升開發效率的工具,或是對 AI 在程式設計中的應用充滿好奇,Composer 都值得你深入探索。
立即加入🚀🔥Mentalok 慢得樂 Vibe-Coding & Tech Startup創業課程官方頻道,取得更多即時AI,創業及Funding資訊。
立即加入🚀🔥Mentalok 慢得樂 Vibe-Coding & Tech Startup創業課程官方頻道,取得更多即時AI,創業及Funding資訊。



