
整理 | 華衛(wèi)、核子可樂
近日,一款名為“Quasar Alpha”、不知來源的神秘 AI 模型悄然上線,并迅速成為第三方平臺 OpenRouter(一個提供統(tǒng)一接口訪問多種 AI 語言模型的服務(wù)平臺)上使用率排名第一的計算機編程類 AI 模型(基于連續(xù)數(shù)天的 token 消費量),甚至被評價“比現(xiàn)在出現(xiàn)的任何模型都要好”。更令人驚訝的是,多位模型體驗者及業(yè)內(nèi)研究人員從種種技術(shù)細節(jié)中發(fā)現(xiàn),Quasar Alpha 很可能是 OpenAI 的新版本模型。
體驗地址:https://www.quasar-alpha.org/
據(jù)了解,Quasar Alpha 在幾天前被推出,其擁有 100 萬 token 上下文窗口、能處理超長文本和復(fù)雜文檔,代碼生成能力出色、指令遵循能力強,支持聯(lián)網(wǎng)功能和多模態(tài)功能,且完全免費提供使用。并且,在 Quasar Alpha 在 AI 社區(qū)引發(fā)熱烈討論后,另一款神秘模型 Optimus Alpha 又在昨日被推出,同樣是免費開放的,再度點燃大家的關(guān)注熱情。
目前所公開的信息
根據(jù)公開的項目公告,Quasar Alpha 是一個向社區(qū)提供的經(jīng)過偽裝處理的通用模型,目的是收集反饋意見。該模型的所有提示和生成內(nèi)容都會由提供者記錄下來,且可能會被用于改進該模型。
項目地址:https://openrouter.ai/openrouter/quasar-alpha
Quasar Alpha 的最大亮點在于其超長的上下文處理能力。100 萬 token 的上下文長度意味著該模型能夠一次性處理相當(dāng)于數(shù)百頁文檔的信息量,這一特性使其在長序列任務(wù)中具備顯著優(yōu)勢,尤其是在需要深度理解和復(fù)雜推理的場景中。
并且,該模型專門針對編碼任務(wù)進行了優(yōu)化,能夠高效生成高質(zhì)量代碼,但其設(shè)計初衷仍定位于通用型 AI 工具,適用于從文本生成到數(shù)據(jù)分析的多樣化應(yīng)用。這種兼顧專業(yè)性與廣泛性的設(shè)計,正在讓 Quasar Alpha 在眾多 AI 模型中脫穎而出,各類用例持續(xù)激增。
從概覽頁面來看,該模型正在迅速獲得關(guān)注,目前已經(jīng)在五大用例類別中挺進前十。根據(jù) OpenRouter 提供的統(tǒng)計數(shù)據(jù),調(diào)用 Quasar Alpha 的知名應(yīng)用包括 Roo Code 與 Cline 等,二者均為依托 AI 編碼的開源 VS Code 擴展,這也表明 Quasar Alpha 算是一款穩(wěn)定可靠的模型。

另一款神秘模型 Optimus Alpha 同樣具有 100 萬 token 上下文窗口和表現(xiàn)卓越的編碼能力。不同的是,Optimus Alpha 針對通用任務(wù)進行了優(yōu)化,適用于現(xiàn)實世界中的各種應(yīng)用場景。并且,Optimus Alpha 目前也獲得多個知名應(yīng)用的調(diào)用。

項目地址:https://openrouter.ai/openrouter/optimus-alpha
值得注意的是,Optimus Alpha 為 300 多家模型及供應(yīng)商提供了一個與 OpenAI 兼容的補全 API,用戶可以直接調(diào)用它,也可以使用 OpenAI 軟件開發(fā)工具包來調(diào)用。此外,還有一些第三方軟件開發(fā)工具包可供使用。
種種線索將來源指向 OpenAI
然而,Quasar Alpha 和 Optimus Alpha 的神秘性也引發(fā)了 AI 社區(qū)的一些疑問。其具體來源至今未明,有人猜測它可能是某大型科技公司(如 OpenAI 或 Google)的實驗性項目,甚至可能是下一代旗艦?zāi)P偷臏y試版。
X 用戶 paradite_ 注意到,Quasar Alpha 的風(fēng)格與 OpenAI 目前的頂級模型 GPT-4o 非常相似,這讓人不禁懷疑 Quasar Alpha 是否出自 OpenAI,只是換了個名字而已。
并且,有許多關(guān)于 Quasar Alpha 或出自 OpenAI 之手的其他技術(shù)細節(jié)被一一披露出來,具體如下:
Quasar Alpha 的工具調(diào)用 ID 格式與 OpenAI 格式一致,這款新模型還在消息對象中支持“name”字段,該字段由 chat completion API 范式提供。目前只有兩家 AI 提供商支持“name”字段,分別為 xAI 與 OpenAI。
在生成細節(jié)中發(fā)現(xiàn)的 upstream ID 與 OpenAI 生成 ID 相同。
存在一些與 OpenAI 高度相似的層次聚類模式。
X 用戶 Pallav Agarwal 發(fā)布的一張與 Quasar Alpha 聊天的截圖,也進一步顯示出 Quasar Alpha 與 OpenAI 之間的關(guān)聯(lián)。

為了進一步探究,AI 研究員 Sam Paech 針對模型輸出結(jié)果,運用了被稱為 PHYLIP 簡約法(PHYLIP pars)的生物信息學(xué)聚類工具。這種方法通過找出模型回復(fù)內(nèi)容中的細微差異,來檢驗各個模型之間的關(guān)聯(lián)。與常規(guī)聚類方法不同,PHYLIP 簡約法旨在尋找出最為簡潔的模型譜系樹。Paech 發(fā)現(xiàn),Quasar Alpha 與 OpenAI 的模型極為相近,尤其是與 GPT 4.5 預(yù)覽版,并且與其他模型存在顯著差異。

另值得一提的是,據(jù)外媒昨日報道,OpenAI 將推出一系列全新 AI 模型,其中包括作為 GPT-4o 升級本的 GPT-4.1,同時還將推出出更輕量級的 GPT-4.1 mini 和 nano 版本,以滿足不同應(yīng)用場景的需求。
所有這些線索似乎都強烈表明:Quasar Alpha 歸 OpenAI 所有,又或者有人正在極力模仿 OpenAI 的 API 設(shè)計。有不少網(wǎng)友猜測道,“ Quasar Alpha 可能是 GPT-4.1,而 Optimus Alpha 是 GPT-4.1 mini?!边€有人甚至猜測,其神秘面紗背后隱藏的可能是 OpenAI 的 o4-mini-low 模型,“營銷鬼才這是又想出新招來了”。
而就在今天,OpenAI 的 CEO Sam Altman 也公開稱贊了 Quasar Alpha 模型,稱其是“非常明亮的事物”。

至于為何 AI 實驗室會選擇在沒有大規(guī)模宣傳的情況下秘密推出一款模型,有觀點認為,在不炒作的情況下于現(xiàn)實環(huán)境中進行測試,能夠收集到開發(fā)者真實的反饋意見,同時保持低調(diào)可以減輕滿足過高期望所帶來的壓力。秘密發(fā)布還能夠促使這款模型與市場上的其他模型進行更為公平、客觀的比較,而不會受到營銷宣傳言論的干擾。
此外,Quasar Alpha 的“隱秘”(Stealth)標簽和預(yù)發(fā)布狀態(tài)也讓外界對其成熟度和穩(wěn)定性存有好奇。專家指出,盡管 Quasar Alpha 在編碼和長上下文任務(wù)中表現(xiàn)優(yōu)異,但在其他通用場景下的全面性能仍需進一步驗證。
性能超越任何現(xiàn)有模型?
目前的用戶反饋顯示,Quasar Alpha 表現(xiàn)出很強的能力,尤其是在編程和遵循指令方面。
據(jù)開源 AI 配對編程工具創(chuàng)建者 AiderPaul Gauthier 稱,Quasar Alpha 運行起來似乎非??欤?Aider 多語言編碼基準測試中取得了 55% 的成績,可與 o3 - mini - medium、DeepSeek V3 以及 Claude 3.5 Sonnet 相抗衡。

X 用戶 paradite_ 在體驗 Quasar Alpha 后表示,該模型在遵循指令方面比 Claude 3.5 Sonnet 和 Gemini 2.5 Pro 出色得多,并評價:“就我默認的編碼測試提示而言,它給出了我目前為止所見過的最佳輸出結(jié)果。 ”

對于關(guān)注 AI 領(lǐng)域的從業(yè)者與創(chuàng)業(yè)者來說,“誰是最強大語言模型”無疑是個值得探究的重要問題。一位模型體驗者 Austin Starks 對 Optimus Alpha 和 Quaser Alpha 在進行一段時間的手動測試后稱,對于復(fù)雜的 SQL 查詢生成任務(wù),OpenRouter 打造的這兩款隱秘模型在 PURE 性能和準確率方面無疑是當(dāng)今市面上最強大的選項。
從公布的數(shù)據(jù)來看,Optimus Alpha 和 Quasar Alpha 不單是完全可用,甚至遠遠超越了其他老牌經(jīng)典模型。Optimus Alpha 的平均得分達到了 0.83,而 Claude 3.7 Sonnet 的平均得分僅為 0.66。至于 Gemini 2.0 Flash 和 Grok 3,它們的得分分別只有 0.717 和 0.747。此外,二者的其他指標,如成功率(即模型是否執(zhí)行完成)亦位居榜首。更要命的是,這兩款模型還完全免費。

各領(lǐng)先AI模型在SQL查詢生成方面的性能比較
具體來講,他在測試中嘗試使用大模型處理股市變化的復(fù)雜性和噪音。圖中所示,為如何使用大模型回答“在市值超過 200 億美元的企業(yè)股票中,哪些股票的 RSI 指標最低?”等問題。其具體實現(xiàn)流程為:由大模型將自然語言問題轉(zhuǎn)換為數(shù)據(jù)庫查詢;對數(shù)據(jù)庫執(zhí)行查詢;由另一大模型對輸出進行“評分”并確保結(jié)果合理;不斷生成查詢,直到結(jié)果準確無誤。

為了評估各模型,他使用了開源 EvaluateGPT 進行測試,通過一組共 40 道金融問題可以看到各模型的平均處理性能,結(jié)果則完全出乎意料。在這項任務(wù)中,Quaser Alpha 和 Optimus Alpha 模型的表現(xiàn)遠遠優(yōu)于其他所有模型,Optimus Alpha 亦成為響應(yīng)速度最快的模型之一。
在成本方面,Quaser Alpha 和 Optimus Alpha 的輸入和輸出均免費,而成本第二低的是 Gemini 2.0 Flash,每百萬輸入 token 的成本為 0.10 美元,每百萬輸出 token 的成本為 0.40 美元。
Starks 認為,相較于還在按 token 收費的競爭對手,這些“世外高手”般的模型卻正在重新定義零成本的可能性。雖然后續(xù)情況很可能發(fā)生變化,但這些不受限的模型當(dāng)前確實可以隨意使用。
https://blog.kilocode.ai/p/quasar-alpha-what-we-know-thus-far
https://medium.com/@austin-starks/there-are-new-stealth-large-language-models-coming-out-thats-better-than-anything-i-ve-ever-seen-19396ccb18b5
https://prompt.16x.engineer/blog/quasar-alpha-openai-stealth-model
https://www.theverge.com/news/646458/openai-gpt-4-1-ai-model
聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。
InfoQ 老友!請留步!極客邦 1 號客服上線工作啦!
后續(xù)我將通過微信視頻號,以視頻的形式持續(xù)更新技術(shù)話題、未來發(fā)展趨勢、創(chuàng)業(yè)經(jīng)驗、商業(yè)踩坑教訓(xùn)等精彩內(nèi)容,和大家一同成長,開啟知識交流之旅歡迎掃碼關(guān)注我的微信視頻號~
今日薦文
你也「在看」嗎?
熱門跟貼