打開網(wǎng)易新聞 查看精彩圖片

在 AI 長文寫作領(lǐng)域,一項革命性突破正在改寫行業(yè)規(guī)則 —— 由「人工智能之父」Jürgen Schmidhuber 領(lǐng)銜的團隊,正式開源其長文寫作框架WriteHERE。該框架憑借異質(zhì)遞歸規(guī)劃(Heterogeneous Recursive Planning)技術(shù),實現(xiàn)單次生成超4 萬字、100 頁專業(yè)報告的能力,在小說創(chuàng)作、報告生成場景中全面超越 Perplexity 付費版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等頂尖方案。

打開網(wǎng)易新聞 查看精彩圖片

  • 論文標題:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models
  • 論文地址:https://arxiv.org/pdf/2503.08275
  • 項目主頁 & 在線 Demo://writehere.site/
  • GitHub 倉庫:https://github.com/principia-ai/WriteHERE

打開網(wǎng)易新聞 查看精彩圖片

動態(tài)規(guī)劃顛覆傳統(tǒng)

從「大綱先行」到「實時編織」

現(xiàn)有 AI 長文生成系統(tǒng)(如 Agent's Room、STORM)多將寫作簡化為「規(guī)劃 - 填充」的線性流程,而 WriteHERE 首次通過數(shù)學形式化揭示:長文寫作本質(zhì)上是檢索(Retrieval)、推理(Reasoning)、寫作(Composition)三類異構(gòu)任務(wù)的動態(tài)編織

1. 寫作代理系統(tǒng)的五元組定義

研究團隊將寫作系統(tǒng)抽象為數(shù)學元組:

打開網(wǎng)易新聞 查看精彩圖片

其中:

打開網(wǎng)易新聞 查看精彩圖片

這一形式化框架突破了傳統(tǒng) AI 寫作工具「重生成、輕管理」的設(shè)計范式。寫作不再是簡單的文本擴展,而是記憶空間、工作空間與外部環(huán)境的持續(xù)交互過程。

2. 任務(wù)類型的數(shù)學建模

研究團隊將寫作過程解構(gòu)為三類原子操作:

打開網(wǎng)易新聞 查看精彩圖片

規(guī)劃問題的形式化革命

從 HTN 到異質(zhì)遞歸

研究團隊受層次任務(wù)網(wǎng)絡(luò)(HTN)規(guī)劃啟發(fā),提出寫作規(guī)劃問題的數(shù)學定義:

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

解決方案為滿足以下條件的原始操作序列:

  • 可執(zhí)行性:每個操作的前置條件均被滿足。
  • 目標達成:最終工作空間狀態(tài)符合寫作目標。

核心技術(shù)

異質(zhì)性遞歸與狀態(tài)化 DAG 任務(wù)管理

WriteHERE 的核心突破體現(xiàn)在兩大技術(shù)創(chuàng)新:

1. 異質(zhì)任務(wù)遞歸分解:每個寫作任務(wù)被動態(tài)標注類型(檢索 / 推理 / 寫作),并基于類型分解為子任務(wù),直至可執(zhí)行的原子任務(wù)。例如,當執(zhí)行「撰寫貿(mào)易報告第六章:行業(yè)深度剖析:識別贏家與輸家」,系統(tǒng)進一步分解為以下子任務(wù):

  • 檢索任務(wù):收集最新 (截至 2025 年 4 月) 的行業(yè)數(shù)據(jù),包括科技 (半導體、軟件、硬件)、汽車、農(nóng)業(yè)、制藥 / 醫(yī)療保健、能源和消費品行業(yè)的貿(mào)易統(tǒng)計、市場份額、公司財務(wù)表現(xiàn)、行業(yè)報告及專家評論。
  • 推理任務(wù)(8 個子任務(wù)):構(gòu)建統(tǒng)一分析框架,確立「贏家」和「輸家」識別標準;分別分析科技、汽車、農(nóng)業(yè)、制藥 / 醫(yī)療保健、能源和消費品行業(yè)的關(guān)稅、非關(guān)稅措施、宏觀經(jīng)濟狀況及全球價值鏈重構(gòu)影響;規(guī)劃行業(yè)績效對比可視化內(nèi)容。
  • 寫作任務(wù)(8 個子任務(wù)):撰寫章節(jié)引言;分別撰寫科技、汽車、農(nóng)業(yè)、制藥 / 醫(yī)療保健、能源和消費品六大行業(yè)的詳細分析;撰寫章節(jié)結(jié)論,綜合關(guān)鍵發(fā)現(xiàn)并過渡至下章區(qū)域視角。

2. 狀態(tài)化層次調(diào)度算法:任務(wù)依賴關(guān)系以有向無環(huán)圖(DAG)管理,結(jié)合任務(wù)狀態(tài)(激活 / 掛起 / 靜默)實現(xiàn)自適應(yīng)執(zhí)行。該機制確保系統(tǒng)能根據(jù)實時反饋動態(tài)調(diào)整規(guī)劃深度,例如在貿(mào)易報告中,系統(tǒng)能追蹤每個子任務(wù)的狀態(tài),確保在撰寫特定章節(jié)(如區(qū)域分析)前完成其所有依賴任務(wù)(如宏觀經(jīng)濟影響分析)。

實驗表現(xiàn)

全面碾壓現(xiàn)有方案

團隊在小說創(chuàng)作(Tell me a story 數(shù)據(jù)集)和技術(shù)報告生成(WildSeek 數(shù)據(jù)集)兩大任務(wù)中驗證了 WriteHERE 的優(yōu)越性:

  • 小說寫作:基于 GPT-4o 和 Claude-3.5-Sonnet,WriteHERE 在情節(jié)結(jié)構(gòu)、創(chuàng)意性、角色塑造等維度全面領(lǐng)先。當生成長度從 2000 詞擴展至 8000 詞時,其優(yōu)勢進一步擴大,整體勝率較 Agent's Room 超過 90%(見圖 1)。
  • 技術(shù)報告:在信息相關(guān)性、覆蓋廣度、深度等關(guān)鍵指標上,WriteHERE 以接近滿分的表現(xiàn)(平均 4.9/5)超越 STORM 和 Co-STORM。對比移除異質(zhì)遞歸規(guī)劃模塊的消融實驗,性能顯著下降,印證了該設(shè)計的核心價值(見圖 2)。

打開網(wǎng)易新聞 查看精彩圖片

圖 1 小說寫作任務(wù)評測

打開網(wǎng)易新聞 查看精彩圖片

圖 2 報告寫作任務(wù)評測

壓力測試

百頁報告生成

研究團隊公開的超100 頁《2025 年 Q2 全球貿(mào)易戰(zhàn)深度報告》展現(xiàn)了框架的極致能力:

系統(tǒng)自動構(gòu)建了一個包含 16 個主要章節(jié)、超過 80 個子任務(wù)的異質(zhì)遞歸計劃,涵蓋引言、全球關(guān)稅結(jié)構(gòu)、非關(guān)稅壁壘、宏觀經(jīng)濟沖擊、全球價值鏈重構(gòu)、行業(yè)贏家與輸家、地區(qū)分析、未來預(yù)測等內(nèi)容。整個生成過程體現(xiàn)了異質(zhì)遞歸規(guī)劃的優(yōu)勢 —— 系統(tǒng)能夠自動根據(jù)需要深入研究特定主題(如美國 232 條款鋼鋁關(guān)稅擴張),同時保持對整體結(jié)構(gòu)的把控,確保各章節(jié)之間的連貫性和一致性。最終報告包含超過 44,000 字的正文,覆蓋從關(guān)稅機制到行業(yè)贏家的全面分析。

開源生態(tài)與社區(qū)反響

作為完全開源(MIT 協(xié)議)的框架,WriteHERE 支持開發(fā)者自由調(diào)用異構(gòu) Agent(如專用檢索模型、推理引擎),或?qū)氐赘淖冮L文寫作工具的商業(yè)模式。

英偉達高級研究科學家 Enze Xie 試用后評價模型表現(xiàn)驚艷:

打開網(wǎng)易新聞 查看精彩圖片

社區(qū)用戶 @AIExplorer 反饋:

「WriteHERE 太棒了。我把它和 GPT-4o-mini 一起使用,它能有效替代我的大部分 OpenAI 深度搜索。」

打開網(wǎng)易新聞 查看精彩圖片

知名 AI 領(lǐng)域推特大 V Ben Tossell 更直言:

「這個寫作模型太棒了。」

打開網(wǎng)易新聞 查看精彩圖片

此刻,長文寫作的「自動化天花板」已被打破。訪問 writehere.site,即可加入這場 AI 寫作的革命。