安康鐵皮保溫工程 從 Harness 到 Loop: AI 居品的下個聯(lián)想層

118     2026-06-12 21:09:37
鐵皮保溫

AI居品司理的職責(zé)范式正在閱歷刻變革——從編寫靜態(tài)prompt到聯(lián)想動態(tài)loop機(jī)制。當(dāng)ClaudeCode的作家聲稱"我的職責(zé)是寫loop"時安康鐵皮保溫工程,這記號著個新期間的運(yùn)轉(zhuǎn):居品司理需要構(gòu)建包含驗(yàn)收圭臬、立評審機(jī)制和止損條款的好意思滿輪回系統(tǒng)。本文將入默契loop聯(lián)想如何成為AI居品的中樞競爭力,以及居品司理該如何委派包含判定機(jī)制與馳念回路的下代案。

前幾天Anthropic的LanceMartin發(fā)了篇著作,講他若何用loop來跑新模子。著作自身是寫給工程師的,但我讀完的反映是:這事跟居品司理的聯(lián)系,可能比跟工程師的聯(lián)系還大。

ClaudeCode的作家BorisCherny說過句近被反復(fù)援用的話:他照舊不徑直prompt模子了,”我的職責(zé)是寫loop”。幾百個agent讀他的GitHub和Slack,我方?jīng)Q定接下來作念什么。

loop俄頃火起來,但中語社區(qū)的籌畫大多停在工程層面:若何寫bash輪回、若何配hook。

我想換個角度聊聊:若是你是個作念A(yù)I居品的PM,loop意味著什么。

先把意見捋明晰:harness是環(huán)境,loop是機(jī)制

昨年遍及在談harness。模子除外的切都算harness:

給它什么器具、什么沙箱、能讀哪些文獻(xiàn)、有哪些權(quán)限。句話,harness是模子干活的環(huán)境。

但環(huán)境是靜態(tài)的。你給模子配了間建立皆全的車間安康鐵皮保溫工程,不等于它知說念今天該干什么、干到什么進(jìn)程算完、干了若何辦。

loop補(bǔ)的即是這層。它是架在harness之上的運(yùn)行機(jī)制:模子跑輪,從環(huán)境里收到反饋,對照圭臬檢查,沒達(dá)標(biāo)就帶著反饋再跑輪,直到驗(yàn)收通過。Lance著作里提到的ClaudeCode的/goal號令、Claude托管Agent里的Outcomes,都是把這套機(jī)制作念成了居品原語。

是以目下的AI居品其實(shí)有三層:

模子是引擎,harness是車間,loop是排班和驗(yàn)收軌制。引擎遍及從幾廠商買,車間的搭法也越來越圭臬化,能拉開差距的運(yùn)轉(zhuǎn)釀成三層。而機(jī)制聯(lián)想這件事,工程師未比PM擅長。

Lance的實(shí)驗(yàn)里,藏著兩個居品啟示

Lance作念了個實(shí)驗(yàn):讓模子在8張H100上自主作念機(jī)器學(xué)習(xí)調(diào),糾合跑8個小時,我方改代碼、跑查考、讀日記、決定下個實(shí)驗(yàn)。細(xì)節(jié)不伸開,我只說兩個對居品東說念主靈驗(yàn)的發(fā)現(xiàn)。

個:他給模子的不是操作設(shè)施,而是份驗(yàn)收清單。九條可檢查的圭臬,比如”須先跑基線”、”至少作念20組實(shí)驗(yàn)”。模子若何完畢,隨它。

這其實(shí)即是PRD想路的遷徙。夙昔咱們寫需求文檔是給東說念主看的,要形容經(jīng)由和交互;給loop寫的”需求文檔”是份rubric,中樞只消個問題:什么景色算完成,若何客不雅地檢查。比起章程若何作念,說清什么動作念完緊要得多。條污穢的圭臬(”代碼質(zhì)料要”)會讓所有l(wèi)oop空轉(zhuǎn),換成可檢查的寫法(”測試全過且新增lint報錯”)它才不時得了。

二個發(fā)現(xiàn)存理由:弗成讓模子我方給我方分。

Lance提到,模子自我批判的果不好,它會傾向于招供我方剛作念完的東西。有的作念法是再開個立的”驗(yàn)收agent”,在干凈的高下文里分安康鐵皮保溫工程,跟本質(zhì)者遮擋。開通員弗成兼任裁判,對模子也樣。

這對居品聯(lián)想的含義很徑直:在你的AI居品里,”判定任務(wù)完成”應(yīng)該是個立的機(jī)制,而不是本質(zhì)經(jīng)由的后步。誰來驗(yàn)收、欠亨過若何回?驗(yàn)收者能看到哪些信息,管道保溫施工會不會被本質(zhì)過程的詮釋帶偏?這些都得畫進(jìn)居品案。

馳念:跨會話的外輪回

著作后半段講馳念,我認(rèn)為是被低估的部分。

若是說自我糾錯是會話內(nèi)的小輪回,馳念即是跨會話的外輪回:

此次踩的坑,下次別再踩。Lance用個基準(zhǔn)測試對比了三代模子若何用馳念,三代都在記,差距體目下馳念的度上。他形容了個五步的遞進(jìn):出錯并記下來,弄明晰為什么錯,考證我方的會診,把會診索求成通用規(guī)矩,后在新任務(wù)里徑直查規(guī)矩而不是重新踩坑。

瑕疵的模子停在步,馳念庫即是堆錯題集和推斷,下次也想不起來翻。強(qiáng)的模子能走程,把教養(yǎng)釀陳規(guī)矩。

作念過馳念的PM應(yīng)該都有體感:

大部分居品的”馳念”即是存聊天歷史,內(nèi)容是個回收站。Lance這個遞進(jìn)給了個好的聯(lián)想框架。馳念的價值不在存儲,而在回路是否閉:寫進(jìn)去的東西經(jīng)過了考證嗎?索求成可復(fù)用的花樣了嗎?下次任務(wù)運(yùn)轉(zhuǎn)時,它會被讀到嗎?三個要津斷掉任何個,馳念就僅僅占地的日記。

反過來,回路旦閉,這部分集結(jié)很難被抄走。模子才氣東說念主東說念主都買取得,但你的居品在這個用戶身上考證過的那些規(guī)矩,競品拿不到。

那PM到底要委派什么

說點(diǎn)實(shí)操的。若是你在作念agent類居品,我認(rèn)為有四個問題值得在案評審之前先想明晰。

任務(wù)的”完成”由誰判定、依據(jù)什么圭臬?反饋信號從那兒來,是測試效力、用戶行為,如故立的評審agent?loop什么時刻須停,迭代次數(shù)上限和預(yù)算上限是幾許?馳念寫入什么、何時被奢華?

三個問題單說句。loop不會我方停,住手條款是聯(lián)想出來的。Uber本年給工程師設(shè)了每東說念主每器具每月1500好意思元的AI開支上限,因?yàn)槟甓阮A(yù)算四個月就完畢。個莫得止損機(jī)制的loop,要么錢,要么”領(lǐng)域化地分娩自信的乖張”。止損聽起來是資本問題,等賬單大約乖張交到用戶手上,就釀成信任問題了。

這兩年這個崗?fù)さ穆氊?zé)對象直在上移:

先是寫prompt,自后管高下文,目下到了聯(lián)想loop。委派物也隨著變了,以前是界面和經(jīng)由圖,目下還要加上份驗(yàn)收圭臬、個判定機(jī)制和組止損條款。

模子還會連續(xù)變強(qiáng)。我的判斷是,這反而讓機(jī)制聯(lián)想值錢:引擎越猛,向和剎車越弗成省。地址:大城縣廣安工業(yè)區(qū)相關(guān)詞條:設(shè)備保溫     塑料擠出機(jī)廠家     預(yù)應(yīng)力鋼絞線    玻璃絲棉    萬能膠廠家

1.本網(wǎng)站以及本平臺支持關(guān)于《新廣告法》實(shí)施的“極限詞“用語屬“違詞”的規(guī)定,并在網(wǎng)站的各個欄目、產(chǎn)品主圖、詳情頁等描述中規(guī)避“違禁詞”。
2.本店歡迎所有用戶指出有“違禁詞”“廣告法”出現(xiàn)的地方,并積極配合修改。
3.凡用戶訪問本網(wǎng)頁,均表示默認(rèn)詳情頁的描述,不支持任何以極限化“違禁詞”“廣告法”為借口理由投訴違反《新廣告法》安康鐵皮保溫工程,以此來變相勒索商家索要賠償的違法惡意行為。