

香港文匯報(記者 黎梓田、黃安琪)中國首個大模型交互數(shù)據(jù)生成公司維納智能今日舉行「香港維納智能核心產(chǎn)品發(fā)布會暨維納智能生態(tài)聯(lián)盟啟動儀式」,發(fā)布產(chǎn)品包括QueWi、Wi Writing Copilot以及Racebot,以上Agentic AI(代理人工智能)應(yīng)用系統(tǒng)具有四大核心技術(shù),為企業(yè)構(gòu)建工業(yè)級高精度閉環(huán) Agentic AI 應(yīng)用系統(tǒng),實現(xiàn)降本增效和業(yè)務(wù)創(chuàng)新。
維納智能創(chuàng)辦人兼行政總裁柳崎峰表示,核心技術(shù)可以概括為四個方面。第一個方面是反饋機制:反饋機制是控制論的核心概念。1940年諾伯特·維納(Norbert Wiener)在《控制論》中指出,反饋是動物與機器系統(tǒng)中不可或缺的要素,用於調(diào)節(jié)系統(tǒng)行為以減少誤差。舉例來說,人體是一個天然的反饋系統(tǒng):當(dāng)感到寒冷時,肌肉會通過顫抖產(chǎn)生熱量以提升體溫;當(dāng)過熱時,則通過出汗降低體溫。同樣的原理也適用於日常場景,例如空調(diào)系統(tǒng)根據(jù)溫度自動調(diào)節(jié)運行。
在系統(tǒng)技術(shù)中,反饋機制分為三層:數(shù)據(jù)生成、模擬訓(xùn)練以及人機交互。其創(chuàng)新在於將人類反饋與機器反饋相結(jié)合。通過這一機制,系統(tǒng)的準(zhǔn)確率可達約70%。
第二個方面是多模型協(xié)同,靈感來源於團隊合作的優(yōu)勢。單個大模型的表現(xiàn)類似於大腦的單一分區(qū),而多模型協(xié)作則相當(dāng)於一個高效的團隊。雖然團隊協(xié)作的潛力遠超個體,但協(xié)調(diào)管理是關(guān)鍵挑戰(zhàn)。
然而,協(xié)同機制類似於企業(yè)管理結(jié)構(gòu):底層模型(如高效的專業(yè)模型)負(fù)責(zé)具體任務(wù),而上層的管理者模型則負(fù)責(zé)協(xié)調(diào)與分配任務(wù)。這種協(xié)調(diào)通過強化學(xué)習(xí)實現(xiàn),具體包括幾種協(xié)作模式,包括路由調(diào)用:根據(jù)任務(wù)類型將問題分配給最適合的模型;匯聚與比較:多個模型的輸出進行整合或?qū)Ρ龋x取最佳結(jié)果;兜底策略:確保系統(tǒng)在特殊情況下仍有可靠輸出。
更進一步,維納智能正在探索動態(tài)協(xié)同機制,即模型間的協(xié)作不再依賴人工預(yù)設(shè),而是通過系統(tǒng)自主學(xué)習(xí)實現(xiàn)。預(yù)計模型協(xié)同將成為學(xué)術(shù)界的研究熱點,這一方向類似於培養(yǎng)一位優(yōu)秀的領(lǐng)導(dǎo)者,需長期投入與優(yōu)化。
第三個方面是提示詞工程,提示詞(Prompt)是大模型應(yīng)用的核心要素之一,直接影響模型的輸出質(zhì)量。目前提示詞規(guī)模約為2,000至3,000詞,遠低於某些系統(tǒng)的上萬詞提示詞,但效果顯著。提示詞工程是一門科學(xué),通過精心設(shè)計的提示詞,可以探知並調(diào)控大模型的行為,類似於通過語言試探一個人的反應(yīng)。
在實踐中,維納智能針對不同場景設(shè)計專屬提示詞,並通過幾個步驟優(yōu)化提示詞,包括設(shè)定目標(biāo)確保垂直領(lǐng)域的質(zhì)量,或者利用專用評估模型對輸出進行打分,並通過反饋機制優(yōu)化提示詞,這一過程確保提示詞逐步精進。系統(tǒng)已實現(xiàn)自動化功能,例如用戶只需輸入興趣(如瑜伽或漂流),系統(tǒng)便能在後臺生成對應(yīng)的垂直領(lǐng)域報告,顯著提升效率與精準(zhǔn)度。
第四方面是自我糾錯能力,自我糾錯是大模型智能化的重要標(biāo)誌。通過用戶反饋驅(qū)動系統(tǒng)自我改進。例如,在一個關(guān)於賽馬的問題中,用戶問及騎師更換對馬匹表現(xiàn)的影響。初始回答可能僅指出「有影響」,但若用戶反饋認(rèn)為回答不夠具體,系統(tǒng)會自動修正,生成更詳盡且直觀的回答。
統(tǒng)計顯示,當(dāng)用戶提供認(rèn)真且具體的反饋時,系統(tǒng)的自我糾錯成功率可達85%。對於模糊反饋(如僅表示「不滿意」),糾錯成功率約為50%至60%。即使有15%的錯誤,系統(tǒng)仍能保持穩(wěn)定,不會因錯誤累積而影響用戶體驗。
評論