中建材信云智聯(lián):媒體聚焦 | AI落地的現(xiàn)實主義:一家AI應(yīng)用一線企業(yè)的業(yè)務(wù)觀
一條不迷信模型,強調(diào)系統(tǒng)工程的路徑,既“做面包”,更“種糧食”。? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
文|趙艷秋
編|?;?br>
隨著DeepSeek等大模型的普及,“萬眾齊用大模型”的時代驟然降臨,行業(yè)落地空前熱鬧。但熱潮之下,也藏著焦慮:每一次技術(shù)革命都曾帶來生產(chǎn)力飛躍,而眼下真正能扎實落地、實現(xiàn)效率躍升的案例仍不多。
要想實現(xiàn)AI真正落地,有什么更有效的路徑?大模型擅長什么?行業(yè)大模型到底該不該訓(xùn)練?行業(yè)知識庫如何構(gòu)建?數(shù)據(jù)從哪來、怎么治理?這些問題,在AI真正成為“生產(chǎn)力工具”前,繞不過去。
在5月10日由中國企業(yè)改革與發(fā)展研究會主辦的“央企AI+大模型應(yīng)用論壇”上,中建材信息副總經(jīng)理、信云智聯(lián)總經(jīng)理王喬晨展示了“大小模型協(xié)同”的安全生產(chǎn)管理實踐。
該系統(tǒng)已覆蓋中國建材集團626家制造型企業(yè),接入攝像頭4.6萬臺,運行算法4萬多路,這一落地規(guī)模和效果,令業(yè)界人士印象深刻。其背后,是一套“不迷信模型”、強調(diào)系統(tǒng)工程與長期價值的工業(yè)智能化路徑——既“做面包”,更“種糧食”。
01??大小模型協(xié)同——人始終要在流程中
信云智聯(lián)起步于視覺小模型時代。當(dāng)時,市場上視覺類人工智能企業(yè),大都投入到智慧城市、公安或交通這類大市場上,而信云智聯(lián)有著很強的行業(yè)背景,它是中國建材集團旗下中建材信息的全資子公司,專注于數(shù)字化、智慧化轉(zhuǎn)型服務(wù)。?
信云智聯(lián)很快發(fā)現(xiàn),工業(yè)場景中圍繞“人、設(shè)備、環(huán)境”的需求,與那些大市場有著明顯不同。于是,公司決定組建算法團隊,專注開發(fā)契合工業(yè)需求的視覺小模型。
那時,為了在工業(yè)企業(yè)中落地視覺模型,一些人工智能企業(yè)要求用戶要拿出數(shù)萬張圖片來訓(xùn)練模型?!暗@種‘把弓拉滿’的做法,在拉弓過程中就停了,因為用戶已經(jīng)接受不了了?!蓖鯁坛坑^察,因此,他們必須要走另一條路——基于小樣本生成可用模型,并在實際應(yīng)用中持續(xù)迭代。
他們的策略是“小步快跑,先做起來”,在技術(shù)選擇上也要更務(wù)實,不迷信時髦技術(shù),將深度學(xué)習(xí)、機器學(xué)習(xí)、模式識別等多種技術(shù)并用,根據(jù)場景選擇最適合的工具。得益于自主算法團隊,信云智聯(lián)在安全生產(chǎn)管理領(lǐng)域,已開發(fā)出70多種適配場景的算法。
不過,視覺小模型的局限性也很明顯。因為訓(xùn)練數(shù)據(jù)不夠多,泛化性較弱,一旦現(xiàn)場環(huán)境發(fā)生變化,模型可能就無法準確識別。而工業(yè)場景的變化極為常見,導(dǎo)致模型需要頻繁調(diào)整,后期運維成本居高不下。此外,即使是百萬次、千萬次級別的調(diào)用,只出現(xiàn)一兩次誤報,用戶依然難以接受。
信云智聯(lián)也在尋找突破路徑,直到大模型的到來?!拔耶?dāng)時被一個場景‘震’到了。”王喬晨告訴數(shù)智前線。在一個水池的安全監(jiān)控案例中,傳統(tǒng)做法需要根據(jù)水位變化,手動調(diào)整電子圍欄。而大模型具有通識理解與推理能力,能夠識別水面變化并自動調(diào)整邊界。這一能力讓王喬晨意識到,大模型有潛力重構(gòu)傳統(tǒng)AI應(yīng)用。
不過,并不是所有問題都需要大模型重做?!跋袼喈a(chǎn)線上皮帶撕裂的檢測,小模型做得已經(jīng)非常好了。如果大模型再做一次,經(jīng)濟價值并不高,客戶也不會為此支付更高的算力費用?!毙旁浦锹?lián)首席架構(gòu)師吳振剛說,小模型輕量化、可集成到終端攝像頭中,性價比很高。
同時,在推動大模型落地過程中,必須重視數(shù)據(jù)安全。尤其是在開放問答等場景中,大模型可能存在信息泄露風(fēng)險,因此,涉及敏感數(shù)據(jù)或高安全等級的業(yè)務(wù)場景,并不適合直接使用大模型,而應(yīng)根據(jù)實際情況采取更穩(wěn)妥的技術(shù)。
信云智聯(lián)提出了“大小模型協(xié)同”的策略。目前,大模型主要的突破集中在語言領(lǐng)域,而計算機視覺(CV)和多模態(tài)大模型仍處于發(fā)展階段。通過大小模型配合,既能發(fā)揮小模型高效、低成本的優(yōu)勢,又能利用大模型的推理與通識能力,可能形成兼顧工程可行性與智能水平的選擇。
這一協(xié)同模式目前主要聚焦兩大目標:其一是降低誤報率。小模型快速識別出不安全因素后,由大模型進一步校驗。其二是處理復(fù)雜行為鏈識別。例如,小模型通過電子圍欄識別到有人進入危險區(qū)域后,大模型判斷其是否有攀爬等危險動作,從而完成更深層次的場景理解。
目前,大小模型協(xié)同在安全生產(chǎn)領(lǐng)域處于探索和驗證階段?!白罱K這道防線,還是人?!蓖鯁坛繌娬{(diào)。盡管現(xiàn)在安全生產(chǎn)系統(tǒng)中已有“虛擬安全員”,但無法取代人類的核心作用?!鞍踩a(chǎn)管理是基于責(zé)任體系來構(gòu)建的,AI不能代替人來承擔(dān)責(zé)任,因此,人必須始終在流程中?!?/span>
目前,中國建材集團的這套智能安全生產(chǎn)管理系統(tǒng),每天產(chǎn)生大量行業(yè)級安全數(shù)據(jù),為系統(tǒng)的持續(xù)優(yōu)化提供堅實基礎(chǔ)。
除了安全生產(chǎn),信云智聯(lián)也在設(shè)備預(yù)測性維護、工藝優(yōu)化等高價值場景中推動AI落地。以水泥工藝為例,工藝過程極為復(fù)雜,涉及大量物理、化學(xué)反應(yīng)。雖然中國建材集團旗下的研究院所在干法水泥工藝機理上有長期積累,但仍不能描述所有變化。信云智聯(lián)將AI算法與工藝機理結(jié)合,取得了“1+1>2”的效果。
“我們有場景,也有工藝機理知識與數(shù)據(jù)資源?!蓖鯁坛空f,“我們就在這些要素之間,起到嫁接的作用?!毙旁浦锹?lián)不拘泥于技術(shù)潮流,從實際需求出發(fā),推動AI真正服務(wù)于工業(yè)落地。
02??系統(tǒng)工程的力量——行業(yè)大模型該不該訓(xùn)?
實際上,信云智聯(lián)的智能安全生產(chǎn)管理系統(tǒng),集中體現(xiàn)了“系統(tǒng)工程”的價值。這些長期在一線落地的團隊認為,當(dāng)前階段,最現(xiàn)實、也是最有價值的路徑,不是盲目追求時髦技術(shù),而是通過系統(tǒng)工程能力,將現(xiàn)有技術(shù)轉(zhuǎn)化為實際可控、穩(wěn)定可用的生產(chǎn)力。
這里提到的是“系統(tǒng)工程能力”,而非盲目追逐行業(yè)大模型的創(chuàng)新。一些業(yè)界人士認為,要解決行業(yè)問題,必須訓(xùn)練行業(yè)大模型?!拔覀€人認為,在很多問題上,訓(xùn)練行業(yè)大模型未必是一個最有效的手段。”王喬晨說,“行業(yè)大模型的訓(xùn)練成本很高,但凡要動到模型參數(shù),對算力和數(shù)據(jù)質(zhì)量的要求就很高。如果準備不足,反而事倍功半?!?/span>
“訓(xùn)不訓(xùn)練行業(yè)大模型的邊界在哪?就像藥物研發(fā),數(shù)據(jù)由專家標注,通用大模型的能力很難達到?!蓖鯁坛空f,“而在工業(yè)場景下,如果沒有觸達到工藝機理深度,行業(yè)大模型可以先不著急做?!币驗楝F(xiàn)在的通用大模型幾乎每周都有更新,可能你剛訓(xùn)練出一個行業(yè)模型,下一周通用模型新版本的能力就把你碾壓了。
“而且,生產(chǎn)數(shù)據(jù)每天都在變,要把這些數(shù)據(jù)以訓(xùn)練方式,更新到大模型中,其實很不劃算?!眳钦駝傃a充道,“行業(yè)大模型真正該訓(xùn)的,反而是本專業(yè)的邏輯推理能力,而不是灌輸記憶型數(shù)據(jù)?!?br>
像嚴謹、共識的知識和公理化的數(shù)學(xué)推理能力,適合內(nèi)置于大模型,而每家企業(yè)的專屬生產(chǎn)經(jīng)驗,需要動態(tài)更新和注重數(shù)據(jù)安全的信息,反而適合基于向量數(shù)據(jù)庫,在大模型之外建立知識庫。
因此,信云智聯(lián)更傾向于通過系統(tǒng)化的工程能力,將通用大模型的價值發(fā)揮出來。比如構(gòu)建高質(zhì)量的行業(yè)知識庫,就是推薦的一種方式。
吳振剛介紹,大模型推出后,行業(yè)知識庫的構(gòu)建和使用門檻已大大降低了。傳統(tǒng)的知識圖譜構(gòu)建方式,抽取效率較低,難以快速適應(yīng)個性靈活的行業(yè)場景需求。
現(xiàn)在,通過RAG(檢索增強生成)、大模型邏輯推理、向量數(shù)據(jù)庫快速檢索的大模型生態(tài)技術(shù)組合,企業(yè)只需對現(xiàn)有文檔進行盤點、分類,即可快速構(gòu)建初步的知識庫。再通過實際使用中,各種智能體的驗證與反饋,持續(xù)完善與修正,從而建立有效的企業(yè)級知識工程。
系統(tǒng)工程的價值也涉及高質(zhì)量數(shù)據(jù)、算法設(shè)計、低代碼、人機協(xié)同等。信云智聯(lián)倡導(dǎo)“小算法大作用”的理念,認為很多實用場景未必只能依賴某個模型,而是通過輕量級的分治策略獲得更高的投入產(chǎn)出比。
例如,現(xiàn)在有種傾向是過度追求算法極限,在安全生產(chǎn)中,不僅要識別安全帽佩戴情況,還要識別帽繩的系法這類細節(jié)。這些需求對算法挑戰(zhàn)極高,但落地價值往往不能覆蓋成本。而從系統(tǒng)工程思維切入,借助相對簡潔成熟的電子圍欄、定位傳感器、人機協(xié)同機制,就能構(gòu)建起更具性價比的解決方案。
這種方法遵循了“20/80法則”:抓住最關(guān)鍵的20%,釋放出80%的價值。比如,在高風(fēng)險區(qū)域,可以先用電子圍欄感知是否有人闖入,再通過定位傳感器判斷人員身份,而不必挑戰(zhàn)在戴口罩且光線復(fù)雜的環(huán)境下仍然精準識別人臉的極限任務(wù)。
在系統(tǒng)工程的框架下,應(yīng)用大模型重點是將“原生能力”用好。以安全生產(chǎn)為例,基于大模型的安全知識問答,或是讓管理者通過自然語言與系統(tǒng)交互,無需點擊菜單,系統(tǒng)就可以理解語義執(zhí)行命令,成為智能化“導(dǎo)航臺”,這正是通用大模型擅長的方向。
信云智聯(lián)還構(gòu)建了面向行業(yè)的智能體商店和工程平臺。智能體一端連接行業(yè)場景,一端調(diào)用各類大模型,按需生成智能體,快速落地到具體業(yè)務(wù)中。這背后并不是“搭積木式”的簡單拼裝,而是需要對場景需求、模型能力、數(shù)據(jù)治理、行業(yè)知識庫、低代碼、集成等多維度進行精細打磨與系統(tǒng)化組合。
在當(dāng)下大模型快速迭代的背景下,信云智聯(lián)的策略是“以快打快”,通過小步快跑、快速驗證,及時釋放價值,形成可持續(xù)的節(jié)奏。哪怕未來模型更新“碾壓”了當(dāng)前能力,系統(tǒng)已經(jīng)產(chǎn)生了實際效益。
03??“做面包”和“種糧食”
在眾多服務(wù)數(shù)字化、智能化轉(zhuǎn)型的企業(yè)中,信云智聯(lián)定位在行業(yè)市場,扮演“最后一公里”落地的關(guān)鍵角色。
“最后一公里”,不是去做純定制化的項目公司,因為這類市場空間有限,還容易受到軟件外包服務(wù)企業(yè)的擠壓;也不是走向通用市場,與大廠正面競爭。
信云智聯(lián)背后有較深的工業(yè)背景,更適合扎根在工業(yè)垂直領(lǐng)域,去服務(wù)那些數(shù)字化空間足夠大、潛力足夠深的行業(yè)。比如一些工業(yè)行業(yè)數(shù)字化、智能化空間可以達到千億級別,足夠支撐一家企業(yè)的長期發(fā)展,也契合信云智聯(lián)當(dāng)下的發(fā)展階段。
在這樣的定位下,行業(yè)Know-How成為核心能力?!靶袠I(yè)Know-How結(jié)合數(shù)字化,是我們的一道門檻。”王喬晨舉例,在做云計算平臺時,我們就在通用PaaS之上,定義了一層行業(yè)PaaS,把行業(yè)知識體系和軟件平臺融合。
“比較幸運的是,行業(yè)的數(shù)字化、智能化推進過程中,最后一公里落地至關(guān)重要,這部分生態(tài)空間一定是存在的?!蓖鯁坛空f對團隊的要求是:“持續(xù)奔跑,永遠領(lǐng)先同行半步?!边@“半步”,靠的不只是代碼,而是理解、經(jīng)驗和體系。
以前,代碼被視為像“金子”一樣的核心資產(chǎn)。但現(xiàn)在,大模型的代碼生成能力越來越強,一個系統(tǒng)的復(fù)制,可能只需要讓模型“看一眼”。因此,信云智聯(lián)在重新思考自己的核心競爭力,不只是“賣工具”,而是深入理解客戶業(yè)務(wù),通過服務(wù)實現(xiàn)業(yè)務(wù)價值,成為客戶數(shù)字化轉(zhuǎn)型過程中的技術(shù)伙伴。
以水泥行業(yè)的安全生產(chǎn)管理為例,哪些是不安全因素?攝像頭該如何布置?算法如何訓(xùn)練和適配——這些是靠對場景的理解、對系統(tǒng)落地細節(jié)的把控,以及對高質(zhì)量數(shù)據(jù)的積累?!耙郧拔液荜P(guān)注我們數(shù)字化能力到底領(lǐng)先別人多少,但現(xiàn)在看,真正的門檻一定是很難的事,比如行業(yè)知識庫和高質(zhì)量數(shù)據(jù)集,是誰都繞不過去的?!?/span>
行業(yè)數(shù)據(jù)是一種像金礦一樣稀缺而有價值的資源,可以成為企業(yè)與競爭對手之間的重要壁壘。信云智聯(lián)能獲取覆蓋全國1/4水泥產(chǎn)能、300多家窯企的實時數(shù)據(jù),這些數(shù)據(jù)數(shù)量龐大且具有代表性,然而,要想充分發(fā)揮這
些數(shù)據(jù)的價值,還需要進行數(shù)據(jù)治理。
數(shù)據(jù)治理是一項系統(tǒng)性極強的工程,涉及大量行業(yè)標準,而這些標準在很多場景中尚未建立。比如想獲得水泥生產(chǎn)過程中某個工藝段的電耗數(shù)據(jù),行業(yè)并沒有規(guī)定統(tǒng)一的采集點;再如,水泥從石灰石燒制成熟料,產(chǎn)量很難直接測量,作為一個過程變量,需要借助其他參數(shù)間接計算得出,然而行業(yè)內(nèi)對此的計算邏輯也缺乏統(tǒng)一標準。
吳振剛告訴數(shù)智前線,在企業(yè)級市場,100%標準化幾乎不可能。實際可行的路徑是將80%的內(nèi)容標準化,而剩下20%需要“拼縫”,也就是根據(jù)客戶化場景進行經(jīng)濟、靈活的適配。實際上,這也對大模型應(yīng)用能否真正落地,起到?jīng)Q定性作用。“而已經(jīng)標準化的內(nèi)容固化到工具,結(jié)合標準的實施方法,就形成了一套可復(fù)用、體系化的技術(shù)能力。”
此外,和大廠強調(diào)的通用能力不同,信云智聯(lián)在構(gòu)建數(shù)據(jù)平臺時,更強調(diào)行業(yè)場景適配。他們會根據(jù)特定場景的要求,把各種SQL腳本、配置參數(shù)、邏輯模型文件等,內(nèi)置到數(shù)據(jù)平臺的各類場景模板中,幫助客戶避免從零開始重復(fù)建設(shè)。比如在安環(huán)系統(tǒng)中,統(tǒng)一各工廠的數(shù)據(jù)標準,再基于模板做適配和復(fù)用,大幅提升了實施效率和質(zhì)量。
數(shù)據(jù)治理是個“短板工程”,要求業(yè)界將一塊塊短板補上?!?/span>大家都愿意做面包,因為面包的增值最大,但沒人愿意種糧食??蓻]有糧食,哪來的面包?”王喬晨說,“我們現(xiàn)在就在種糧食?!彼麄兿Mㄟ^兩三年的周期,借助新一代信息技術(shù),全面提升“數(shù)據(jù)糧食”的產(chǎn)能和質(zhì)量,而那時,信云智聯(lián)的行業(yè)門檻也就真正立起來了。
文章來源 | 數(shù)智前線公眾號
監(jiān)督:0571-85871513
投稿:news@ccement.com