羞羞网站免费在线观看_羞羞网站在线_黄片APP下载羞羞视频_羞羞视频网站免费观看 在线视频夫妻内射,在线观看成本人亚洲,日韩a

你的位置:首頁 > 互連技術(shù) > 正文

生成式 AI 幫助工程師挖掘隱藏在非結(jié)構(gòu)化數(shù)據(jù)中的深層洞察

發(fā)布時(shí)間:2026-02-25 來源:轉(zhuǎn)載 責(zé)任編輯:lily

【導(dǎo)讀】生成式AI(GenAI)的崛起,不僅能將分散的非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化傳感器數(shù)據(jù)深度融合,更將工程師的角色從繁瑣的數(shù)據(jù)清洗中解放出來,轉(zhuǎn)向更高階的戰(zhàn)略分析與決策。從塔塔汽車?yán)脵z索增強(qiáng)生成(RAG)技術(shù)構(gòu)建上下文感知的故障診斷助手,到哥本哈根大學(xué)通過圖論與大模型結(jié)合加速食品科學(xué)發(fā)現(xiàn),GenAI正展現(xiàn)出超越基礎(chǔ)代碼編寫的巨大潛力。然而,盡管普及率日益提升,許多工程師仍受限于傳統(tǒng)用法或?qū)ぷ髁髡系膿?dān)憂,尚未充分挖掘其在預(yù)測性維護(hù)和復(fù)雜系統(tǒng)分析中的深層價(jià)值。


您是否知道,生成式 AI(GenAI)可以幫助工程師在幾秒鐘內(nèi)診斷汽車故障,甚至在設(shè)備出現(xiàn)問題之前預(yù)測潛在失效?GenAI 正在通過加速數(shù)據(jù)分析和算法開發(fā),讓這些場景從設(shè)想走向現(xiàn)實(shí),使工程師能夠充分發(fā)揮專業(yè)知識,挖掘可執(zhí)行的洞察。


工程團(tuán)隊(duì)每年都會產(chǎn)生數(shù) TB 級的數(shù)據(jù)。根據(jù) Gartner 的估算,其中多達(dá) 80% 屬于非結(jié)構(gòu)化數(shù)據(jù)。服務(wù)記錄、研究論文和技術(shù)人員記錄中蘊(yùn)含著關(guān)鍵的組織知識,但由于格式不一致,難以有效解析。GenAI 工具能夠幫助工程師整合結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)過去難以大規(guī)模開展的分析工作。對工程師而言,這意味著更快速的故障排查、更高效的設(shè)計(jì)流程以及更快的技術(shù)發(fā)現(xiàn)。


工程師在使用 GenAI 時(shí)的盲區(qū)

盡管 GenAI 在重塑工程工作方面具有高度靈活性,但其能力與工程師日常使用方式之間仍存在差距。許多工程師仍將 GenAI 主要用于編寫基礎(chǔ)代碼或生成文檔,而不是將其應(yīng)用于更高級的工程流程。


為更好地了解工程師對 GenAI 的態(tài)度及其實(shí)際應(yīng)用情況,MathWorks 于 2025 年 12 月在社交媒體上進(jìn)行了一項(xiàng)非正式投票。反饋結(jié)果揭示了多項(xiàng)重要洞察,包括:

-83% 的工程師至少每月使用一次 GenAI,其中最常見的應(yīng)用場景是“編寫代碼”和“文檔與報(bào)告生成”。

-工程師對 GenAI 的最大擔(dān)憂是其與現(xiàn)有工作流程的整合(46%)。在擁有六年以上經(jīng)驗(yàn)的工程師中,這一比例更是升至 75%。


這些數(shù)據(jù)表明,大多數(shù)工程師已經(jīng)在使用 GenAI,但尚未將其應(yīng)用于戰(zhàn)略性工程任務(wù)。希望提升 GenAI 使用能力的工程師應(yīng)考慮將其用于準(zhǔn)備和分析非結(jié)構(gòu)化數(shù)據(jù)。


利用服務(wù)手冊、工程文檔和維修記錄構(gòu)建面向技術(shù)人員的聊天助手

汽車故障排查通常需要在不同品牌和車型中診斷復(fù)雜問題。盡管大語言模型(LLM)包含大量公開的汽車知識,但它們?nèi)狈?xì)節(jié)豐富的品牌專屬信息。為彌合這一差距,塔塔汽車的工程師采用了一種名為檢索增強(qiáng)生成(RAG)的 GenAI 技術(shù),將 LLM 的通用知識與內(nèi)部專有數(shù)據(jù)結(jié)合,從而生成具有上下文針對性的建議。


工程師利用 RAG 開發(fā)了一個(gè)具備上下文感知能力的聊天助手,能夠檢索內(nèi)部文檔并基于這些內(nèi)容生成故障排查回復(fù)。他們使用 MATLAB? 構(gòu)建了 RAG 工作流程,使其應(yīng)用(稱為 ServiceSage)可以搜索服務(wù)手冊、工程文檔和維修記錄。當(dāng)技術(shù)人員向 ServiceSage 提問時(shí),問題會被轉(zhuǎn)化為 GenAI 能理解的數(shù)值表示,系統(tǒng)隨后查找最相關(guān)的文檔。由于 RAG 執(zhí)行的是語義搜索,問題的具體措辭并不關(guān)鍵,它會根據(jù)相關(guān)概念進(jìn)行推斷。相關(guān)文檔隨后被輸入 AI 模型,模型將其與通用知識結(jié)合,生成清晰、可理解的回答。


這種方法具有成本效益且可擴(kuò)展,無需進(jìn)行昂貴的模型再訓(xùn)練,并能處理大量此前未被充分利用的文本數(shù)據(jù)。借助該方法,團(tuán)隊(duì)能夠快速識別根本原因,提供上下文相關(guān)的指導(dǎo),并縮短維修周期。通過 GenAI,工程師可以高效分析大量文本數(shù)據(jù),并將其融入故障排查流程中。


利用全球與歷史科研資料推進(jìn)食品科學(xué)發(fā)現(xiàn)

科學(xué)研究通常涉及跨越數(shù)十年、來自多個(gè)地區(qū)的大量論文,想要系統(tǒng)梳理某一主題的所有研究或找出其中潛在聯(lián)系,若無先進(jìn)工具幾乎不可能。哥本哈根大學(xué)的食品科學(xué)研究人員在分析龐大資料尋找主題關(guān)聯(lián)時(shí)面臨這一挑戰(zhàn)。LLM 雖然能夠總結(jié)單篇文獻(xiàn),但難以在海量數(shù)據(jù)中梳理整體關(guān)聯(lián)。為解決該問題,研究人員在使用 LLM 前,將 GenAI 與傳統(tǒng)技術(shù)相結(jié)合——如文本預(yù)處理與清洗、信息提取等——為非結(jié)構(gòu)化文本建立結(jié)構(gòu)。


哥本哈根大學(xué)團(tuán)隊(duì)在整個(gè)流程中多次使用 GenAI,包括:

1清理并標(biāo)準(zhǔn)化了數(shù)千份格式不一致的 PDF 文件。

2在元數(shù)據(jù)缺失時(shí)自動生成關(guān)鍵字。

3將文本轉(zhuǎn)換為詞元(tokens),并標(biāo)記異常長的詞語,以識別隱藏在文中的化學(xué)物質(zhì)名稱。

4將論文拆分為段落和關(guān)鍵字后構(gòu)建知識圖譜。圖譜中的每個(gè)節(jié)點(diǎn)代表一個(gè)段落或化學(xué)名稱,節(jié)點(diǎn)之間的連接則體現(xiàn)主題之間的關(guān)聯(lián)。


隨后,團(tuán)隊(duì)使用 MATLAB 對該數(shù)據(jù)集應(yīng)用圖論方法,識別各概念之間的關(guān)聯(lián)路徑。接著,他們將這些結(jié)構(gòu)化的文本子集輸入 LLM,由模型生成摘要并解釋不同主題之間的關(guān)系——這些關(guān)系若由人工分析,可能需要數(shù)周時(shí)間。最終,他們構(gòu)建了一套能夠?qū)⒎稚⒀芯哭D(zhuǎn)化為可執(zhí)行洞察的流程,大幅加速了食品科學(xué)研究的推進(jìn)。


盡管 GenAI 帶來了顯著價(jià)值——研究人員通過該流程節(jié)省了數(shù)天的人工處理時(shí)間——但成功仍高度依賴人工判斷與手動工作。團(tuán)隊(duì)在將數(shù)據(jù)輸入 GenAI 之前投入了數(shù)百小時(shí)進(jìn)行實(shí)驗(yàn)與數(shù)據(jù)準(zhǔn)備。通過反復(fù)試驗(yàn),他們才確定將文本按段落進(jìn)行切分最為有效,因?yàn)?GenAI 無法自動作出這種判斷。GenAI 的強(qiáng)大之處只有在具備高質(zhì)量數(shù)據(jù)和嚴(yán)謹(jǐn)工程方法的前提下才能充分發(fā)揮。


將維護(hù)數(shù)據(jù)轉(zhuǎn)化為前瞻性洞察

傳統(tǒng)的預(yù)測性維護(hù)(PdM)主要依賴傳感器的數(shù)值數(shù)據(jù),用來跟蹤溫度、振動、壓力等變化,以捕捉設(shè)備故障前的異常模式。許多組織還會收集維護(hù)日志和技術(shù)人員記錄等文本信息,這些內(nèi)容能夠提供傳感器無法捕捉的關(guān)鍵背景,例如故障癥狀、維修過程以及可能的根因判斷。


圖片1.png

生成式 AI 幫助工程師處理來自設(shè)備日志和服務(wù)記錄的非結(jié)構(gòu)化數(shù)據(jù),從而改進(jìn)預(yù)測性維護(hù)流程。


文本信息并不能取代傳感器數(shù)據(jù);工程師可以利用 GenAI 將其標(biāo)準(zhǔn)化,使其能夠與傳統(tǒng)信號協(xié)同使用。例如,GenAI 可以總結(jié)維護(hù)記錄、統(tǒng)一不一致的術(shù)語,或標(biāo)注關(guān)鍵事件(如組件故障或重復(fù)出現(xiàn)的故障類型)。這些標(biāo)注數(shù)據(jù)隨后可與時(shí)間序列傳感器數(shù)據(jù)對齊,為 PdM 模型的開發(fā)提供更清晰的目標(biāo)與上下文。


圖片2.png

生成式 AI 幫助技術(shù)人員將服務(wù)記錄與傳感器數(shù)據(jù)結(jié)合,以更快速、更準(zhǔn)確地完成汽車故障診斷。


GenAI 還可以支持工程流程的其他環(huán)節(jié)。工程師可以使用它起草和優(yōu)化用于數(shù)據(jù)清洗、特征工程或探索性分析的代碼,也可以用它評估不同的建模方法。然而,領(lǐng)域知識在整個(gè)過程依然至關(guān)重要。只有經(jīng)驗(yàn)豐富的工程師才能判斷特征是否具有物理意義、模型行為是否符合系統(tǒng)動力學(xué),以及輸出結(jié)果是否反映真實(shí)的故障模式或只是數(shù)據(jù)噪聲。


與所有 PdM 方法一樣,基于 GenAI 的工作流程在部署前需要經(jīng)過嚴(yán)格驗(yàn)證。一個(gè)在原型或小規(guī)模測試集中表現(xiàn)良好的模型,未必能夠應(yīng)對真實(shí)環(huán)境中的多變條件。工程師應(yīng)使用具有代表性的數(shù)據(jù)集進(jìn)行驗(yàn)證,對模型進(jìn)行多工況壓力測試,并加入確定性檢查以確保其健壯性。這些最佳實(shí)踐適用于所有 PdM 方法,無論是否包含 GenAI,再次強(qiáng)調(diào)成功的 PdM 不僅依賴先進(jìn)工具,更依賴扎實(shí)的工程判斷。


工程師們?nèi)灾挥|及 GenAI 的表層

與任何工具一樣,GenAI 應(yīng)在方法論指導(dǎo)下使用,而非被泛化應(yīng)用于所有問題。當(dāng)任務(wù)涉及大量非結(jié)構(gòu)化數(shù)據(jù),或需要處理語言驅(qū)動的輸入時(shí),GenAI 的價(jià)值最為突出。工程師需要戰(zhàn)略性地整合 GenAI,拓展領(lǐng)域?qū)I(yè)知識,并思考如何在自身的設(shè)計(jì)方法中切實(shí)應(yīng)用這一工具。


總結(jié)

生成式AI雖已展現(xiàn)出重塑工程流程的強(qiáng)大能力,但目前大多數(shù)應(yīng)用仍停留在表層,尚未完全轉(zhuǎn)化為推動技術(shù)創(chuàng)新的核心引擎。真正的突破不在于盲目依賴模型的通用能力,而在于將GenAI戰(zhàn)略性地嵌入嚴(yán)謹(jǐn)?shù)墓こ谭椒ㄕ撝校和ㄟ^人工判斷指導(dǎo)數(shù)據(jù)預(yù)處理,利用領(lǐng)域知識驗(yàn)證模型輸出的物理意義,并將非結(jié)構(gòu)化文本洞察與傳統(tǒng)傳感器數(shù)據(jù)有機(jī)結(jié)合。無論是加速故障排查還是優(yōu)化預(yù)測性維護(hù),成功的鑰匙始終掌握在那些能夠駕馭工具、堅(jiān)持嚴(yán)格驗(yàn)證并具備深厚專業(yè)背景的工程師手中。


3-958x200_20251021044824_513.png

特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索

關(guān)閉

?

關(guān)閉