生成式 AI 幫助工程師挖掘隱藏在非結(jié)構(gòu)化數(shù)據(jù)中的深層洞察

發(fā)布時(shí)間：2026-02-25 來源：轉(zhuǎn)載責(zé)任編輯：lily

【導(dǎo)讀】生成式AI（GenAI）的崛起，不僅能將分散的非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化傳感器數(shù)據(jù)深度融合，更將工程師的角色從繁瑣的數(shù)據(jù)清洗中解放出來，轉(zhuǎn)向更高階的戰(zhàn)略分析與決策。從塔塔汽車?yán)脵z索增強(qiáng)生成（RAG）技術(shù)構(gòu)建上下文感知的故障診斷助手，到哥本哈根大學(xué)通過圖論與大模型結(jié)合加速食品科學(xué)發(fā)現(xiàn)，GenAI正展現(xiàn)出超越基礎(chǔ)代碼編寫的巨大潛力。然而，盡管普及率日益提升，許多工程師仍受限于傳統(tǒng)用法或?qū)ぷ髁髡系膿?dān)憂，尚未充分挖掘其在預(yù)測性維護(hù)和復(fù)雜系統(tǒng)分析中的深層價(jià)值。

您是否知道，生成式 AI（GenAI）可以幫助工程師在幾秒鐘內(nèi)診斷汽車故障，甚至在設(shè)備出現(xiàn)問題之前預(yù)測潛在失效？GenAI 正在通過加速數(shù)據(jù)分析和算法開發(fā)，讓這些場景從設(shè)想走向現(xiàn)實(shí)，使工程師能夠充分發(fā)揮專業(yè)知識，挖掘可執(zhí)行的洞察。

工程團(tuán)隊(duì)每年都會產(chǎn)生數(shù) TB 級的數(shù)據(jù)。根據(jù) Gartner 的估算，其中多達(dá) 80% 屬于非結(jié)構(gòu)化數(shù)據(jù)。服務(wù)記錄、研究論文和技術(shù)人員記錄中蘊(yùn)含著關(guān)鍵的組織知識，但由于格式不一致，難以有效解析。GenAI 工具能夠幫助工程師整合結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)，實(shí)現(xiàn)過去難以大規(guī)模開展的分析工作。對工程師而言，這意味著更快速的故障排查、更高效的設(shè)計(jì)流程以及更快的技術(shù)發(fā)現(xiàn)。

工程師在使用 GenAI 時(shí)的盲區(qū)

盡管 GenAI 在重塑工程工作方面具有高度靈活性，但其能力與工程師日常使用方式之間仍存在差距。許多工程師仍將 GenAI 主要用于編寫基礎(chǔ)代碼或生成文檔，而不是將其應(yīng)用于更高級的工程流程。

為更好地了解工程師對 GenAI 的態(tài)度及其實(shí)際應(yīng)用情況，MathWorks 于 2025 年 12 月在社交媒體上進(jìn)行了一項(xiàng)非正式投票。反饋結(jié)果揭示了多項(xiàng)重要洞察，包括：

-83% 的工程師至少每月使用一次 GenAI，其中最常見的應(yīng)用場景是“編寫代碼”和“文檔與報(bào)告生成”。

-工程師對 GenAI 的最大擔(dān)憂是其與現(xiàn)有工作流程的整合（46%）。在擁有六年以上經(jīng)驗(yàn)的工程師中，這一比例更是升至 75%。

這些數(shù)據(jù)表明，大多數(shù)工程師已經(jīng)在使用 GenAI，但尚未將其應(yīng)用于戰(zhàn)略性工程任務(wù)。希望提升 GenAI 使用能力的工程師應(yīng)考慮將其用于準(zhǔn)備和分析非結(jié)構(gòu)化數(shù)據(jù)。

利用服務(wù)手冊、工程文檔和維修記錄構(gòu)建面向技術(shù)人員的聊天助手

汽車故障排查通常需要在不同品牌和車型中診斷復(fù)雜問題。盡管大語言模型（LLM）包含大量公開的汽車知識，但它們?nèi)狈?xì)節(jié)豐富的品牌專屬信息。為彌合這一差距，塔塔汽車的工程師采用了一種名為檢索增強(qiáng)生成（RAG）的 GenAI 技術(shù)，將 LLM 的通用知識與內(nèi)部專有數(shù)據(jù)結(jié)合，從而生成具有上下文針對性的建議。

工程師利用 RAG 開發(fā)了一個(gè)具備上下文感知能力的聊天助手，能夠檢索內(nèi)部文檔并基于這些內(nèi)容生成故障排查回復(fù)。他們使用 MATLAB? 構(gòu)建了 RAG 工作流程，使其應(yīng)用（稱為 ServiceSage）可以搜索服務(wù)手冊、工程文檔和維修記錄。當(dāng)技術(shù)人員向 ServiceSage 提問時(shí)，問題會被轉(zhuǎn)化為 GenAI 能理解的數(shù)值表示，系統(tǒng)隨后查找最相關(guān)的文檔。由于 RAG 執(zhí)行的是語義搜索，問題的具體措辭并不關(guān)鍵，它會根據(jù)相關(guān)概念進(jìn)行推斷。相關(guān)文檔隨后被輸入 AI 模型，模型將其與通用知識結(jié)合，生成清晰、可理解的回答。

這種方法具有成本效益且可擴(kuò)展，無需進(jìn)行昂貴的模型再訓(xùn)練，并能處理大量此前未被充分利用的文本數(shù)據(jù)。借助該方法，團(tuán)隊(duì)能夠快速識別根本原因，提供上下文相關(guān)的指導(dǎo)，并縮短維修周期。通過 GenAI，工程師可以高效分析大量文本數(shù)據(jù)，并將其融入故障排查流程中。

利用全球與歷史科研資料推進(jìn)食品科學(xué)發(fā)現(xiàn)

科學(xué)研究通常涉及跨越數(shù)十年、來自多個(gè)地區(qū)的大量論文，想要系統(tǒng)梳理某一主題的所有研究或找出其中潛在聯(lián)系，若無先進(jìn)工具幾乎不可能。哥本哈根大學(xué)的食品科學(xué)研究人員在分析龐大資料尋找主題關(guān)聯(lián)時(shí)面臨這一挑戰(zhàn)。LLM 雖然能夠總結(jié)單篇文獻(xiàn)，但難以在海量數(shù)據(jù)中梳理整體關(guān)聯(lián)。為解決該問題，研究人員在使用 LLM 前，將 GenAI 與傳統(tǒng)技術(shù)相結(jié)合——如文本預(yù)處理與清洗、信息提取等——為非結(jié)構(gòu)化文本建立結(jié)構(gòu)。

哥本哈根大學(xué)團(tuán)隊(duì)在整個(gè)流程中多次使用 GenAI，包括：

1清理并標(biāo)準(zhǔn)化了數(shù)千份格式不一致的 PDF 文件。

2在元數(shù)據(jù)缺失時(shí)自動生成關(guān)鍵字。

3將文本轉(zhuǎn)換為詞元（tokens），并標(biāo)記異常長的詞語，以識別隱藏在文中的化學(xué)物質(zhì)名稱。

4將論文拆分為段落和關(guān)鍵字后構(gòu)建知識圖譜。圖譜中的每個(gè)節(jié)點(diǎn)代表一個(gè)段落或化學(xué)名稱，節(jié)點(diǎn)之間的連接則體現(xiàn)主題之間的關(guān)聯(lián)。

隨后，團(tuán)隊(duì)使用 MATLAB 對該數(shù)據(jù)集應(yīng)用圖論方法，識別各概念之間的關(guān)聯(lián)路徑。接著，他們將這些結(jié)構(gòu)化的文本子集輸入 LLM，由模型生成摘要并解釋不同主題之間的關(guān)系——這些關(guān)系若由人工分析，可能需要數(shù)周時(shí)間。最終，他們構(gòu)建了一套能夠?qū)⒎稚⒀芯哭D(zhuǎn)化為可執(zhí)行洞察的流程，大幅加速了食品科學(xué)研究的推進(jìn)。

盡管 GenAI 帶來了顯著價(jià)值——研究人員通過該流程節(jié)省了數(shù)天的人工處理時(shí)間——但成功仍高度依賴人工判斷與手動工作。團(tuán)隊(duì)在將數(shù)據(jù)輸入 GenAI 之前投入了數(shù)百小時(shí)進(jìn)行實(shí)驗(yàn)與數(shù)據(jù)準(zhǔn)備。通過反復(fù)試驗(yàn)，他們才確定將文本按段落進(jìn)行切分最為有效，因?yàn)?GenAI 無法自動作出這種判斷。GenAI 的強(qiáng)大之處只有在具備高質(zhì)量數(shù)據(jù)和嚴(yán)謹(jǐn)工程方法的前提下才能充分發(fā)揮。

將維護(hù)數(shù)據(jù)轉(zhuǎn)化為前瞻性洞察

傳統(tǒng)的預(yù)測性維護(hù)（PdM）主要依賴傳感器的數(shù)值數(shù)據(jù)，用來跟蹤溫度、振動、壓力等變化，以捕捉設(shè)備故障前的異常模式。許多組織還會收集維護(hù)日志和技術(shù)人員記錄等文本信息，這些內(nèi)容能夠提供傳感器無法捕捉的關(guān)鍵背景，例如故障癥狀、維修過程以及可能的根因判斷。

圖片1.png

生成式 AI 幫助工程師處理來自設(shè)備日志和服務(wù)記錄的非結(jié)構(gòu)化數(shù)據(jù)，從而改進(jìn)預(yù)測性維護(hù)流程。

文本信息并不能取代傳感器數(shù)據(jù)；工程師可以利用 GenAI 將其標(biāo)準(zhǔn)化，使其能夠與傳統(tǒng)信號協(xié)同使用。例如，GenAI 可以總結(jié)維護(hù)記錄、統(tǒng)一不一致的術(shù)語，或標(biāo)注關(guān)鍵事件（如組件故障或重復(fù)出現(xiàn)的故障類型）。這些標(biāo)注數(shù)據(jù)隨后可與時(shí)間序列傳感器數(shù)據(jù)對齊，為 PdM 模型的開發(fā)提供更清晰的目標(biāo)與上下文。

圖片2.png

生成式 AI 幫助技術(shù)人員將服務(wù)記錄與傳感器數(shù)據(jù)結(jié)合，以更快速、更準(zhǔn)確地完成汽車故障診斷。

GenAI 還可以支持工程流程的其他環(huán)節(jié)。工程師可以使用它起草和優(yōu)化用于數(shù)據(jù)清洗、特征工程或探索性分析的代碼，也可以用它評估不同的建模方法。然而，領(lǐng)域知識在整個(gè)過程依然至關(guān)重要。只有經(jīng)驗(yàn)豐富的工程師才能判斷特征是否具有物理意義、模型行為是否符合系統(tǒng)動力學(xué)，以及輸出結(jié)果是否反映真實(shí)的故障模式或只是數(shù)據(jù)噪聲。

與所有 PdM 方法一樣，基于 GenAI 的工作流程在部署前需要經(jīng)過嚴(yán)格驗(yàn)證。一個(gè)在原型或小規(guī)模測試集中表現(xiàn)良好的模型，未必能夠應(yīng)對真實(shí)環(huán)境中的多變條件。工程師應(yīng)使用具有代表性的數(shù)據(jù)集進(jìn)行驗(yàn)證，對模型進(jìn)行多工況壓力測試，并加入確定性檢查以確保其健壯性。這些最佳實(shí)踐適用于所有 PdM 方法，無論是否包含 GenAI，再次強(qiáng)調(diào)成功的 PdM 不僅依賴先進(jìn)工具，更依賴扎實(shí)的工程判斷。

工程師們?nèi)灾挥|及 GenAI 的表層

與任何工具一樣，GenAI 應(yīng)在方法論指導(dǎo)下使用，而非被泛化應(yīng)用于所有問題。當(dāng)任務(wù)涉及大量非結(jié)構(gòu)化數(shù)據(jù)，或需要處理語言驅(qū)動的輸入時(shí)，GenAI 的價(jià)值最為突出。工程師需要戰(zhàn)略性地整合 GenAI，拓展領(lǐng)域?qū)I(yè)知識，并思考如何在自身的設(shè)計(jì)方法中切實(shí)應(yīng)用這一工具。

總結(jié)

生成式AI雖已展現(xiàn)出重塑工程流程的強(qiáng)大能力，但目前大多數(shù)應(yīng)用仍停留在表層，尚未完全轉(zhuǎn)化為推動技術(shù)創(chuàng)新的核心引擎。真正的突破不在于盲目依賴模型的通用能力，而在于將GenAI戰(zhàn)略性地嵌入嚴(yán)謹(jǐn)?shù)墓こ谭椒ㄕ撝校和ㄟ^人工判斷指導(dǎo)數(shù)據(jù)預(yù)處理，利用領(lǐng)域知識驗(yàn)證模型輸出的物理意義，并將非結(jié)構(gòu)化文本洞察與傳統(tǒng)傳感器數(shù)據(jù)有機(jī)結(jié)合。無論是加速故障排查還是優(yōu)化預(yù)測性維護(hù)，成功的鑰匙始終掌握在那些能夠駕馭工具、堅(jiān)持嚴(yán)格驗(yàn)證并具備深厚專業(yè)背景的工程師手中。

上一篇：臺積電、英特爾、三星爭霸：誰將主宰2026先進(jìn)封裝王座？

下一篇：東芝推出適用于高溫環(huán)境工作的小型光繼電器，最高額定工作溫度達(dá)135°C

特別推薦

噪聲中提取真值！瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
10MHz高頻運(yùn)行！氮矽科技發(fā)布集成驅(qū)動GaN芯片，助力電源能效再攀新高
失真度僅0.002%！力芯微推出超低內(nèi)阻、超低失真4PST模擬開關(guān)
一“芯”雙電！圣邦微電子發(fā)布雙輸出電源芯片，簡化AFE與音頻設(shè)計(jì)
一機(jī)適配萬端：金升陽推出1200W可編程電源，賦能高端裝備制造

技術(shù)文章更多>>

技術(shù)白皮書下載更多>>

熱門搜索

羞羞网站免费在线观看_羞羞网站在线_黄片APP下载羞羞视频_羞羞视频网站免费观看在线视频夫妻内射,在线观看成本人亚洲,日韩a

生成式 AI 幫助工程師挖掘隱藏在非結(jié)構(gòu)化數(shù)據(jù)中的深層洞察

友情鏈接(QQ：317243736)

羞羞网站免费在线观看_羞羞网站在线_黄片APP下载羞羞视频_羞羞视频网站免费观看 在线视频夫妻内射,在线观看成本人亚洲,日韩a

生成式 AI 幫助工程師挖掘隱藏在非結(jié)構(gòu)化數(shù)據(jù)中的深層洞察

友情鏈接(QQ：317243736)

羞羞网站免费在线观看_羞羞网站在线_黄片APP下载羞羞视频_羞羞视频网站免费观看在线视频夫妻内射,在线观看成本人亚洲,日韩a