昆山杜克大(dà)學李昕:工(gōng)業4.0時代,大(dà)數據賦能智能制造的4大(dà)應用

從最早公元前2000年文字誕生(shēng)起人類就開(kāi)始采集數據,到1998年正式提出大(dà)數據這一(yī)概念,實際上數據的發展已經橫跨了上下(xià)4000多年的時間。在這一(yī)漫長的曆史演變中(zhōng),人類共經曆了四次工(gōng)業革命,從最早以蒸汽技術爲代表的工(gōng)業1.0,到如今以智能和互聯網爲代表的工(gōng)業4.0,制造業也迎來了其全面蛻變的時刻——智能工(gōng)廠時代的強勢來襲。

畢業于美國卡内基梅隆大(dà)學、專注于制造業大(dà)數據研究的昆山杜克大(dà)學教授李昕認爲,在人工(gōng)智能和大(dà)數據愈發滲透的今天,如何更好地收集數據、分(fēn)析數據、利用數據才是企業根本。尤其是制造業,作爲立國之本,量級更是驚人,如何用數據助力智能制造,點“數”成金?

在李昕看來,數據分(fēn)析在制造業應用有兩大(dà)技術難點:第一(yī)個是數據變異性,第二個是工(gōng)藝的變化。對于未來大(dà)數據的發展,李昕也表示,最大(dà)痛點在于“懂數據又(yòu)懂行業”的雙料人才的匮乏。在這點上,不管是學校,還是企業,都任重道遠。

以下(xià)是李昕教授在2017IT 價值峰會暨中(zhōng)國企業級技術峰會上的演講,經ITValue編輯整理:

我(wǒ)(wǒ)本人主要從事制造業大(dà)數據的研究,是台灣富士康集團總裁郭台銘先生(shēng)的大(dà)數據顧問,同時也是香港兩家公司的董事。

互聯網時代,數據暴增。目前每兩天創造的信息幾乎相當于人類有史以來到2003年所創造的信息總和。這是什麽概念?在美國,每分(fēn)鍾就會産生(shēng)2.04億封郵件,Facebook上會有180萬次的點贊、20萬張照片的上傳。而且這個量級還會随着時間不斷上升,大(dà)概每1.2年就會翻一(yī)番。

如此龐大(dà)的數據量怎麽才能很好利用?我(wǒ)(wǒ)們先來看一(yī)下(xià)大(dà)數據應用的現狀。過去(qù)5-10年,大(dà)數據的發展主要集中(zhōng)在三個方向:圖像、視頻(pín)、語音。國内外(wài)很多IT公司在這三個方向上都取得了非常成功的發展。今年3月,李克強總理在政府工(gōng)作報告上強調,要把人工(gōng)智能、大(dà)數據推廣到各行各業中(zhōng),包括商(shāng)業、醫療、制造、教育、城市等。這意味着,未來大(dà)數據将會滲透到我(wǒ)(wǒ)們生(shēng)活的每個環節中(zhōng),發揮越來越重要的作用。

要利用數據就要先分(fēn)析數據。大(dà)數據分(fēn)析需要兩類人:數據分(fēn)析專家和行業專家,二者缺一(yī)不可。谷歌過去(qù)十年一(yī)直在推自動駕駛技術,但是兩年前意識到,自動駕駛并不是一(yī)個IT公司的數據專家就能單獨完成的事,還必須和各個整車(chē)廠包括本田、福特等的行業專家合作,共同研發産品。

智能工(gōng)廠時代全面來臨

就制造業來說,數據量的龐大(dà)難以想象。中(zhōng)國具有強盛的制造業,如果利用大(dà)數據把制造業的效率提高10%,那麽創造的利潤非同小(xiǎo)可。在美國,奧巴馬時期就提出了智能制造的戰略,歐洲老牌制造強國德國一(yī)直在提倡工(gōng)業4.0,新加坡也有明确的規定國家GDP必須有15%-20%的貢獻是來自于制造業。

沒有制造業,一(yī)個國家就喪失了生(shēng)存之本。

回顧起來,制造業的發展大(dà)概經曆了四次工(gōng)業革命。第一(yī)次工(gōng)業革命發生(shēng)于18世紀60年代,主要以蒸汽技術爲代表的工(gōng)業1.0時代;第二次工(gōng)業革命是在19世紀50年代,以電(diàn)力爲主要能源的工(gōng)業2.0時代;第三次是20世紀50年代,以計算機技術爲代表,把計算機技術應用到工(gōng)業控制中(zhōng)的工(gōng)業3.0時代;最後一(yī)次就是當今以智能和互聯網爲代表的第四次工(gōng)業革命即工(gōng)業4.0時代。

這次工(gōng)業革命對制造業來說非比尋常,它意味着智能工(gōng)廠時代的全面來臨。什麽是智能工(gōng)廠?在每個工(gōng)廠的每個車(chē)間的每個機台上都安裝有很多傳感器,不斷地采集數據,并對數據進行分(fēn)析,從而優化生(shēng)産線,降低成本。這個數據量有多大(dà)?制造業有一(yī)項技術叫自動光學檢測(AOI),每個零部件生(shēng)産出來後都會被拍照檢驗質量的好壞。倘若按每分(fēn)鍾收集一(yī)張1M像素的圖片來估算,一(yī)台機器一(yī)天産生(shēng)的數據就是1.5G。每個工(gōng)廠有N多個機台,N多個傳感器,總的數據量可想而知(zhī)。

大(dà)數據提升制造流程的4大(dà)應用

這麽多數據能拿來做什麽?第一(yī)個應用就是調度優化。

在智能車(chē)間裏,機台與機台之間的産品傳遞主要靠機械手臂來完成,而車(chē)間與車(chē)間之間的産品傳遞則是通過傳動帶來完成。所謂調度優化就是通過數據分(fēn)析,了解每個産品在每個機台上需要處理的時間,然後決定出把某個産品送到哪個機台去(qù)處理的最優解決方案。這個事情看起來容易,操作起來卻很難,正如車(chē)輛在路上突然抛錨造成交通擁堵一(yī)樣,如果一(yī)個機台出了問題,就會擾亂整個調度的優化方案,更糟的是如果發現某個産品不合格,就需要被重新發配到某個機台重新處理,那麽就會導緻整個調度非常複雜(zá),處理不好就會造成“擁堵”,甚至停工(gōng)。

大(dà)數據的另外(wài)一(yī)個重要應用就是設備監控。産品制造分(fēn)許多步驟,如果第一(yī)道工(gōng)序出了故障沒有立刻發現,等生(shēng)産出來之後經檢測時才發現,那就意味着這段時間裏生(shēng)産的全部産品都要報廢。這是個很嚴重的問題。設備監控就是在每個機台上都安置多個傳感器來監測設備是否有故障。美國有個大(dà)型制造企業,曾經成品率總是提不上去(qù),經多方查找後才發現,原來是一(yī)個機台在清理時出了問題,早班清潔工(gōng)是從上往下(xià)清理,晚班清潔工(gōng)是從下(xià)往上清理,就是這樣一(yī)個個小(xiǎo)小(xiǎo)的瑕疵就會對整個生(shēng)産線造成幾百萬甚至幾千萬美金的損失。

第三個應用就是虛拟測試。在制造業中(zhōng),測試占整個制造成本的25%-50%,怎麽用大(dà)數據降低測試成本?最根本的一(yī)點就是利用數據的相關性,也就是用數據去(qù)分(fēn)析不同的數據量之間是否相關,如果存在相關就可以用一(yī)個數據量去(qù)估計另一(yī)個數據量。

這裏有兩個例子,一(yī)個是空間的相關性。在集成電(diàn)路制造中(zhōng),一(yī)塊矽片包含很多芯片,傳統的方法是每個芯片都要去(qù)測試,如果我(wǒ)(wǒ)們把整塊矽片看作是一(yī)幅圖像,那麽不同的像素對應不同的芯片,像素點之間是有相關性的,我(wǒ)(wǒ)們可以通過測試少數幾個像素點的值,利用統計方法來估值另外(wài)的像素點,從而大(dà)大(dà)減少測試量。

另一(yī)個例子是給金屬塊鑽孔。鑽孔是否平整?是不是圓形?在制造業上是一(yī)個非常昂貴的測試過程。我(wǒ)(wǒ)們通過在鑽孔機上安裝各種非常廉價的傳感器,包括震動傳感器、聲音傳感器、壓力傳感器等,用這些傳感器的測試值去(qù)創建一(yī)個模型,然後預估鑽孔的平整度和質量狀況,從而節省很大(dà)一(yī)筆成本。

第四個應用是故障追蹤。監控生(shēng)産線中(zhōng)産品的制造過程,發現故障的根源。故障可能是某一(yī)個機台,可能是某一(yī)種原材料,也可能是某一(yī)位操作員(yuán)。

大(dà)數據分(fēn)析在制造業應用有兩大(dà)技術難點:第一(yī)個就是數據變異性,不同機台,在不同時間、不同環境下(xià)的數據具有不同的統計特性,也就是說,在這個機台上采集的數據不可能直接拿來去(qù)用于另一(yī)個機台的建模。當你把采集到的數據分(fēn)配到每個機台、每個時間點、每個不同的環境條件下(xià)去(qù)做分(fēn)析的時候,你會發現數據量其實并不大(dà),甚至很小(xiǎo)。另外(wài)一(yī)個難點是工(gōng)藝的變化。制造工(gōng)藝随時間在不斷演變,同樣一(yī)個産品,今年制造出來的測試結果和明年制造出來的測試結果完全不同,因爲産線在不斷變化,這是大(dà)數據分(fēn)析的一(yī)個軟肋。我(wǒ)(wǒ)們分(fēn)析的數據都是曆史數據,所以大(dà)數據分(fēn)析實際上就是兩步,第一(yī)步記錄曆史數據,第二步根據這些曆史數據去(qù)預測未來。如果由于工(gōng)藝變化導緻未來和曆史是不一(yī)緻的,那麽大(dà)數據分(fēn)析的最根本假設就已經不成立了。這也是大(dà)數據分(fēn)析的一(yī)個痛點所在。

怎麽去(qù)解決這一(yī)問題?從我(wǒ)(wǒ)來看,大(dà)數據未來發展的一(yī)個最大(dà)難點就是缺乏複合型的人才。要找到一(yī)個既懂數據又(yòu)懂專業領域的雙料人才非常困難,所以培養跨學科的人才是我(wǒ)(wǒ)們昆山杜克學校的一(yī)個重要任務。

昆山杜克大(dà)學剛剛成立了一(yī)個大(dà)數據中(zhōng)心,裏面有很多昆山杜克大(dà)學的教授,以及美國杜克大(dà)學的教授,我(wǒ)(wǒ)們一(yī)起合作緻力于中(zhōng)國大(dà)數據人才的培養,也希望與中(zhōng)國的企業合作共同貢獻一(yī)份力量。(本文首發钛媒體(tǐ),整理/胡江路)