昆山杜克大學(xué)李昕:工業4.0時代,大數據賦能智能制造的(de)4大應用

從最早公元前2000年(nián)文字誕生起人類就開始采集數據,到1998年(nián)正式提出大數據這一(yī)概念,實際上數據的(de)發展已經橫跨了上下4000多年(nián)的(de)時間。在這一(yī)漫長(cháng)的(de)曆史演變中,人類共經曆了四次工業革命,從最早以蒸汽技術為(wèi)代表的(de)工業1.0,到如(rú)今以智能和(hé)互聯網為(wèi)代表的(de)工業4.0,制造業也迎來了其全面蛻變的(de)時刻——智能工廠時代的(de)強勢來襲。

畢業于美國(guó)卡內(nèi)基梅隆大學(xué)、專注于制造業大數據研究的(de)昆山杜克大學(xué)教授李昕認為(wèi),在人工智能和(hé)大數據愈發滲透的(de)今天,如(rú)何更好地(dì)收集數據、分析數據、利用數據才是企業根本。尤其是制造業,作為(wèi)立國(guó)之本,量級更是驚人,如(rú)何用數據助力智能制造,點“數”成金?

在李昕看來,數據分析在制造業應用有(yǒu)兩大技術難點:第一(yī)個是數據變異性,第二個是工藝的(de)變化。對于未來大數據的(de)發展,李昕也表示,最大痛點在于“懂數據又懂行(xíng)業”的(de)雙料人才的(de)匮乏。在這點上,不管是學(xué)校,還是企業,都任重道(dào)遠。

以下是李昕教授在2017IT 價值峰會暨中國(guó)企業級技術峰會上的(de)演講,經ITValue編輯整理(lǐ):

我本人主要從事制造業大數據的(de)研究,是台灣富士康集團總裁郭台銘先生的(de)大數據顧問,同時也是香港兩家公司的(de)董事。

互聯網時代,數據暴增。目前每兩天創造的(de)信息幾乎相當于人類有(yǒu)史以來到2003年(nián)所創造的(de)信息總和(hé)。這是什麽概念?在美國(guó),每分鍾就會産生2.04億封郵件,Facebook上會有(yǒu)180萬次的(de)點贊、20萬張照片的(de)上傳。而且這個量級還會随着時間不斷上升,大概每1.2年(nián)就會翻一(yī)番。

如(rú)此龐大的(de)數據量怎麽才能很好利用?我們先來看一(yī)下大數據應用的(de)現狀。過去(qù)5-10年(nián),大數據的(de)發展主要集中在三個方向:圖像、視(shì)頻、語音。國(guó)內(nèi)外很多IT公司在這三個方向上都取得了非常成功的(de)發展。今年(nián)3月,李克強總理(lǐ)在政府工作報告上強調,要把人工智能、大數據推廣到各行(xíng)各業中,包括商(shāng)業、醫療、制造、教育、城市(shì)等。這意味着,未來大數據将會滲透到我們生活的(de)每個環節中,發揮越來越重要的(de)作用。

要利用數據就要先分析數據。大數據分析需要兩類人:數據分析專家和(hé)行(xíng)業專家,二者缺一(yī)不可(kě)。谷歌過去(qù)十年(nián)一(yī)直在推自(zì)動駕駛技術,但是兩年(nián)前意識到,自(zì)動駕駛并不是一(yī)個IT公司的(de)數據專家就能單獨完成的(de)事,還必須和(hé)各個整車廠包括本田、福特等的(de)行(xíng)業專家合作,共同研發産品。

智能工廠時代全面來臨

就制造業來說,數據量的(de)龐大難以想象。中國(guó)具有(yǒu)強盛的(de)制造業,如(rú)果利用大數據把制造業的(de)效率提高(gāo)10%,那麽創造的(de)利潤非同小可(kě)。在美國(guó),奧巴馬時期就提出了智能制造的(de)戰略,歐洲老牌制造強國(guó)德國(guó)一(yī)直在提倡工業4.0,新加坡也有(yǒu)明确的(de)規定國(guó)家GDP必須有(yǒu)15%-20%的(de)貢獻是來自(zì)于制造業。

沒有(yǒu)制造業,一(yī)個國(guó)家就喪失了生存之本。

回顧起來,制造業的(de)發展大概經曆了四次工業革命。第一(yī)次工業革命發生于18世紀60年(nián)代,主要以蒸汽技術為(wèi)代表的(de)工業1.0時代;第二次工業革命是在19世紀50年(nián)代,以電力為(wèi)主要能源的(de)工業2.0時代;第三次是20世紀50年(nián)代,以計算機(jī)技術為(wèi)代表,把計算機(jī)技術應用到工業控制中的(de)工業3.0時代;最後一(yī)次就是當今以智能和(hé)互聯網為(wèi)代表的(de)第四次工業革命即工業4.0時代。

這次工業革命對制造業來說非比尋常,它意味着智能工廠時代的(de)全面來臨。什麽是智能工廠?在每個工廠的(de)每個車間的(de)每個機(jī)台上都安裝有(yǒu)很多傳感器,不斷地(dì)采集數據,并對數據進行(xíng)分析,從而優化生産線,降低(dī)成本。這個數據量有(yǒu)多大?制造業有(yǒu)一(yī)項技術叫自(zì)動光學(xué)檢測(AOI),每個零部件生産出來後都會被拍照檢驗質量的(de)好壞。倘若按每分鍾收集一(yī)張1M像素的(de)圖片來估算,一(yī)台機(jī)器一(yī)天産生的(de)數據就是1.5G。每個工廠有(yǒu)N多個機(jī)台,N多個傳感器,總的(de)數據量可(kě)想而知。

大數據提升制造流程的(de)4大應用

這麽多數據能拿來做(zuò)什麽?第一(yī)個應用就是調度優化。

在智能車間裏,機(jī)台與機(jī)台之間的(de)産品傳遞主要靠機(jī)械手臂來完成,而車間與車間之間的(de)産品傳遞則是通過傳動帶來完成。所謂調度優化就是通過數據分析,了解每個産品在每個機(jī)台上需要處理(lǐ)的(de)時間,然後決定出把某個産品送到哪個機(jī)台去(qù)處理(lǐ)的(de)最優解決方案。這個事情看起來容易,操作起來卻很難,正如(rú)車輛在路上突然抛錨造成交通擁堵一(yī)樣,如(rú)果一(yī)個機(jī)台出了問題,就會擾亂整個調度的(de)優化方案,更糟的(de)是如(rú)果發現某個産品不合格,就需要被重新發配到某個機(jī)台重新處理(lǐ),那麽就會導緻整個調度非常複雜,處理(lǐ)不好就會造成“擁堵”,甚至停工。

大數據的(de)另外一(yī)個重要應用就是設備監控。産品制造分許多步驟,如(rú)果第一(yī)道(dào)工序出了故障沒有(yǒu)立刻發現,等生産出來之後經檢測時才發現,那就意味着這段時間裏生産的(de)全部産品都要報廢。這是個很嚴重的(de)問題。設備監控就是在每個機(jī)台上都安置多個傳感器來監測設備是否有(yǒu)故障。美國(guó)有(yǒu)個大型制造企業,曾經成品率總是提不上去(qù),經多方查找後才發現,原來是一(yī)個機(jī)台在清理(lǐ)時出了問題,早班清潔工是從上往下清理(lǐ),晚班清潔工是從下往上清理(lǐ),就是這樣一(yī)個個小小的(de)瑕疵就會對整個生産線造成幾百萬甚至幾千萬美金的(de)損失。

第三個應用就是虛拟測試。在制造業中,測試占整個制造成本的(de)25%-50%,怎麽用大數據降低(dī)測試成本?最根本的(de)一(yī)點就是利用數據的(de)相關性,也就是用數據去(qù)分析不同的(de)數據量之間是否相關,如(rú)果存在相關就可(kě)以用一(yī)個數據量去(qù)估計另一(yī)個數據量。

這裏有(yǒu)兩個例子(zǐ),一(yī)個是空間的(de)相關性。在集成電路制造中,一(yī)塊矽片包含很多芯片,傳統的(de)方法是每個芯片都要去(qù)測試,如(rú)果我們把整塊矽片看作是一(yī)幅圖像,那麽不同的(de)像素對應不同的(de)芯片,像素點之間是有(yǒu)相關性的(de),我們可(kě)以通過測試少數幾個像素點的(de)值,利用統計方法來估值另外的(de)像素點,從而大大減少測試量。

另一(yī)個例子(zǐ)是給金屬塊鑽孔。鑽孔是否平整?是不是圓形?在制造業上是一(yī)個非常昂貴的(de)測試過程。我們通過在鑽孔機(jī)上安裝各種非常廉價的(de)傳感器,包括震動傳感器、聲音傳感器、壓力傳感器等,用這些傳感器的(de)測試值去(qù)創建一(yī)個模型,然後預估鑽孔的(de)平整度和(hé)質量狀況,從而節省很大一(yī)筆(bǐ)成本。

第四個應用是故障追蹤。監控生産線中産品的(de)制造過程,發現故障的(de)根源。故障可(kě)能是某一(yī)個機(jī)台,可(kě)能是某一(yī)種原材料,也可(kě)能是某一(yī)位操作員。

大數據分析在制造業應用有(yǒu)兩大技術難點:第一(yī)個就是數據變異性,不同機(jī)台,在不同時間、不同環境下的(de)數據具有(yǒu)不同的(de)統計特性,也就是說,在這個機(jī)台上采集的(de)數據不可(kě)能直接拿來去(qù)用于另一(yī)個機(jī)台的(de)建模。當你把采集到的(de)數據分配到每個機(jī)台、每個時間點、每個不同的(de)環境條件下去(qù)做(zuò)分析的(de)時候,你會發現數據量其實并不大,甚至很小。另外一(yī)個難點是工藝的(de)變化。制造工藝随時間在不斷演變,同樣一(yī)個産品,今年(nián)制造出來的(de)測試結果和(hé)明年(nián)制造出來的(de)測試結果完全不同,因為(wèi)産線在不斷變化,這是大數據分析的(de)一(yī)個軟肋。我們分析的(de)數據都是曆史數據,所以大數據分析實際上就是兩步,第一(yī)步記錄曆史數據,第二步根據這些曆史數據去(qù)預測未來。如(rú)果由于工藝變化導緻未來和(hé)曆史是不一(yī)緻的(de),那麽大數據分析的(de)最根本假設就已經不成立了。這也是大數據分析的(de)一(yī)個痛點所在。

怎麽去(qù)解決這一(yī)問題?從我來看,大數據未來發展的(de)一(yī)個最大難點就是缺乏複合型的(de)人才。要找到一(yī)個既懂數據又懂專業領域的(de)雙料人才非常困難,所以培養跨學(xué)科(kē)的(de)人才是我們昆山杜克學(xué)校的(de)一(yī)個重要任務。

昆山杜克大學(xué)剛剛成立了一(yī)個大數據中心,裏面有(yǒu)很多昆山杜克大學(xué)的(de)教授,以及美國(guó)杜克大學(xué)的(de)教授,我們一(yī)起合作緻力于中國(guó)大數據人才的(de)培養,也希望與中國(guó)的(de)企業合作共同貢獻一(yī)份力量。(本文首發钛媒體,整理(lǐ)/胡江路)