點亮建筑新夢想
LIGHT BUILDING NEW DREAM
企業(yè)BIM定制培訓服務經典案例
今天,您的企業(yè)“大數據”了嗎? 二維碼
作者:廣聯(lián)達施工企業(yè)項目管理系統(tǒng)高級需求工程師 侯凱 我們身邊的大數據2018年最火的歌手是誰?采訪不同的人,會有不同的答案。有人說是毛不易,有人說是華晨宇,也有人說是張靚穎。但要說到2018年“真愛粉”最多的歌手,非張學友莫屬了。據不完全統(tǒng)計,在張學友近半年的10場演唱會上,一共有50多名違法犯罪人員被抓。最多的一次,在陜西咸陽,一次性抓獲逃犯、其他違法犯罪人員18人。罪犯們真是冒著生命危險來聽演唱會,也讓張學友喜提“逃犯克星”的稱號。 這一切真的只是巧合嗎?其實和我們今天要聊的主角,大數據與商務智能,有著密不可分的聯(lián)系。
商務智能的前世今生
大數據,英文是Big Data,又稱為巨量資料,指的是傳統(tǒng)數據處理應用軟件不足以處理它們的大或復雜的數據集的術語。大數據也可以定義為來自各種來源的大量非結構化或結構化數據。 商務智能,又稱商業(yè)智能,指用現代數據倉庫技術、在線分析處理技術、數據挖掘和數據展現技術進行數據分析以實現商業(yè)價值。 ——以上定義來自維基百科
大數據技術和商務智能,從出現到成熟,再到近幾年的大紅大紫,經歷了漫長的發(fā)展過程。
起源:從數據到知識的挑戰(zhàn)和跨越
1946年,人類歷史上第一臺電子計算機在美國費城問世。來自匈牙利的移民馮·諾伊曼(John von Neumann)是這臺計算機的主要設計者,他被后世成為之“計算機之父”。 僅一年之后,卡內基梅隆大學教授赫伯特·西蒙(Herbert Simon)出版了《行政組織的決策過程》一書。在這本被后世視為經典的著作里,他指出:人類的理性是有限的,因為所有的決策都是基于有限理性的結果。他預測:在后工業(yè)時代,也就是信息時代,人類社會面臨的中心問題將從如何提高生產率轉變?yōu)槿绾胃玫乩眯畔磔o助決策。 1975年,由于對人工智能的貢獻,他獲得了計算機學界的最高獎——圖靈獎;1978年,他又因為對“商務決策過程”的出色研究,帶上了諾貝爾經濟學獎的桂冠。追本溯源,學界普遍認為,西蒙對決策支持系統(tǒng)的研究,是現代商務智能概念最早的源頭和起點?,F代商務智能技術回答的還是決策支持系統(tǒng)面對的老問題:如何將數據、信息轉化為知識,擴大人類的理性,輔助決策? 從數據到知識,這個跨越,人類用了半個多世紀。
二進制的引進,解決了在沒有“情感、智能和生命”的物理機器中表達、計算、傳送數據的最大難題。但當數據在計算機內部累計得越來越多的時候,如何快速地組織、存儲和讀取數據又成為了新的挑戰(zhàn)。1970年,IBM的研究院埃德加·科德(Edgar Codd)發(fā)明了關系型數據庫,成為軟件發(fā)展歷史上一個跨越性的里程碑。 此前,數據庫的組織結構以網狀、層級制為主,復雜多變,程序和數據之間你中有我、我中有你,彼此有很強的依賴性??频绿岢龅年P系型數據庫具有結構化高、冗余度低、獨立性強等優(yōu)點,徹底把軟件中的程序和數據分立開來。從此,軟件的發(fā)展成了“兩條腿”走路,程序和數據在各自的軌道上自由奔跑。 隨著大型信息管理系統(tǒng)的應用一日千里、遍地開花,怎樣從各個獨立的信息系統(tǒng)中提取、整合有價值的數據,從而實現從數據到信息、從信息到知識、從知識到利潤的轉化?這個要求,變得越來越迫切。
結蛹:數據倉庫之厚積薄發(fā)
決策支持系統(tǒng)面臨的“瓶頸式”難題,是如何有機地聚集、整合多個不同運營信息系統(tǒng)產生的數據。1988年,為解決企業(yè)的數據集成問題,IBM公司的兩名研究員巴里·德夫林(Barry Devlin)和保羅·莫菲(Paul Murphy)創(chuàng)造性地提出了一個新的術語——數據倉庫(Data Warehouse),然而遺憾的是,他們并沒有乘勝追擊。 1992年,比爾·恩門(Bill Inmon)出版了《數據倉庫之構建》(Building the Data Warehouse)一書,第一次給出了數據倉庫的清晰定義和操作性很強的實戰(zhàn)法則,真正拉開了數據倉庫走向大規(guī)模應用的序幕。此后,他的“江湖地位”也得以確定,被譽為“數據倉庫之父”。 數據倉庫和數據庫的最大差別在于,前者是以數據分析、決策支持為目的來組織存儲數據,而數據庫的主要目的則是為運營行系統(tǒng)保存、查詢數據。 如蠶之蛹,數據倉庫是商務智能的依托,是對海量數據進行分析的核心物理架構。它可以形象地理解為一種格式一致的多源數據存儲中心,數據源可以來自多個不同的系統(tǒng),如企業(yè)內部的項目管理系統(tǒng)、財務系統(tǒng)、人力資源系統(tǒng),甚至是企業(yè)外部的系統(tǒng)。這些系統(tǒng),即使運行的平臺不同、編制的語言不同、所處的物理位置不同,但其數據可以按統(tǒng)一定義的格式被提取出來,再通過清洗、轉換、集成,最后百流歸海,加載進入數據倉庫。
蠶動:聯(lián)機分析之驚艷
聯(lián)機分析(Online Analytical Processing),也稱多維分析,本意是把分立的數據庫“相聯(lián)”,進行多維度分析。分析問題的任何角度,都可以視為一個或多個維度的交叉。例如: 一公司2018年完成的新簽合同額是多少?這是“組織”和“時間”兩個維度的交叉問題。 一公司2018年完成的基礎設施類新簽合同額是多少?這是“組織”“時間”和“工程類別“三個維度的交叉問題。 一公司2018年在華北地區(qū)完成的基礎設施類新簽合同額是多少?這是“組織”“時間”“工程類別”和“地域”四個維度的交叉問題。 同時,一個維度,還可以下鉆細分。例如,就時間的維度,可以看年度的數據,也可以具體到月度;地域的維度,可以看華北地區(qū),也可以具體到省份、城市。 和下鉆相對應的,是上卷。各公司的新簽合同額相加,就是集團的新簽合同額。 報表,是關系型數據庫時代將數據轉化為信息和知識最主要的手段。但交叉的維度越多,報表就越復雜,而且不同維度的組合將產生不同的報表,對于一個立足決策的用戶來說,他的需要是“動態(tài)”的,他可能問出任意維度交叉和細分的問題。有了聯(lián)機分析,用戶可以自己隨時創(chuàng)建所需要的報表,開發(fā)人員只需要預先為用戶在后臺構建多維的數據立方體(Cube)。
破繭:數據挖據之智能生命的產生
真正給商務智能賦予“智能”生命的是它的下一個產業(yè)鏈:數據挖掘。其中,最為經典的例子當屬啤酒和尿布。 零售企業(yè)沃爾瑪擁有世界上數一數二的數據倉庫,是最早應用數據挖掘技術的企業(yè)之一,也是數據挖掘技術的集大成者。在一次例行的數據分析之后,研究人員突然發(fā)現:和尿布一起搭配購買最多的商品竟然是啤酒! 尿布和啤酒,聽起來風馬牛不相及,但這是歷史數據進行挖掘的結果,反映的是數據層面的規(guī)律。這種關系令人費解,這是一個真正的規(guī)律嗎? 經過跟蹤調查,研究人員終于發(fā)現事出有因:一些年輕的爸爸經常要到超市去購買嬰兒尿布,有30%到40%的新爸爸會順便買點啤酒犒勞自己。沃爾瑪隨后對啤酒和尿布進行了捆綁銷售,不出意料,銷量雙雙增加。 數據挖掘把數據分析的范圍從“已知”擴大到了“未知”,從“過去”推向了“未來”,是商務智能真正的生命力和靈魂所在。
化蝶:數據可視化的華麗上演
圖形是解決邏輯問題的視覺方法。 生理學證明,人的大腦皮層當中,有40%的視覺反應區(qū),人類的神經系統(tǒng)天生就對圖像化的信息最為敏感。通過圖像,信息的表達和傳遞將更加直觀、快捷、有效。 更重要的原因在于:人的創(chuàng)造力不僅僅取決于邏輯思維,還取決于形象思維。數據可視化的技術,可以通過圖像在邏輯思維基礎上進一步激發(fā)人的形象思維和空間想象力,吸引、幫助用戶洞察數據之間隱藏的關系和規(guī)律。 進入21世紀之后,大數據的爆炸使人們急需展示數據、理解數據、演繹數據的工具。這種需求,刺激了數據可視化專業(yè)市場的形成,產品迅速增多,使現在的市場可謂絢麗多彩、百花齊放。從最早的點線圖、直方圖、餅圖、網狀圖等簡單圖表,發(fā)展到以監(jiān)控商務績效為主的儀表盤、記分板,再到以交互式的三維地圖、動態(tài)模擬、動畫技術等更加直覺化、趣味化的表現方法,曾經冰冷堅硬、枯燥乏味的數據開始“動”了起來、“舞”了起來,變得“性感”!
可視化技術的出現,使商務智能的產業(yè)鏈形成了一個從數據整合、分析、挖掘到展示的完整閉環(huán)。它的起點是多個獨立的關系型數據庫,經過數據整合之后形成統(tǒng)一的、多源的數據倉庫,再根據用戶的需要,重新取出若干數據子集,或構造多維立方體(Cube)進行聯(lián)機分析,或進行數據挖據,發(fā)現潛藏的規(guī)律和趨勢。如果挖掘的結果經得起現實的檢驗,那就形成了新的知識,這種知識,還可以通過數據可視化來表達、展示和傳遞。
施工企業(yè)大數據
回顧了大數據技術和商務智能的前世今生,回歸到我們施工行業(yè),在這樣一個數據大爆炸的時代,企業(yè)的運營數據呈現爆發(fā)式的增長,如何利用大數據分析實現精益化管理,驅動業(yè)務增長,是每個企業(yè)新的理想藍圖。相信您的企業(yè)對下述困境也是感同身受。
(1)業(yè)務發(fā)展的瓶頸業(yè)務部門數據分析需求得不到及時響應,在一片漆黑中前行。 業(yè)務部門對于數據分析具有極大的需求,但卻苦于沒有數據以及工具的有效支持,依賴于IT部門的報表制作,需求得不到及時響應。
(2)信息中心的瓶頸IT集權下的疲于應對,放權下的數據管理混亂。 信息中心集權,導致業(yè)務部門需求集中扎堆,響應不足。員工熬夜加班多,卻成就感低。
(3)大數據應用的瓶頸不利用心慌,利用時迷茫,如何走好“最后一公里”? 大數據倒逼企業(yè)不斷地去升級硬件,擴展底層架構,但存儲的數據越來越多,如何真正讓數據發(fā)揮價值,做好數據建設的最后一公里至關重要。 住房和城鄉(xiāng)建設部印發(fā)的《2016-2020年建筑業(yè)信息化發(fā)展綱要》中明確提出: “施工類企業(yè): 有條件的企業(yè)應推進企業(yè)管理信息系統(tǒng)中項目業(yè)務管理和財務管理的深度集成,實現業(yè)務財務管理一體化。 注重推進企業(yè)知識管理信息系統(tǒng)、商業(yè)智能和決策支持系統(tǒng)的應用,有條件的企業(yè)應探索大數據技術的集成應用,支撐智慧企業(yè)建設?!?/span> 所以,對施工企業(yè)來說,早已經不再是要不要使用大數據技術的問題,而是什么時間上線大數據分析平臺,能不能早一點上線的問題。施工企業(yè)要做大做強,實現規(guī)模化效益,囿于傳統(tǒng)的手段已經無法持續(xù),必須尋求新的突破,大數據技術和商業(yè)智能,不失為一個通過結果倒閉過程、優(yōu)化管理模式的新起點。
參考資料: (1)維基百科 (2)《大數據:正在到來的數據革命》,涂子沛著 |