當前位置:首頁 > 科技百咖 >

“多維數據倉庫”是企業業務治理的未來

公布时间:2019-07-22 17:44:51 來源:中國軟件網 作者:趙晨希
[摘要]第一次見到本期嘉賓智達方通CEO蔡志宏,是在一次關于大數據、數據智能治理爲主題的講座上
專業性強、技術範兒是智達方通CEO蔡志宏給人的第一印象。

第一次見到本期嘉賓智達方通CEO蔡志宏,是在一次關于大數據、數據智能治理爲主題的講座上。蔡志宏從多維數據倉庫切入,講述了傳統企業治理軟件設計思路的滯後,以及企業降本增效的考量下,怎樣通過EPM系統底層技術多維數據倉庫,建立企業的“數字孿生”。進而,實現企業業務的動態計劃、測算、利用、分析等在內的數字化治理。

智達方通作爲一家專業從事全面預算治理、財務分析、企業績效治理、數據倉庫等領域軟件産品研發和咨詢服務的軟件公司。目前,服務的客戶已逾百家,遍布國內主要地區,覆蓋醫療健康、能源、港口、機械設備、地産、制造業、教育等行業。

事實上,智達方通選擇企業治理軟件中數據分析、決策支持方向,即企業績效治理EPM軟件方向,而沒有選擇其它方向建設、研發數據倉庫,這背後與智達方通CEO蔡志宏個人興趣、從業經曆有紧密的關系。

蔡志宏對中國軟件網透露,平時自己更喜歡技術類、行業專業類的文章,平時自己也會在相關平台專欄寫寫文章,發表自己對行業的看法。2001年至2010年期間,蔡志宏曾經在美國Hyperion和Oracle公司從事EPM軟件研發的相關工作。在這段時間裏,蔡志宏認識到數據分析對企業治理的重要性,以及ERP等傳統業務前端系統的局限性。

如今,數據已經成爲信息化社會建設的新能源,企業數據演變曆經財務報表、非財務信息,進入了第三個階段即大數據階段。伴隨5G的正式商用,AI人工智能第三次浪潮的到來,商業智能公司開始出現。

傳統的企業治理方式,顯然早已不能適應環境新的巨變。另一方面,過去企業治理中的信息不確定性在今天依旧存在,未曾消弭。抛開能力差異,企業治理者認知方面的偏差成爲企業發展最大的掣肘。

根據Wealth-X統計顯示,從2014年7月至2015年7月,美國有45%的富豪遭遇財富損失,這其中11%的人損失達一半以上。這些問題出現的根本原因在于,企業治理者對于事物的認識、認知不夠充实。

蔡志宏告訴中國軟件網,以往企業的信息化建設,通常是針對某個部門或某一實體業務,通過軟件系統模擬其線下的單據、表單格式,以及審批流程。這類系統中靈活一些的,可以開放其業務單據、流程、字段等自定義配置功能,更容易配置出企業用戶的個性化業務。但由于其數據缺乏結構性,無法實現智能治理所需的分析能力。

(智达方通CEO 蔡志宏)

以下爲中國軟件網對話智達方通CEO蔡志宏詳細實錄:

企業數據治理:“多維數據倉庫”的優勢

中國軟件網:智達方通網絡資料顯示,貴司以企業績效治理軟件研發和方案咨詢爲核心業務,致力于幫助企業加強全面預算治理體系,提升財務分析水平,有效支撐經營決策,從而改善治理提升績效。所以,智達方通很大一部门數據來源于企業治理中産生的數據,智達方通建設、研發數據倉庫,當初是怎樣選擇企業治理這個方向?爲什麽沒有選擇其他方向?

蔡志宏:我們選擇企業治理軟件中的數據分析、決策支持方向,也就是企業績效治理EPM軟件方向,主要是源自2001-2010年在美國Hyperion和Oracle公司從事EPM軟件研發的工作經曆。

在這段時間裏,我認識到數據分析對企業治理的重要性以及ERP等傳統前端業務系統的局限性。舉例來說,機場的民航系統中,有全世界每一個航線、航班、座位的所有信息,但對于某一位旅客來說,他並不需要這些海量數據,而是想知道這個周末從北京到三亞,哪個航班價格最優時間最合適。

也就是說,用戶更需要的是分析後的數據,而不是原始數據自己。對于企業治理者來說,他可能並不關心某一筆會計憑證、訂單、費用單據等,而是關注某一個型號的産品近3個月以來利潤率的變化趨勢,以便快速決策是否再繼續向這個型號的産品投入研發生産銷售成本。

這並不意味著ERP等前端業務系統不再重要,而是說前端業務軟件更適合對業務數據的收罗。相當于物聯網中的傳感器,負責生成數據,但傳感器並不能分析數據。而對企業業務數據的實時多維分析,就是多維數據倉庫擅長的領域,也是EPM軟件的基礎技術。

多維數據倉庫與關系型數據庫的差別在于,數據結構化水平更高,數據分析能力更強,更適合治理者自助式分析測算業務數據。

基于多維數據倉庫可搭建很多數據分析應用,典型的應用場景就是企業績效治理EPM,或稱爲治理會計信息化,這類應用包罗:企業的計劃預算編報、基于業務動因的計劃和測算、基于預算的資金、費用、成本、項目、合同等執行利用、經營分析商業智能分析等等。

同時,也可做企業各類業務數據的多維建模和分析自動化平台。如政府的各類監管數據月報快報平台等。一套系統可以實現所有業務分析、報表報告的自動化平台要求,幸免針對差异的治理指標要求,建設各種報表、報告、經營分析等等多個軟件系統。

中國軟件網:企業數據治理産生的數據和其他部門産生的數據,有何差异?

蔡志宏:以往的企業信息化建設,通常是針對某個部門或某個實體業務,通過軟件系統模擬其線下的單據、表單格式、以及審批流程。這類系統中靈活一些的,可以開放其業務單據、流程、字段等自定義配置功能,更容易配置出企業用戶的個性化業務。但由于其數據缺乏結構性,無法實現智能治理所需的分析能力。

企業數據治理或智能治理是指通過對實體業務的多維建模,並在多維數據模型中建立起業務間的因果關系,實現企業實體業務的數字孿生。這樣建立的企業治理信息化系統,就不再是業務數據的靜態呈現,而是可基于業務動因隨時模擬測算經營結果的動態系統。

各業務部門的業務前端信息化系統産生的數據,是企業實體業務的原始數據,需要經過分析計算才气形成決策支持所需知識,進而産生洞察力。相當于人工智能領域,從感知到認知的變遷。

中國軟件網:智達方通在數據歸類、數據清理、數據模型方面有什麽經驗,有何具體技術?

蔡志宏:數據建模是多維數據倉庫的基本功能。EPM項目交付的質量跟數據倉庫模型設計是否優化有很大關系。缺乏經驗的顧問,在梳理模型時會遷就企業線下的表樣,而不是基于業務抽象優化,甚至會設計出很多綜合維度、預留維度等。

雖然數據建模是多維數據倉庫的基本功能,模型是否優化仍然依賴業務顧問的業務梳理能力同樣,數據歸類和數據清理不完全是技術手段,更多是業務設計和治理咨詢能力。治理指標梳理、主題域設計通常比技術實現更關鍵。

中國軟件網:智達方通在企業治理中,有沒有用到包罗遷移學習、GAN或者其它的人工智能技術?

蔡志宏:大数据分析方法一般分为两类,一类是人工智能这一类探究性数据分析,EDA-Exploratory Data Analysis,解决的是数据间的相关性问题,提供的是概率性“参考答案”。好比,啤酒尿布、猫狗识别等。GAN这种深度学习方法就是这一类的分析方法。

第二类是验证性数据分析,CDA-Confirmatory Data Analysis。好比治理者感觉上半年经营利润下滑,但不知下滑到什么水平。收入成本费用数据完整,利润率指标计算方式明确,需要通过分析计算确认实际利润率,这就属于典型的验证性数据分析,分析结果是唯一正确答案而不是参考答案。无法想象经过经营分析后,得到的产物利润率是1-10%的参考答案。

EPM這一類財務分析應用,是典型驗證性數據分析,其基礎技術就是多維數據倉庫。對于智達方通的一些企業應用案例中,粗顆粒度的經營分析接纳基于多維數據倉庫的EPM産品方案,全量數據的分析,根據差异的業務方案接纳了差异的統計模型和算法。如基于時間序列進行的銷售預測分析。

中国软件网:BAT互联网公司,均有人工智能实验室。其中,有数据智能方向的研究,在安全、雲計算各个业务中有实地、具体的应用。那么,互联网厂商有没有可能自己建筑治理数据库?智达方通独特的优势在哪里?

蔡志宏:互聯網公司的數據智能,主要服務于其用戶。通常會基于開源數據庫做深度優化,否則接纳商用數據庫,很難承載平台流量的海量數據。

互聯網公司自身的數據化治理,仍然屬于企業績效治理範疇,也就是基于多維數據倉庫搭建的決策支持應用。因服務的對象是企業自身,用戶量比互聯網企業的客戶數量少的多,並不值得自己研發這樣一種需要長期研發投入的多維數據倉庫系統。但是由于互聯網企業的技術研發配景,完全可以自行運維這類EPM系統。

智達方通作爲多維數據倉庫及應用廠商,優勢在于爲企業提供自助式的實體業務建模、分析、計劃和測算平台。解決現有業務系統無法實現經營分析和決策支持的問題。是企業內部使用的分析決策類軟件系統。

中國軟件網:有沒有企業案例,好比,某企業接纳了貴司的解決方案,相關治理效率有一個很大的提升?

蔡志宏:國內一家大型的港口物流集團,接纳了智達方通的全面預算和執行利用系統後,實現了業務驅動型的計劃預算,資金費用等從無預算利用到實現基于多維預算和標准精細化利用。

某造幣行業企業,實施了智達方通的全面預算治理、執行利用治理和商業智能分析系統後,實現了預算編報、執行利用和經營分析一體化聯動。在一個平台上實現治理會計全業務閉環,並獲得了集團降本增效獎。

某央企物資公司,集中采購的物資數量巨大,通過智達方通多維數據倉庫和分析平台,實現10多年多批次、網省、表款、標包的大量的物資及成本明細的大數據多維分析,總計算量100億條。實現了異常報價、典型成本、屬地物料成本、供應商屬地、典型表款價格、優質投標人和網省招標數據的多維分析,提升招投標決策效率,並獲得了集團科技進步一等獎。

“數據中台”風暴下:未來行業的發展趨勢

中国软件网:今年包罗阿里巴巴、腾讯等都在谈“数据中台”,您怎么看待这个趋势?另外,阿里等雲計算厂商建筑数据中台后,对数据库企业,如Oracle等会有什么影响?数据库企业在这其中的角色是怎样的?有何变化?

蔡志宏:我們了解的企業“數據中台”項目,目的都是解決前端業務系統數據孤島,無法貫通分析決策的問題。這跟幾年前流行的廣義的“數據倉庫”項目沒有本質的區別,都是买通數據孤島,提升經營分析和決策效率。

只是隨著大數據技術的成熟,有些數據中台項目接纳了Hadoop/Spark分布式存儲技術,實現原子顆粒度的全量數據分析。我們的方案是:如果企業的數據量達到大數據級別,則類似銷售轉化率等全量數據分析,接纳Hadoop/Spark方案,而到月級的粗顆粒度數據,可用多維數據倉庫方案,爲治理者提供自助、即席分析能力。這種混合式數據倉庫解決方案,是國內國外應用較多的成熟方案。

我理解的阿裏和騰訊等談到的“數據中台”,並不是一種新的數據庫産品,而是企業業務數據分析平台的一種解決方案,目的是爲企業提供數據資産治理和數據賦能。由于涉及的數據量可能較大,通常會接纳Hadoop、HBase、HDFS等分布式計算平台和存儲平台,也可能整合多維數據倉庫提供多維分析能力。對于Oracle等數據庫廠商而言,是數據庫應用場景的擴展,而不是同類産品的競爭。

中國軟件網:前不久,不少評論討論爲何國內發展不起來SaaS?您怎麽看待中國、美國或者其它地區,軟件行業的差異?

蔡志宏:對EPM軟件這種數據集中型應用,非常適合SaaS和雲模式,可降低企業的建設成本以及服務商的咨詢實施交付成本。但考慮到EPM涵蓋的實際業務、計劃預算、執行利用數據的敏感性,國內企業通常不願意將EPM系統部署到公有雲上,而是接纳私有化部署或部署在企業私有雲上。

美國和其他國家的監管環境相對規範,SaaS模式CPM、EPM軟件市場發展較爲健康。這方面差距的拉近,是中國發展SaaS企業軟件的基礎。在非敏感領域的企業應用,如考勤、CRM、OA、報賬等,SaaS應用在國內市場發展的還是挺好的。

中國軟件網:國外數據庫巨頭的發展路徑是怎樣的?差异巨頭方案有何差異?您看好哪一種?

蔡志宏:數據庫種類很多,如關系型數據庫、NoSQL、多維數據倉庫、列存儲數據庫、分布式數據庫、圖數據庫、對象數據庫等等,適用于差异的應用場景。企業應用領域,ERP通常接纳關系型數據庫,EPM通常接纳多維數據倉庫。

Oracle、IBM、SAP三巨頭也是關系型數據庫和多維數據倉庫的廠商。各巨頭爲提升數據庫性能接纳了各種方案,包罗定制化硬件一體機,實時內存壓縮等技術。在數據倉庫領域,我們更爲看好計算引擎算法優化以及基于通用設備的硬件加速方向上。

中國軟件網:您認爲企業治理數據,未來的發展趨勢是怎樣的?

蔡志宏:更多的企業將認識到數據資産的重要性。企業信息化建設的重點也將從線下業務轉移線上的電子化過程,逐步演變成利用數據分析平台建立實體業務模型,並基于實體業務數字孿生進行經營分析、計劃預測,以便動態數字化智能化治理企業。

中国软件网:您认同雲計算服务SaaS化趋势吗?您认为国内软件厂商在雲計算浪潮下,未来可能有怎样的进展路径?软件厂商在产业链条中,处于怎样的位置?

蔡志宏:從技術角度而言,企業軟件的SaaS化是發展趨勢。而從企業實務角度,國內企業核心業務數據的SaaS化仍爲時過早。但軟件廠商應提早做好技術准備,以應對未來大量的私有雲部署需求。

中國軟件網:今年5月底,國內也出台了類似于歐洲GDPR數據保護的相關規定,這對于國內數據公司將會有怎樣的影響?

蔡志宏:國內的一些2C軟件對用戶隱私數據的侵犯已經到了很嚴重的水平。其原因跟之前沒有類似GDPR數據保護的法規,以及沒有得到應有懲罰有關。隨著大數據、人工智能應用越來越廣泛,流量平台作爲數據來源更易變現。如沒有相關的數據保護規範,用戶的個人數據風險極高。

EPM作爲企業數據的分析決策系統,通常不涉及個人數據,也不會向外部提供,不太可能涉及GDPR的數據保護範圍。

中國軟件網:創業中,您認爲最大的難點在哪裏?有沒有覺得是非常棘手的事情?國內數據環境您有何看法?

蔡志宏:最大的難點在于不完全競爭的市場。但隨著企業對智能治理的逐漸重視,有研發技術實力的軟件廠商競爭力會凸顯。另外,隨著企業治理水平的提升,將逐漸擺脫由外部咨詢團隊梳理自身業務的依賴,更多關注軟件平台技術功能是否適應智能治理的要求。

從企業的數據環境來看,正從非結構化或弱結構化,向高度結構化演進。這是智能治理、決策支持自動化的要求,也爲後續基于AI進行數據價值的深度挖掘,奠定了基礎。

【返回首頁】