SAP 數字平臺四大法寶
發(fā)表于:2019/5/21 10:26:28??閱讀量:?[關閉]
隨著對數字化道路探索的不斷深入,僅僅解決業(yè)務問題,對企業(yè)而言還遠遠不夠。數據的獲取、清洗、監(jiān)控和存儲、數據資產管理、數據的理解和使用……對于數字化轉型中的企業(yè)而言,處理好數據問題是當務之急。因此,「數據中臺」的概念一經提出,便引起廣泛的關注。
其實,SAP 對于「數據中臺」的概念從來都不陌生,早在2012年就提出了「SAP 實時數據平臺」的概念,再之后發(fā)展出「SAP 現代數據平臺」與「SAP 現代化數據倉庫」,結合至大數據領域形成了如今的 SAP 數字平臺。廣義上的「數據中臺」提供基本的數據服務,而 SAP 數字平臺的意義遠不止于此。
SAP數字平臺架構示意,紅色框內為普通數據中臺的功能
普通數據中臺,在數據處理層面只能提供基本的數據轉換與批量處理等服務,再經由分布式計算處理,全部存儲于分布式數據倉庫之中。又因其前臺業(yè)務缺少應用數據沉淀、受到數據模型限制,普遍只能滿足零售業(yè)相關的簡單數據應用。
而 SAP 數字平臺作為完整的數字架構解決方案,不僅可以連接前臺與后臺,支持后臺從業(yè)務系統等數據源更好地進行數據采集,賦能業(yè)務前臺進行經營分析、業(yè)務洞察、創(chuàng)新應用與數據服務。更重要的是,SAP 數字平臺整體架構帶來的更為完整的結構與更為強大的功能。
SAP 數字平臺在中臺部分,由數據集成、數據存儲、數據倉庫、開發(fā)建模、人工智能與行業(yè)模版等多個部分組成。其中,SAP HANA 是整個中臺的核心部分,使用內存計算技術大大提高了數據采集、存儲與分析的效率。再分別在數據采集與數據使用層面分別輔以 Data Hub 大數據集成與 Hadoop 分布式計算,大大提升了 SAP 數字平臺處理海量數據的能力,使其在大數據時代下能真正為企業(yè)數字化轉型帶來力量。
數據中臺面臨的四大難題
然而,在「業(yè)務數據化」與「數據業(yè)務化」的思考與實踐中,許多企業(yè)的業(yè)務跨度大、數據構成復雜,面臨著「采」、「存」、「用」、「智」四大難題。
采-多渠道數據采集
如今,數據源越來越多、越來越復雜,除了傳統的應用系統以外,互聯網的興起形成了更為廣泛的外部渠道??蛻舸蠖嘁巡粷M足于原本封閉的數據來源,選擇打開門戶迎接大數據時代,以實現數據的共通共榮。面對如此復雜的數據源,如何有條理地對數據進行選擇、采集,已成為數據中臺面臨的第一大難題。
存-業(yè)務數據化
所謂「業(yè)務數據化」,就是把所有業(yè)務模塊以數據的方式存儲到數據中臺中。對于大型企業(yè)而言,業(yè)務模塊十分多樣,產生的數據通量巨大、結構復雜。如何將這些優(yōu)先級、價值完全不同的大體量數據分類存儲以供后續(xù)使用,是數據中臺面臨的第二大難題。
用-數據業(yè)務化
要將數倉中存儲的數據重新提取運用,需要將數據再次業(yè)務化。而數據業(yè)務化的過程會產生更多創(chuàng)新性的數據,這就對數字架構的性能提出了更高的要求。如何實現快速實時的多維度數據分析,是數據中臺面臨的第三大難題。
智-數據智能化
在「采」、「存」、「用」的基礎之上,如何結合人工智能與機器學習的技術,來提高數據的利用率,使數據智能化,讓數據產生更大價值,這便是數據中臺面臨的第四大難題。
采:雙管齊下,既提高效率,也控制成本
對于內置于內存數據庫中的數據,SAP HANA 實時集成數據抽取、整合及清洗工具,實現數據的快速整合。作為高性能內存數據處理平臺,任何格式的數據通過 SAP HANA 內存數據庫統一處理,都可應用于任意目標系統——無論是 SAP 數據庫、SAP 應用套件等 SAP 配套目標系統,還是開源平臺、第三方應用等非 SAP 目標系統。
除了業(yè)務模塊中的結構化數據,互聯網等外部數據系統中的數據浩如煙海。SAP Data Hub 對互聯網類型數據進行大數據集成,實現元數據的管理、編排、監(jiān)控、處理和獲取,以形成超大容量的分布式數據湖。簡單而言,SAP Data Hub 就是將海量外部數據的數據格式與企業(yè)內部原有的經營數據格式進行互通,形成一個個整體化數據的解決方案。
SAP HANA 實時集成與 SAP DATA HUB 大數據集成相結合,既滿足了內部數據的高效采集需求,又將外部的海量數據妥善采集保存,共同組成了真正完善的數據采集架構。
存:熱數據、溫數據、冷數據分類存儲
數據被采集之后,需要被合理存儲,存儲成本則是企業(yè)最關心的問題。SAP HANA 雖然性能極高,但成本也相對較高。對于客戶而言,使用 SAP HANA 存儲所有數據明顯過于奢侈。對此,SAP 數字平臺選擇依據數據訪問的頻度與數據價值將數據分為「熱數據」、「溫數據」、「冷數據」存儲到不同的存儲區(qū)域之中,以控制整體成本。
這種自動化的數據移動叫做數據生命周期管理。對于其他企業(yè)的產品而言,數據生命周期管理只是讓數據在不同成本的存儲器之間移動。而 SAP 選擇提供自動化組件 SAP Data Lifecycle Manager (DLM),完成數據的自動化流轉、分類、移動,從根本上降低了客戶的數據管理成本。
用:集成式解決方案提高數據價值
數據的使用對于數字解決方案而言是最核心的問題。SAP 數字平臺以 SAP HANA 內存計算引擎為核心,將所有重要數據在 SAP HANA 中進行全時內存計算,以實現交易與分析混合處理,結合虛擬數據模型以做到實時在線分析與多模型并行分析。同時,SAP HANA 的內置機器學習庫更為內存計算賦能,真正實現快速實時的多維度數據分析。
除了核心內存計算以外,SAP 數字平臺在結構上以 Hadoop 分布式計算作為擴展,提供范圍更寬、成本更低的大數據分析。內存計算的「快」與分布式計算的「寬」共同實現了 SAP 數字平臺的全域數據分析體系。
在全域數據分析體系之上,是依靠 SAP HANA 企業(yè)級數據倉庫打造的統一數據池,以簡化數據倉庫模型,整合大數據投資,滿足不同規(guī)模數據倉庫的未來需求,實現大容量數據與實時數據的分別處理,最終超越其他數據倉庫產品,成功打造端到端的解決方案。
SAP 數字平臺在幫助客戶構建企業(yè)級業(yè)務模型領域沉淀多年,擁有成熟、完備的解決方案。從概念模型到物理模型再到邏輯模型,三層模型共同形成企業(yè)模型庫。內容上,從業(yè)務模型沉淀數據模型,形成真正的企業(yè)資產。
最終,SAP 數字平臺通過數據分析套件,將處理后富有價值的數據顯示至終端,提供給客戶使用。協同計算分析、統一數據池、企業(yè)模型庫與數據分析套件共同作用,為企業(yè)提供全方位的計劃、分析服務,以滿足企業(yè)「數據業(yè)務化」的需要。
智:以客戶為中心打造智慧型企業(yè)
作為數字科學平臺,SAP Data Science Platform 集成 SAP 多款產品,滿足數據的準備和清洗,桌面化和自動化,多媒體深度學習,數據庫內機器學習以及開源語言庫等多項功能需求,真正做到了走在數據科學前端。再與SAP 數字平臺集成,以完整成熟的解決方案,為企業(yè)提供完整的數據生命周期管理,打造統一的機器學習和數據科學體驗。最終基于「互聯網+大數據」的數據價值思考,助力企業(yè)數字化,提升企業(yè)競爭力,讓數據產生價值!
近年來,致力于通過應用智能技術,打通從數據獲取到業(yè)務價值的完整鏈路,提高自動化水平,以減少重復性工作,降低企業(yè)成本。在打造智慧型企業(yè)的實踐中,SAP 堅持以客戶為中心進行主導,并提出了 SAP 云上數倉解決方案。
SAP 云上數倉是一項集成化的、完全托管的服務,這一解決方案完全可由個人驅動:無論客戶是否曾經采用 SAP 數字架構,通過 SAP 云上數倉,都能以簡單的部署、靈活的定價迅速集成至 SAP 智能套件解決方案、SAP 分析云(SAC)、SAP 云平臺服務(SCP)、合作伙伴解決方案和開源技術等多項 SAP 產品或架構之中,通過完整的 SAP 數據倉庫解決方案,進行數據分析與數據管理,享受數字化時代的便利。通過這樣的方式,客戶不僅可以迅速搭建混合云場景,還可避免將大量本地數據遷移到云端的復雜工作。 (來源:SAP天天事)
本文鏈接:SAP 數字平臺四大法寶