2017年6月27日星期二

如何用精細化數據管理打造競爭優勢?——實例分析

永輝超市是中國大陸首批將生鮮農產品引進現代超市的流通企業之一,被國家七部委譽為中國「農改超」推廣的典範,被百姓譽為「民生超市、百姓永輝」。生鮮經營是其最大的特色,各門店的生鮮經營面積都達到40%以上;在集團總銷售額中,生鮮農副產品的銷售額佔到總銷售額50%以上。2016年,以數據分析技術為依託,通過賽馬制和供應鏈資源整合,集團毛利率已高達20.19%,在中國連鎖百強企業中,暫居第10位,並以高於10%增長率向更強邁進。
如何實現精細化管理
永輝超市大數據團隊的吳江淮介紹,永輝超市主營零售、服務亮大行業,主營生鮮&加工、食品用品和服裝等產品,旗下有大賣場、賣場、社區店、BRAVO精緻超市等主要業態,全國合計300多加門店,170多萬會員。其中生鮮&加工營業收入增長了約19%,食品用品增長了月20%。這兩塊是永輝重點做精細化管理的產品線。除了針對產品線做精細化管理,對不同業態的門店也做重點管理。從效果來看,大賣場和社區店效果顯著,分別增長2.5%和1.2%。
零售行業裡面的增長空間靠規模取勝是沒有希望了,用投資擴大資本取得社會增長的這個時代也已經過去了。企業增長方式要從圈地逐漸轉化為精細化運營。企業運營效率也是決定企業核心競爭力的關鍵指標。做精細化運營,首選的技術是AI。永輝在上海成立了專門的大數據公司,為超市做數據支撐、雲計算支撐。永輝就是要走零售轉數據科技的發展方向方向,依託大數據分析軟體公司的數據處理能力和數據分析能力,來支撐自身精細化運營。同時,廣泛和社會上的像帆軟這類的專註於產品的大數據、數據分析公司合作。永輝的專長是零售業務運營,走科技創新、數據科技之路,依然是重點深耕業務,依託多年業務積累經驗,轉型做商業智慧零售解決方案提供商。

數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團

生鮮精細化管理
為提升數據的及時性,準確性,便利性及實用性。2016年上線了永輝生意人、永輝到家、永輝管家等APP,幫助各部門提升的工作效率,優化了工作流程。這其中,重要的一塊便是帆軟數據分析的集成與應用。永輝將生鮮毛利分析模塊集成到現有業務APP中,讓業務部門直接隨手可查經營數據,及時提供經營異常預警。如下圖的生鮮毛利率日分析,店長通過手機APP,可是實時看到當前門店(下圖中的門店一)的毛利率情況,包括月累計銷售同比、月累計毛利同比、區域毛利率、本店毛利率、毛利率排名。還有毛利率排行榜。那這個怎麼用起來呢?根據自身店面的毛利和區域的毛利率以及其他毛利率對比,一旦數據異常,系統自動彈出消息提示經理。門店經理根據分析頁面提供的數據,初步判定毛利是否在可接受範圍。然後根據查看排名靠前的門店的經銷實時情況對比分析,看是自己的有效SKU不足導致的,還是斷銷導致的,或者是客流不足導致的等等,系統會自動對比這些維度的數據,幫助門店經理分析自己店面的不足,及時改正。
門店賽馬精細化管理
數據驅動運營,不管是數據分析還是信息系統,都是輔助業務經營和管理。真正改變業務的,還是要靠一線業務人員的執行。如何在強化管理的同時又調動業務部門的積極性和創造性呢?我們採用KPI體系和賽馬體系兩者結合運營管理。KPI體系就是「大棒」,就是上級給下級定任務,施加壓力,完不成就扣績效獎金。賽馬體系是「胡蘿蔔」,就是同級之前相互競爭,完成的好有獎勵,除了物質獎金獎勵,還有榮譽獎勵。另外,大家都是勤勤懇懇的員工,多年共事,相互之間還是想比一比的,自己落後了肯定面子掛不住。所以,賽馬體系激發業務部門的活力和創造力。
如下圖的賽馬成績單,賽馬成績單的核心就是不同門店、課組的業績獨立核算。永輝在這裡形成了一套完整體系,相對公平的模型來自動評分,每月公布一次。同時,門店看門店相互競爭,門店還看自己的課組,要對下級監督;課組看課組相互競爭,課組還看門店,對上級監督。為什麼既能相互競爭,又能相互監督呢?哪裡來的動力和權力呢?因為永輝做了績效考評,有個人績效獎懲和團隊績效獎懲,這樣大家就團結成一股繩。
供應鏈精細化管理
2016年,永輝超市從品牌商合作轉向工業化採購、向市場化貿易商機制轉變,全面提升採購服務和效率。規模化採購與區域靈活性兼顧,優化商品結構,聚焦核心商品。食品用品集中化採購佔比提升0.8個百分點,梳理淘汰近2萬 SKU,淘汰了15%供應商;服裝淘汰近25%的供應商。
永輝超市的物流預警管理,主要依託的是微信公眾號,將帆軟報表集成到微信裡面。之前永輝用的是SAP的報表製作,想要個性化定製,功能不十分滿足,技術難度很大,而且這個費用確實不太合適。現在這個微信集成方案,永輝申請好企業號,然後要求需要推送消息的用戶關注永輝企業號。帆軟和微信後台可以對接集成,實現人員許可權、數據許可權的匹配。
我們看物流庫存預警報表,預警缺貨。這個物流庫存預警永輝針對不同崗位受眾,有不同的版本。我們看下圖,對東北大區不同課組的商品做缺貨預警,其中預警信息是通過微信自動實時發到課組長手上。預警消息含詳細的商品描述、含稅進價、總庫存天數、物流信息和門店的庫存詳情。可以看到,不同課組的缺貨狀態時,門店庫存天數並不相同。這實際上是由我們一線的業務人員綜合物流運輸管理、庫存管理等綜合設定的,是每個門店在總部提供的建議值的基礎上,做了量體裁衣的精細化調整。如此根據業務需求自動調整定製,這才是永輝物流庫存預警靈活高效的秘訣之一。
精細化管理成效
永輝數據中心APP,是公司高層大行數據驅動決策的成果,是永輝紮實做數據分析的良好實踐。從一年多的統計數據來看,數據中心APP用戶活躍率正在逐步上升,這正說明數據中心APP真正在業務中得到了認可,並在被廣泛推廣。尤其是,永輝數據中心APP曾創下當日線上人數6300+人,日查詢次數10w+次的記錄。正是這樣的廣泛關注和認可,讓永輝的數據創新工作蒸蒸日上。
千言萬語,不如我們店長一段實時在在的感慨。他郵件給數據中心部門寫到:
文 | 帆軟數據應用研究院 船長

2017年6月26日星期一

企業如何以客戶為中心進行數據化運營?-看這個實例

當下互聯網的餘震未醒,「新零售」又提出。成本上升、人口紅利消失、電商滲透率飽和都在倒逼零售的整體升級。
不管業內業外,政府公司,都在談轉型。但關鍵如何轉型,基點在哪?這都需要探索。
有人說,消費變革的起點一定是在里消費者最近的地方,其中最關鍵的一環,就是要提升自身的數據能力,真正實現以用戶體驗為中心的經營模式。
就在上月,步步高集團電商事業部產品技術總監王衛東在帆軟零售大會上發表了一場「頗具格局」的演講。從數字化創新驅動業務發展、「人貨場」的數據分析、再談到實際的數據化管理案例。
全程乾貨滿滿,總計4700餘字,建議閱讀時間10分鐘。
步步高商業連鎖股份有限公司(下文簡稱步步高),是涉及零售業、電子商務、商業地產、互聯網金融、大型物流等多業態的大型商業集團。目前擁有步步高超市、步步高百貨(廣場)、步步高雲猴網、步步高置業(步步高新天地)、步步高電器城、太楚餐飲、匯米巴便利店等業態。2016年銷售收入超過320億元人民幣,位列中國民營企業500強第158位。
一、數字化創新驅動業務變革
2017年是步步高數字化轉型的一年,總體數字化創新戰略方針是線上節約顧客時間,線下「浪費」顧客時間,創造更好的購物體驗。步步高擁有百貨和超市兩大事業群,兩個事業群的客戶群體是不同的。步步高超市業務以快捷為主,百貨業務以客戶體驗為主。如何通過數字技術來提高客戶滿意度呢?總體是增強智慧體驗、優化線上渠道、客戶畫像精準行銷三個路徑來實現技術驅動業務創新。
客戶獲取與經營的閉環
運營的關鍵是兩條線:獲客和經營。我們的數字運營體系,圍繞著用戶的運營這個重心,以顧客為中心,融合數字技術形成客戶獲取與客戶經營閉環。抓好這兩條線,讓客戶群不斷壯大,提高客戶成長轉化率,以此來保證毛利的提高。零售行業是個薄利行業,提高企業毛利,就是要在這個閉環裡面多下功夫。具體怎麼下功夫呢?可以針對性活動設計(目的)、分析人群相關性(精準)、交易簡便個性化、提供更多價值(權益/服務)、了解顧客喜好(消費偏好)、贏得顧客信任和主動傳播。
客流數據分析建模
傳統零售的數據是基於交易客流,基本等同於俗稱的會員。商超裡面的客流其實分為交易客流、飯店客流、進店客流、到達客流、潛在客流。這裡最容易獲取的就是交易客流,因為企業現有的CRM系統或者收銀系統基本都能涵蓋這部分客流。而現行的基於CRM客流管理和收銀系統客流管理模式有兩個管理上的缺陷。一是普遍重視客戶的消費能力,而忽視傳播與分享能力,也無法量化客戶的傳播與分享能力;二是高度重視新用戶的數量積累,而忽視後期的長期服務和維護,靠利益刺激,吸引促銷客戶而非忠誠客戶。我們應該有新的認知:到店即是會員,得顧客數據者得天下。怎麼得顧客數據?這就要建立一整套的全顧客全消費行為管理的客流分析系統。
身份識別
顧客到店,不同級別的會員消費不同,給企業帶來的效益也有較大差別。如何提前區分會員等級?而不是在收銀的時候強制出示會員卡來事後統計會員。首先,是對不同渠道、方式獲取的顧客機那裡統一的ID和ID映射圖譜方案,能夠在具體的場景中識別顧客。比如步步高用WIFI探針、手機號、微信號、支付寶ID、人臉識別等等。只要有了顧客ID,那麼客戶就成為了廣義的會員,把這些有身份信息的會員管理起來,在不同的場景中預判用戶行為,在顧客離店之前便進行適當的會員關懷和消費引導。
客流分析系統
客流分析系統的升級,戰略目標就是要獲取全顧客全消費行為數據。傳統的客流分析系統,主要是人工統計、紅外感應、視頻檢測,採集到的主要就是進店客流、POS等銷售數據,能做的工作優先,主要是就是強化管理,努力提高顧客轉化率。然而,一方面是競爭加劇,另一方面是經營成本增加,這些都要求步步高必須要做變革,以保持較強的競爭力。升級的客流分析系統,重點是對到達客流、車流數據、顧客運動軌跡、WIFI探針等做挖掘建設。通過識別和數據採集技術以及數據分析技術,步步高得以豐富會員畫像做精準的會員成長關懷和管理,提高客單附加值,提高會員活躍度,甚至從周邊商圈吸引到潛在客流並最終轉化為忠誠會員。

數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團

二、數據分析綱要
數據分析的核心三要點
我們鋪設整體的信息化,是有明確的綱要的。這個綱要就像是做項目的章程,是我們的指導文件。數據分析的核心三要素是什麼,是數據一致、實用當先、以人為先。保持數據的一致性,是要解決數據分散在各個系統,不同部分重複開發報表,不同報表製作計算口徑不一的問題。步步高通過建立統一的數據倉庫,集中解決數據不一致的問題,並保持嚴格的定期維護。杜絕華而不實,實用當先,不做表面文章,重在先能用,再好用。步步高數據分析項目一期,明確暫緩大屏項目,優先從查詢報表、監控報表、數據分析報表三步逐次實現。這就是堅持先能用再好用。以人為先,工具次之。帆軟工具確實數據分析領域的成熟的平台,但工具再好用,做再多的分析,業務人員不會用,也是捨本逐末,功虧一簣。步步高通過成立專業的大數據學院,在企業內部培養大數據分析軟體專業人才,精通業務,熟練掌握數據分析工具,然後由他們結合企業特點,向集團各單位推廣數據分析平台。
人貨場財指標梳理
傳統零售運營,分四個維度:人、貨、場、財。雖然大體維度相似,但具體到指標,還是各有不同。我們針對自身,做了專門的維度和指標的梳理。
人員,主要分為員工和顧客,前者是對內管理,後者是管理客戶運營。如何用這些數據,如果做對內管理,我們要規劃好目標,規劃好對內管理的定位。要想對內管理好用到位,必須基於每一個商業智慧單位設置各自的KPI考核。千萬不要給自己挖坑,做個高大上的分析或者報表。不用高大上,只需要幾個關鍵指標值。作為業務人員,他更多關注的是老闆對他設定的考核指標,如何改善公司層面的業績。業務人員關注的,是KPI。顧客分析,重點考核3個指標:客單價、毛利率、會員數。客單價的變化,毛利率的變化,會員的整理流失、有效、貢獻、年齡層次變化直接在日報中體現,每天都要抓。
貨。我們從採購環節、供應鏈環節、銷售環節、售後環節進行指標管理和控制,穿透整個經營環節。我們只把關鍵指標篩選出來,作為監控項和管理項。具體的監控和管理指標,可以看上圖。
場。我們在場這個維度上重點管理績效。包括銷售指標、競爭情況指標、促銷指標、渠道指標。每次促銷活動,不僅會監測會員和銷量指標,還會重點監測場指標,貨源是零售長期穩定經營的基石。
財。財務重點關注的一點就是毛利和回款。步步高的百貨,重點還關註銷售利潤率。
三、數據分析案例
我們的數據分析項目2017年還在重點就建設中。很多的數據分析的實踐剛有起色,並未得到長期的經營驗證。所以部分經驗和案例效果圖還不便公開,我們也本著開放的心態,歡迎更多同行能前來交流。這裡就部分內容做個分享。
巡店預警
我們的會員管理部分只關注門店會員數據,其他周邊數據業務部門並不想要。所以不需要定製太多的報表,也不需要提供太多的維度和指標數據。曾經,兩個月的時間完成的初版巡店預警控制報表,一線人員反饋說沒用。他們只關注商品調撥,需要實時查詢相關數據。這個預警報表能不能告訴業務人員當前門店哪個品類、哪個商品有問題,告訴業務人員這些,就是他們最需要的。我們對初版報表稍作改動,出來了下圖的最終版。現在一線業務人員,可以通過一張報表直接告訴他們那些商品有異常,哪些銷量有異常,哪些會員有異常。旗下的梅西新天地有1萬多款SKU,這一張報表就可以完成監測和分析。當然,針對會員也提供了關鍵指標畫像,只提供業務人員最為關注的幾個指標。
對標比價
我們引入京東、天貓、一號店以及其他同行的一些外部數據,監測零售同行商品的價格走勢和當前活動。根據外部數據,步步高一整套數據分析報表會自動給門店經理手機提示異常,會直接告訴他哪些價格有異常,同行的當前價格和歷史價格多少,以及預測近期價格走勢,並給店長提供建議價格做參考。
除了銷售對標比價,另一個就是採購。如果發現採購價格高於隔壁同行,商超裡面採購經理會說別人家在做促銷活動,或者有其他原因。但是顧客偏偏就是漸漸到隔壁家消費去了。現在專門開發了對標比價系統,店長拿著手機,對著商品QR code一掃,就能立馬顯示天貓、京東、一號店甚至是一些隔壁同行的價格。步步高在每個超市門店,都實現了對標比價的應用對接。
異常監測分析
目前我們已經建立了銷售、毛利、庫存、會員和積分的五大異常模塊。原來傳統的方式監測是依靠專家經驗(甚至很多企業現在也是這麼做的)。那麼我們分析一下,對於出差,第一周1次,第二周2次,第三周2次,第四周0次,第五周4次,第五周是否異常?如果專家判斷3次以上算異常,那就是異常,如果專家判斷4次以上是異常,那就4次剛好達標,不算異常。這裡面就有人為制定固定標準的局限。同理,我們看訂單數變化,連續多日統計後,某一天訂單量為85,這是否異常?同樣類似的會員消費,消費頻率達到多少算是活躍會員?業務專家給的指標建議,都是固定的,很難自動調節。我們也很難針對每個SKU、每個訂單都單獨去做人工測試。那怎麼辦?步步高採用的是建立分析模型,系統自動算一個標準差為基礎的UCL、LCL和CL。因為這個是固定一個標準差,所以分析模型是專業的。而整個三個指標的計算,是系統動態的根據近期數據或者整個歷史數據自動計算的,所以這三個指標也是隨著業務發展自動變化的。這樣就節約了指標維護的工作量。再對訂單數通過該模型分析,模型給出UCL=81,那麼顯然訂單數85屬於銷售異常。異常檢測分析,其實核心就是建立動態的異常指標。
到店客流監測
到店顧客,其實是需要我們重點經營轉化的。那麼要思考幾個問題:這些客戶從哪裡來,客戶量有沒有變化,這些客戶要消費什麼,這些客戶哪些是常客,這些客戶都對哪些店面感興趣等等。能用數據回答清楚這幾個問題,就方便進行顧客的數據運營和管理了。
首先,如何回答這些客戶數量的變化。因為一天接待的顧客眾多,很難用人員觀察統計,即使採用定時定點安排人統計人數,也是不科學抽樣,可信度不高。步步高升級了客流分析系統,得以通過停車場數據系統、WIFI探針數據、人臉識別等技術自動識別客流變化,然後,定製出客流量檢測看板。步步高主要關注近一小時累計客流量、近一小時新增客流量、今日累計客流量、今日平均停留時間這四個主要指標。當然,還針對歷史數據做對比分析,會對比昨日數據,看指標變化數值和變化幅度。這些指標變化也是納入異常檢測分析範圍的,只要超出動態的CCL和UCL,系統自動給店長預警,提示相關人員採取措施,並關聯KPI績效。督促一線人員及時有效的解決問題。
那麼客流總數異常,從哪些維度查找原因呢?或者客流總數正常,客流質量是否也正常呢?步步高重點關注兩個對比類指標。一個是新老客戶佔比,一個是今日客戶到店分布對比。客流數異常,首先要看的就是新老客戶佔比和數量的變化,新客戶減少可能是宣傳或者促銷的問題了;老客戶減少,多半是會員政策或者商品經營出了問題。這樣,步步高就幫助業務人員快速分析業務問題,及時幫助解決業務問題。當然,及時客流總數正常,也要關注新老客戶佔比變化。比如開展促銷活動,新客戶佔比增加顯然是促銷的一個關鍵指標。
到店客戶,他們來了,我們想知道他們都停留在哪裡,去了哪裡,好做針對性的店面布局和行銷管理。步步高採用電子圍欄技術、WIFI探針、人臉識別等技術,實時採集人流分布數據和運動軌跡。那做這個是什麼目的呢?其實說白了就是為了百貨經營時增加客戶的整體駐留時間,提高消費的可能性。步步高在梅西新天地做了客流實時分布分析和客流軌跡分析。通過這些分析,步步高可以判斷客流都是從哪些區域過來的,甚至是從哪個周邊小區過來的。然後從不同區域進店的客戶,消費目的有和不同,消費習慣有何不同,是否有更多的消費需求可以挖掘。負責管理的樓層長經理要思考:為什麼一些區域熱度很高,另一些區域熱度卻很低,為什麼有些熱度高的區域最終毛利卻不高,現在的店面布局是不是有更合理的方案。
通過對客流的監測和分析,步步高將一些經營決策所需要的數據和信息下放到基層管理崗,讓熟悉業務個店長樓層長來提出決策建議,供高層選擇,用數據來支撐決策,用可視化分析提高決策效率和科學性。
文 | 帆軟數據應用研究院 船長

2017年6月20日星期二

企業數據分析部門組織架構形式探討

數據時代的到來使企業越來越意識到數據的價值,企業紛紛建立自己的數據分析團隊.花重金招攬的數據人才怎麼融入到本企業組織中才能發揮他們的才能呢?本文試圖分析數據分析部門組織架構形式的優劣及影響。
從數據分析部門與傳統IT部門的關係來看,分析部門有兩種形式:設立獨立的分析部門或設在IT部門下,由一個CIO管轄。
從數據分析人員是否集中來看也分兩種情況:數據分析人員集中在大數據分析軟體中心或者數據分析人員分散在各個業務部門。或者混合情況:兩者都有數據分析人員,但職能分工不同。
下面具體分析三種典型組合情況:
第一種形式為傳統式,
如下圖:大數據中心設立在IT部門下,數據分析師集中在大數據中心。
這是一種大信息中心的形式。這種形式的特點是大數據中心與IT合并在一起,貼近數據源,業務部門向大數據中心提需求,大數據中心根據需求統一排期開發、分析。這時一般傳統的報表、臨時需求分析等也可能會與業務系統分開,由大數據中心管理。大數據中心對接各業務系統數據源在部門內部即可解決。各業務部門只需要跟大信息中心一次提需求即可。業務部門沒有自己的分析挖掘團隊,但一般會有傳統的報告分析。
這種形式大多由傳統BI系統部門演變而來。傳統的經營分析中心或商業智慧部演變為大數據中心,在數據倉庫基礎上增建大數據平台,增加大數據及數據挖掘人才,在原來的報表製作的基礎上建設更深入的數據分析應用。
優點:數據中心與IT在一個部門,離數據近,數據整合便利,保障數據質量高。集中的需求管理也使內部溝通有效,避免重複開發,也可以使分析師內部總結提高。
缺點:離業務較遠,尤其是分析團隊與業務部門的工作地點不同時,容易與業務部門溝通不暢,閉門造車。如果業務變化快,無法跟上業務的步伐,對數據的思考不夠深入,與業務部門溝通成本加大。
針對分析師集中後離業務較遠的弊端有一種方法為:分析師仍然集中在大數據中心,但分析資源的使用、請求在各個業務部門,企業各業務部門自己根據項目需求請求所需的分析師。這種情況下分析師需要同時向本部門和業務部門彙報工作。

數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團

第二種形式為集中式。
這種形式與第一種的主要區別在於大數據中心是否獨立
這種形式的特點是公司所有與數據相關的平台建設、數據應用、數據分析挖掘都歸屬到一個部門,此部門是數據管理的唯一出口,業務部門不設立自己的分析團隊,IT部門也不負責相應平台開發維護。
優點:部門職責明確單一。指標由一個部門計算,口徑統一,且與業務部門獨立,所以立場獨立,分析結果更中立。
缺點:同時具有第一種形式的缺點,並且離業務部門及業務系統都較遠,無論是數據理解還是業務理解都可能不夠深入,同時如果大數據平台開發維護能力不強,會有技術困難難以推進。
第三種形式為混合式
此圖與之前的主要區別在於業務部門是否有分析師。這裡不再分析大數據中心是否獨立的問題。主要分析大數據中心下分析師與業務部門分析師的職能及定位。
大數據中心分析團隊職責主要集中在整個企業級的數據產品、數據應用、數據分析。服務的對象也主要是公司級的部門和領導。他們技術能力和業務能力更強,能利用最新技術解決業務問題,同時必要時對業務部門分析團隊給予指導。
而各業務部門自己的分析團隊主要服務於自己部門內部,技術能力不等,以前主要根據報表做統計或分析報告,但他們本身在業務部門對業務理解深入,主要是利用數據解決業務問題。有些強勢部門可直連倉庫自己寫SQL提數,定製開發簡易報表,技術強的業務部門甚至要求建設自己的數據集市,搭建自己的挖掘團隊。
這種形式下的主要缺點是兩者職責有時劃分不清,造成部門利益為重、爭搶項目、職責推諉、重複開發、口徑不一致等問題。各業務部門的分析團隊之間交流不暢,技能提升有限。有一種變通的方法為打破各部門利益障礙,建立橫向的虛擬分析團隊,加強虛擬團隊內部溝通交流,甚至團隊內部成員作為共享資源可根據項目周期流動。
通過以上分析可以發現為發揮分析優勢,是在集中分析部門便於內部交流與靠近業務便於理解業務的矛盾的平衡。
每個形式都有各自的優點與缺點,沒有對錯之分。沒有最好的只有最合適的,每個企業都要根據自己的實際情況進行調整。
文 | 岳瑞
文章源自:數據陽光

2017年6月18日星期日

從DAMA出發,一個指標庫到底是如何煉成的?


 在數據管理領域,我們通常將數據分為:主數據、交易數據、參考數據、元數據和統計數據分析(指標), 指標是BI系統裡面核心的概念,是一個企業數據運營關注的核心數據,一般以KPI和報表的形式體現。
從實踐來看,一個企業要進行數據治理,涉及了架構、安全等諸多層面,但最迫切的是提升數據質量,其中指標質量則是重中之重,一般業務上90%以上關於數據的疑問都從指標的質疑開始,只要你從事數據相關工作,就應該深有體會。
「這個指標好像跟業務發展實際不符,快去查查」,估計這是報表取數人員聽到的最多的一句話了。
下文就來談談如何從根本上去提升指標的數據質量,即實現指標的標準化,作為一個數據管理人員,不管你有多少能力,曾經解決了多少問題,當過多少回救火英雄,都應該從更為長遠的角度來思考這個問題。
指標標準化的核心價值在於實現「書同文,車同軌」,即通過針對指標的一系列管理過程,去提升指標準確性、一致性、敏捷性及開放性。
DAMA將數據治理放到核心地位,指標的標準化就是個典型的數據治理問題,治標是容易的,治本的代價則太高,但如果要實現進階,還是要站的高一點,多思考一下,想想是否有更好的方法,就從筆者多年前做過的指標標準化項目開始吧,分為組織保障、報表梳理、指標整合、實現方式、功能架構、可視化引擎及管理流程等七個方面。
1、組織保障
指標庫這類數據管理項目,或稱BI項目,一般業務部門參與的力度是不大的,這是大多BI項目實施效果不佳的一個深層次原因。
DAMA提到要實施數據治理活動,跨部門的數據治理委員會等是關鍵的組織,的確是這樣,指標跟全公司每個單位都相關,對於其進行規範化改造當然應該獲得大家的一致同意。
可惜的是,大多企業沒有這個理想條件,也不會有數據治理委員會,在數據還未成為真正的實質性資產前,比如納入財務部的資產目錄,很少有企業會設立這個數據組織,因為效益不明顯,因此,哪個企業都不大可能為指標出一個規範並且通令全公司貫徹執行,對於數據管理人員,指標庫這個事情也許意義不小,但對於全公司意義則小了,這是現狀。
在沒有公司層面的組織保障前,數據管理人員或BI部門大多得靠自己,通過自己來推動事情往前走, 這是應有的態度,你不提,公司也沒有任何人會提,畢竟你是最大受益者,實施指標庫這個事情非常複雜,誰都沒有成功的把握,秉持小步快跑,試點探索的原則是不錯的。
筆者的這個指標庫項目獲得了分管領導的強力支持,這是項目能進行的現實組織保障,其實這類管理項目設立之初,很難讓業務部門和一線人員馬上認識到其價值並充分參與進來,這個溝通管理成本太高了,但無論如何,一個數據治理項目能否成功,公司的支持是第一要務,不僅僅是IT部門的事情,DAMA的很早就在《DAMA數據管理知識體系指南》明確了數據治理的組織要點,以下是DAMA的數據治理組織架構圖,非常超前:
當然我覺得現實的組織演進也許如下圖更合適,但道理是一樣的,相關利益方需要對這個事情達成共識:
2、報表梳理
指標的主要表現形式是報表,因此第一要務就是報表梳理,公司的報表浩如煙海,因此這個項目設立之初就限制了範圍,主要針對一線市場部經理、終端管理、流量管理三類核心角色,共梳理了相關的39個彩信、48份郵件通報及數據集市上的733張報表。(筆者所在公司為某運營商)

數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團

3、指標整合
各類報表及相關指標表達各不相同,梳理前應該給出一個描述指標的標準框架,包括指標大類、子類、維度、周期、歸屬、命名規範等等,曾經由於框架漏了一些要素導致返工現象,這個頂層設計一定要做好,以下是示例:
命名規範:業務限定詞+業務名稱+量值限定詞+量值描述(量、收、用)
舉例1:兩網有效用戶到達數
舉例2:自建有線寬頻出賬用戶數
下圖列出了大致的梳理步驟,主要以省公司報表和彩信KPI為基礎確定基準指標,各地市指標剔除個性指標後,合并到省公司的基準指標中,形成本次的最終指標範圍。
全省指標共計6841個(未剔重),經過歸併整合,得到基礎共性指標2306個,如下圖所示:
此項工作耗時巨大,以下是成果的示意:
4、實現方式
根據指標性質不同可以分為3類,即基礎指標1046個、計算指標652個和通用行銷類指標303個。
5、功能架構
為了支撐指標快速,標準化實現,通過增強數據管理平台來實現指標的快速開發、部署和管理,主要包括指標信息維護、指標開發、運維管理、指標質量管理等功能。
比如指標庫每月需要新增超過9. 5億行的數據,存儲周期按12+1,即123億行,以傳統關係型資料庫的查詢能力無法支撐,這裡就採用Hbase架構支撐海量指標的快速查詢。
6、可視化引擎
為了支撐指標組裝報表與配置報表的快速開發,使用數據可視化引擎產品,主要包括指標組裝、報表開發、報表展現功能,現在的這類產品很多了,但定製化給予一個創新性項目更大的自由度。
指標組裝報表製作工具是區別傳統基於SQL配置報表的靈活度更高的報表配置方式,主要提供基於指標選擇組裝生成報表。
7、管理流程
指標的建設只是走完了數據治理的第一步,為了確保指標庫長期可用,必須要有一套針對的指標管理機制和流程,否則建設的結束就是混亂的開始,理想的做法當然是發布一套公司級別的指標管理規範,但這個時候時機往往並不成熟,比如系統可用性到底如何,因此,我們當時就確立了一個簡單原則,一條開發鐵律:不重複開發,能用指標實現的不允許單獨開發報表,當然這非常考驗數據管理的藝術,極大依賴於團隊的業務和數據能力,但有主見的數據管理團隊一定要懂得如何與業務人員進行博弈,記得你才是全公司數據的管理者,而不僅僅是個開發者。
筆者在關於指標庫的實現簡要談完了,但我對於大多企業搞指標庫卻是持悲觀態度的,傳統BI部門面對浩海的數據需求時,往往是沒有管理原則的,因為公司對你的數據管理授權是不明確的,我們不得不以犧牲長遠來滿足當前,其實BI每接收一個不規範(比如胡亂的指標命名和定義)的報表需求就要承擔由此帶來的管理成本,而不僅僅是開發成本,這為後續數據管理的混亂埋下了禍根。
但存在的又是合理的,因為搞個指標庫在開始的時候,無論是管理及運維成本都不低,關鍵是短期來看效益還不明顯,這也許是成功案例不多的一個原因。
因此,當我們在抱怨業務指標口徑一塌糊塗的時候,要記得是企業沒有數據管理的原則導致了這個現象,也是你的不作為導致了這個現象,這跟公司的文化、機制及流程是息息相關的,頂層設計沒解決,也許只能將就了,或者,你就要付出百倍的努力去改變或優化這個設計吧,這需要巨大的決心和毅力。
DAMA談數據治理首當其衝談組織設置,顯然是非常睿智的,奇怪的是在知乎上關於DAMA數據治理的討論幾乎沒有,這倒是值得思考的問題。
文 | 傅一平
原文自:微信公眾號 與數據同行

2017年6月14日星期三

數據分析報告的框架——既要懂分析,也要會講故事

數據分析項目到收尾關頭,總要出一份數據報告。
按照項目類型,可能是產品投放市場的效果評估;日常報表製作數據匯總;活動數據分析。而報告也分多種情況,有的需要給項目組一個交代,有的需要和業務組一同評估分析,有的則是郵件抄送領導向上級彙報。
數據報告無論是文本、PPT還是數據圖表製作,都得展示分析的核心思路和結果,本質都是相同的。
1.好的分析師要會講故事
一個數據報告的核心不是面面俱到的內容,而是讓讀者讀懂「問題——假設——原因——驗證過程——結論——背後現象——可推行的決策」這樣一個脈絡的故事。類同於諮詢和投資機構,在做BP之前會先花時間理清楚storyline。其實各種報告都應該這樣,先理清楚思路,就有了故事。
2.數據分析報告的框架
這裡列出一個我慣用的報告框架(針對不同業務場景可能會有所調整,增刪或再細分):
項目背景 &項目進度
項目背景,需要簡述項目相關背景,項目需求、分析目的、市場情況、為什麼做,目的是什麼,以讓讀者了解項目的前因後果。項目進度,需要綜述項目的整體進程,以及目前的情況。
數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團
指標定義&數據獲取
核心指標如何定義?公式是什麼,為什麼這麼定義,這點是很重要也是很容易被忽略的,很多時候的誤解都是沒有對指標進行統一定義。舉個例子,比如服裝「斷碼」。從領導層來講,公司倉儲的服裝全部尺碼如果不完整就是斷碼;從倉庫的倉管員角度來講,倉庫內的服裝尺碼不全就是斷碼;從門店的業務員角度來講,客戶需要的尺碼當前門店無貨就是斷碼。定義不同,在會員系統、庫存系統、訂單系統中這個斷碼的數據就不對應。主數據管理可能並沒有覆蓋到所有指標,所以分析指標時要考慮這一點。
數據概覽 &數據探維
數據概覽是對指標的發展趨勢和變化情況,例如最高最低點做成因解釋。而數據探維是對某指標按照不同的維度做分析,做細節補充。這也是數據分析時常的方法,多維度分析。這一點常常用FineBI等BI系統工具來操作,製作好模板,以後就可以按照特定的維度來分析了。這裡需要注意的是,核心指標要少而關鍵,拆分指標要有意義並有清晰地邏輯來說明。如果涉及的維度較多,不建議用PPT來一個一個描述。一些BI工具可直接在web上展示,切換維度,動態的展示更加生動,容易說明。
結論匯總
結論匯總,基本是對之前數據分析階段的數據進行匯總,形成完整的結論。後續改進,需要在數據分析的結論和問題的基礎上,對後續的迭代和改進措施作出方向性的說明。這部分其實很多時候也是分析的根本目的。
最後附上詳細的數據,尤其是那些沒有必要在數據報告中體現但是仍然有價值的數據。一個項目/業務,如果你不能衡量它就不能了解他,也就無法改進它,說的就是數據。
我們都不可能提前知道數據的結果,也不能報紙中立的態度去判斷。任何從事數據工作的人,尊重數據結果,並分析形成結論,遠比相信一些所謂的方法論的條條框框好得多。

2017年6月12日星期一

大數據下的銀行業信用風險監控體系什麼樣?看工商銀行的案例

信息不對稱,尤其是信息不真實甚至不同程度存在的信息欺詐問題,是信用風險形成的重要因素之一。為此,亟需依託互聯網和大數據分析軟體技術,建立新型的信用風險監控體系,強化對風險的全景分析和前瞻預警。近年來,工商銀行在構建外部欺詐風險信息系統的基礎上,進一步收集全行風險大數據並挖掘處理,通過關聯業務分析和數據可視化建設,基於風險大數據重構了銀行風控體系,亦實現了銀行安全保衛工作內涵的創新突破。
當前,外部欺詐風險態勢日益嚴峻。在互聯網和大數據背景下,圍繞風險大數據重構銀行風控體系已經成為業界共識。按照這一理念,工商銀行2013年研發投產了外部欺詐風險信息系統,並陸續在工商銀行全集團(境內外所有機構)、全渠道(線上和線下渠道)、全業務(接入16大業務系統)投產應用,風險防控成效顯著,有效保障了銀行與客戶的資產安全:一是累計預警業務風險129萬筆,涉及資金435億元。二是累計防堵電信詐騙事件11.27萬起,避免客戶損失超16.88億元。
與此同時,工商銀行積極探索並實踐大數據分析方法,通過外部欺詐風險信息系統,對海量客戶信息開展多維度數據挖掘,排查業務風險,並根據風險排查過程的經驗總結,於2016年研發投產了風險客戶「三維立體」全景視圖,一站式、可視化呈現出風險客戶「基本信息、風險信息(外欺系統風險資料庫信息)、銀行業務與往期風險處置信息」三大類信息,提升了外部欺詐風險信息挖掘處理和關聯業務分析能力,為客戶風險分析與處置提供了技術保障,為銀行業務穩健安全發展提供了有力支援。
本文特選取幾個典型案例,簡要介紹工商銀行對風險客戶開展關聯業務分析的主要做法,進而與業界分享工商銀行風險客戶「三維立體」全景視圖的設計思路和主要功能。
一、剖析企業關聯風險 強化系統監測 指導風險處置
工商銀行安保部從外部欺詐風險信息系統中篩選出30萬戶風險企業,進一步挖掘分析其存量關聯業務。以信貸業務為例,在分析樣本中發現存在高風險公司有貸戶上千戶,涉及貸款金額逾千億元、不良餘額數百億元,不良率均值14.73%,遠高於全行平均水平。對該類企業註冊、投資等信息進一步挖掘,發現集團關聯企業內部成員之間互相投資、交叉投資關係錯綜複雜,在信息不對稱的情況下,極易造成銀行業務風險。
例如,客戶某集團有限責任公司存在高法未結案風險信息,雖然2015年初信用等級AA,貸款餘額3.8億元,貸款形態正常,但通過數據挖掘分析,發現該客戶存在較為突出的潛在風險。比如,集團內投資關係多達6層,關聯企業130餘家,涉及金融投資、貿易、房地產、建材、酒店、擔保、小額貸款、旅遊等多個行業,集團法人代表梁某共在其他10個企業內任職,其中有3家為法院認定的被執行人;集團對外投資企業共計38家,涉及多個行業,其中有10家企業被吊銷營業執照,4家為高法被執行人,1家為高法失信執行人。根據分析結論,工商銀行信貸管理部已對涉事企業及其法定代表人加強監測,開展風險處置,從而有效地規避了資產損失。
數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團

二、多維評估客戶風險 凈化客戶群體 提升資產質量
工商銀行從外部欺詐風險信息系統中篩選出60萬戶風險人員,在信貸、信用卡、私人銀行等業務領域進一步開展關聯分析,發現部分人員作為工商銀行信貸、信用卡或私人銀行客戶,其整體資產情況呈現出「負債高、資產少」的特徵。
例如,外部欺詐風險信息系統顯示,李某存在高法失信等風險記錄,故對其進行深度數據挖掘,由此發現了李某的多項風險點:一是其在工商銀行貸款餘額267萬元,信用卡透支餘額高達48.6萬元,負債總計315.6萬元,資產負債率僅為0.32%,遠低於同類客戶資產負債率;二是其投資企業某貿易公司為海關失信企業,某房地產公司為法院被執行人,涉及未結案金額448萬元;三是李某貸款形態及信用卡使用情況雖然正常,但所持信用卡月均額度使用率高達91.8%,透支利息月均6797元,存在一定業務風險。
根據外部欺詐風險信息系統的評估意見,工商銀行個人金融、信貸、信用卡、私人銀行等業務部門對風險客戶加強業務風險監測,並相應開展了貢獻星級降級、貸款提前清收、綜合授信降額、私人銀行資格清退等風險處置措施,提升了全行客戶群體品質及客戶整體的資產質量。
三、透視賬銷案存客戶 辨析清償能力 指導資產清收
賬銷案存資產是指工商銀行已批准核銷,但尚未依法終結債權債務關係或仍具有追索可能,要按規定轉入表外核算並繼續追索的債權性資產。由於納入表外管理,銀行有關業務部門對賬銷案存資產的持續管理和重視力度容易欠缺。通過外部欺詐風險信息系統,對賬銷案存客戶的資產、負債、結算業務情況、外部風險情況多維度進行分析,可洞悉其關聯風險特徵並確認清償能力,提出完善賬銷案存業務資產管理的意見和建議,優化全行風險信息共享機制。
為深入挖掘分析賬銷案存風險客戶特徵及其清償能力,工商銀行通過外部欺詐風險信息系統隨機抽取了5000個名下有企業的賬銷案存個人風險客戶,並根據其工商註冊信息進行分析,發現這5000個客戶共涉及4937家企業,其中部分客戶在多數企業擔任法定代表人、主要股東或高管。通過對上述客戶的關聯企業進行查詢,發現部分企業為正常客戶,且具有一定資產規模。此外,通過關聯分析客戶社會信息(如乘機記錄、社保繳納信息、手機實名認證信息、工商註冊信息、戶籍信息、稅務登記信息、出入境記錄等),發現部分客戶有穩定社保繳納記錄,或存在商務出行和旅遊記錄,進一步證實了其償債能力。工商銀行有關業務部門根據上述分析結論,專門建立了不良資產處置系統,通過與外部欺詐風險信息系統深化合作,加強對此類風險客戶的監測與處置。
四、融合信息可視化 聚焦外部風險 保障業務發展
為響應和支援行動互聯網金融環境下工商銀行「以客戶為中心」的客戶統一畫像智慧管理體系,持續提升外部欺詐風險信息挖掘處理和關聯業務分析能力,工商銀行安保部基於數據分析經驗積累,按照「以外部風險為中心」和「One Bank」的原則,融合風險信息可視化技術,研發投產風險客戶「三維立體」全景視圖。
該視圖可有效支援風險關聯分析和業務運營保障:一是能夠從客戶基本信息(開戶三要素、地址、聯繫方式等)、客戶風險信息(外欺系統風險資料庫信息)、客戶銀行業務與往期處置信息(資產負債信息和資產質量信息)三個維度,立體、全面、直觀、準確展現客戶全方位風險要素,實現客戶風險畫像的動態可視化,助力欺詐偵測的「一站式、一頁式、共享式」高效管理;二是可對風險客戶的資產情況、社會關係、行為軌跡等信息橫向關聯,縱向發掘,支援風險信息的交叉分析驗證和多維風險評估,提升風險客戶評價的可靠性和準確率;三是能夠根據外部欺詐風險信息系統的用戶角色分級授權機制,按照「知所必需」原則,支援工商銀行全集團各業務條線自動調用與實時展現,豐富了業務風險防控的預警模式與參考要素。全景視圖的應用,有效促進了風險大數據與業務經營的高度融合,為工商銀行信息化銀行建設的深化發展,提供了基礎信息、應用架構與成熟案例。
本文原載於《中國銀行業》雜誌2017年第1期。
文/靳曉鵬

2017年6月4日星期日

如何成為一家真正發揮大數據作用的「數據驅動型公司」?


概述:作者是業界資深的數據分析師,人工智慧投資人,他在文章里給我們介紹了什麼是大數據的來源,目前在數據領域的初創公司與現有巨頭的競爭現狀,各自在數據領域所採取的不同做法,數據分析工作的外包,為什麼有關大數據分析軟體的項目總是會失敗?
在本章節中,我想試著描述、分享一下大數據在公司商業運營情境當中所扮演的角色。
大數據的能力是從何處而來?
首先,我想先花一點時間來談談有關數據的價值,數據所發揮的作用,它是從何處而來的。
我認為「企業專家中心「(Centre Of Excellence) 這個部門非常之重要,它作為最前沿的公司職能部門,負責將數據的角色引入到公司,並將其功能放大化。它的主要職能就是對跨部門的工作進行協調,具體包括了下面這幾項內容:
1. 對企業的技術架構進行維護和升級
2. 決定應該收集什麼樣的數據,從哪個部門來收集這些數據
3. 推動人才招募計劃
4. 制定「關於從數據中獲取真相」的流程環節以及戰略,並制定有關隱私、合法合規性、以及行業道德規範標準的政策制度。
但是,除此之外還存在其他的管理架構和形式。也許對你現有的商業模式來說,還存在匹配程度更高的管理架構和形式,數據分析、組織結構模式。
其實,在商業模式和數據分析基礎的結合上,存在著好多種組合方式。商業單元(BU)各自獨立,各自為戰是一種法子,相互獨立的 BU 為了某些具體的項目相互協作也是一種法子,企業內部治理(公司治理的金字塔頂端)是一種途徑,外部中心(企業專家中心)也是一種途徑。
數據初創公司與數據壟斷型公司的對決
到底是數據初創公司勝出?還是數據壟斷型公司勝出?這個答案不可能清楚地給出,裡面有太多需要考慮到的變數,尤其跟公司本身所處的行業,還有所持有的競爭優勢有關。最重要的一點是,商業策略的制定,跟公司處於哪個成長階段有著莫大的關係。
儘管從歷史經驗上我們可以看出:很多小公司在結構上比大公司要有著明顯的優勢(就比如說一些初創公司在管理數據上面比大型藥品公司要做的出色的多),但是這並不能說:公司越是初期,在數據處理和應用上的成熟度更高。
更準確的說法是:因為小公司本身的靈活性,它們在這方面行動會非常迅速,而且因為本身基數小,所以很容易在增長比例上大幅超越大公司。
在這裡,我想要強調的重點是:初創公司和大公司,在面對數據問題,儘管目標一樣,但是採取的路徑和方式方法是截然不同的。這裡將這兩種方法分別稱之為:回溯型方式和前瞻型方式
前瞻型方式:一般適用於小型初創公司,更準確的說,是那些剛剛進入行業不久,短期內還無法產出大量的數據,但是很快就會實現。正因為這一點,決定了它們從一開始就要制定一個高效實用數據的戰略。
回溯型方式:更適合於已經在行業里紮根多年的大公司,它手上握有海量數據,但是它們不知道怎麼使用,比如如何將數據向某個中心樞紐集中。
前瞻型方式
採取這種方式的初創公司不拘泥於過去既定的任何組織架構,而且從一開始,為了某種長期的願景,它就制定出非常嚴格的數據政策,以避免未來在數據領域出現任何的突髮狀況。而且,它一開始就投入大量的資源和時間,如果做對了的話,那麼它會繞開接下來運營發展中的種種不便。
一開始就制定好一個完善的數據政策,能夠很好地滿足初創公司在接下來發展中,處於各個不同發展階段時的需要。更重要的是,年輕的公司所受的約束較少,這種約束不僅體現在內部,比如官僚層級還沒有形成;更體現在外部,比如政策法規上面扶持鼓勵遠遠多過約束限制。而且它們往往對風險的接受度較高,使得它們願意去測試和應用很多前沿科技,它們更願意關注高質量的數據,而不是追求數據量的積累以便獲得研發的基礎。
回溯型方式(已有的大公司)
大公司往往會遇到下面的兩個問題:
1. 它擁有的數據量確實非常大,但是它們不知道該如何是好。
2. 它們手裡有數據,而且頭腦中已經存在著明確的目的,但是因為數據質量達不到標準,數據整合方式上面並不完善,以及配套技能上不過關,連啟動這個項目都做不到。
先說第一種情況。這樣的公司往往是剛試著轉型到數據驅動領域,它是有數據,但是不知道如何從中提取出有價值的東西出來。鑒於很多大公司的工作崗位要求都很明確,工作任務都被塞的很滿,要求也比較高,所以某些時候它是無法做到公司內部進行創新的,也就是說,它們太忙了,根本抽不出時間。有些行業,比如銀行業、金融科技行業,這個問題體現的尤其明顯。
關於這個問題,我認為一開始就要聘請一名專門在商業智慧想法、戰略上做創新的人進來。這個人富有經驗,能夠成為「數據驅動」理念的傳道者,哪怕他不具備非常強大的計算機技術背景,他也能夠為整個公司帶來非常寶貴的建議和想法。
有了這樣一個角色的存在之後,再去考慮找一名合格的數據分析師。
再來看第二種情況。他們手上有數據,也有明確的目的,但是不知道如何利用它們。我認為這存在著兩種解決方案:
1. 公司從「一張白紙」出發,建立某種全新的數據平台,團隊,以及以數據為核心的文化;
2. 公司直接將數據分析工作以及與數據有關的問題外包出去。
第一種方式如果一切進展如預期一樣,肯定會帶來更加穩健強勁的發展,但是成本也比較高。所以這個時候決策者是需要權衡成本收益誰大誰小的。
第二種方式是數據分析工作的外包。大公司一般傾向於選擇某些大學作為數據分析工作的外包方。理由很簡單:大學一般來說都比較缺錢,也需要數據來進行一些研究,從而方便最終形成論文報告。一般它們的報價也比專註於做數據分析的初創公司要低很多,更何況大學機構中不缺人才,不缺時間,不缺意願,有足夠多的理想條件來收拾整理一堆亂七八糟的數據。
相比之下,初創公司以盈利為目標,選擇它就意味著較高的成本,但是它也是有優勢的。往往這樣的公司里聚集著世界最頂尖的數據分析人才,而它本身就掌握著很多非常有價值的應用研究案例和資料庫,這些東西都是大學機構所比擬不了的。
但無論你是選擇大學機構還是初創公司,都存在著一個繞不開的問題:數據的隱私安全性。你需要問下面的這些問題:公司外包出去的數據都是什麼?第三方機構是如何保證這些數據的安全性的?它們是怎麼存儲數據,決策機制又是怎樣的?
除了這兩種辦法之外,其實還有一些「旁門左道」,能夠讓你近乎於免費的得到數據分析結構。這就是科技圈裡日趨流行起來的黑客馬拉松和某些行業內聚會。你在這其中可以看到很多人有數據分析的才能,也能通過公開自己的數據,免費地拿到數據分析結果。
為什麼大數據項目很容易失敗?
原因來自各個方面:
1、缺少商業目標和規劃;
2、無法正確的找出需要解決的問題,缺少解決方案規模化的路徑;
3、缺少 C 級管理人員或者高管的認可及支援;
4、過度投入大量時間和金錢,尤其是隊伍中人才組成不合理,這一點尤其常見;
5、不合理的預期;
6、公司內部的屏障:比如存在很多數據走不出來的 「深坑」,團隊內部糟糕的溝通機制,基礎設施問題等等;
7、將這項工作看作是一時的項目,而不是持續性的學習過程;
8、數據管理、保護、隱私方面做的不到位。

銀行大數據平台如何搭建和發揮價值?

江蘇銀行是在江蘇省內無錫、蘇州、南通等10家城市商業銀行基礎上,合并重組而成的現代股份制商業銀行,是江蘇省唯一一家省屬地方法人銀行。江蘇銀行有營業機構510多家,其中,省內下轄12家分行,在南京地區擁有23個營業網點,在省外開設了北京、上海、深圳、杭州4家分行,全行現有員工1.4萬餘人。
本文是江蘇銀行科技部朱妍在帆軟銀行大會上的演講,這裡整理成文。
2016年,作為大數據平台的組成構建,帆軟數據多維分析平台(BI系統平台)正式在江蘇銀行啟動運行。大數據平台為數據多維分析平台提供了優質、多維的數據以及高性能數據處理的底層。
數據多維分析平台的數據基礎
江蘇銀行大數據平台,整合、清洗了大量內部、外部數據,為數據多維分析做好了數據準備,也就是為「巧婦」準備了充足的「好米」。
引入的數據主要分三大類。第一類是企業生產數據,比如煙草、電力、電商、運營商等數據,這部分數據重點雙方合作,直接接入數據;第二類是政府機構等公共數據,比如公積金、地稅、法院、工商、社保、醫保、海關等數據,這部分主要藉助的是政府對大數據產業的推動,積極對接數據,不過數據清洗和對接工作量比較大;第三部分是偏向個人身份數據,比如學習、戶籍、房價、房產、商戶驗證等數據。這部分數據主要用來做身份識別和校驗以及個人信用評級。整體三部分的數據提供了充分的個人信用評級數據和企業信用評級數據,為開展開展風控業務,以及創新產品「稅E融」提供了數據分析決策的基礎。
數據多維分析平台的產生背景
大數據平台的搭建提供了充足的分析數據,但同時也形成了巨大的挑戰。銀行1萬4千多名員工,現已開發900多張報表,在用將近700張,這些報表的數據來源多達49個,一年的報表開發需求量,達到了開發一個新報表系統的量級。
過去以往的數據分析流程是業務部門提出需求 ——科技部分析需求 ——雙方溝通口徑 ——科技部試取數據——業務部修改口徑 ——科技部再次試取數據…… 如此往複幾輪,完成報表製作。但製作的報表並不完全滿足需求,業務部門需要Excel加工。這樣業務部門看不到基礎數據,只能依賴科技部來做個性化定製取數,造成統計周期特別長,分析數據十分不靈活。
現在業務發展迅猛,數據分析需求繼續採用之前的報表開發流程已經無法滿足業務快速發展的需求。現在預計一年的數據分析需求,完全換算成單獨報表,要超過5千張。因為龐大的工作量,之後採用了新的數據分析方式。採用業務部和科技部預先商議數據分析主題,然後科技部定製數據分析主題包。也就是將業務部門的需求劃分成若干主題,針對每一個主題,預先匯總、關聯、轉義好數據,讓業務人員能有一目了然的看到他所需要的數據,需要分析,只需要拖拽形成圖和表格即可。當然,這裡面是需要解決許可權分配、大並發、高性能數據處理等方面帶來的問題。這塊通過數據多維分析平台和大數據平台結合,已經解決。
數據多維分析平台的效果展示
數據多維分析平台,可以讓業務人員自助進行數據分析,無需了解資料庫,無需學習技術語言,甚至不需要懂太多的數據分析的理論以及數理統計知識。只要是了解業務的人員,經過10分鐘培訓,都可以自助拖拽進行分析。這大大減輕了科技部的工作,同時業務部門可以靈活定製分析,對數據準確度也提高了信任,不再輕易懷疑科技部對數據做了什麼手腳。
當然,數據分析功能雖然是開放的,但是數據許可權是嚴格把控的。什麼人能看哪些數據,什麼人能看哪些欄位,一部分是科技部這邊做一個高層級的許可權劃分,而細粒度的許可權劃分是可以分配給多個不同的管理員,讓業務部門自行把控低層級的許可權。
在具體的應用上,江蘇銀行實施了領導視圖、卡部報表、零售部報表、Excel數據導入、串串盈報表等。
下圖是行領導視圖中的一張,領導打開電腦或者手機,就可以看到行內核心機構分布、優質分行的客戶數排行等。領導關注這些數據,同時會對其中的不特定的機構進行詳細鑽取,深入了解特定機構的經營狀況。所有的數據都是關聯打通的,所以,只要需要其他維度的信息,領導都可以直接點擊或者拖拽,就能直觀看到。
下圖是對各機構的盈利分析,在關注不同機構的盈利佔比同時,又關注排名前10的優質機構盈利狀況。然後不斷嘗試根據數據分析結果來推出新的產品,統計利潤排名靠前的產品就是我行的明星產品,分析目的是保持明星產品的高效持續運營,及時下架盈利不佳的產品,及時止損,同時對分行盈利能力做排名對比分析。例如下面的表格是根據上面的分行排名數據聯動,是分行的明細經營數據。根據明細,可以基本定位是分行的什麼產品線出了問題。
2016年12月,科技部推出串串盈行銷雲平台,串串盈平台是面向行內外用戶的兼具趣味遊戲、行銷活動展示、賺豆任務發布、蘇銀豆商城等功能和板塊的新平台。不光基於數據分析推出了這個平台,還用數據分析來驅動平台的運營。我們對用戶行為、用戶操作時間分布和用戶獎勵發放做重點分析。用戶行為分析是指具體分析不同操作類型及操作種類的參與人數和頻數。通過人數和頻數,我們確定這個操作對應的活動的受歡迎程度,及時調整活動細節。用戶操作時間分析,主要是分析抽獎、種豆等用戶操作的時間集中分布區間。比如我們看活動轉發時間分布,主要是早上6點到8點。那麼這個數據就可以用來在推送其他活動信息時,借鑒參考。另外,用戶獎勵發放分析。我們以蘇銀豆的形式發放獎勵,通過監測分析蘇銀豆的發放情況,既把控活動熱度,又可以適度預測活動未來走勢。
行動端應用重點在於方便靈活,具體的數據分析內容和PC上是可以相同的,我們選的這個數據分析工具是支援PC、IPAD、PC、大屏自適應的,所以一般來說無需為行動端額外開發一些報表。不過也有例外情況。有些報表領導一般不再PC上看,只在手機上查看,所以這種情況可以單獨定製一下行動端的分析頁面。我們在行動端的分析應用主要是面向產品挖掘的。使用場景是,領導在碰頭會議中或者直接手機批註,下達指示。這種手機端的應用是比PC上更為靈活的。隨時隨地可以擺出數據做簡單會議。