2015年11月6日星期五

如何從一開始就設計好資料分析的基本框架

【引子】
Porterfield的最新創業項目是Looker,一個商業資料分析解決方案提供商。主人公在下面這篇文章中向我們講解創業者們如何可以從一開始就設計好資料分析的基本框架:將資料儲存於何處?用什麼工具分析最好?可以規避哪些常見的錯誤?以及,今天的你如何亡羊補牢?
關於資料分析,避免6個錯誤
1. 走得太快,沒空回頭看路
初創公司里的人們彷彿一直在被人念著緊箍咒:「要麼快要麼死,要麼快要麼死。」他們是如此著急於產品開發,以至於他們常常沒有空想用戶對產品的具體使用細節,產品在哪些場景怎麼被使用,產品的哪些部分被使用,以及用戶回頭二次使用產品的原因主要有哪些。而這些問題如果沒有資料難以回答。
2.你沒有記錄足夠的資料
光給你的團隊看呈現總結出來的資料是沒有用的。如果沒有精確到日乃至小時的變化明細,你無法分析出來資料變化背後看不見的手。如果只是粗放的,斷續的統計,沒有人可以解讀出各種細微因素對於銷售或者用戶使用習慣的影響。
與此同時,資料儲存越來越便宜。同時做大量的分析也不是什麼高風險的事情,只要買足夠的空間就不會有system breakdown的風險。因此,記錄儘可能多的資料總不會是一件壞事。
不要害怕量大。對於初創企業來說,巨量資料其實還是比較少見的事情。如果正處於初創期的你果真(幸運地)有這樣的困擾,Porterfield(本文)推薦使用一個叫Hadoop的平台。
3. 其實你的團隊成員常常感覺自己在盲人摸象
許多公司以為他們把資料扔給Mixpanel, Kissmetrics,或者Google Analytics就夠了,但他們常常忽略了團隊的哪些成員能真正解讀這些資料的內在含義。你需要經常提醒團隊裡面每一位成員多去理解這些資料,並更多地基於資料來做決策。要不然,你的產品團隊只會盲目地開發產品,並祈禱能踩中熱點,不管最終成功還是失敗了都是一頭霧水。
舉例:
有天你決定採用市場上常見的病毒營銷手段吸引新用戶。如你所願,用戶量啪啪啪地上來了。可此時你會遇到新的迷茫:你無法衡量這個營銷手段對老用戶的影響。人們可能被吸引眼球,註冊為新用戶,然後厭倦而不再使用。你可能為吸引了一幫沒有價值的用戶付出了過高的代價。而你的產品團隊可能還在沾沾自喜,認為這個損害產品的營銷手段是成功的。
這種傻錯誤經常發生。而如果你的企業在一開始就建立起人人可自助使用的資料平台,來解答他們工作中最重要的疑惑,則可以避免上文所說的悲劇。
4. 把資料存放在不合適的地方
先讓我們來看一個正確示範吧。Porerfield提到他有個客戶整合了NoSQL, Redshift,Kitnesis以及Looker的資源自創了一個資料分析框架。這個框架不僅能在很高的量級上捕獲及儲存自己的資料,還能承受每月數以百萬計的點擊流量,還能讓所有人查詢自己想要的資料。這個系統甚至可以讓不懂SQL語言的小白用戶們真正理解資料的意義。而在資料分析的世界裡,基本上如果你不會SQL, 你就完蛋了。如果總是要等待工程師去把資料跑出來,那就是把自己陷入困境。而工程師在不理解需求的情況下建立的演算法或者買的軟體對於使用者來說往往是個煎熬,因為他們對資料的使用往往與前者不再同一水平線上。
你需要讓你所有的資料都存放在同一個地方。這個是關鍵關鍵最關鍵的原則。
讓我們回到前文那個假設存在的公司。他們做了一個又一個病毒營銷,但是沒有把用戶活動資料放在同一框架內,所以他們無法分析一個活動是如何關聯到另一個活動的。他們也無法進行一個橫跨日常運營以及活動期間的資料分析比較。
很多公司把資料發給外包商儲存,然後就當甩手掌柜了。可是常常這些資料到了外包商手裡就會變成其他形式,而轉化回來則需要不少工序。這些資料往往是某些宣傳造勢活動時期你的網站或者產品的相關資料。結合日常運營資料來看,你可以挖掘哪些活動促成了用戶轉化。而這樣結合日常運營資料來分析用戶使用歷程的方式是至關重要的。但令人震驚的是,儘管任何時期的所有運營資料都至關重要,許多公司仍不屑於捕獲及記錄他們。約一半以上Porterfield所見過的公司都將日常運營資料與活動資料分開來看。這樣嚴重妨礙了公司正確地理解與決策。
5. 目光短淺
任何一個好的資料分析框架在設計之初都必須滿足長期使用的需要。誠然,你總是可以調整你的框架。但資料積累越多,做調整的代價越大。而且常常做出調整後,你需要同時記錄新舊兩套系統來確保資料不會丟失。
因此,我們最好能在第一天就把框架設計好。其中一個簡單粗暴有效地方法就是所有能獲取的資料放在同一個可延展的平台。不需要浪費時間選擇一個最優解決方法,只要確認這個平台可以裝得下所有將來可能用到的資料,且跨平台也能跑起來就行了。一般來說這樣的原始平台能至少支撐一到兩年。
6. 過度總結
雖然說這個問題對於擁有巨量資料分析團隊的公司來說更常見,初創公司最好也能注意避免掉。試想一下,有多少公司只是記錄平均每分鐘多少銷售額,而不是具體每一分鐘銷售了多少金額?在過去由於運算能力有限,我們只能把海量資料總結成幾個點來看。但在當下,這些運算量根本不是問題,所有人都可以把運營資料精確到分鐘來記錄。而這些精確的記錄可以告訴你海量的信息,比如為什麼轉化率在上升或者下降。
人們常常自我陶醉於做出了幾張漂亮的圖標或者PPT。這些總結性的表達看上去很令人振奮,但我們不應該基於這些膚淺的總結來做決策,因為這些漂亮的總結性陳述並不能真正反映問題的實質。相反,我們更應該關注極端值(Outliers)。
3個簡單防護措施,幫你少走彎路
少犯錯誤遠比你想的重要,因為錯誤一旦發生,很容易耗費大量的工程時間和資源來彌補錯誤。如果不小心,你的工程師們可能花費昂貴的時間來為銷售團隊解碼資料,可能錯過無數寶貴的營銷機會。每當資料變得難使用或者理解時,你的團隊決策速度會變慢,因此你的生意進展必將受到拖累
好消息是,如果你從有用戶伊始就採用以下3個簡單的防護措施,你一定可以避免走很多彎路。
1. 任命一個商業資料首席工程師
如果你能在團隊中找到一個隊資料分析真正有興趣的工程師,你可以讓他負責記錄管理所有資料。這將為整個團隊節省海量的時間。Porterfield 分享到,在Looker, 這樣的一個商業資料首席工程師負責寫能記錄所有資料的腳本,從而方便大家總是能在同一個資料庫內獲取需要的信息。事實證明,這是個簡單有效的方法,極大地提高了團隊的工作效率。
2. 把資料放在開放的平台上
Porterfield強力推薦大家使用類似於Snowplow的開源平台,以能實時記錄所有與產品相關的活動事件資料。它使用方便,有好的技術支援,可以放量使用。而最棒的一點,它能與你其餘的資料框架很好的兼容。
3. 儘快將你的資料遷移到AWS Redshift或者其它大規模並行處理資料庫(MPP)上
對於還處於早期的公司來說,類似於Redshift這種基於雲端的MPP經常就是最好的選擇。因為他們價格便宜,便於部署和管理,並且擴展性強。在理想狀況下,你會希望從公司有記錄之初就將你的事件與操作的資料寫入亞馬遜Redshift之中。「使用Redshift的好處在於這個平台便宜,迅速,可訪問性高,」Porterfield說。並且,對於那些已經使用AWS服務的人來說,它(使用redshift)可以無縫接入你已有的架構中。你可以很容易的建設一個資料通道把資料直接傳入這個系統中進行分析處理。「Redshift能讓你靈活的寫入巨量的顆粒狀的資料而並不根據事件觸發量的多少這樣難以估計的參數來收費,」他說。「其它的服務會根據你儲存事件的多少來收費,所以當越來越多的人使用你的產品時,越來越多的操作資料會被記錄下來,這會導致最終的收費像火箭一樣越升越高。」
如何用資料分析佔領市場先機?
資料分析的價值取決於它能如何幫助你佔領市場先機。作為初創公司,所有的資料應該被用於你對公司不同階段設立的目標上。
舉例
一個快遞公司通常會檢測平均送達每件貨物的時間。這看上去是很關鍵的資料,但如果沒有充分的上下文(畢竟收貨人可能在一個街區外,也可能在幾百公里外),這也是沒有意義的。另一個角度上,平均送貨時間也沒有收貨人的整體滿意度重要。因此,你必須確保你的分析囊括了正確的資料。
請列舉量化你需要的結果:你希望你的客戶體驗是怎麼樣的?一些常見的成功資料分析會基於銷售或用戶轉化率(即如果客戶做了叉叉事情以後會購買或者成為用戶),轉化需要的時間,以及讓客戶產生負面體驗的比例。你會希望第一個比例很高,而後兩者降低。
通常來說,媒體網站會全然以網頁瀏覽量論英雄。但現在他們也開始注意一個叫做「注意力停留時長」的指標:人們在某個頁面專註多長時間,是否注意到某些字句,是否在上下拖動頁面,是否有看視頻,等等。他們不僅僅實在看用戶在某個頁面停留了多少時間,他們更需要知道用戶被頁面中的哪些部分吸引,且積極專註地瀏覽了多少時間。這樣可以幫助媒體網站設計新的標題,頁面設計和內容選擇,以延長這樣的注意力停留時長。這樣,他們可以革新網站設計的方式,來更好地打動他們的受眾。
另一個重點是監測留存用戶。成功的資料分析可以同時涵蓋日常運營資料以及活動資料,並橫向分析。如果你僅僅看日常運營資料,你能知道哪些人會回訪你的網站,哪些人可以達成復購。但你還需了解哪些回訪網站卻沒有復購的人群: 為什麼他們不願意再次購買?這樣的問題可以通過介乎運營與活動資料分析來找到答案。活動資料會告訴你哪些沒有購買行為的客戶按照何種順序瀏覽網站,注意到了什麼,點擊了什麼,在離開網站前做了什麼。當你跟蹤這個線路,你可以了解如何修改這種行為,來增加他們下次訪問時購買的可能性。
為了設計最適合你的資料籃子,你可以參考以下三個建議:
1. 尋找一類合適的用戶行為;
2. 測算多少比例的受眾會有這一類的用戶行為;
3. 測試這一類用戶行為是不是包含了重要的信息。
有時候,發明一個新的資料記錄籃子可以促成對公司很大的改變。
舉例
拿Venmo(翻譯君註:一個紐約的小額支付平台)舉個栗子吧。有段時間,公司的支付APP團隊聽說很多本想向朋友索取款項的用戶不慎把錢反而支付給了朋友,因為「索取款項」和「支付款項」的按鈕放在一塊很容易按錯。然而公司並不知道這個問題有多普遍,是否值得公司重新設計用戶界面。為了更好地做決策,他們設計了一個新的資料系統來檢測這個索取/支付失誤有多常見。他們把「A向B付款後不久B雙倍將款項付給了A」這種奇怪的支付行為全都找了出來。結果顯示,這個情況經常發生。所以在下次的產品更新中,他們修復了這個問題。
讓你的資料可分享
阻礙團隊輕鬆分享資料的罪魁禍首常常是資料的定義。因此,從一開始你最好充分完整地定義你的資料。可以考慮建立一個中央辭彙表wiki page, 來讓每個成員更容易理解。Porterfield指出,人們喜歡用奇怪的詞語給資料命名。比如「Ratio」這個詞就常備濫用,因為他們命名時常沒有把分子分母講清楚。
資料是大部分成功公司的生命線。好的資料分享不僅能增加公司的透明度,還能加強不同部門之間的協作。比如在很多公司里,不同部門常常會各自找工程師生成不同資料來回答同一問題。而如果有一個好的分享資料平台這樣的浪費時間精力可以被避免。
另外,讓資料形象化也是一個好平台能輕易做到的。把顆粒資料形象化為圖表可以讓團隊的每一個成員更好地解讀這些資料。對於大部分人來說,理解圖表比理解表格容易得多,因此把資料形象化可以幫助交流更加順暢。
不好的資料分析框架只會打擊人們的自信心。它會無形地把公司分為兩個派別:懂資料的大神以及不懂資料的白痴。這是個很常見的危險錯誤。你必須讓公司最小白的資料用戶都能輕鬆地生成自己需要的圖表並理解它。這是選擇資料平台的一個基本原則。
Poterfield總結道:好的資料分析能讓人們更有準備地去開會,幫銷售團隊問出更到位的問題,免去了無謂的猜測。人們不用再猜測他們的用戶在尋找什麼,或者為什麼他們達成銷售,或者為什麼他們不再回頭。人們也不用再猜測其他團隊的同事知道或者不知道什麼。而這一切都要歸功於從一開始就把資料框架設計好。

4500+企業選擇FineReport報表與 BI 商業智慧工具【免費下載】
opensource開發,類excel設計,全方位異質資料庫整合,資料填報、Flash列印、權限控制、行动應用、客制化、交互分析、報表協同作業管理系統。
分享自:資料觀

14個複雜資料視覺化的奇妙例子

摘要: 根據IDC資料,2015年全球資料量的年增長率可達到5.6澤位元組(即5.6萬億兆位元組),是2012年增長率的兩倍。這意味著太多要理解吸收的信息,特別是黑白掃描文件或者沒有乏味的長達50頁的pdf。而大腦對可視化圖像的處理速 ...
根據IDC資料,2015年全球資料量的年增長率可達到5.6澤位元組(即5.6萬億兆位元組),是2012年增長率的兩倍。
這意味著太多要理解吸收的信息,特別是黑白掃描文件或者沒有乏味的長達50頁的pdf。而大腦對可視化圖像的處理速度要比文字快60,000倍,可以讓人更容易理解資料的意義。
而且文本資料中沒有發現的模式、趨勢和相關關係可以很容易通過資料視覺化顯示或識別出來。
雖然如此,複雜資料視覺化仍然可能是令人困惑的。
我們將在本文中曆數14個複雜資料視覺化的奇妙例子。開始吧!
1.彭博億萬富翁(Bloomberg Billionaires):每日世上最富有人排名

它是什麼?
這個互動式指數是每日世上最富有人的排名,並根據市場動態、經濟和彭博新聞報道(Bloomberg News)動態變化。資料在周一到周五的美國東部標準時間下午5:30更新。
探索
彭博社使資料更容易瀏覽的方法有:排名、曲線圖、地圖。你可以通過以下過濾搜索:
行業
國籍
性別
年齡、
財富來源。
點擊億萬富翁的頭像,就會彈出這個人的信息。
2.彭博社最好和最差(Bloomberg Best and Worst)

它是什麼?
在你看到彭博社最好和最差可視化資料前你不會看到這麼多資料:彭博社排名團隊分析、組織和可視化的資料都展現給你,並且只包含沒有編輯調整或帶有觀點的透明、基於事實的資料。
資料從哪裡來?
資料由彭博社排名團隊( Bloomberg Rankings team)分析、組織和可視化。
探索
你可以按照以下主題排序:
商業
經濟
教育
投資
生活方式
個人理財
政治政策
或者按照以下實體排序:
職業
公司
投資學

地方
學校
其他
3. State-by-State

它是什麼?
State-by-State可視化美國當前及歷史的經濟資料和分析。基於美國經濟健康指數,State-by-State每月更新最新的美國勞工統計局國家失業率。這個可視化還包含住房供給、醫療保健、能源生產和人口統計資料等等。
資料從哪裡來?
據該網站,「可視化美國當前和歷史經濟資料和分析,基於經濟健康指數State-by-State包含來自美國勞工統計局的最新失業人數(每月更新),以及住房供給、醫療保健、能源生產和人口統計資料等的現狀資料。」
探索
你對選定的資料集進行任意排序,查看隨時間變化的趨勢。資料可追溯至2000年。
4.The dude map:美國人是怎樣提到兄弟

它是什麼?
這個有趣的可視化是關於美國人多經常使用「兄弟(dude)」這個詞。它高亮顯示了美國地區中使用「兄弟(dude)」比「朋友(pal)」或者「夥伴(buddy)」更多更流行的地區。
資料從哪裡來?
推特的位置資料。
探索
可以用」bro」, 「buddy」, 「dude」, 「fella」和 「」pal」來過濾地圖。
5. 話題#每天每時(#Everyday Moments Beta)

它是什麼?
推特創建了這個動態可視化,來顯示英國和愛爾蘭正常一周關於每天每時的推特。它不是實時的資料圖形,只顯示2014年1月1日到1月4日間推特分享增加的速度。
資料從哪裡來?
英國和愛爾蘭用戶發布的加了地理標記的推特,只佔所有推特中很小一部分。
探索
你可以探索關於以下話題的會話:
早晨、交通、食物飲料、寵物、音樂、小吃、娛樂、家庭活動、形容詞、教育、運動、鍛煉、假期、工作、TV、晚上
6實時零售(Retail in Real Time)

它是什麼?
這個可視化通過顯示美國人花現金的速度增加有多快,來告訴你美國人花現金的方式和地點。因為對美國流行的消費支出可視化感興趣,Retale創建了Retail in Real Time。
探索
包括以下不同類別:
紙質書、電子書、麥當勞、智能手機、沃爾瑪、亞馬遜、唐恩都樂、星巴克、百思買、7-11、信用卡交易、可口可樂服務、優惠券、彩票、服裝、寵物食品、嬰兒食品、玩具、槍支
7. A Light Year

它是什麼?
這個網站就像一個日曆,顯示太陽的一束光線旅行一年會經過哪些事物。
8. Pistats.io

它是什麼?
我喜歡這個超級簡單把你的個人信息資料視覺化的工具。使用Gmail賬戶登錄後,就可以:
計算你每月在Uber和Lyft(譯者註:均為打車軟體)上的花費;
告訴你哪些天使用Uber和Lyft最多;
在地圖上顯示你的乘坐路線;
資料從哪裡來?
Pistats.io從你的郵箱獲取Uber和Lyft賬單信息,並轉化成特定的資料集。
9.Major League Baseball Franchise Valuations

它是什麼?
這個可視化是彭博新聞社九個月的工作成果,它分解了不同球隊間的差異。構成聯盟30個球隊價值的不同因素有哪些?
棒球活動
企業價值
授權
有線電視
數字媒體
信心評級
資料從哪裡來?
據該網站,「彭博新聞設在計算美國職業棒球大聯盟球隊價值時,使用資料涉及門票收入、授權、贊助和廣播權,以及電視頻道、廣播電台和房地產的收益。」
10.College Speaker Fees

圖中標題:你在佛羅里達州的六度分隔值為¥70,000
圖中黃字:從2013年開始,佛羅里達的州立大學花錢聘請代言人
它是什麼?
基於彭博社的調查,可視化結果顯示了佛羅里達的大學在通過學生審核在請代言人上的花費。
資料從哪裡來?
資料源來自彭博社調查。
11.網際網路圖

它是什麼?
「網際網路圖用二維圖呈現了網際網路上網站之間的關係。每一個網站是地圖上的一個圓圈,圓圈的大小由網站流量決定,流量越大,圓圈越大。用戶通過鏈接在網站間的跳轉決定了圓圈間的關係,跳轉越頻繁的網站在圖上圓圈距離越近。
資料從哪裡來?
統計資料來自Alexa。
12.Redditviz

它是什麼?
Redditviz是網際網路的首頁——Reddit(譯者註:社交新聞網站)的互動式地圖。因為Reddit網太大了,存在一些你可能永遠不會發現的子頁面。Redditiviz就是基於用戶行為的子頁面關係,生成的可視化網站地圖,而且比Reddit本身的導航更有效。演演算法跟蹤了用戶在過去八個月通過他們網路發布的帖子。如果存在比較大的趨勢,比如說1000個人經常在兩個子頁面上發帖,那麼演演算法就在地圖上生成兩個子頁面的關聯。
13.Renting vs. Buying

它是什麼?
紐約時報圖形部門的編輯和D3.js(譯者註:一個基於資料操作文檔JavaScript庫)的創始人Mike Bostock 設計了一個交互資料計算器,給考慮買房用戶提供一個成本利益分析。可視化圖顯示了最主要的購房成本,並計算等價的每月租金。
資料從哪裡來?
資料來源包括穆迪首席分析師Mark Zandi,聯邦儲備經濟資料庫 、聖路易斯聯邦儲備銀行、Miller Samuel公司的Jonathan J. Miller。
14.An Interactive Visualization of NYC Streets

它是什麼?
這個可視化源自創始人很好奇紐約市五個區有哪些常見和不常見的樹木,於是從紐約市的公開資料抽取資料而來。
資料從哪裡來?
這個可視化資料來自紐約市公開資料。
4500+企業選擇FineReport報表與 BI ]商業智慧工具【免費下載】
opensource開發,類excel設計,全方位異質資料庫整合,資料填報、Flash列印、權限控制、行动應用、客制化、交互分析、報表協同作業管理系統。
分享自:36大数据

2015年11月5日星期四

傳統企業如何挖掘自身巨量資料的價值 ?

當前,傳統(非互聯網類)企業已認識到巨量資料的價值,但如何結合企業現狀有效應用巨量資料,仍普遍存在著迷茫。針對這種現狀,下文基於企業巨量資料應用的相關服務經驗,提出一些可行性的思路和建議,供企業客戶了解和實施。
本文內容適合擁有較多客戶資源(ToC和部分ToB)和內部資料的大中型企業,對擁有大量企業/個人管理資料的政府機構(如稅務)的巨量資料應用也有借鑒意義。
一、企業最有價值的資料在哪裡
巨量資料的價值基礎來自於資料,對於企業最有價值的資料,我們認為有兩點:
1)內部業務巨量資料(而非外部巨量資料)具有最高的應用價值
企業的巨量資料,從來源講可分為內部(自身業務生產經營環節產生的所有資料)和外部(來自外部,如第三方/互聯網)。當前企業熱衷於引入來自外部的巨量資料(如互聯網/電商/移動互聯網)和相關服務應用,而忽視了一個事實:現有的內部業務巨量資料才是最大的價值挖掘目標。
大中型企業在信息化與資料應用過程中,大都已經完成了第一階段(信息化系統建設與業務資料採集的自動化/常態化)的工作。多年來建立的各種業務信息系統已積累了大量業務資料。而進入第二階段(挖掘資料提升企業業務經營管理)後,卻進度緩慢。相比外部資料,內部業務資料體量大,內容多樣,時間跨度長,是企業巨量資料的主體。因其與企業特性直接相關,深入覆蓋經營的各個環節,其對企業的價值遠大於各種外部資料。然而,這些資料很少發揮出應有的價值,大都沉睡在那裡,甚至成為負擔。
2)內部業務巨量資料中,應優先關注服務客戶相關的資料
企業內部業務巨量資料,如果按邏輯屬性劃分,可分為兩大類:
1) 產品/服務相關: 圍繞企業產品/服務相關的(研發/設計/原材料/生產/製造/反饋)的資料
2)服務客戶相關: 圍繞著目標客戶(可為B或者C)的相關(售前/銷售/客服/運維/活動/CRM等等)資料
以上兩類資料中,服務客戶相關的業務行為對企業經營影響巨大。其資料也是企業內部巨量資料的主體,應優先作為內部巨量資料挖掘應用的目標。
二、實施的流程
下面,針對企業最有價值的內部業務資料集,結合消費者研究與標籤化研究方法,我們來介紹如何有效挖掘其巨量資料價值的機制。
首先我們給出一個主要的流程,後續將對每個步驟進行詳細說明。
Step1總體體系設計: 對現有內部資料進行重構設計
對現有的業務資料體系,結合實際情況與未來的應用目標,重新進行資料組織和規劃。過程中要關注兩點:
要點1:資料的組織,要從功能為中心轉向以客戶為中心(按生命期階段組織)。企業內部業務資料,當前大多是以業務功能(系統)為中心組織,相互間未充分打通。用於價值挖掘的業務資料,要以每個客戶為中心,以用戶生命期為線,將其所有業務功能階段的資料串起來。
要點2:以類標籤化的思想建立客戶的資料描述體系,作為未來全景資料整合的框架。描述體系的來源資料不僅有內部資料,也包含外部資料(輔助)。實際的資料整合處理將基於該體系進行:已有的資料可直接引入,缺失資料內容作為後續採集/外購的主要目標。
以某車企客戶為例,其相關的巨量資料,對應由9大內部業務系統產生,各自獨立。在資料體系重構整合中,重構的示意圖如下:

Step2 資料整合集中 :對現有資料進行實際整合,建立一個統一巨量資料平台
基於step1得到的規劃方案,對現有的業務資料通過技術手段從各業務系統整合到統一巨量資料平台上。該平台作為資料分析平台,與生產業務系統分離,提供對資料倉庫/結構化/非結構化資料的支持。
整合中要注意:
(1) 資料模型的設計以及資料ETL(清洗/轉化),都需要以客戶為中心進行統一規劃
(2) 充分考慮新資料體系中缺失/不足的資料內容未來的融入和整合機制。
Step3 標籤化分析 : 對客戶進行全方位標籤化資料分析,生成標籤化描述結果
在step2整合得到的以用戶為中心的多維度資料空間上,基於消費者研究與業務特性建立用戶標籤體系,並對客戶進行實際的標籤化分析。標籤體系的定義,要兼顧用戶基本信息、業務特點和未來應用的目的,並不斷擴展。
比如前述的車企客戶,對用戶標籤,已經定義了如下幾類:基本屬性(性別、年齡段、購買能力、職業階層…)、家庭情況(家有兒童,第二輛車)、車型/駕駛偏好(如偏好SUV 、注重安全性.、追求速度感…)、配件關注點(喜歡原裝、喜歡功能性配件)、內裝偏好、保養習慣、參與活動偏好、觸媒習慣等。
Step4 業務實際應用/挖掘: 通過業務活動,進行客戶巨量資料價值的實際挖掘和應用
對所有客戶分析得到標籤化描述結果,可通過統一的客戶分析平台,提供給企業內部所有部門實際應用。各部門可根據實際業務需要,通過標籤靈活準確篩選目標客戶(如市場部可以查找80後家有兒童且購買能力強的目標客戶做MPV家用車型推廣),或發現產品客戶群的深層特性(產品設計部門可分析車型的目標客戶與實際購買客戶是否一致)。
4500+企業選擇FineReport報表與 BI 商業智慧工具【免費下載】
opensource開發,類excel設計,全方位異質資料庫整合,資料填報、Flash列印、權限控制、行动應用、客制化、交互分析、報表協同作業管理系統。
分享自:hong

2015年11月3日星期二

對於工具功能的學習

摘要:
雙十一即將來臨,伴隨著銷售量的一路上升,各類資料也接踵而來。適當的統計分析可以提取有用信息、形成有效結論,這一過程的良好操作對於店鋪的持久發展意義非凡。

資料分析是一個加強對工具運用的階段,因此對於工具功能的學習十分重要,但其又不僅是使用工具的過程,更需要明確的思路去讓資料處理變得更加高效。做資料分析第一個要做的就是明確分析目的。這一個明確目的的來源,就是基於對於自身業務的理解。業務也是資料分析四要素中的f第一要素,沒有業務的理解,一切都還只是空談。
現在來拋出一些問題,比如要進行一個價格段的觀察,這應該是很多朋友對寶貝進行定價,包括一些做什麼價位段產品的規劃等很多情況下的一個需求。正確的一個價位段的分析,可以避免陷入一個被動,否則陷入一個進退兩難的地步。
有了一個目的,第二步的一個工作就是尋找相對應的一個資料源,需要去尋找不同價位段的一些指標情況的資料源。

這邊有一個關於各種客單價的一個情況:

接下來就可以進行一個透視了, 但是就像那句網路用語一樣,並沒有什麼用,這樣的價格,有好幾百個,看著就頭疼。這並不是想要的結果,所以工具除了節約時間之外,另外的好處也漸漸顯現出來,那就是更加可視化。

先給大家看結果, 這樣的一個結果給到大家就比較清楚,每一個階段的價格做一個匯總。可以很清楚明白的看到想要的結果。每一個價格段都可以清楚明白的了解一個具體的被關注數量,也可以一眼能看出,這個類目的產品,哪一個價位段的是更受人們關注,當然,這個肯定不限於關注人數,也可以是收藏人數,搜索點擊次數等一系列的資料,都可以用這個方法來進行一個觀察。
接下來,就分享一下這樣的內容是怎麼做到的。

先隨機點中客單價這一列中的任意一個單元格,記得要是客單價這一列中的某一個單元格,然後右鍵,這時候會有一個創建組:

點擊這個按鍵:

這邊可以看到3個框,分別解釋一下都代表什麼含義。第一個框,默認值為資料那一列的值的一個最小值,第二個框代表的是一個最大值。最後一個框的話,代表的就是一個價格段的區間,10,20,50的一個金額區間都是可以自由選擇的,可以自己點默認的設置。但是從中可以明顯看到,默認設置不夠美觀,因此更多的自主的進行一個價格段的設置,這裡已經知道低級價在133,那可以設置130,最高價可以設置為300,步長為10的話,就是剛才做的情況,步長也可以是20,結果就是:

雖然最後上限會強制變成310,但是並不影響我們的一個觀看。
4500+企業選擇FineReport報表與 BI 商業智慧工具【免費下載】
opensource開發,類excel設計,全方位異質資料庫整合,資料填報、Flash列印、權限控制、行动應用、客制化、交互分析、報表協同作業管理系統。
分享自:馭寶雲天

2015年11月2日星期一

突破性資料分析是新商業模式成功的關鍵

摘要: 具有全新商業模式的OTT內容服務商帶來的破壞威脅著通信服務提供商的傳統收入來源,從商品服務轉向增值服務是阻止通信服務提供商利潤流失的關鍵。不斷變化的格局所造成的不確定性和破壞要求通信服務提供商快速建立新 ...
具有全新商業模式的OTT內容服務商帶來的破壞威脅著通信服務提供商的傳統收入來源,從商品服務轉向增值服務是阻止通信服務提供商利潤流失的關鍵。不斷變化的格局所造成的不確定性和破壞要求通信服務提供商快速建立新的業務和運營模式,並尋找替代的收入來源。
對於大多數通信服務提供商而言,找到正確解決方案的關鍵近在咫尺。每個電信運營商都擁有非常寶貴的龐巨量資料源。而他們所面臨的挑戰是探索如何利用這些豐富的信息以實現最大的價值——包括在選擇正確的技術組合時做出明智、戰略性的決策。
如何充分利用豐富的資料
過去,運營商沒有充分利用其所掌握的資料帶來的優勢。通過利用資料的價值,通信服務提供商現在可以創造新的收入,以抵消傳統業務的商品化並在OTT市場中參與競爭。它也有可能使通信服務提供商在現有用戶群的基礎上尋找交叉銷售和追加銷售的機會。
情境感知型巨量資料應用讓通信服務提供商成為數字價值鏈的核心。通過將實時監控信息(如用戶位置、興趣和活動)與人口統計學相關的知識(如用戶關係管理信息、用戶習慣和用戶偏好)相結合,通信服務提供商能夠擁有全新的營銷力量。
在以下三個核心領域裡,通信服務提供商可以最大限度地發揮資料的價值:第一,利用巨量資料,以提高用戶忠誠度為目標來確定產品和定價,並根據用戶的個人需求提供個性化體驗;第二,利用網路和IT資料來提高運營效率,改善用戶體驗效果;第三,使用運營商的資料來確定新的商業模式、尋找與OTT服務提供商的合作機會,豐富用戶服務,增加用戶收入。
對於通信服務提供商而言,機會近在眼前,那就是要融入數字價值鏈,而不僅僅是停留在一個網路基礎架構提供商的層面上。
尋找以客戶為中心的巨量資料
憑藉豐富的可用資料,能夠充分利用資料分析全部價值的通信服務提供商將最有機會獲得成功。通過更有效地分析以下資料,通信服務提供商應努力改善用戶體驗並創造新的收入來源:第一,網路資料,通過分析使用記錄、性能監測、故障監測和呼叫管理資料,發現優化機會,以獲得更好的網路性能;第二,網路註冊、運營支持系統和計費系統的用戶資料;第三,應用程序資料,充分利用非結構化資料(如流量分析、網路/搜索/簡訊/電子郵件、社交媒體、移動應用和設備資料)的價值;第四,市場資料,更好地了解客戶,包括個人資料、人口統計資料和細分情況。
利用資料分析提高服務質量
從本質上看,用戶體驗和用戶關係維繫取決於服務質量。然而,隨著設備和應用的快速發展,以及網路容量所遭受的壓力,保持始終如一的服務交付面臨重大挑戰。定義關鍵績效指標因此顯得至關重要。這些指標需要反映卓越的用戶體驗以支持規劃和服務交付,並提供可衡量的結果以評估績效。
資料分析在服務質量和容量規劃方面發揮著重要的作用:第一,有效的分析平台能夠監測網路性能、預測服務故障,並降低意外停機的風險;第二,趨勢分析能夠定點預測帶寬增加,從而在需要加大容量的地方增加帶寬投資;第三,巨量資料技術能夠幫助優化資料路由和帶寬,尤其是出現臨時的峰值需求時。
重點關注用戶價值
試想一下,如果巨量資料分析能夠時時洞察用戶的使用模式、偏好和興趣,那會怎樣?這些信息能夠幫助通信服務提供商利用這些機會,並與新的OTT供應商更有效地合作。而現實的情況是,很少有通信服務提供商在資料分析方面擁有一致的方法,或在核心的領域都具備分析技能。
其實並不是簡單地提高用戶體驗的平均水平,一種可能的做法是關注具體用戶的終生價值,為其提供最佳的投資回報。資料分析應該著眼於以下幾個方面:第一,更加個性化、創新和高效的服務和產品。這些將提高用戶滿意度,減少用戶流失,並增加每個用戶的平均收入。第二,豐富翔實的單一用戶視圖,以更好地實現用戶高級細分、有針對性的激勵機制和市場活動、價格方案優化、更高的運營效率、更低的運營成本、更快的響應時間和更優質的用戶服務。總之,經營狀況和盈利狀況的改善,以及卓越的用戶體驗是衡量項目成功與否的關鍵指標。
涵蓋所有用戶群的方法
利用資料分析來提升用戶體驗的一個有效方法是在全公司範圍內、跨越各個職能部門來實施。它需要一個全面的視角,能夠連接公司的各個業務職能部門(如市場和產品)以及技術職能部門(如IT和網路操作)。為了取得清晰的業務成果必須定義一個清晰的角色,接納來自不同部門的限制、職責和流程。
通過進行業務影響分析(包括資本和運營開支、量化的成本節省和直接的收入增長),通信服務提供商能夠對新舉措的效果進行評估。這些舉措帶來的收益和影響可以在整個企業的各個部門得到量化,包括運營和網路部門,以及市場和客戶服務團隊。
對於關鍵的績效指標來說,行業標準是最為關鍵的,因為通過它們可以對成本節省、收入和利潤的增加、運營效率和用戶體驗進行量化。為了每一項技術投資都需要進行業務影響分析,以影響決策制定,並證明用戶體驗管理解決方案是如何影響贏利的。
做出正確的技術選擇
技術正在為通信服務提供商開闢一個新的世界,以前所未有的方式將他們與用戶連接起來。但對於保持和贏得用戶並滿足其不斷變化的需求來說,僅僅投資最新的尖端技術是遠遠不夠的。為了理解和預測用戶的喜好,通信服務提供商必須充分利用海量資料,並有效地通過資料分析來使用它,以保持競爭力。
此外,必須明確地規划出優先事項。這樣一來,通信服務提供商才能夠對正確的技術進行正確的投資,隨時隨地為用戶提供適當的服務。只有這樣,他們才能實現真正卓越的用戶體驗。
4500+企業選擇FineReport報表與 BI 商業智慧工具【免費下載】
opensource開發,類excel設計,全方位異質資料庫整合,資料填報、Flash列印、權限控制、行动應用、客制化、交互分析、報表協同作業管理系統。
分享自:爱数据