2015年1月31日星期六

牙尖上的大數據:從牙齒看美國經濟滑坡

世紀鐘聲剛過不久,大數據威力初顯。大數據與雲計算的關係就像一枚硬幣的正反面一樣密不可分。如今我們的生活已經和大數據分析息息相關,無論是美劇《紙牌屋》的火熱還是「啤酒與尿布」的經典案例都在提醒著我們:大數據分析並改造了我們的生活。那麼,牙齒又是如何與大數據發生關聯的呢?

        這還得從美國的牙齒文化說起,在美國人眼裡,牙齒可不僅僅是用來吃飯的工具,而是已經成了儀錶美的一部分。他們的觀念是牙齒的整潔和口腔的衛生是一種文明的象徵,在交際中,牙齒不整潔會被人看不起,甚至會影響到求職就業。
        美國人對自己的一口牙齒的確照顧得非常周到。美國牙醫學會向人們的建議是,每隔半年要洗一次牙、做一次牙齒檢查等,一般來說一半以上的美國人都會做到這一點。甚至很多富裕的美國人每3到4個月就要看一次牙醫。所以,看牙醫對美國人來說是一個經常化的行為,商業情報軟體Sikka正是基於此收集到的數據來分析美國的經濟狀況的。
牙尖上的大數據:從牙齒看美國經濟滑坡
        該公司從2008年就開始致力於這件事,並著手於分析研究與美國經濟的關係。2014年美國人從牙科診所那裡購買的牙冠、牙罩冠及牙齒植入物數量出現下降。而這不能夠歸咎於互聯網的發展,移動互聯網並沒有把牙醫也搬到網上來。
Sikka數據統計
牙尖上的大數據:從牙齒看美國經濟滑坡
        Sikka總共對12200家牙科診所進行了數據分析,通過三種不同的形式,發現由於經濟不景氣,美國人錢包羞澀,所以看牙的頻率和購買都出現了下降。
        雖然如此,Sikka認為2014年對於美國來說,是處在復甦的階段。當人們正在經歷經濟不好的時代時,人們都不會想到去牙醫那裡預約,這是基於2008年經濟危機以來的認識。
        筆者不由想起中國的大眾們,看牙醫者少之又少,這不正好說明在經濟問題上,中美之間的差距嗎?大數據可以管中窺豹,由此可見一斑。

FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel。官網:http://www.finereport.com/tw/

大數據、機器學習和數據挖掘面試指導

目錄
機器學習、大數據相關崗位的職責
面試問題
答題思路
準備建議
總結
自己的專業方向是機器學習、數據挖掘,就業意向是互聯網行業與本專業相關的工作崗位。各個企業對這類崗位的命名可能有所不同,比如數據挖掘/自然語言處理/機器學習演算法工程師,或簡稱演算法工程師,還有的稱為搜索/推薦演算法工程師,甚至有的併入後台工程師的範疇,視崗位具體要求而定。
機器學習、大數據相關崗位的職責
自己參與面試的提供演算法崗位的公司有 BAT、小米、360、飛維美地、宜信、猿題庫 等,根據業務的不同,崗位職責大概分為:
1、平台搭建類
數據計算平台搭建,基礎演算法實現,當然,要求支持大樣本量、高維度數據,所以可能還需要底層開發、並行計算、分布式計算等方面的知識;
2、演算法研究類
文本挖掘,如領域知識圖譜構建、垃圾簡訊過濾等;
推薦,廣告推薦、APP 推薦、題目推薦、新聞推薦等;
排序,搜索結果排序、廣告排序等;
廣告投放效果分析;
互聯網信用評價;
圖像識別、理解。
3、數據挖掘類
商業智能,如統計報表;
用戶體驗分析,預測流失用戶。
以上是根據本人求職季有限的接觸所做的總結。有的應用方向比較成熟,業界有足夠的技術積累,比如搜索、推薦,也有的方向還有很多開放性問題等待探索,比如互聯網金融、互聯網教育。在面試的過程中,一方面要儘力向企業展現自己的能力,另一方面也是在增進對行業發展現狀與未來趨勢的理解,特別是可以從一些剛起步的企業和團隊那裡,了解到一些有價值的一手問題。
以下首先介紹面試中遇到的一些真實問題,然後談一談答題和面試準備上的建議。
面試問題
1、你在研究/項目/實習經歷中主要用過哪些機器學習/數據挖掘的演算法?
2、你熟悉的機器學習/數據挖掘演算法主要有哪些?
3、你用過哪些機器學習/數據挖掘工具或框架?
4、基礎知識
無監督和有監督演算法的區別?
SVM 的推導,特性?多分類怎麼處理?
LR 的推導,特性?
決策樹的特性?
SVM、LR、決策樹的對比?
GBDT 和 決策森林 的區別?
如何判斷函數凸或非凸?
解釋對偶的概念。
如何進行特徵選擇?
為什麼會產生過擬合,有哪些方法可以預防或克服過擬合?
介紹卷積神經網路,和 DBN 有什麼區別?
採用 EM 演算法求解的模型有哪些,為什麼不用牛頓法或梯度下降法?
用 EM 演算法推導解釋 Kmeans。
用過哪些聚類演算法,解釋密度聚類演算法。
聚類演算法中的距離度量有哪些?
如何進行實體識別?
解釋貝葉斯公式和樸素貝葉斯分類。
寫一個 Hadoop 版本的 wordcount。
……
5、開放問題
給你公司內部群組的聊天記錄,怎樣區分出主管和員工?
如何評估網站內容的真實性(針對代刷、作弊類)?
深度學習在推薦系統上可能有怎樣的發揮?
路段平均車速反映了路況,在道路上布控採集車輛速度,如何對路況做出合理估計?採集數據中的異常值如何處理?
如何根據語料計算兩個詞詞義的相似度?
在百度貼吧里發布 APP 廣告,問推薦策略?
如何判斷自己實現的 LR、Kmeans 演算法是否正確?
100億數字,怎麼統計前100大的?
……
答題思路
1、用過什麼演算法?
最好是在項目/實習的大數據場景里用過,比如推薦里用過 CF、LR,分類里用過 SVM、GBDT;
一般用法是什麼,是不是自己實現的,有什麼比較知名的實現,使用過程中踩過哪些坑;
優缺點分析。
2、熟悉的演算法有哪些?
基礎演算法要多說,其它演算法要挑熟悉程度高的說,不光列舉演算法,也適當說說應用場合;
面試官和你的研究方向可能不匹配,不過在基礎演算法上你們還是有很多共同語言的,你說得太高大上可能效果並不好,一方面面試官還是要問基礎的,另一方面一旦面試官突發奇想讓你給他講解高大上的內容,而你只是泛泛的了解,那就傻叉了。
3、用過哪些框架/演算法包?
主流的分布式框架如 Hadoop,Spark,Graphlab,Parameter Server 等擇一或多使用了解;
通用演算法包,如 mahout,scikit,weka 等;
專用演算法包,如 opencv,theano,torch7,ICTCLAS 等。
4、基礎知識
個人感覺高頻話題是 SVM、LR、決策樹(決策森林)和聚類演算法,要重點準備;
演算法要從以下幾個方面來掌握
產生背景,適用場合(數據規模,特徵維度,是否有 Online 演算法,離散/連續特徵處理等角度);
原理推導(最大間隔,軟間隔,對偶);
求解方法(隨機梯度下降、擬牛頓法等優化演算法);
優缺點,相關改進;
和其他基本方法的對比;
不能停留在能看懂的程度,還要
對知識進行結構化整理,比如撰寫自己的 cheet sheet,我覺得面試是在有限時間內向面試官輸出自己知識的過程,如果僅僅是在面試現場才開始調動知識、組織表達,總還是不如系統的梳理準備;
從面試官的角度多問自己一些問題,通過查找資料總結出全面的解答,比如如何預防或克服過擬合。
5、開放問題
由於問題具有綜合性和開放性,所以不僅僅考察對演算法的了解,還需要足夠的實戰經驗作基礎;
先不要考慮完善性或可實現性,調動你的一切知識儲備和經驗儲備去設計,有多少說多少,想到什麼說什麼,方案都是在你和面試官討論的過程里逐步完善的,不過面試官有兩種風格:引導你思考考慮不周之處 or 指責你沒有考慮到某些情況,遇到後者的話還請注意靈活調整答題策略;
和同學朋友開展討論,可以從上一節列出的問題開始。
準備建議
1、基礎演算法複習兩條線
材料閱讀 包括經典教材(比如 PRML,模式分類)、網上系列博客(比如 研究者July),系統梳理基礎演算法知識;
面試反饋 面試過程中會讓你發現自己的薄弱環節和知識盲區,把這些問題記錄下來,在下一次面試前搞懂搞透。
2、除演算法知識,還應適當掌握一些系統架構方面的知識,可以從網上分享的阿里、京東、新浪微博等的架構介紹 PPT 入手,也可以從 Hadoop、Spark 等的設計實現切入。
3、如果真的是以就業為導向就要在平時注意實戰經驗的積累,在科研項目、實習、比賽(Kaggle,Netflix,天貓大數據競賽等)中摸清演算法特性、熟悉相關工具與模塊的使用。
總結
如今,好多機器學習、數據挖掘的知識都逐漸成為常識,要想在競爭中脫穎而出,就必須做到
保持學習熱情,關心熱點;
深入學習,會用,也要理解;
在實戰中歷練總結;
積极參加學術界、業界的講座分享,向牛人學習,與他人討論。
最後,希望自己的求職季經驗總結能給大家帶來有益的啟發。

FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel。官網:http://www.finereport.com/tw/

2015年1月29日星期四

十個有趣的「大數據」經典數據挖掘案例

馬雲說:互聯網還沒搞清楚的時候,移動互聯就來了,移動互聯還沒搞清楚的時候,大數據就來了。近兩年,「大數據」這個詞越來越為大眾所熟悉,「大數據」一直是以高冷的形象出現在大眾面前,面對大數據,相信許多人都一頭霧水。下面我們通過十個經典案例,讓大家實打實觸摸一把「大數據」。你會發現它其實就在身邊而且也是很有趣的。

啤酒與尿布
全球零售業巨頭沃爾瑪在對消費者購物行為分析時發現,男性顧客在購買嬰兒尿片時,常常會順便搭配幾瓶啤酒來犒勞自己,於是嘗試推出了將啤酒和尿布擺在一起的促銷手段。沒想到這個舉措居然使尿布和啤酒的銷量都大幅增加了。如今,「啤酒+尿布」的數據分析成果早已成了大數據技術應用的經典案例,被人津津樂道。
數據新聞讓英國撤軍
2010年10月23日《衛報》利用維基解密的數據做了一篇「數據新聞」。將伊拉克戰爭中所有的人員傷亡情況均標註於地圖之上。地圖上一個紅點便代表一次死傷事件,滑鼠點擊紅點後彈出的窗口則有詳細的說明:傷亡人數、時間,造成傷亡的具體原因。密布的紅點多達39萬,顯得格外觸目驚心。一經刊出立即引起朝野震動,推動英國最終做出撤出駐伊拉克軍隊的決定。
意料之外:胸部最大的是新疆妹子
淘寶數據平台顯示,購買最多的文胸尺碼為B罩杯。B罩杯佔比達41.45%,其中又以75B的銷量最好。其次是A罩杯,購買佔比達25.26%,C罩杯只有8.96%。在文胸顏色中,黑色最為暢銷。以省市排名,胸部最大的是新疆妹子。
QQ圈子把前女友推薦給未婚妻
2012年3月騰訊推出QQ圈子,按共同好友的連鎖反應攤開用戶的人際關係網,把用戶的前女友推薦給未婚妻,把同學同事朋友圈子分門別類,利用大數據處理能力給人帶來「震撼」。
「魔鏡」預知石油市場走向
如果你對「魔鏡」還停留在「魔鏡魔鏡,告訴我誰是世界上最美的女人」,那你就真的out了。「魔鏡」不僅僅是童話中王后的寶貝,而且是真實世界中的一款神器。其實,「魔鏡」是蘇州國雲數據科技公司的一款牛逼的大數據可視化產品,而且是國內首款喔。
在現在,「魔鏡」可以通過數據的整合分析可視化不僅可以得出誰是世界上最美的女人,還能通過價量關係得出市場的走向。在不久前,「魔鏡」幫助中石等企業分析數據,將數據可視化,使企業科學的判斷、決策,節約成本,合理配置資源,提高了收益。
Google成功預測冬季流感
2009年,Google通過分析5000萬條美國人最頻繁檢索的辭彙,將之和美國疾病中心在2003年到2008年間季節性流感傳播時期的數據進行比較,並建立一個特定的數學模型。最終google成功預測了2009冬季流感的傳播甚至可以具體到特定的地區和州。
大數據與喬布斯癌症治療
喬布斯是世界上第一個對自身所有DNA和腫瘤DNA進行排序的人。為此,他支付了高達幾十萬美元的費用。他得到的不是樣本,而是包括整個基因的數據文檔。醫生按照所有基因按需下藥,最終這種方式幫助喬布斯延長了好幾年的生命。
奧巴馬大選連任成功
2012年11月奧巴馬大選連任成功的勝利果實也被歸功於大數據,因為他的競選團隊進行了大規模與深入的數據挖掘。時代雜誌更是斷言,依靠直覺與經驗進行決策的優勢急劇下降,在政治領域,大數據的時代已經到來;各色媒體、論壇、專家鋪天蓋地的宣傳讓人們對大數據時代的來臨興奮不已,無數公司和創業者都紛紛跳進了這個狂歡隊伍。
微軟大數據成功預測奧斯卡21項大獎
2013年,微軟紐約研究院的經濟學家大衛•羅斯柴爾德(David Rothschild)利用大數據成功預測24個奧斯卡獎項中的19個,成為人們津津樂道的話題。今年羅斯柴爾德再接再厲,成功預測第86屆奧斯卡金像獎頒獎典禮24個獎項中的21個,繼續向人們展示現代科技的神奇魔力。
超市預知高中生顧客懷孕
明尼蘇達州一家塔吉特門店被客戶投訴,一位中年男子指控塔吉特將嬰兒產品優惠券寄給他的女兒——一個高中生。但沒多久他卻來電道歉,因為女兒經他逼問後坦承自己真的懷孕了。塔吉特百貨就是靠著分析用戶所有的購物數據,然後通過相關關係分析得出事情的真實狀況。
FineReport[url=http://www.finereport.com/tw/products/trial]報表免費下載[/url]——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel。官網:http://www.finereport.com/tw/

2015年1月28日星期三

空間數據挖掘主要方法

1.空間分析方法
利用GIS的各種空間分析模型和空間操作對GIS資料庫中的數據進行深加工,從而產生新的信息和知識。常用的空間分 析方法有綜合屬性數據分析、拓撲分析、緩衝區分析、距離分析、疊置分析、地形分析、趨勢面分析、預測分析等,可發現目標在空間上的相連、相鄰和共生等關聯規則,或發現目標之間的最短路徑、最優路徑等輔助決策知識。

2.統計分析方法
報表工具統計分析一直是分析空間數據的常用方法,著重於空間物體和現象的非空間特性分析。統計方法有較強的理論基礎,擁有大量成熟的演算法。統計方法難以處理字元型數據,需要有領域知識和統計知識,一般由具有統計經驗的領域專家來完成。
3.歸納學習方法
歸納學習方法是從大量的經驗數據中歸納製取一般的規則和模式,其大部分演算法來源於機器學習領域,歸納學習的演算法很 多,如Michaski等的 AQ11,AQ15,洪家榮等的AE1,AE9,Hunt的CLS,Quinlan的ID3,C5.0等,其中最著名的是Quinlan提出的C5.0決策樹演算法。
4.聚類與分類方法
聚類和分類方法按一定的距離或相似性系統將數據分成一系列相互區分的組。常用的經典聚類方法有 Kmean,Kmeriod,ISO DATA等。分類和聚類都是對目標進行空間劃分,劃分的標準是類a內差別最小,類間差別最大。分類和聚類的區別在於分類事先知道類別數和種類的典型特徵,而聚類則事先不知道。
5.探測性的數據分析方法
李德仁、邸凱昌等提出了探測性的數據分析(簡稱EDA)。EDA採用動態統計圖形和動態鏈接窗口技術將數據及統計特 征顯示出來,可發現數據中非直觀 的數據特徵及異常數據。 EDA與空間分析相結合,構成探測性空間分析(exploratory spatial analysis,簡稱ESA)。EDA和ESA技術在數據挖掘中用於選取與問題領域相關的數據子集,並可初步發現隱含在數據中的某些特徵和規律。
6.粗集方法
粗集理論是波蘭華沙大學Z.Pawlak教授在1982年提出的一種智能數據決策分析工具,被廣泛研究並應用於不精 確、不確定、不完全的信息的分類分析和知識獲取。粗集理論為空間數據的屬性分析和知識發現開闢了一條新途徑,可用於GIS資料庫屬性表的一致性分析、屬性的重要性、屬性依賴、屬性表簡化、最小決策和分類演算法生成等。粗集理論與其他知識發現演算法相結合可以在GIS資料庫中數據不確定的情況下獲取多種知識。
7.空間特徵和趨勢探測方法
這是Ester等人在第4屆KDD國際研討會(1998)上提出的基於領域圖 (neighborhoodgraphs)和鄰域路徑 (neighborhoodpath)概念的挖掘演算法。Ester等將一個空間特徵定義為GIS資料庫中具有空間/非空間性質的目標對象集,並以非空間屬性值出現的相對頻率和不同空間對象出現的相對頻率(目標對象集相對於整個資料庫)作為感興趣的性質,從空間目標集合經過它的相鄰擴展後的一個開始點出發,發現一個或多個非空間性質的變化規律。這種演算法的效率在很大程度上取決於其處理相鄰關係的能力。
8.數字地圖圖像分析和模式識別方法
GIS資料庫(數據倉庫)中含有大量的圖形圖像數據,一些圖像分析和模式識別方法可直接用於挖掘數據和發現知識,或 作為其他挖掘方法的預處理方法。 用於圖像分析和模式識別的方法主要有:決策樹(desicion tree)方法、神經元網路(artificial neural net work)方法、數學形態學方法、圖論方法。
9.可視化方法
可視化數據分析技術拓寬了傳統的圖表功能,使用戶對數據的剖析更清楚。例如把資料庫中的多維數據變成多種圖形,這對 提示數據的狀況、內在本質及規律性起到了很強的作用。當顯示SDM發現的結果時,將地圖同時顯示作為背景。一方面能夠顯示其知識特徵的分布規律;另一方面也可對挖掘出的結果進行可視化解釋,從而達到最佳的分析效果。可視化技術使用戶看到數據處理的全過程、監測並控制數據分析過程。為了發現某類知識,常要綜合運用這些方法。數據挖掘方法還要與常規的資料庫技術充分結合,數據挖掘利用的技術越多,得出的結果精確性就越高。
空間資料庫中的知識
基於GIS與遙感應用,一般認為(Li D R. et al., 1994,1997; 邸凱昌等,1996,1997;Han J., 1996; Koperski K. et al, 1996), 可以從空間資料庫中發現的知識有以下8種:
a.普遍的幾何知識(general geometric knowledge)
所謂普遍的幾何知識,是指關於目標的數量、大小、形態特徵等的普遍性知識,如點狀目標的位置、大小等,線狀目標的長 度、大小和方向等,面狀目標的周長、面積、幾何中心等。可以通過計算或統計得出GIS中空間目標某種幾何特徵量的最小值、最大值、均值、方差、中數等,還可以統計出有關特徵量的直方圖等。
b.空間分布規律(spatial distribution regularities)
空間分布規律是指目標在地理空間中垂直向、水平向以及垂直與水平聯合的分布規律。垂直分布是指空間目標沿地理調和的分布,如植被覆蓋與生物多樣性的海拔變化,作物生長的坡度變化等;水平分布是指地物沿地理區域的平面分布,如水稻畝產的區域分異性,基礎設施的城鄉差異等;垂直與水平的聯合分布是指目標的高程和區域方面的同時變化,如風土人情的流域差異性、氣候特徵的地理分異性等。
c.空間關聯規則(spatial association rules)
空間關聯規則是指空間目標的相鄰、相連、共生、包含等關係,如道路與河流的相連,國家與國家的相鄰等。
d.空間分類(聚類)規則(spatial classification/clustering rules)
空間分類規則是根據目標的空間或非空間特徵進行類別劃分的規則;而空間聚類規則是根據目標的聚散程度進行類別劃分的 規則,可用於GIS的空間概括和空間綜合。空間分類和空間的共同之處是:都是對目標空間的再劃分,劃分的標準是類內差別最小而類間差別最大;不同之處是:分類是有導師的 (supervised)而聚類是無導師的,即分類是事先知道類別數和各類的典型特徵,而聚類則事先不知道。
以遙感圖像分析為例,一般性遙感圖像處理是針對一幅圖像或一個試驗區的多幅圖像進行處理和分析,找出某種結論性的東西;而遙感數據挖掘則強調對大量數據的處理、分析和對比,進而找出共性和特性,總結出規律和規則,而這些規律和規則在後續的圖像分析中具有指導作用。
e.空間特徵規則(spatial characteristic rules)
空間特徵規則是指某類或某幾類空間目標的幾何與屬性的普遍特徵,是對共性的描述。比如:」高速公路一般都比較直」、 「高速公路一般6車道」是兩條描述高速公路普遍特徵的空間特徵規則。普遍的幾何知識屬於空間特徵規則的一類,將它分離出來單獨作為一類知識是由於它在遙感影像解譯中有十分重要的作用。
f.空間區分規則(spatial discriminate rules)
空間區分規則特徵是指兩類或多類目標間幾何或屬性的不同特徵,是對個性的描述。」高速公路一般比較直,高等級公路一 般稍彎一些」、」高速公路一般6 車道,高等級公路一般4車道」是兩條描繪高速公路與高等級公路特徵差別的區分規則。它不同於空間分類規則;分類規則是對空間目標進行明確分類,強調的是分類精度,為了保持分類精度,一般在較低的層次進行分類;而區分規則是對已知類別對象的對比,一般是比較高層次上的描述。
g.空間演化規則(spatial evolution rules)
空間演化規則是指空間目標的幾何、屬性特徵隨時間而變化的規律。這一規律的發現必須基於時空資料庫或同一區域的多個時相的數據。
h.面向對象的知識(object oriented knowledge)
它是關於某類複雜對象的子類構成及其普遍特徵的知識。比如對於一個小區對象,由住宅樓、服務樓、幼兒園、綠地、健身區等子類對象構成,相互之間的空間穿插和均衡布局等構成該小區的總體特徵。

2015年1月27日星期二

報表系統的一些知識

報表系統
將計算機技術與會計報表編製方法相結合設計出專門用於報表數據處理的軟體。報表系統是用於統計報表製作及報表及數據填報的企業級報表分析軟體。
作用
報表是企業管理的基本措施和途徑,是企業的基本業務要求,也是實施 BI 戰略的基礎。報表可以幫助企業訪問、格式化數據,並把數據信息以可靠和安全的方式呈現給使用者。
2
   分類編輯EXCEL、WORD等編輯軟體:它們可以做出很複雜的報表格式。但是由於它們沒有定義專門的報表結構來動態的載入報表數據,所有這類軟體中的數據都是已經定義好的,靜態的,不能動態變化的。它們沒有辦法實現報表軟體的「數據動態化」特性。資料庫軟體:它們可以擁有動態變化的數據,但是這類軟體一般只會提供最簡單的表格形式來顯示數據。它們不具備報表軟體能夠實現「格式多樣化」的特性。報表軟體:它們有專門的報表結構來動態的載入數據,同時也能夠實現報表格式的多樣化。
3
報表繪製方式編輯根據報表的繪製方式,報表工具大致可以分為SQL畫布方式,Cell單元格方式和類excel方式:
SQL畫布方式報表工具的特點是將報表水平分割成若干個區域,在各個區域上放置報表組件,報表組件位置可以是任意的,各組件可以互相重疊。畫布式報表工具的優點是可以做到可視化數據綁定,組件位置自由。缺點是插入列、組件對齊困難,畫表格線經常出現線與線之間的錯開現象。這種報表只是很好的解決了「報」的問題,但對於「表」的問題依然存在。比較著名的畫布式報表工具主要有CrystalReport、FastReport、Style Report、ActiveReports等。
CELL單元格式報表工具,是將報表看作是由一系列連續的單元格組成的區域。要改變報表組件(一般是文本或圖形)的位置,只能通過改變行高列寬方式進行,組件之間不能重疊,單元格可以合并。單元格式報表工具的優點是畫線,插入列,多行列標題繪製非常方便,但格子中的動態數據綁定,往往需要手寫公式來進行。這種報表只是很好的解決了「表」的問題,但對於「報」的問題依然存在。F1BOOK、用友華表是這個類型中比較著名的單元格式報表工具。
類excel方式報表工具,融合上面兩種報表工具的特點,使用戶可以可視化地動態綁定數據,也可以象Excel一樣來畫線,從而提高報表設計的效率。在國產報表中,快表、ExcelReport、華丹報表系統、FineReport、皕傑報表、潤乾報表、FlyReport 是屬於這種兩者優勢結合型的報表。
傳統的報表主要以excel為主,而目前的報表比較廣,已經不僅僅局限於excel那種簡單的管理了,現在已經將資料庫跟軟體相結合,用戶只需要錄入數據,就可以得到各種各樣的報表,包括列表、圖表、分組、樹形列表、樹形空間等等,而華丹報表系統就是這類報表的一個成功例子,這個產品融合了10多種報表類型,20多種圖表報表。可以將你的數據以各種各樣的方式顯示出來,方便領導決策,開拓你的產品市場,有意向的可以去他們的官網看看。這種報表系統使用方便,數據永久保存,不會丟失,如果你有分公司的話,效果更加明顯,可以將各個分公司的數據正合到一個報表中,更加準確的將各項數據顯示出來,圖表顯示更形象。當然,這類報表系統市面上越來越多,比如潤乾、飛揚,ET等等,相比之下,飛揚報表更具優勢,他們的產品經過4年的客戶使用驗證,獲得大量好評,非常穩定,使用也方便,用低格的價錢來,享用高品質的軟體,何樂而不為 。
分析型報表工具,有更多分析功能,幫助用戶在展示數據的同時做更多數據的分析功能,譬如Qliktech的Qlikview,SAP的BO,永洪科技的Z-Suite等。使得用戶可以通過分析發現更多內在價值。
4
報表服務編輯企業級報表系統除實現報表繪製、自定義報表開發、通用查詢、即席報表、報表填報、報表分析外,對報表進行遠程管理和維護的報表服務功能,能夠實現負載均衡使得報表軟體可以部署在分布式的集群伺服器上,另外計劃任務、批量處理報表及報表存檔功能,提供了靈活的批量報表生成功能。報表批量處理方式將報表按照許可權分別放到單獨的分頁,報表採用的基於許可權的用戶數據視圖將受到嚴格的許可權控制。

2015年1月26日星期一

Oracle 資料庫實現自增長列

SqlServer 和MySql都有自增長的功能,而Oracle必須接結合sequence序列(一般用於主鍵列),並使用觸發器才能夠實現自動增長,具體步驟如下:

一、            建表
create table list(id number,name varchar2(50));


二、            創建序列

1.        create sequence list_seq
2.        minvalue 1
3.        maxvalue 99999999999999
4.        start with 1
5.        increment by 1
6.        cache 20
7.        order;

http://bbs.chinabyte.com/data/attachment/image/default/default.jpg
                                 
三、            創建觸發器
1.        Create or replace trigger list_tg
2.        Before insert on list
3.        For each row
4.        Begin
5.        Select list_seq.nextval into :new.id from dual;
6.        End;

http://bbs.chinabyte.com/data/attachment/image/default/default.jpg

http://bbs.chinabyte.com/data/attachment/image/default/default.jpg

http://bbs.chinabyte.com/data/attachment/image/default/default.jpg
四、            插入數據
Insert into list values(』』,』aaa』);
Insert into list values(』』,』bbb』);
Select * from list ;
結果為:
   ID     name
   1       aaa
   2       bbb

在Oracle 10g  的em 操作界面按照上圖配置即可實現自增長序列,資料庫端設置完成;
在插入數據時自增長欄位可由空值』 』或null代替,如果insert 語句中列出了所插入的欄位,如insert into list(name) values(』aaa』),則增長欄位不用寫 ;如模板所示為一簡單的表單,ID欄位綁定資料庫中的自增長列,BS填報時,id欄位不輸入若輸入任意數字時,資料庫中都按照自增長的規律進行賦值.

FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel官網:http://www.finereport.com/tw/

2015年1月25日星期日

中國式的報表與商業智能

曾幾何時,報表左上角的小斜線早已成為判別報表製作能力的標準之一,以小斜線為代表的,則是各種格式古怪,但數據卻未必複雜的所謂中國式報表。在繁雜紛呈的中國特色之下,成熟的報表軟體Crystal Report紛紛落馬,幾十種國產報表工具陸續從小作坊中出現,其成功者已經大行其道,直至今天仍然有人打算陸續炮製,增加這個數量。我一直在想,報表需要的到底是什麼?是哪些勾勒的線線框框,還是需要呈現的數據?

放在信息系統之中,卻被複雜表樣框死的報表,與紙質的報表相比到底有什麼更大的用途?難道僅僅是省紙,並且歸檔之後易查找、不易丟失?框死的表樣是否斷絕了以報表信息化轉換作為起點,陸續挖掘信息化給報表應用帶來的其它價值?當然,我們一般說,這不是用戶所要的,用戶需要的只是出幾張報表。

近期因為項目原因,需要了解合并報表,就了解了相關會計準則,也看了看各種合并報表軟體,可惜可供深入了解合并報表軟體的資料極少。但從論壇、顧問等途徑,卻看到了許多自己不認可的觀點。其中之一就是,表並和帳並的問題。有人認為Hyperion、SAP等以往來帳套輔助的帳套合并方式,不滿足合并報表的製作——會計準則規定了合并報表是從個別報表出發,而不是從帳套。我則認為,既然從個別報表經過抵消調整可以完成合并,為什麼他們要採取帳並得方式?顯然,他們不僅僅是為了產生那四張報表及一堆附註。再看看會計準則,字面上講的是個別報表、合并報表等,而實質上則是為了消除內部交易等對集團財務狀況及其變動的影響。我不懂財會,但我想在帳務的層面處理好往來與合并,出幾張合并報表和些許附註應該不困難吧。果真如此的話,我們是否應該想想合并之後,帳並/表並的方式分別給集團帶來什麼額外的價值。當然,我們仍然會說,這不是用戶所要的,用戶需要的只是出幾張合并財務報表。

再回頭看看自己這麼多年所從事的商業智能領域,如果您有心但卻沒有太多時間的話,我建議您只去SAP/BO實驗室看看,看看人家在鼓搗些什麼。而我們所做的呢,則不外乎是倉庫、查詢、報表、門戶等等吧,最多再加上「新」舶來品KPI、DashBoard、ScoreCard等,鸚鵡學舌、老舊膚淺;我們有些人甚至倡導商業智能就是他們的報表系統。而對於巨頭們陸續提倡的搜索集成、分析型主數據管理、協同決策、業務分析等,我們冷靜的認為這些只是他們的又一次忽悠。我們還是會說,這不是用戶所要的,用戶需要的只是堆砌在Web里的表格和圖形。

我們這樣做,原因不外乎有以下幾點:謀求自己業務的生存空間;自己撿的總是別人的剩飯,忽悠不來新東西;國內管理信息化參差不齊,土問題還需土辦法。至於更深層的原因及評判,我沒資格多說,感興趣的話可以揣摩一下這篇文章《商業智能:中外差距到底有多大?》(麥炳),除去某些字面的細節外,其中的觀點我很是贊成,比如管理思想的差異,比如我們只是結果導向,而不重視過程改進和績效優化等。

最後,特別聲明一下:本人並不崇洋迷外;同時本人也是某幾家山寨版BI的始作俑者之一。本文純屬自我鞭策,以求進步,現引用莊子《逍遙遊》的一句話聊以自勉:「適莽蒼者,三餐而反,腹猶果然;適百里者,宿舂糧;適千里者,三月聚糧」。

2015年1月22日星期四

集團公司預算的七大誤區

編製集團公司的預算是一項複雜而系統的工作。許多集團公司在做預算時,往往受到一些誤區的驅使,導致集團預算往往以失敗而告終。
  九略企業管理諮詢有限公司高級顧問李韶玲在其著作《破解企業全面預算管理中得9大難題》一書(機械工業出版社出版)中,總結了集團預算工作的七個誤區。
  缺少培訓,沒有全面了解預算管理的真正意義。在集團內部可能會認為預算只是財務部的事,把預算理解為簡單的表格加數據。這就會使預算的結果大打折扣,預算的準確性、專業性、準確性受到質疑。
  缺乏科學的整體時間布局。由於缺乏經驗,不能科學合理地安排時間的進度。因為時間偏差較大,預算的結果就不會太理想。
  預算的選擇方法不當。 預算方法有彈性預算和靜態預算,集團市場變化較快,業務量變化也很大,成本多為變動成本,採用彈性預算加滾動預演算法比較適合。不合適的預算方法會導致預算偏差過大。
  缺乏嚴謹的預算流程安排。如果缺乏嚴謹的流程安排,考慮不好信息流上下游的關係,數據報表的傳輸過程則會出現混亂無序的情況。
  組織建設不健全,角色分工不清晰。在集團預算中,容易出現財務部全權負責預算管理工作的情況,這就不可避免的缺乏整體組織預算建設的能力,各個部門容易出現扯皮現象,將會嚴重的影響預算的質量。
  預算的模板設計存在缺陷。預算的模板設計沒有考慮到工作計劃、業務、財務信息流之間的轉換,對財務報表的邏輯順序考慮的不夠周詳,財務部之外的其他部門由於缺乏財務知識不會正確的使用填報制度,這樣填報起來的難度很大。
  預算執行與控制存在缺陷。在實際執行過程中由於沒有相應的工具進行監控和考察,或者預算內外管理的細則不到位,都會影響預算執行的效果。

三張可以用來試驗web報表工具的表單

下面三個實際的表單的表樣,均是在實際開發與業務中很可能遇到的情況,是企業信息化中表單非常典型的應用。可以用不同的報表表單做一下試驗:
第一張:這張表單的特點是數據很簡單,常規表單上所有數據對應資料庫的一條記錄,但表格畫起來很麻煩。另外可以檢驗各個表單廠商對編輯器的支持。用不同的報表工具實際動手畫,可以體驗易用性的巨大差別:


報表工具製作表格1
第二張:這張表單特點是能實現對數據的增刪改查,是信息化系統中必備功能。很多表單可以能需要配合編碼來實現,而FineReport報表工具能在幾分鐘內通過拖拽就能搞定~


報表工具製作表格2
第三張:在實際的應用中,經常出現一張表單填入的數據,同時保存到多張物理表中,並且要求多張表之間保持資料庫的事務一致性。這種表單,我們稱為多源填表單。以下是主子表單是典型的多源表單。

報表工具製作表格3

FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel官網:http://www.finereport.com/tw/

2015年1月21日星期三

報表工具需要報與表的完美結合

報表報表,顧名思義,有「報」也有「表」,是由「報」和「表」兩部分構成的。「報」指數據的匯總統計,即將數據從資料庫中取出按一定規則運算統計後 排列。「表」則指格式,數據需要放在格子中,才能清楚定位,體現數據之間的層次與對應關係。「報」和「表」兩方面需要完美結合,才能把完整的報表問題解決好。
目前很多國際品牌的報表工具,基本上都能把資料庫的數據取出來運算排列製作出動態的變長統計報表,也就是「報」的能力不錯。但「表」的功能就不 是很好了,一般都要採用控制項拖放的方式編輯表樣,靠一個個矩形邊線重合對齊畫表樣,一條直線要拼接多條線段,搞個多層表頭累得要死,而且還和解析度相關, 好不容易在屏幕上畫齊的,列印出來又不整齊。還有一類仿製Excel的產品,合并格、設邊框都很方便,可以很快地畫出一個複雜格式的報表式樣來,可惜,又沒有數據處理介面,除了簡單的格內 運算外,與資料庫打交道的過濾、分組等統計運算都要自己做,最要命的是不能自己完成變長報表,還要編程去動態插行插列。最終這些「報」「表」分離的報表軟 件,給用戶帶來了許多苦腦。  
報表之苦
那麼,中國報表的難點到底在哪裡?
普遍的一種說法是中國報表樣式複雜(比如有斜線),其實中國報表的難點遠不止這一處,相比之下,斜線這種樣式問題還是只要費工夫就能解決的小問題,而中國報表還有大量費了工夫也極難解決的大問題,總結如下:
 「用」之累 「用」指應用集成能力,即報表工具能否被很好地嵌入集成到應用系統中。當前業界的高端報表工具均採用獨立伺服器方式,與主程序溝通要通過網路協議,嚴重影
響性能,而且控制力度減弱;獨立伺服器都會有自己的用戶許可權管理機制,對應用而言永遠都不夠用,卻要應用程序向這個規則靠攏,無端浪費工作量;而且獨立服 務器無法享用伺服器的各種優勢能力,如共享連接池、集群能力等。
「報」之難 「報」指統計匯總能力。中國報表最困難的地方是數據統計。中國報表具有的多數據源、整表規則分片、不完全劃分、跨行組運算及獨立格間運算、行列對稱等諸多
特徵,是傳統報表工具無法滿足的,常常導致要求編寫代碼準備數據或進行子表拼接才能完成一個複雜報表的製作。
  「表」之煩 「表」指展現樣式能力。表樣格式複雜也是中國報表比較麻煩的地方,中國報表均要求有整齊的格線,多層表頭層次分明。業內有名的報表工具一般採用控制項式拖拽
的繪製方案,畫起來非常煩瑣,且還與解析度相關,屏幕與列印不一致,而中國報表對列印樣式要求向來很高。「填」之亂 「填」指填寫上報能力。中國報表幾乎都有填寫的需求,前端需要支持各種填寫控制,如編輯風格、自動計算、合法性校驗等;填寫好的數據能夠方便地寫入資料庫 以進行下一步的統計匯總;還需要能支持離線填報和多級匯總填報等。而很多報表軟體不支持填寫能力,一般的填報解決方案都不能自動處理數據入庫的問題,導致 相應的編程工作量仍然很大。
報表之惑  
中國報表的複雜是舉世公認的,用業界常見的傳統工具去完成中國報表會很困難。但這些複雜的報表是否很有必要,還是僅是庸人自擾?
一種常見的看法是:中國報表的複雜目前是現實,但主要是由於業務不規範和應用水平低下造成的,其實是沒有必要的,隨著業務的完善和應用水平的進步,這些報表會逐步簡化以至取消。
實際情況是怎樣的呢?
由於業務不規範和應用水平低下造成的沒道理的複雜報表是現實存在的,某些信息化程度較低的行業確實常常是這樣。但是,我們考察中國信息化程度相 對較高的銀行業,其報表沒幾個是很簡單的,而且複雜很有道理,很難把這些報表搞得更簡單了。看來,複雜報表具有一目了然信息量大的優勢,並非沒有必要,與 業務規範程度及應用水平的高低並無直接關係。
造成這個現象的一個可能的原因是由於東方文化習慣造成的。中國的漢字就很複雜,常用字就有幾千之多,每個字把多種筆劃組成一體;而西文則都是由有限幾個字母去組合而成的,老外習慣於用簡單的東西去拼接組合,而我們則習慣於把相關的信息組織在一起。事實上,我們永遠都沒有資格去指責需求,而應當正視這些困難並去解決它。
  報表之道
  中國報表的困難無法避開,而當前的一些報表工具在諸多方面不能適應中國報表的需求,新一代的報表工具在開發時,需要從以下幾個方面考慮:
  首先,充分考慮應用集成的要求,使報表運算引擎能夠方便地嵌入到業務系統中,並享受應用體系架構的優勢,集中精力處理報表運算。
   其次,徹底摒棄傳統工具的條帶狀數據處理模型,設計全新的適合於中國報表的數學模型演算法,全面支持多源、分片、不完全劃分、格間運算、行列對稱等中國報表的統計特性。
   然後,採用與Excel類似的表格展現方式,充分體現表格規律性,特別重要的是,需要與統計演算法很好地結合在一起,保證表格也可自動地隨數據動態變化。
  最後,對於填寫功能,設計單元格與數據表欄位的對應機制,使之適應任何類型的填寫,可自動複製對應規則,解決填寫數據自動入庫的難題。

FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel

2015年1月20日星期二

再論類excel報表設計器

企業採購報表工具有一個很重要方面,從在報表設計人員角度考慮,選擇易學,易用,易維護的報表設計器。於是很多報錶廠商都選擇學習Excel,設計出類excel設計器。解決報表的複雜表樣,提高畫報表的效率,並且國內的用戶大都非常熟悉 Excel 的使用。從設計的方便性來說,廠商們需要提供一個儘可能貼近 Excel 使用習慣的設計器。 但凡支持類 Excel 報表設計的設計器,除了和Excel單元格命名相同,單元格基本屬性相同,單元格內容編輯方式相同,Excel提供相同函數和無縫導出導出excel之外,還要具備如下功能:
    •  浮動圖表元素
    圖表元素如果能浮動在excel元素至少,就能任意控制圖表顯示位置,做到更加靈活圖表定位,特別是以向量為模型的Excel報表。
    •  相同多Sheet使用方法
多sheet在Excel製作過程廣泛使用,如果在報表工具中沒有辦法很方便創建多sheet,讓用戶很困惑。
    •  拖動複製單元格內容
    如果相連單元格具有相似性,比方值分別為:1、2、3、4、5,如果能通過滑鼠拖動能快速複製。
    •  插入圖片能保存在報表文件中
    如果只是保存一個圖片相對路徑,這樣對後期報表維護來說是一個巨大工作量。所以圖片一定要保存報表文件中。
    。完全兼容Excle公式
    比方如果Excel中寫一個SUM(C1,C2),導入到類Excel設計器後,這個公式要能計算。
FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel官網:http://www.finereport.com/tw/

2015年1月18日星期日

科學研究與大數據概念的濫用

突如 一夜春風來,千樹萬樹梨花開。2012年興起的「大數據」潮流,讓「data」這個IT圈子裡面的名詞一下風靡各個行業。可以說,沒有任何一個IT界的術 語能夠受到如此之大的關注和使用。除了傳統IT界以及和IT圈子相關的行業以外,各種如餐飲業、房地產業、金融業等都迫不及待的宣布了自己的」大數據「戰 略。
微軟研究院的《第四範式:數據密集型的科學研究》,將人類的科學研究從實驗型科學研究、理論型科學研究和模擬計算型科學研究三個範式的定義之後,推出了第四個範式,即數據密集型的科學研究。
大數據
所以,大數據的風潮不可避免的刮進了科學研究領域。
就在 這種全民熱炒的時代,還是有一群科技工作者保持著冷靜的。大數據這個名詞雖然是科學研究界最早提出來的,但是真正被推廣和使用的,都是在互聯網領域,特別 是對於大數據的公認的那些個V不管是最早的3V還是4V,到現在的11V,無一不是與互聯網所產生的數據洪流的特性相匹配的,科學研究界真的需要這些嗎?
大數據
首先,大數據從概念上講究數據的「快」,這裡的快可以是產生快、傳播快、變化快、處理速度快等。但是在科學研究領域,很多數據的並沒有這麼多快的概念。比如在地理信息相關的很多領域,如土地利用、土壤變化、行政區劃等信息中,多年不變,或者變化很少是很常見的現象。
其 次,關於維度的問題。大數據有一種思想,就是去收集更多的數據,不管這個數據是否目前能夠用得上,是否是我們目前所關注的信息,只要有可能,就去收集,不 怕全不怕多,就怕沒有(很多時候,很多公司和研究者,都進入一種為了數據而數據的走火入魔的狀態)。特別是NoSQL這種數據思想的流行,讓很多研究者高 呼「媽媽再也不用擔心我的數據存儲範式了……」。但是,我們知道在科學領域,首先要定義的就是你的科學研究目標,目標必須要界定清晰,那麼你的數據結構一 開始就要設計得符合你的研究目標,這樣才能有目的性的開展工作,如果不預先進行詳細界定和設計,在研究的過程中就會導致目標的弱化以至於迷失。
還有關於數據價值的問題。互聯網的數據可用「得來全不費工夫」來形容,特別是我們常用來舉例的推特、谷歌、臉書這樣的互聯網行業。但是科學研究的每一份數據都得來不易,無論是從實驗中獲取,還是實地考察採樣,每一份數據後面都可能有極其高昂的人力和時間成本。
獲取更多的數據,是一個理想的狀態,但是如果每一份數據都有很大的成本,要想在科學研究領域達到互聯網領域那種數據量,是一個幾乎無法完成的任務。
當然,《大數據時代》的思想來看,大數據的大並不是單純的數量龐大的概念,還包含有完整性分析的概念。
在科 研領域,獲取完全的數據,進行分析也是一個理想狀態。就從地理信息領域來看,採樣點以點方式存在,根據地理信息要素的概念,點要素只有(X,Y)的性質, 只表示位置,不能表示大小,所以不管怎麼進行採集,也無法鋪滿整個研究區域。所以各種以樣本來估算整體的演算法,在地理信息領域才如此重要,包括空間抽樣、 地統計分析等。
大數據是一種思想,但是在使用的過程中不能犯教條主義,不是數據量才加大數據,也不是符合各種V才叫大數據,我們需要在真正理解的情況下,去應用。正如小平同志說的:黑貓白貓,抓住老鼠,才是好貓!
FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel官網:http://www.finereport.com/tw/

2015年1月17日星期六

我們還需要開源報表工具嗎?

曾幾何時,中國大地上報表工具群雄並起,為了掙得一席之地,各報錶廠商使出渾身解數,廣告到處是,價格各種低,拼的血肉橫飛。但奇怪的是,受市場歡迎的竟然是Jasperreport+ireport、birt報表這樣開源的java報表工具。究其原因,無非是這兩個詞「開源」、「免費」。
時間轉到2014年第4季度,當年炙手可熱的開源報表軟體是否還那麼受歡迎,是否還擁有那麼多的粉絲?經典的、較知名的開源報表工具有「JasperReports」、「ireport」、「JFreeReport」、「BIRT」、 「Openreports」、「DataVision」、「Fourfive」和「Jmagallanes」這幾款,下面我們一一述說他們的境況。

JasperReports

JasperReports是程序員最受歡迎、最常用的開源報表工具,常和ireport一起搭配使用。JasperReports可以在Java環境下製作報表,支持PDF、HTML、XLS、CSV和XML文件輸出格式。
百度搜索「JasperReports」,結果有988000條,但內容多是2012年以前的,排名第一位的官網,更新時間竟然是2008年,可以看出jasperreports的關注度、搜索量已經不比往年。
我們還需要開源報表工具嗎?

Ireport

Ireport和jasperreports是天生一對,是轉為後者開發的純java的可視化報表設計器。Ireport允許用戶可視化編輯包含charts、圖片、子報表等的複雜報表。iReport 還集成了JFreeChart圖表製作包。允許用戶可視化地編輯XML JasperDesign文件。
百度搜索ireport,返回2240000條結果,內容同樣沒有多少更新,毋庸置疑,ireport也喪失掉了人們的寵愛。
我們還需要開源報表工具嗎?

JFreeReport

JFreeReport是一個用來生成報表的Java類庫,現在改名為Pentaho Reporting。作為開源報表工具的它為Java應用程序提供一個靈活的列印功能並支持輸出到印表機和PDF, Excel, HTML和XHTML, PlainText, XML和CSV文件中。
百度搜索JfreeReport返回了19100條結果,搜索Pentaho Reporting返回了35600條結果,相比ireport更加寒磣,而且可悲的是,筆者試圖找到最新的源碼包和使用教程,竟然沒有找到,資源還都是2009年以前的。
我們還需要開源報表工具嗎?

BIRT

BIRT是一個Eclipse-based開源報表系統。它主要是用在基於Java與J2EE的Web應用程序上。BIRT主要由兩部分組成:一個是基於Eclipse的報表設計和一個可以加到你應用服務的運行期組件。BIRT同時也提供一個圖形報表製作引擎。
BIRT報表由數據連接、數據轉換、業務邏輯設計、表現四個組成邏輯構成,可以設計製作簡單的列表報表、交叉報表和文本報表,也支持餅圖、折線圖、柱形圖等基礎圖表。
我們還需要開源報表工具嗎?
BIRT報表的搜索結果還是很多的,達到了163萬,這得益於與Eclipse強大的支持。但是網路輿論是怎麼樣的呢?大家是熱捧還是棒殺?經過一番資料收集加上個人經驗,BIRT的優劣大概有這麼幾點。優點是免費,操作界面清晰直觀,布局比較科學,圖表還是比較漂亮的,而且本地化做的還好,安裝之後操作界面是中文的(最新版是4.4.1,可以下載測試下),這些優點在開源報表工具中也算是比較突出的。同樣,缺點也很明顯,條帶狀的報表模型,很多中國式複雜報表做不了,沒有填報,若項目中遇到填報需要花費大量時間開發,最麻煩的就是問題找不到技術支持,學習資料也是很少。下圖是一個網友對Birt報表的心聲和態度。

Openreports

OpenReports提供基於web的開源報表解決方案,通過瀏覽器自動生成動態PDF,XLS,HTMLCSV和Chart報表。利用到的開源技術有Hibernate,Veloctiy,Webwork。
百度搜索Openreports返回了78400條數據,打開其官網,發現真是簡陋至極, 不愧是開源報表工具!請問幫助文檔在哪?請問可以交流的人在哪?請問可以在那裡交流問題。
我們還需要開源報表工具嗎?

DataVision

DataVison 是一個類似於 Crystal Reports 的開源報表工具。通過它可以使用一個拖放的 GUI 設計報告並從應用程序中運行、查看和列印報告,或者將報告導出為 HTML、XML、PDF、LaTeX2e、DocBook 或以製表符或逗號分隔的文本文件,這些文件又可以用於生成 PDF、文本、HTML、PostScript 格式的報告。
我們還需要開源報表工具嗎?
DataVison的熱度似乎要好一些,百度搜索結果達到70多萬,但版本一直停留在2008年的V1.2.0,這就是一個致命缺陷了。翻遍各大IT論壇和問答網,也不見DataVison的討論,可以判斷,DataVison就是昨日輝煌。

Fourfive、Jmagallanes等

之所以把他們放在一起,是因為這些開源報表工具實在是人氣太低了,沒有必要去單獨介紹分析。筆者只能說,fourfive和jmagallanes已經over了。

經過上面的分析,可以看出開源報表工具風光大不如以前,日薄西山了,形成前後如此巨大差異的原因是是什麼?

數年前,人力成本低,所開發的系統難度也不高,相對於昂貴的商業報表工具,開源的報表工具成了最好的選擇,雖然開源報表工具都很難,但投入人力研究是可行的。而現在,一方面人力成本成了項目的主要成本,另一方面系統難度逐漸升級,要求的穩定性、功能、美觀度和交互效果已遠非開源工具能解決的,對整個項目而言,商業報表工具帶來的效益以遠高於投入。簡單總結一下,開源報表工具的致命缺點有:

1、功能整體比較弱,若是項目需求有變更,項目開發者將陷於進退兩難境地,此外開源報表功能薄弱,所實現的效果、展現的功能較收費軟體差距較大。

2、技術服務沒有保障,若是項目中遇到難題或出現bug,開發者只能嘆息了,總之項目風險很大。

3、對人員能力要求高,一般是程序員才能勝任使用開源報表,但須知這類人員的人力成本。

4、學習成本高,全英文的幫助文檔、產品說明書和產品使用界面,讓多少英雄淚流滿面。當然也有學習資料好的,但那收費!

那麼,社會潮流已經拋棄開源報表軟體,需要什麼樣的商業報表軟體呢?

對應開源報表軟體的4大致命缺點,需要的商業報表需要滿足如下條件:

1、功能強大,可以解決中國式複雜報表,支持多數據源報表、html5圖表、移動端、填報功能。

2、強大的技術支持團隊,覆蓋到全國的服務體系,多種多樣的服務渠道和服務響應策略。

3、報表產品易學易用易集成,0編碼即可製作報表,最好支持業務人員自己DIY報表並分析。

4、事實證明類excel設計模式是最適合中國的報表設計模式,需要類excel的設計界面,多種多樣的學習資料,如幫助文檔、視頻教程、線下線上培訓課程。

當然滿足這一條件的國產報表軟體並不多(國外報表軟體水土不服,這裡直接pass掉),而FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel官網:http://www.finereport.com/tw/

2015年1月15日星期四

用web報表工具自定義父格

用Web報表工具自定義父格,可以實現很多功能,下面來講述其中一種。
如下圖,要實現對每一組相同籍貫下的員工進行人數小計,而不是對所有員工人數進行總計,就需要用到自定義父格的方法,用FineReport報表工具能夠很方便的實現這種效果。

1.       新建數據集(略)
2.       報表表樣設計
2.1    綁定報表數據列
單元格
數據列
屬性
B2
ORIGIN
從上到下擴展,居中,其餘默認
C2
EMPNAME
從上到下擴展,居中,其餘默認
C3
EMPNAME
從上到下擴展,居中,數據設置:匯總|個數,其餘默認
註:由於C3是對員工人數進行計數,所以數據設置為匯總|個數,而C2隻是簡單的將數據擴展出來,所以選擇默認設置。
2.2    報表表樣圖如下
2.3    在未自定義父格時預覽報表,是對所有員工進行計數統計,沒有分籍貫計數,不是我們的初始目的,如下圖
3.       自定義父格
選中單元格C3,在擴展屬性面板將其左父格設置為B2
這麼做的目的是為了讓C3實現按照B2中的籍貫進行人數小計
如下圖

4.       自定義父格後,預覽報表最終效果,可以看到已經實現按籍貫對員工計數

2015年1月14日星期三

FineReport助華耐家居建報表平台

 近日,中國報表軟體領導平台FineReport廠商帆軟軟體有限公司,與華耐家居集團達成合作協議,華耐集團將使用帆軟FineReport搭建報表平台。


    華耐家居集團是國內領先的家居服務及建材營銷企業集團,旗下員工6000多人,業務範圍涉及家居建材流通、家居建材總部基地開發和經營等領域。集團旗下機構——華耐立家建材連鎖,業務遍及北京、上海、天津、廣州、河北等12個省市60多個銷區,已發展有800多家連鎖店,已成為中國建材流通領域的第一連鎖品牌。

    通過FineReport報表軟體搭建的報表平台,華耐家居可以方便的實現報表管理、用戶管理、機構管理和許可權管理,進而支撐起各種企業主題分析,進行豐富多樣的圖表分析、鑽取分析、多維度分析、自定義分析、即時分析等,更好的閱讀報表數據,發現數據價值。藉助FineReport報表軟體的多數據源關聯的功能,可以方便實現跨資料庫跨數據表取數,使得多業務系統數據的應用更為簡單。集中相關業務數據於一張報表,讓更多數據應用於經營分析和業務管控。通過帆軟FineReport報表設計器,可以簡單靈活設計所需報表。

    FineReport作為中國報表軟體領導品牌,行業標準參考產品,多年來不斷開拓創新,力求最大限度滿足用戶的需求,經受住了市場的考驗,被廣大用戶評為是最專業、最人性化的報表軟體。FineReport用戶遍布金融、電信、廣電、電力、公安、煙草、稅務、政府、地鐵、鐵路、石油、鋼鐵、航空、海運、外貿等各個行業,成功實施於幾千家客戶的信息化應用項目,得到了用戶的廣泛認可和讚譽。

FastReport報表工具與FineReport報表工具的對比

FineReport報表工具中國報表工具領導品牌,經過十多年的發展,其市場佔有率為業內第一,用戶遍布各行各業,深受用戶讚譽。
相對fastreport,finereport報表工具無論在實現語言、報表設計和處理、展現的多樣性,還是集成應用方面,都有著明顯的優勢。如果說fastreport是能打電話的手機,那麼finereport就是iPhone6。
報表架構
fastreport是FastReports, Inc.公司的旗艦產品,也是Delphi平台最優秀的報表控制項,可以為.NET應用程序添加報表的支持,是C/S報表。隨著B/S架構的發展,C/S將漸漸告別歷史舞台。FineReport是純java開發的,天然完美支持B/S報表生成。就這一點,fastreport就已經落後一大截了。
數據源支持
fastreport使用ADO.NET數據源,號稱支持連接到任何資料庫,如直連到ADO、SQL、和xml數據,並可以對數據進行分類排序、數據過濾。其實fastreport不支持程序數據源,只支持資料庫單連,沒有辦法支持多數據源,對於最新的BI多維資料庫,更是無從支持。
而finereport的數據連接功能強大太多了,支持Oracle、SQLServer、MySQL、DB2、Sybase、Access、Derby、Postgre、支持SAP數據集、存儲過程、BI多維資料庫等,還有內置數據,方便開發者測試。
報表設計
fastreport的設計界面是面板式、條帶式的,非常不適宜設計交叉報表或者有複雜表頭的報表。而且在設計的時候需要編寫大量的腳本代碼。
舉個例子:一個簡單報表中需要用紅色來顯示負數,這個處理需要在Delphi中的事件處理中編寫代碼,但並不通用,因為它不允許在Delphi外創建報表而無需重新編譯,這就是為什麼要在fastreport中要寫腳本語言。
FineReport報表工具0編碼快速設計報表,只需拖拖拽拽就能搞定複雜的中國式報表,實現的功能則更豐富更絢麗。用fastreport製作報表需要高級程序員,而finereport只要懂點SQL的普通人就行了。
報表展現
fastreport只是一個簡單的報表控制項,所以能展現的報表樣式也是有限的。以圖表為例,fastreport只支持幾乎所有報表工具都支持的柱形圖、餅圖、面積圖、條形圖、折線圖和散點圖,且樣式很少,實現效果很醜。
FineReport則在報表展現方面處於佼佼者地位,支持各種圖表類型和樣式,比如地圖、雷達圖、股價圖、圓環圖等;支持圖表動態效果展現,比如數據點提示、坐標軸提示、坐標軸縮放,圖表動畫效果。良好的報表展現和數據分析,如頁面即時分析,數據鑽取分析。
移動端
移動互聯網時代已經來臨,移動端查看報表的呼聲越來越高。通過移動端,人們可以在出差時、在碎片時間查閱報表,處理公司  事務,遺憾的是fastreport並不支持製作移動端報表。FineReport的移動端功能支持集成到用戶APP中,而自己原生的APP支持IOS和Android兩種系統。利用組件式設計、響應式布局,簡單製作符合移動端屬性的報表,一次設計,多種移動終端上完美展現。
填報
之所以國外報表工具在國內水土不服,是因為無法滿足複雜的中國式報表需求,更不理解不支持報表填報的功能,國情決定成敗。老外認為,報表工具是用來展示的,怎麼要用來填報,水晶報表、fastreport都是這個思維。
finereport有著強大的填報功能,製作簡單,風格樣式豐富,可實現多種上報流程業務和離線填報業務。
fastreport學習成本偏高
報表工具的使命是提高項目進度,節約項目成本,fastreport也是如此,但他只做到了一點點。首先fastreport對編碼的依賴,屏蔽掉了一大批人,只有技術高超的程序員才會使用,其次fastreport的設計器和資料多是英文,對使用者的英文水平是個很大的考驗,再次fastreport學習資料匱乏,沒有技術支持,一旦遇到問題叫天天不應叫地地不靈。總之,fastreport的學習成本極高。相比之下,finereport卻易學易用易集成,豐富的學習資料,多樣的答疑渠道,完善的售後支持,學習成本極低。
fastreport與finereport對比總結
fastreport功能點少、學習成本高的特徵將漸漸被時代所淘汰,以finereport為代表的新時期報表工具正在擴大戰果、影響著世界。
FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel官網:http://www.finereport.com/tw/