隨著科技與經濟社會的聯系越來越緊密,科技統計的內涵、對象及方法都得到巨大延伸,科技創新發展對科技統計提出了更高要求。當前,科技統計數據分散,缺乏統一的數據平臺,數據開發力度小,強度低,統計數據時效慢,深度不夠,難以滿足科技管理工作的需要。為了進一步改進科技統計工作,需要根據科技統計特點和現有條件,分析科技管理對統計數據和統計分析的需求。為此,本文建立了一套能快速反應,實施科技統計調查,開展科技統計數據分析,具有高可定制性的科技統計綜合業務系統。該系統全面整合了調查設計、調查組織、調查監控和數據分析四大統計業務流程,有效提高了科技統計調查工作效率,為政府、社會了解和掌握全社會科技活動,提供又快、又準、又廣的統計分析數據和決策參考。
一、科技統計業務元模型應用
元模型是關于模型的模型。采用元模型驅動的四層元模型體系結構,可以便利、快速地進行統計業務建模。元模型解決了各類不同統計調查項目數據一致性與統計信息共享問題。統計調查業務包括統計調查設計、調查組織、調查監控和數據分析四大業務流程。為了快速完成統計調查任務,保障統計數據的準確性、時效性,并高效地進行數據統計分析,本系統在開發設計過程中引入了元模型方法,依據元模型思想,系統建立了統計業務元模型框架。該框架是一個四層的元數據體系結構,每一層描述如下:
1.信息層。信息層是由各類統計調查數據組成。
2.模型層。模型層是由元數據組成,元數據是描述信息層的數據,如統計指標元數據就是由表1組成。元數據的集合被稱作為模型。模型層是為描述信息層而定義的一種“抽象語言”,統計調查數據指標是模型層的一個實例。
3.元模型層。元模型層是由元—元數據組成,元—元數據定義了元數據的結構和語義,元—元數據的集合被稱作為元模型。元模型層是對模型層的進一步抽象,統計調查表是元模型的一個實例。
4.元—元模型層。元—元模型層由元—元數據的結構和語義的描述組成,是為了描述元模型而定義的一種“抽象語言”。相關聯的元模型和元—元模型可以共享同一個設計原理和構造。
表1 統計指標元數據
元數據名稱 |
說明 |
元數據名稱 |
說明 |
Fid |
字段序號 |
FOutState |
字段是否可以導出開關 |
FName |
指標名稱 |
FStatState |
字段是否可以求和開關 |
FCode |
指標代碼 |
FSystem |
字段是否系統默認開關 |
FType |
指標類型 |
FState |
字段是否可以啟用開關 |
FLen |
指標長度 |
FEnabled |
字段是否可以錄入啟用開關 |
FUnit |
指標單位 |
FList |
下拉或聯動選擇下拉列表項 |
FDemo |
指標說明 |
FAddTime |
字段增加時間 |
FCheckTypeB |
瀏覽器端檢查類型 |
FUserName |
增加字段的用戶名 |
FCheckSriptB |
瀏覽器端檢查的 s腳本 |
FAlert |
檢查后的錯誤提示語 |
FCheckStateB |
瀏覽器端檢查開關 |
FAleaType |
檢查后的錯誤提示類型 |
FCheckTypeS |
服務器端檢查類型 |
FOrder |
字段排列順序 |
FCheckSfiptS |
服務器端檢查的sql腳本 |
Old |
主表分步驟的序號 |
FCheckStateS |
服務器端檢查開關 |
FOrderPage |
分步的步驟序號 |
FGroupState |
字段是否可以分組開關 |
OId2 |
從表分步驟的序號 |
依據統計調查業務四大流程,系統分別建立了統計指標元模型、數據質量控制元模型、統計用戶元模型、WEB界面元模型等統計業務元模型。
二、基于元模型的科技統計綜合業務系統應用研究
(一)各類統計業務元模型設計
依據上述統計業務元模型,系統對用戶元模型、統計指標元模型、填報界面元模型、數據打印元模型、數據質量控制元模型等進行了比較規范和深層抽象的描述,通過模型驅動技術、元模型方法和可視化建模技術的配合使用,實現對各統計業務元數據的解釋,以及各級用戶操作界面和各種統計業務功能的配置和定制。當業務功能模型變化后,只要元模型沒有發生變化,系統就可以將新業務功能模型和元數據解釋成新的結果,實現對業務的定制,以及對新業務功能的支持。為了提高系統的可重用性,通過WEB服務技術和組件技術,抽取系統的部分功能模塊進行組件化,實現成WEB服務。同時,通過基于組件的開發方法構建系統功能模塊,形成標準的服務組件庫,使進入系統的所有統計業務流程均可以根據已構建的各類模型便捷地進行配置與定制。系統構建的統計業務元模型如圖1所示。
圖1 科技統計綜合業務系統元模型
(二)科技統計綜合業務系統應用研究體系
為了快速開展科技統計調查任務,便于建立和配置統計業務流程的各個環節,本文建立了科技統計業務系統的應用研究體系,包括調查設計、調查組織、調查審核和數據匯總分析四個環節,如圖2所示。
圖2 科技統計綜合業務系統應用研究體系
1.統計調查設計功能
包括統計調查項目管理、項目歷年數據庫管理、項目數據庫表結構配置管理、項目調查表結構字段配置管理、統計調查表結構字段視圖配置管理、統計調查數據錄入步驟配置管理、統計調查審核平衡關系配置管理、統計調查單位數據配置管理、統計調查數據打印配置管理和統計調查管理用戶配置管理等10個子功能項目。
2.統計調查組織功能
包括通知公告、工作答疑、相關下載、統計調查截止時間管理、統計調查單位清單管理、統計調查市縣管理用戶管理、統計調查填報數據管理和統計調查填報情況管理等8個子功能項目。
3.統計調查審核功能
包括調查指標基礎檢查、平衡關系檢查、調查指標排序檢查和縱向對比檢查等4個子功能項目。
4.統計數據匯總分析功能
包括統計數據匯總配置管理、統計數據匯總報表配置管理、統計數據集配置管理和統計數據導出配置管理等4個子功能項目。
(三)科技統計綜合業務系統數據結構
科技統計綜合業務系統數據庫主要由系統配置信息數據庫和其它各類可定制性科技統計調查數據庫構成。系統配置信息數據庫主要存放各類科技統計調查數據庫的共性信息,如系統用戶、統計管理用戶和科技統計調查表配置等信息;各類可定制性科技統計調查數據庫結構基本一致,主要存放各類統計調查數據結構、通知文檔、數據打印、數據填報界面、數據檢查關系、統計數據等信息。目前,系統已建立并配置了廣東省專項科技統計、國家火炬計劃統計和國家專項統計等多項統計調查數據庫。以高新技術產業開發區企業統計數據庫為例,該數據庫包含調查報表數據表、數據庫表字段數據表、填寫步驟定制數據表、數據視圖定制數據表和數據檢查平衡關系定制數據表等共16張表,如圖3所示。
圖3 高新技術產業開發區企業統計數據庫結構
(四)科技統計綜合業務系統功能框架
從用戶需求來看,科技統計綜合業務系統需提供系統管理、填報須知、填報單位、數據管理和數據審核等功能。系統基礎功能框架包含5大管理模塊,如圖4所示。
圖4 科技統計綜合業務系統功能框架
1.管理模塊
其主要功能體現在以下三個方面:一是系統參數配置。在系統應用過程中,必須先對系統本身的一些共性配置數據進行設置,比如數據庫鏈接設置、主數據庫設置、所屬地域設置等。采用這樣的配置能保證系統參數需要修改時系統可以不受影響,仍不間斷運行。二是統計調查項目填報功能的構建。在統計調查項目開展前,必須對統計調查對象填報數據的字段、數據審核條件、報表打印樣式、調查單位基本數據信息及數據匯總等等功能進行設計。三是系統管理用戶和各級統計管理用戶的管理。除了維護這些管理用戶的登錄信息和基本信息外,還必須對這些管理用戶的操作權限進行分配與管理。
2.填報須知管理模塊
在系統應用過程中,必須對各項科技統計調查任務進行布置。為了便于統計調查工作任務的布置、相關資料下載和統計指標答疑,系統專門設置了填報須知管理模塊,對通知、報表下載、各級統計人員與統計單位的問題及系統的使用幫助進行維護、調整、修改和擴充。
3.填報單位管理模塊
該模塊主要有三個方面的功能:一是完成對科技統計調查單位的帳號、密碼及其基本聯系方式的增加、修改、撤消操作。對于市縣區用戶,在這里可以得到本市、本縣(區)里基層單位的系統登錄帳號與密碼,以及基層單位的基本聯系方式。若因單位用戶不存在或拒報等原因不能上報數據,市級用戶可以申請撤消該單位用戶的數據填報。二是完成全省21個地市近200多個市縣(區)級用戶的帳號、密碼及其聯系方式的增加、修改。三是對全省各地市或各縣區科技統計調查單位填報數據狀態的查詢。
4.統計數據管理模塊
該模塊主要完成對已填報的數據進行管理,進行修改、打印、狀態查詢等功能操作。一是數據修改。各級管理員或企業可以登錄系統,對已填報的數據進行修改和完善。二是數據打印。市縣(區)級管理用戶和企業用戶在確定已填報的數據正確無誤后,由企業用戶通過網頁的打印功能打印數據報表三份,蓋上單位公章,自己留底存檔一份,上交市科技局與科技統計管理部門各一份。三是數據填報狀態查詢。隨著填報數據截止時間的推進,必須對各市填報的企業數據的狀態進行快速查詢,以方便各市統計工作管理人員做好審核與催報工作。
5.統計數據審核管理模塊
各項科技統計調查指標體系復雜,數量眾多,指標間的邏輯關系也比較復雜,系統通過統計數據審核管理來完成對統計數據的定量與定性檢查,以確保統計數據的真實、精確、有效。一是基礎數據檢查。系統根據各項統計報表的平衡關系,建立平衡關系模型。在統計單位填報完所有數據的最后一步,自動檢查數據的有效性,不滿足平衡關系的將會對統計單位用戶進行提示,分“錯誤” 與“警示”信息。若出現“錯誤”信息,數據將不能保存;若出現“警示”信息,數據可以保存。如果系統提示“錯誤”和“警示”信息,統計單位用戶要及時檢查,修正數據。統計單位用戶錄入數據后,可以隨時使用“數據檢查”功能對數據進行全面檢查,市級用戶也可以隨時進行數據檢查,敦促統計單位用戶及時修正有誤的數據。二是排序檢查。在統計數據填報過程中,統計單位用戶有可能看錯數據單位、多填或少填。系統提供數據排序功能,可以對全市、全縣(區)企業的某一個指標進行升序或降序的排序,通過檢查最大數據和最小數據是否異常來保證數據的準確性
三、科技統計綜合業務系統實證和評價
自2007年以來,基于科技統計綜合業務系統,廣東省科技統計分析中心組織開展了27項國家、省和市統計調查項目工作,并建立1400余條數據審核平衡關系,經過近5年的開發與實施運行,數以萬計的基層統計單位已完成各項調查的數據填報、數據審核和數據匯總分析,保證了各項統計調查任務按時并高質量完成;同時,利用系統的統計分析功能,為《2011廣東火炬統計年鑒》、《2011廣東科技統計調查數據匯編》、《2011廣東省高新技術企業統計調查報告》等統計分析產品提供支撐。目前,全省各地市科技局、省級高新區基本采用這套系統,該科技統計綜合業務系統不斷趨于成熟完善。
結合元模型理論和模型驅動技術實現高可定制性的科技統計綜合業務系統是一個全新的綜合性概念,該項目的研究成果將填補國內相關領域的研究空白,開創元模型與統計業務有機結合的先例。
統計調查業務數據結構組織管理具有創新性。本研究基于元模型的體系結構,設計構建了各類統計業務元模型以及對應的數據存儲表結構,模型化的統計業務數據庫可以靈活、便捷配置。國內同類產品一般針對某一特定部門或行業,依據固定的統計報表,結合各個角色管理、數據檢查的需要建立固定存儲結構,數據結構設計一般不具有或部分具有可配置性、通用性。
統計調查業務系統軟件結構具有先進性。本研究采用了純B/S的軟件結構,結合元模型理論與模型驅動技術及系統定制理論,有效地解決了統計直報軟件系統可定制性問題,針對統計調查用戶需求,從技術和需求兩個方面有機整合了國內相關研究基礎。目前,國內同類產品一般采用了C/S或B/S的軟件結構。
系統功能設計具有高可定制性。本研究將元模型理論與統計調查設計、調查組織、調查監控和數據分析四大業務流程有機結合,使得統計業務流程的各個環節便于建立、易于配置。統計工作人員只需憑具有超級用戶權限的帳號,就可以完成對數據填報存儲結構、數據填報界面、統計基層用戶、數據審核關系、數據打印和數據匯總分析等功能的設計,并可以隨時修改各個功能的配置,之后即可快速展開統計調查。在所有操作過程中,無需修改系統的任何源代碼,所有操作都是可以按需生成與配置的。目前,國內已建成多個統計調查業務服務支持系統,但這些統計系統一般依據固定的統計報表,通過設計程序來完成對數據填報存儲結構、數據填報界面、統計基層用戶、數據審核關系、數據打印和數據匯總分析等功能的設計,若某一環節業務需求發生變化,則必須修改程序源代碼,不具有可配置性。
四、結論
本文構建了一套以統計調查表為研究對象、以元模型為理論研究基礎、多種統計業務元模型設計相結合、以模型驅動技術來實現的科技統計綜合信息管理和決策支撐系統,能夠根據不同用戶的需求提供可定制、個性化服務。該系統的成功建設與實施,對于快速組織開展科技統計調查任務,保證科技統計數據的準確性、時效性,并高效地進行數據統計分析具有深遠的影響。