數據統計分析范文
時間:2024-02-18 17:58:36
導語:如何才能寫好一篇數據統計分析,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
1.收視數據統計分析的必要性
1.1 IPTV的技術特點
IPTV以電信運營商提供的寬帶物理網絡為基礎,采用通信、廣播、計算機、互聯網和多媒體等技術,傳送數字音視頻等多媒體信息到多種終端,并實現業務管理和控制IP化的系統和業務,具有如下特點:
(1)交互性:IPTV是建立在通信網絡上的互動性視頻服務,可以非常靈活地實現電子菜單、節目預約、實時快進、快退、節目編排等。
(2)內容豐富:除了提供類似電視頻道制視頻直播之外,利用互聯網信息資源的優勢,IPTV還可提供包括遠程教育、網上購物、視頻電話、網絡游戲、互聯網瀏覽等在內的交互式多媒體信息服務。
(3)可開發性強:在改動量小的情況下支持不同的視頻編碼標準。
1.2收視數據統計分析的必要性
IPTV的雙向性,使得用戶需要觀看某一個節目時,必須向服務器發送請求命令,利用這一特點,通過數據采集系統,形成了IPTV獨有的收視數據。IPTV的收視數據是客觀的、真實的,對其進行統計分析,有著重要意義。
1.2.1準確收視統計,提供決策參考
電視收視率既反映一個電視臺電視節目的質量和水平,也反映觀眾的欣賞要求。及時準確的收視率調查,不僅可以動態觀察觀眾收視動向,發現節目編排問題,為電視臺領導決策提供依據,給節目編導改進節目提供方向,而且為廣告商確定各時段的廣告價位和企業選擇時段做廣告等提供了重要參考。
1.2.2收視偏好分析,客戶分群關懷
從客戶收視行為角度出發,對IPTV收視數據進行統計分析,可以得到開機率、到達率、占有率、活躍度等多項指標,以及對收視內容的偏好等。根據客戶的基礎業務觀看時長和增值消費情況,客戶群主要分為高端、中端和低端三類,針對不同客戶價值,可以進行不同的關懷措施。對于沉默客戶、流失客戶均可制定相應的關懷舉措,達到喚醒、挽留的目的。
1.2.3深度商業挖掘,精準數據營銷
在對客戶價值分群的基礎上,把握消費者對IPTV的個性化消費需求,可做到更細致、更精準的數據庫營銷。例如,結合智能推薦引擎,生成個性化的點播單、為客戶推薦具有高度相關性的其他節目;基于客戶偏好和觀看歷史的學習,在客戶不知道看什么節目的時候,為其推薦最符合偏好的節目;結合年齡、性別、教育程度、收入情況等,綜合分析收視偏好,其結果對于運營商開展IPTV客戶數據庫營銷亦具有啟示意義。
2.收視數據統計分析系統功能需求
2.1數據獲取
IPTV收視數據以Log文件的形式存儲在電信運營商的FTP服務器上,并且進行了壓縮處理,以日期作為文件名,存儲當天的增量收視數據。系統首先要定時,例如每天的凌晨4時,將收視數據從運營商的服務器下載到本地服務器,進行解壓縮,還原成原始Log文件,以備進行后續處理。
2.2數據轉換
數據轉換是將收視數據從Log文件轉換進入數據庫的過程。在轉換之初,所有的字段都是以字符的形式存儲,對于收視開始時間、收視結束時間等非字符型的字段,要進行相應的類型轉換,形成數據庫版的原始收視數據。由于每次轉換的是一天之內的增量收視數據,需要對轉換操作進行日志記錄,防止遺漏和重復的發生。
2.3數據篩選
原始收視數據中存在著一些不合法的和無意義的數據,例如只有收視開始時間沒有收視結束時間,缺少收視頻道等都屬于不合法數據,收視時間間隔小于5秒(可以由用戶自己定義)被視為是用戶調整頻道,為無意義數據。原始收視數據是海量的,必須對不合法的和無意義的數據進行過濾。
2.4數據校驗
電信運營商除了提供每天的增量收視數據以外,每月還提供一次收視匯總數據,同樣以壓縮Log文件的形式提供。利用月收視匯總數據與每天的增量收視數據進行校驗,形成最終的當月收視數據。
2.5統計分析
從用戶維度、內容維度、產品維度定義多種指標,對收視數據進行業務邏輯統計和客戶端呈現;對于常用指標如收視率、總收視率、平均收視率、開機率、占有率、到達率、轉臺數、收視時間等進行統計分析;可以在不同的周期下(天、周、月、季度、年)統計收視數據;不同內容在相同周期內的橫向比較,相同指標在不同周期的縱向比較;多種形式呈現統計結果,多種渲染設置美化呈現效果。
3.收視數據統計分析系統功能實現
針對收視數據統計分析系統功能需求,從以下幾個方面加以實現。
3.1后臺服務程序,自動實現數據獲取
(1)后臺服務程序功能:登錄電信運營商的FTP服務器,查找指定目錄,下載當天原始收視數據,對原始收視數據進行解壓縮,把解壓縮后的原始收視數據Log文件拷貝到本地指定的目錄下,調用數據庫存儲過程,進行數據處理。
(2)后臺服務程序設置:服務程序啟動之前,可以通過配置文件對其進行設置,包括:電信運行商FTP服務器地址、登錄用戶、登錄密碼、原始數據存儲路徑、本地數據存儲路徑、執行方式(在每天的指定時間點執行一次或在指定時間間隔到達后執行多次)、是否刪除FTP服務器原始文件、是否刪除本地下載文件等。
3.2編寫數據庫存儲過程,完成各項數據處理
收視數據最大的特點是數據量大,在后臺進行數據處理非常必要。存儲過程可以接受參數、輸出參數、返回單個或多個結果集以及返回值,運行速度比較快,運行比較穩定,是后臺數據處理最好的選擇。對于功能需求中的數據導入、數據轉換、數據篩選、數據校驗等操作都通過編寫存儲過程得以完成。
重點說明一下數據導入存儲過程,SQL Server數據庫提供了一個BULK INSERT命令,可以將具有特定格式的外部文件快速加載到數據庫表或視圖中,在此發揮了重要作用。
3.3前臺應用系統,呈現統計結果
因為延續微軟開發體系,前臺統計結果呈現使用MSChart控件。MSChart是微軟的一個免費的畫圖控件,為圖形統計和報表圖形顯示提供了很好的解決辦法。在圖形效果方面,本系統實現的功能包括:
(1)圖形標題:根據統計時間、指標名稱,生成默認圖形標題,默認標題可編輯。
(2)圖形種類:折線圖、曲線圖、階梯圖、柱形圖、條形圖、餅形圖、環形圖、面積圖、點狀圖、堆積圖等多種圖形種類選擇。
(3)圖形背景:多種顏色背景選擇,即選即變。
(4)圖例位置:頂部、底部、左側、右側、不顯示等。
(5)坐標選項:坐標始于0,適合數值相差不大情況,坐標不始于0,適合數值相差較大情況。
(6)數值選項:是否在圖形上顯示每一結點的數值。
(7)3D選項:是否啟用3D圖形效果,啟用時,X軸、Y軸角度可調節。
(8)特殊渲染:是否啟用圖形渲染,對部分圖形種類有效。
(9)強調顯示:適用于餅形圖和環形圖,突出顯示某一比例。
(10)圖形尺寸:默認圖形尺寸可調整。 IPTV收視數據統計分析系統已經開放完成,收視數據日積月累在不斷增大,系統優化需求在較長的時期內會一直存在?!科]
【參考文獻】
[1]中國電視視像行業協會.解讀數字電視.北京:人民郵電出版社,2008,1.
篇2
【關鍵詞】數據統計分析;港口管理;重要作用
一、前言
在港口的日常管理中,考慮到貨物的流動性較大,并且貨物種類較多的特點,要想保證港口的日常管理取得積極效果,滿足港口管理需要,就要在港口日常管理中積極引入數據統計分析手段,實現對港口貨物的有效統計,保證港口管理能夠有第一手的數據作為支撐,為港口分析整體效益和制定經營策略提供有力保證。從這一點來看,港口管理中應對數據統計分析引起足夠的重視,應從港口管理實際出發,分析數據統計分析對港口管理的重要作用和意義,將數據統計分析作為重要的管理手段,提高港口管理的整體效果。
二、數據統計分析手段在港口管理中的應用
目前來看,數據統計分析手段在港口管理的應用主要表現在以下幾個方面:
1.數據采集與數據傳輸。目前各港貨物吞吐量的統計已基本實現了數據采集的信息化,做到數據文件傳輸的準確及時。如廈門港已開發了港口生產統計管理系統,各碼頭公司也相應擁有自己的統計系統,數據源直接可以通過碼頭一線操作系統傳入碼頭公司內部統計管理系統,加工處理后,再和管理局的生產統計系統對接。
2.數據存儲。由于要做到詳細掌握每條船每批次貨品的具體數量和儲存情況,每月每年累計下來,將會形成大量的基礎數據,因此必須配備專門設備進行存儲。廈門港已在港口生產統計管理系統投入使用后,配套配備了專門的存儲器進行處理和存儲,并進行定期的維護。
3.數據分析應用。該層可以進行統計查詢、統計服務,通過對數據庫中的各種數據進行分析、統計、建模、歸類等工作,?可以為管理人員提供決策支持,幫助管理人員做出好的決策,提供了聯機分析處理和數據挖掘服務。
三、數據統計分析對港口管理的重要作用
從數據統計分析手段在港口管理中的應用來看,數據統計分析對港口管理的重要作用主要表現在以下兩個方面:
1.數據統計分析能夠綜合分析港口的吞吐量。數據統計分析的具體做法是對港口貨物的種類和數量進行全面計算,并最終形成每日或者周期性的通過圖表等形式反映出來的吞吐量完成情況,為港口日常管理提供直觀的數據支撐。所以,數據統計分析對分析港口吞吐量具有重要作用。
2.數據統計分析能夠正確計算港口的整體效益。在數據統計分析中,不但能夠計算港口的吞吐量,還能計算港口的整體經營收入。通過固定的收費項目和收費標準,計算出港口的基本收入情況,進而驗證港口的實際收入是否存在出入,形成對整體經營管理效益的合理核算。所以,數據統計分析手段對港口的日常管理具有重要的促進作用。
四、數據統計分析對港口管理的重要意義
考慮到數據統計分析的作用及其在港口管理中的應用,數據統計分析手段對港口的管理具有重要意義,具體表現在以下幾個方面:
1.數據統計分析對提升港口經營管理水平具有重要意義。港口作為重要的交通貨運樞紐,其經營管理水平不但關系到港口的整體效益,還關系到港口的未來發展。為此,通過港口數據統計分析直接反映港口的實際經營情況,對提升港口經營管理水平具有重要的促進作用和指導意義。
2.數據統計分析對促進港口持續健康發展具有重要意義。考慮到數據統計分析的重要作用,在港口日常管理中,數據統計分析手段得到了充分應用。由此可見,數據統計分析為促進港口持續健康發展具有重要意義。
五、結論
通過本文的分析可知,在港口日常管理中,數據統計分析作為一種基礎手段應該得到應有的重視。為此,我們應立足港口管理實際,認識到數據統計分析在港口管理的中作用和意義,重點做好統計分析工作,滿足港口管理需要,為港口發展提供有力的支持。
參考文獻:
[1]白雪潔.中國港口經營與管理發展特征和趁勢[J].港口經濟, 2009年04期
[2]高素爭.港口統計數據質量的評價分析[D].大連海事大學, 2010年
[3]黃始堅.完善企業統計制度促進施工企業發展[J].企業科技與發展,2011年14期
[4]黃杰.沿海港口吞吐量與國民經濟關系研究[D].大連海事大學,2011年
篇3
關鍵詞 計量統計;數據庫;動力能源;供給;事件管理
中圖分類號:TP2 文獻標識碼:A 文章編號:1671-7597(2013)12-0124-01
企業動力能源保證是企業生產的基本條件,動力能源管控系統的平穩運行保證著企業產品的質量和企業的經濟效益。隨著電子技術的快速發展,電控技術突飛猛進,我們企業通過技術改造項目實施,在電氣控制中引進新產品、新技術,使設備性能和生產能力都有了飛躍性的提升。動力能源車間對設備管控技術有了嶄新的突破,實現與制冷機、空調機組、空壓機、冷干機以及供水系統數據通訊、智能聯控調節,鍋爐、變配電設備遠程監測。原來設備大都停留在單機運行、手動操作的階段,車間人員配置較多,數據的統計與計量全靠人工手抄和手工計算,設備、能源管理等也停留在經驗與估算的基礎上,在動力能源數據管控、統計與分析、管理方面呈現基礎薄弱、技術水平低下的特點。目前結合車間動力能源管控系統的開發與完工,我們具備了一套功能完備、技術先進、易于操作、便于維護的動力能源管控于一體的信息集成系統,實現電力能源供應、空調機組、制冷機組、空壓機組、真空泵機組、變配電、鍋爐供熱、給排水及污水處理配套設施全面自動化控制和信息化采集,系統通過遍布在全廠的能源監測點,全面控制、調節和管理各設備,為生產調度提供準確和實時的數據,對全廠的水、電、蒸汽、真空、壓縮空氣等能源監測點進行計量與監測;對重要工藝設備的水、電、氣和汽用量與質量指標進行監測,保障設備正常運行,保證企業生產的正常開展。
動力能源管理系統,是基于計算機網絡和數據庫技術的應用,實現了網上并行工程處理和數據共享以及同其它應用程序的動態數據交換,保證計量和管理信息準確及時。動力能源設備通過底層設備控制器及PLC從各個采集點搜集數據,實時監控各生產設備運行狀態、開停情況、故障次數、故障原因等運行情況;把不同的數據傳輸至管理系統SQLSERVER數據庫中;相應數據再次經過SQLSERVER數據庫的處理,將數據用關系數據庫的模型以表的形式存貯在 數據庫中;SQLSERVER數據庫中的數據不僅可以在控制網絡中得到,也可以在其他數據庫中或其他的管理系統中通過網絡讀取數據。
動力車間首要工作是保持動能設備平穩運行,穩妥供給企業水電氣汽需求。通過精準計量統計分析,杜絕資源浪費,合理調配動能設備投入量,節約能源消耗。我們基于動力能源管控系統平臺可以順利實現有效設備管理、管路泄露和動能消耗計量統計,通過客戶機終端登錄管理系統,查詢到所需要的數據,訪問所需相應模塊,輸出各種報表,并建檔保存;為提高設備的作業率和設備操作人員的工作效率,就要將動力車間的各種設備的運作效率、設備運行情況以及設備的故障情況等各項指標進行完整的記錄和詳細的分析,將這些信息經行完整有效的規范化管理。
設備管理與備件消耗統計,進入設備管理模塊,通過機械設備故障數據的收集和分析,加強設備維修管理,開展預防性維修,提高設備運行可靠性、降低設備突發故障率,提升維修預知性,準確統計設備維修成本,以及維修費用階段性變化,有效組織單機設備的維修計劃,準確下達項修、大修任務。對設備進行檢修或排除設備故障的同時,維修人員通過填寫統一格式的維修記錄,一方面可以整理維修思路和經驗,便于技能素質的提升;另一方面通過維修工單的數量掌握每一位維修人員工作量,通過維修工單內容維修效果分析維修人員的個人技術能力。對設備維修施工數據的統計存檔,利于掌握設備全壽命周期內歷史事件查詢,固定資產審核保存記錄。
水、氣、汽管路節點計量統計,首先通過動力能源管控系統平臺數據的收集,提供管路分布數據,統計各個分支管路消耗數據指標,掌握某個部門或某個工藝設備用能消耗情況,分析數據可以發現是否有異常浪費,是否動能供給量過剩與不足,調整動能設備的投入;經過某段管路的計量信息統計,分析是否異常泄露情況,維修人員檢查確認,可以判定接頭、法蘭、彎頭、閥門等管件的泄露情況。
能源計量統計,主要是電力和天然氣消耗,以高壓配電計量統計為例,計量統計數據為上位監控每半個小時自動采集發送。選擇“查詢內容”為“查看用量值”,通過選擇“統計類型”可查看每個時間段,每日,每月,每年的用量值,若選擇“查詢內容”為“查看表碼數”,可查看計量表各時間段的表碼數。通過導出統計匯總表查閱某時段內各個線路的用電量,分析部門、車間、設備用電結果;統計各車間部門用電功率并統一匯總存檔,為日后的能源消耗考核提供參考數據。部門的詳細用電功率匯總表分別列出生產用電部分的用電功率和照明用電部分的用電功率,明細部門用電情況。
基于生產數據的統計報表數據,要從生產數據中按照科學的運算模式抽取需求數據,把各種業務數據相關聯起來,層層數據挖掘、分析,并通過實時數據獲取、報警與事件管理數據的處理,進而完成實時數據存儲與歷史事件追溯查詢功能,利用SPC分析等技術,對車間工作安排和下一步團隊發展,提出建設性的指導建議,為車間管理工作提供更加強有力的幫助。
參考文獻
[1]崔堅.西門子工業網絡通訊指南[M].北京:機械工業出版社,2005.
[2]陽憲惠.現場總線技術及運用[M].北京:清華大學出版社,2001.
篇4
網絡問卷應用優勢
1.省時省力
在局域網或互聯網上發問卷,整個操作過程無紙化,問答方便,回收過程快速,可及時反饋,節省人力、財力。
2.問卷填寫時間自由
在一定時間段內,可以自由回答問卷,不限人數;網絡環境可以多人同時填寫,大大提高工作效率。
3.保證數據錄入有效性
在網頁和Excel中均可設置填寫有效性檢查,通過命令限制,防止漏填或不符合規范的數據錄入。如輸入身份證號時,若位數不夠,將提示重新輸入,否則不允許繼續錄入,保證數據錄入準確。
4.數據統計快速、準確
由于網絡問卷采集的是數字化數據,進行統計分析快速高效。如在Excel中進行運算和統計,一條命令幾秒鐘可抵上手工幾小時甚至幾天的工作量。
5.題型多樣,統計方便
網絡問卷可采用單選、多選、判斷題、簡答題等形式調查。前三種可用字符統計命令快速統計結果,而簡答題匯總時,由于是電子形式,可大大節省后期錄入的時間和精力。
6.安全性強
紙質問卷回收過程中,涉及回收環節較多,而且不少被調查者不愿意被其他人看到自己的回答內容。若采用網絡問卷的形式,只有網絡后臺管理人員和問卷組織者才有權限接觸到數據結果,減少了中間環節。
數據采集方法
隨著技術的不斷發展,數據收集和統計的方法多種多樣。中小學校可以利用現有條件,在學校局域網或互聯網上通過Excel表格方式調查,利用學校網站進行互聯網調查,或通過專門的在線調查網站進行問卷調查。
1.利用Excel在機房內收集數據(局域網環境)
傳統匯總學生信息,通常是教師將學生的數據收集起來,然后一條一條輸入匯總為一個表格。由于一些統計數據過細過多,輸入的工作量很大,費時費力。而在網絡機房進行調查反饋,可多人同時填寫一張Excel表格,既減輕了人工輸入的壓力,還節省時間。采集的數據信息集中在一張表上,可快速高效地完成相關調查反饋。要完成此操作,只需正常網絡設置的學校機房,安裝Excel軟件,通過對Excel文件及所在文件夾進行一些設置,就能完成數據采集。方法如下:
設置文件夾共享:首先在網絡教室中教師機(Windows XP或Windows 2003系統)上建立一個共享文件夾,然后在文件夾上右擊,執行快捷菜單命令【共享和安全】,打開文件夾【屬性】對話框,在【共享】標簽上選擇【共享此文件夾】選項,點【權限】按鈕,打開權限設置對話框,選中“允許”列的所有選項,點【確定】按鈕,這樣就將文件夾設為“完全共享”,局域網內其他人就能訪問了。
設置工作簿共享:將Excel文件(成績單.xls)復制到此完全共享文件夾,打開Excel文件,點擊菜單【工具】|【共享工作簿】命令,打開【共享工作簿】對話框,選取【允許多用戶同時編輯,同時允許工作簿合并】選項(有對勾),點【確定】按鈕,這就完成了工作共享。
編輯應用工作簿:在學生機上,雙擊桌面上的【網上鄰居】,在打開的窗口左側單擊【網絡任務】列表中【查看工作組計算機】,在右側窗口找到教師機,雙擊打開,能看到共享文件夾,雙擊打開Excel文件,按自己序號輸入相應內容后保存。所有學生輸入數據后,保存Excel文件。教師在教師機上點擊【保存】按鈕,這就得到全班的數據(成績)匯總表,然后就可以通過Excel命令對收上來的數據進行分析處理了(提示:在學生機打開Excel文件后,此時可以看見標題欄的文件名右邊有“共享”提示,若標題欄文件名右側提示為“只讀”,則需要重新打開)。
說明:局域網內共享Excel方式簡單易行,但受到機房環境的限制,若調查人數較多還是不方便。解決辦法是可以通過互聯網共享Excel文件方式進行,如利用EditGrid網站(),新建或上傳已有Excel表格文件,為不同用戶設置相應的瀏覽權限,其他操作都如在Excel軟件中操作一樣。利用EditGrid網站可以不受時間、空間和人數限制地進行數據調查。
2.利用ASP程序在互聯網上采集數據
由于同區域學校間網絡可以互訪,因此,可在學校任意一臺計算機(無論是Windows XP 或Windows 2003系統均可)中安裝IIS(互聯網信息服務),正確配置一個ASP程序運行的環境,再到網上下載一個問卷調查程序,修改成自己問卷內容即可,操作過程如下。
下載:上網搜索ASP問卷調查源程序,選擇題型與自己問卷要求一致的,如凌云有獎問卷調查ASP問卷,將其下載、解壓、復制到IIS網站目錄下,通過網頁瀏覽器,運行無誤后,就可進行修改操作了。
修改:一個問卷調查系統一般包括問卷輸入、問卷保存、答案查看等多個網頁文件,只需修改兩個網頁和一個數據庫文件。
步驟 1,通過FrontPage或Dreamweaver等網頁編輯軟件,打開問卷錄入網頁(dati.asp),將原網頁問卷內容修改成新問卷調查內容。再切換到“拆分”視圖,如右上圖所示,將按鈕名稱和選項對應。主要是修改每個答案的代碼,如在語句中,type說明題目類型為單項選擇題,每一題各答案中name后的名稱要相同,它對應數據庫中的字段名稱,value后是輸入數據庫中需要統計的內容。
篇5
文獻標識碼:A 文章編號:1672-7800(2015)005-0098-02
作者簡介:陳冠星(1984-),男,廣東揭陽人,碩士,海南軟件職業技術學院網絡工程系助教,研究方向為數據庫、網絡技術與物聯網。
1 數據倉庫簡介
數據倉庫(Data Warehouse,DW)是隨著關系數據庫、并行處理和分布式技術的飛速發展而產生的[1], W?H?Inmon出版了《Building the Data Warehouse》一書,給出了數據倉庫的定義:數據倉庫是一個面向主題的、集成的、非易失的、隨時間變化的用來支持管理人員決策的數據集合[2]。數據倉庫包含的是整個企業視圖的粒度化數據。
數據倉庫系統通常對多個異構數據源有效集成,集成后按照主題進行重組[3]。存放在數據倉庫中的數據通常不再修改,用作進一步的分析型數據處理。
數據倉庫系統的建立和開發以企事業單位的現有業務系統和大量業務數據的積累為基礎 [4],其開發是一個循環迭代過程,通常需要企業有一定的業務數據積累,開發人員將這些歷史數據通過ETL輸入到數據倉庫中,進行分析和統計,以建立決策支持輔助系統,為企事業單位管理者提供決策支持。
2 保險業需求分析
隨著保險業發展及保險市場競爭的加劇,保險公司在管理和運營方面面臨著更高的要求,來自監管、競爭、技術更新及全球化等各方面的壓力不斷考驗著保險企業。保險業發展的核心動力表現在以下幾個方面:①進入新分市場及提高業務質量;②鞏固客戶忠誠度,適應客戶多變的需求;③高效的運營;④精確的風險及成本控制;⑤消除各種技術壁壘。
要做到上述目標并不容易。對高層管理者來說,由于統計口徑的關系,很難獲取一致性數據進行比對,很難及時監控到業務狀況,不能有效地進行決策支持。對于業務部門主管與業務分析員,所需報表難以及時獲取,即使取得的數據也難用于多視角、全方位地分析業務問題。對于IT部門來說,要不斷幫助業務部門制作報表,時間相對較長,而且開發的報表越多,特別是分析型的報表越多,業務系統性能越受影響。
以某人壽保險有限公司為例,該公司的數據支持情況如下:
(1)保單管理系統中大致有50張左右的報表在運行,但隨著公司業務的發展,數據分析及用于日常管理的制式報表與日俱增,報表數量將很快無法滿足業務發展需求。
(2)各業務管理部門有各自的制式報表及統計需求,但在將數據匯總時,時常出現因統計時點不同、指標定義的理解差異等原因造成數據不一致,導致額外的數據校驗工作。
(3)當前報表的IT實現基本上是按照單個報表需求來設計的,造成IT設計無法復用,報表開發缺乏整體規劃,呈一種臨時性狀態,隨著報表及統計需求的增加,IT相應的工作將與日俱增。
(4)因當前報表及數據統計都在保單管理系統中運行,隨著需求數量的增加,保單管理系統將面臨沉重的夜間批處理壓力并嚴重影響日間日常業務操作的效率及穩定性。
針對上述系統現狀,在建設中決定采用數據建模、ETL、數據分析以及數據展現等技術,實現風險管控分析、客戶服務分析、客戶維持分析、市場銷售分析、綜合分析和綜合管理6大功能,達到以下目標:①代替原有手工報表方式,為業務人員節省時間;②提供精細的分析數據。業績分析可以從營業部,鉆取到營業組,甚至每個FC(理財顧問),保全分析可以分析每種保全項目的明細;③統一的分析口徑。各部門統計指標,可以在統一的時間點上進行公司級匯總;名稱一致的統計口徑,可以唯一定義一種統計方式;④唯一的報表平臺。從報表需求獲取到報表需求分析以及最后的實現都在一個體系下完成,公司數據分析工作逐步系統化和實用化。
3 系統設計
統計分析系統采用靈活架構,在構建一個統一、穩定的企業級數據倉庫基礎上,分步構建各個獨立的分析應用數據集市,滿足靈活性、擴展性要求,系統架構如圖1所示。
保險數據倉庫是一個中央的知識數據庫,包含來自壽險系統、團險系統、短期險系統和電話銷售系統等源系統的源數據,數據模型分為3層:
(1)數據準備層(Staging Layer): 采用同源系統相似的數據結構存儲源系統的每日增量數據。
(2)保險企業模型層(Insurance Enterprise Models Layer): 作為保險數據倉庫的核心,相應的保險企業模型部署在該層。根據保險行業的業務視圖,保險企業模型分為10個主題,根據保險信息的特性而非事務處理的目的來設計,企業級上所有保險業務信息根據歷史版本進行記錄。在數據準備層通過ETL(數據抽取轉換裝載程序)進行數據批處理,采用增量機制裝載進入保險企業模型。
(3)分析數據模型層(Analysis Data Models Layer): 各種各樣的數據分析需求歸類到不同的數據集市,如市場及銷售數據集市、運營效能數據集市、風險管控數據集市等。分析數據模型即為滿足數據集市需求而采用維度建模方法特別設計的模型。分析數據模型從保險企業模型衍生而來,數據通過ETL 批處理,采用增量機制裝載進入保險企業模型。
ETL采用增量機制,每日從源系統抽取變更數據至Staging層,接著將Staging層數據轉換至企業模型和分析模型。在ETL批處理完成后,系統運行報表批處理生成報表并到相應的報表文件服務器上。
OLAP元數據管理工具: 提供OLAP 元數據管理工具,用于管理所有OLAP 業務元數據,包括指標定義、維度層次定義、指標與維度的關系及分析需求。通過使用這個工具可幫助保險企業統一KPI 定義及促進企業標準化管理,同時其管理的內容可作為統計分析系統所支持的知識庫來使用。
OLAP平臺:選擇微軟的SQL Server 2008作為OLAP平臺。OLAP 工具支持分析的類型包括管理儀表盤、平衡記分卡、制式化管理報表、臨時查詢、數據挖掘等。
4 系統實現
4.1 ETL實現
ETL采用SQL Server集成服務來實現。Microsoft Integration Services 是一個可以生成高性能數據集成解決方案(包括為數據倉庫提取、轉換和加載ETL包)的平臺。Integration Services包括生成和調式包的圖形工具和向導;執行工作流函數操作和執行SQL腳本等任務;提取和加載數據的數據源和目標;清除、聚合、合并和復制數據的轉換;管理包執行和存儲的管理服務,即Integration Services;用于Integration Services對象模型編程的應用程序編程接口(API)。
4.2 多維數據實現
創建報表之前,需要通過SQL Server分析創建多維數據模型。之所以使用SQL Server分析服務創建多維模型,主要是為了實現對業務數據的即席查詢。系統開發人員創建多維數據集以支持快速響應,并提供單個數據源以進行業務報告。商業智能的重要性不斷提高,使用單一的分析數據源可確保將差異減到最?。ㄈ绻麩o法完全消除差異)。
4.3 報表系統實現
報表系統實現使用了SQL Server報表服務,報表服務包含一整套管理報表的工具。報表工具在微軟的開發環境中工作,并與SQL Server無縫銜接。通過報表服務,可以從多種不同的數據源創建各種不同樣式的報表。
5 應用效果
該系統目前已經在某人壽保險有限公司正式投入使用,結果顯示,該系統使業務數據的分析效率、分析能力大大提高,在一定程度上簡化了業務人員數據統計工作,對公司決策支持起到很大的幫助作用,系統良好的應用價值體現在以下幾個方面:①數據集成。數據倉庫能夠把來自多個不同子系統的數據進行有效集成,提供統一的、一站式的業務報表系統;②查詢靈活方便。統計分析系統能夠根據不同的需求進行條件過濾,并支持數據向上向下鉆取,數據查詢方式更加靈活,追溯更加簡單直接,為業務分析人員提供了很大的便利;③安全性高。為了保證數據的安全性和可靠性,對數據倉庫中的數據實行統一管理;④降低成本。統計分析系統的建立,可以代替原來的手工匯總操作,一次創建,只需要進行簡單的維護就可長期使用。
6 結語
本系統開發及系統運行工作得到如下經驗及啟示:
(1)理念的轉變。在數據分析上,需要從清單和簡單匯總上升到數據分析,從單個部門分析到全局分析,從數據庫到數據倉庫進行分析設計。
篇6
關鍵詞:政府數據;質量成本;分析
0.引言
構建資源節約型、環境友好型的“兩型社會”是當前我國的一項建設目標,在建設社會主義和諧社會的進程中,需要把資源節約型社會建設這一理念貫徹其中。節約資源不單單是企業的義務,我國政府的相關在工作中也需要具有節約資源的意識。一直以來,我國政府的數據統計工作都是存在著嚴重缺乏成本觀念以及理性經濟的意識,這樣是非常不利于政府工作的可持續發展的。由此,政府相關部門需要認識到在確保統計數據統計工作質量的條件下,進行節約資源的重要性。如何更有效地控制政府統計工作的成本,提高政府統計工作的效率是我國政府需要應對的時代挑戰。
1.數據質量成本的內涵及其分類
1.1數據統計成本的內涵
人們把在整個統計活動中,為了保證數據取得的質量而花費的費用以及在統計活動、過程之后因為數據沒有達到標準而造成的各種損失一起定義為統計數據的質量成本。其中,統計活動的整個過程指的是為了取得數據進行的一次完整的工作流程。因為數據質量不達標而發生的成本指的是對數據重新進行返工、評估造成的成本支出,以及數據使用者對數據不滿意造成的各種損失。
1.2統計數據成本的分類
在數據統計的的整個過程中,質量成本涉及的內容大體上可以分為外部質量保障成本以及內部質量運行成本兩大塊。其中,因為政府統計數據工作的特殊性,數據質量成本保障還需要包括外部保障成本,如為了更好進行統計調查工作而進行的廣泛宣傳而發生的費用。統計數據中的內部質量運行成本包括了預防、鑒定、內部以及外部損失成本等四大類。其中,預防成本指的是為了取得高質量的數據的保證成本,它的目標是減少、限制數據統計中發生的各種失誤并進行及時的糾正。鑒定成本又叫質量控制成本,指的是為了鑒定數據的質量而發生的成本。
2.政府統計數據的細分以及計算
2.1政府統計數據的細分
一般而言,統計工作流程包括了需求研究、調查設計、實施、數據整理、統計分析、數據評估等幾個環節。在這幾個主要的工作步驟中又涵蓋著許多的工作程序,在這些工作階段中進行中都會相應地產生的統計數據質量保證(預防)成本、數據質量控制(鑒定)成本以及內部損失、外部損失成本等,這些因素的影響程度在政府進行的數據統計工作中又會增大。
其中,政府統計工作中的預防成本包括了對于統計數據進行的需求研究、調查設計、調查數據的收集、分析等造成的成本;數據質量控制成本包括了調查問卷的測試評審、數據質量的評估以及其他質量鑒定等各個事項產生的支出;而內部成本損失指的是調查設計、數據收集、數據整理以及分析中等造成的各種損失;外部成本損失則包括了信息使用者投訴造成的成本以及數據再加工處理產生的各種費用等。
2.2政府統計數據質量成本的計算
正如前文所述,政府統計數據的質量成本包括了確保數據的高質量發生的費用以及在統計工作中因為質量未達標而造成的各種損失兩大類。但是在實際的會計入賬的時候,發生在統計工作之后出現的因為質量問題而造成的各種損失是不會顯示在賬面上的。為了更好地與顯性質量成本進行區分,可以把這種損失成本定義為隱性成本。
因為在政府統計數據的工作過程中出現了兩種性質不同的質量成本,所以在真正進行成本計算的過程中,需要采取不同的方法。可以對于其中的顯性成本在會計賬簿中進行核算,然后對隱性成本進行另外的統計資料的核算。還有一種做法是不分隱性成本以及顯性成本,通過成本數據收集之后將所有的質量成本都匯總,進行總體的核算。
3.政府統計數據質量成本的分析探討
3.1政府統計數據質量成本分析
通過對政府統計數據的質量成本進行分析,能夠發現其中存在的缺點和不足,并在此基礎上進行改進,提高數據統計質量工作的效率。
3.1.1時期發展分析
對于統計數據質量成本進行時期分析,總體而言可以分為長期發展分析、短期發展分析。長期發展趨勢分析總要是對統計工作的全局戰略、整體流程的質量成本進行監測。在統計工作的流程中,質量改進之后的效果需要一段時期才能夠顯現出來,,因此需要對統計工作的總質量成本的變化進行長期的監測。這時就需要將統計工作的歷年成本總值和相應基數的百分比來作為判定的標準,以此來檢測數據統計質量成本的改進成效。另外一個就是短期發展分析,將統計工作分為各個流程并制定相應的質量成本改進目標。其檢測程序也是先確定一個基數,并對各個類型的質量成本的數值的變化進行分析,在此基礎上采取有效措施降低質量成本。
3.1.2帕累托分析
發現數據統計質量成本問題的第二個方法就是進行帕累托分析。該分析方法的主要步驟就是找出對數據質量成本有影響的要素,并依據影響程度的高低進行排列。要想最大程度的減少數據統計質量成本,就需要在影響程度最高的要素上下功夫。只要對要素列表中的各個影響因素進行嚴格的成本控制,就能達到控制統計數據質量總成本的目標。另外,可以將數據統計的預防成本以及鑒定成本的總值和內部以及外部損失的總值進行對比,進而找出每單位質量的投入對于質量損失減少的程度,有利于提高統計工作決策的正確性。
3.2政府統計數據的質量成本的預測
當對統計數據的質量成本進行了一系列的分析之后,就需要對數據統計工作進行相應的預測、計劃。依據對數據統計質量成本進行的預測值、以及經濟效益最優的計算制定質量成本和預防工作的合理計劃,并規劃出統計數據質量成本標準,依據實情進行成本質量的控制。當然,還需要時刻地對數據質量成本進行評估,以便及時發現問題,調整措施。只有對政府統計數據的質量成本進行深入的分析、正確的預測,才能更大程度地提高政府數據統計工作的效率和質量。
4.結語
對政府統計數據質量成本的深入分析,包括時期發展分析以及帕累托分析等,并在數據質量成本分析基礎上進行相應預測,不僅對我國建設長效的政府統計工作機制大有裨益,同時有助于切實提高政府統計工作的效率,控制政府統計工作的成本。(作者單位:重慶市江津區油溪中心衛生院)
參考文獻:
[1]徐榮華,張英花,成金.美國統計質量控制和評估的經驗及對我國的啟示[J].中國統計.2012(04)
[2]趙學剛,王學斌,劉康冰.中國政府統計數據質量分析―一個文獻綜述[J].經濟評論.2011(01)
篇7
重慶市第七人民醫院,重慶 550004
[摘要] 目的 充分發揮病案統計管理系統的作用,保證統計數據的準確性及科學性,提升數據質量。方法 以我院病案統計管理系統在對各項病案數據進行統計和分析時出現的問題為視角點,尋找和分析對統計數據質量影響的因素,并采取相應有針對性的措施進行處理,總結處理方案。結果 我院的病案統計管理系統在對病案各項數據進行統計和分析的過程中,存在影響統計數據質量的漏洞,設定的數據接口和輸入源頭數據都會對統計數據的準確性和科學性造成影響,進而降低數據質量。結論 提高工作人員的業務水平,健全完善、科學的數據核對機制是提升統計數據質量的有效途徑。
[
關鍵詞 ] 病案統計管理系統;統計數據;質量
[中圖分類號] R197.3 [文獻標識碼] A [文章編號] 1672-5654(2014)08(c)-0045-02
隨著社會對醫療需求的不斷增加與醫院效率的低下已然成為當前社會的主要醫患矛盾之一;同時信息時代對人們的影響不斷增大,使得醫院不得不改變以往的運營模式,繼而HIS(醫院信息管理系統)開始在各大省、市,乃至區縣鎮等醫院的普及,這大大提升了醫院的診治效率。而病案統計管理系統作為HIS子系統之一,其通過設定的數據接口與HIS系統進行連接和數據傳輸,保證HIS系統自行收集各項源頭數據得以處理和保存,并對接受到的數據進行分析和處理,從而提升醫院對各項醫療數據及病案數據的自動化分析及處理,這不僅提升了醫院統計報表的效率,也保證數據的準確性和可信性。醫院通過使用病案統計管理系統,在很大程度上提升了數據統計和分析效果,也很大程度上避免因人為統計分析造成的誤差和數據錯誤,為醫院對病案數據的統計及管理帶來了很大方便,但同時也出現了一些新的問題與挑戰,導致該系統在處理個別數據時出現差錯,對整個統計數據的質量造成影響?,F就對我院應用病案管理系統時存在的相關問題進行分析和解剖,探討如何提升數據質量,并總結了相關措施,現整理報道如下。
1 當前醫院在應用病案統計管理系統對數據處理時出現的問題
1.1 HIS收集源頭數據多而散,不利于數據的核對
HIS在對醫院病案數據進行收集時,其源頭數據主要為兩處:一處為病案首頁;另外一處為流動報表。數據的采集是由門診部、住院部、醫技科室、護士站、醫生站以及收費科室等各個部門完成,這些數據采集點呈現一定散亂性。HIS在醫院的應用,使得收集大部分病案統計數據的主要來源于,在對HIS相關業務的操作輸入過程中而自動生成,再直接將生成的數據傳送到病案統計管理系統之中。這很大程度上打亂了各項數據收集步驟的順序性和歸屬性,導致數據之間的界限相互交叉,混亂不清。而許多統計人員在對數據進行相關處理時,不容易分清哪些數據屬于HIS自動采集,哪些數據屬于人工手動輸入,這大大增加了工作人員的審核和核查難度。如,醫院設定的病區工作日志各項數據的產生就涉及到了收費處、護士站、醫生站以及住院部四個部門的業務操作。同樣,病案首頁收集的信息填寫,在一定程度上也會對統計數據質量造成影響。因此,對數據收集的來源進行準確劃分,加強對錄入數據源頭的核查和監控,是提升數據質量的基礎保障。
1.2 系統存在漏洞,自身運行中存在的缺陷對統計數據質量造成影響
我院目前使用的病案統計管理系統并不完善,正處于一個逐漸趨于完善的磨合期,這使得HIS在對源頭數據進行收集時,在一定程度上不能保證數據的高質量;同時病案統計管理系統的數據接口設置在一定程度上也對統計數據的質量造成了影響。如,在對入出院人數進行統計時,就存在與實際入出院人數不符的情況,病人雖然辦理了入院手續,但實際上并未入院;病人雖然出了院,但還沒有辦理出院手續。若是相關護士未能及時對實際入出院人數與HIS收集的入院人數進行核查和校對,那么就會導致病區工作日志上的統計數據存在差錯和指標失真。
1.3 統計工作人員過度依賴系統
在醫院對病案數據進行統計和處理的人員擁有一定的統計學知識,但同時能夠借助計算機技術以及數據庫知識等復合型人才相對較少,因此,大部分的統計人員在對醫院病案數據進行統計和分析的過程中只是停留在工作業務的操作表面上,并不了解HIS和病案統計管理系統的實際運行規律及流程,因此不能理清統計數據和相關機制,這導致數據中存在的差錯很容易被忽視,甚至認為系統自動生成及傳輸的數據具有高度可信性,造成對上述數據不及時進行核查和審對,當在系統運行處理環境發生變化后,才發現數據存在差錯,而此時尋找數據出錯源頭極其費力,導致最終的統計數據結果的可信性降低。
2 提升統計數據質量的措施
2.1加大對數據收集源頭的監控力度
病案統計管理系統在醫院的廣泛應用,使得醫院對數據統計處理的效率得到提升。然而,系統自動處理生成的數據導致大部分的原始數據存在一定程度的隱蔽性,同樣數據收集源頭的散亂性也很大程度上加大了數據審查的難度。因此必須要健全完善、合理、科學的數據核對機制,確保統計數據具有高度可信性和可靠性,提升數據質量??梢酝ㄟ^實施“三步核查”機制來對整個數據進行監控和核查:
①“每日核查”:醫院在向大眾服務的過程中,每天都存在入院、出院以及轉科等情況的病人,因此,病區護士應及時將上述數據與病區工作日志上記錄的數據進行核查和修改,若是發現錄入錯誤,應及時向統計工作人員,并進行數據修改。病區工作日志作為連接HIS和病案統計管理的橋梁,需要病區護士做好每日核查工作,保證病區日志數據的準確性,這也是統計數據質量的基礎保障。
②“每周核查”:統計工作人員在數據進行統計和處理的過程中,應每周對各病區的工作日報匯總表中的數據進行核查,對其中的邏輯關系及平衡關系進行審對,如當天住院的人數應該和前一天的留院人數對等;只有保證每個病區在出、入、轉病人的人數都符合邏輯關系和平衡關系,最后匯總出來的數據質量才能得到保證。
③“每月核查”:統計數據人員在借助病案統計管理系統的校驗功能對上月的數據進行處理時,應分成兩種情況進行,一種是借助病區工作日志的數據對病案數據進行校驗,通過對病區工作日志中記錄的出、入、轉人數、占床情況以及治療情況等校對指標和病案首頁錄入數據進行核查和審對;另一種為借助病區工作日志進行自校驗,通過對當天住院人數與前一天留院人數進行核查與校驗等。若是在進行校驗的過程中,出現差錯,應該及時進行糾正,只有所有校驗都成功,才能保證報表質量的可信性和可靠性。
2.2 規范首頁病案填寫,實施電子病案
病案首頁作為生成統計質量報表的基礎數據,其質量的好壞將直接對整個數據質量造成影響。為保證病案首頁信息的可靠性及高質量性,應規范首頁病案的填寫,統計資料必須準確、可靠,錄入質量必須得到保障??蓪嵤╇娮硬“?,將病案首頁的錄入歸類成四類:收費科室、醫生工作站、住院部以及統計室,保證分工明確,落實責任。
2.3 完善病案統計管理系統,培養和儲備醫院統計復合型人才
在系統運行和使用的磨合期,工作人員應該正確使用軟件審核數據的功能,若是在對數據進行處理的過程中,發現存在與統計相悖的設計要求,應及時向計算機管理中心反映,進而對病案統計管理系統進行再次完善,保證以后統計數據的質量。同時,醫院還應該加強對統計復合型人才數據的培養和儲備,對具備統計學知識,熟悉HIS及病案統計管理系統的人員進行培訓,提升其計算機掌握能力,使其熟悉統計數據的整個流程,能及時發現統計過程中存在的問題,并及時進行處理。
3 結語
無論是手工統計還是如今信息自動化統計,都應該保證統計數據質量的高度可靠性和可信性。病案統計管理系統雖然方便了統計人員對醫院病案數據進行相關統計和處理,但是同時也提出了新的要求與挑戰。統計室人員應該不斷加強自身技能學習,提升綜合能力,這樣才能提升統計數據質量。
[
參考文獻]
[1] 王玉貴,明星辰.HIS功能的自主拓展與應用[J].中國病案,2011(2):46-47.
[2] 陳祝萍.病案統計原始數據來源現存問題分析及管理對策[J].中國醫院統計,2009(3):243-244.
篇8
關鍵詞:狀態采集平臺;數據分析;圖表
中圖分類號:G717 文獻標識碼:A
1 網絡版高職院校狀態采集平臺動態數據分析系
統建設的必要性
為促進高職院校發展的需要,實現學校管理的科學化、現代化、規范化,提高人才培養質量,江蘇省自2008年開始推進《高等職業院校人才培養工作狀態采集平臺》系統的應用,每年采集一次數據。目前,高職院校的數據采集平臺是由上海行健職業技術學院開發的單機版[1],近兩年推出了網絡版的采集平臺,但網絡版只有數據采集的功能,沒有開發數據分析的功能。
目前狀態采集平臺的數據分析系統使用的是江蘇經貿學院開發的單機版數據分析系統。該系統將全省80多所高職院校的統計數據整合起來,進行分析處理,以人們最能接受的直觀的圖表方式來呈現。界面簡潔,功能相對齊全。但單機版的數據分析系統因為受到各種條件的限制,存在一些缺點。
(1)自動化程度低。單機版數據分析系統的統計數據需要從每個院校的excel表格中獲取,獲取數據的自動化程度低。各個院校提交到省教育部門的是一個excel文檔,其中包括原始數據和統計數據。數據的獲取必須將80多個excel文檔中的統計數據項提取到一個新的excel文檔中,然后通過數據分析系統將這些統計數據以圖表的方式呈現。在數據提取的過程中,需要人為干預,耗費大量的時間和精力,容易出現錯誤。
(2)缺乏狀態采集數據的縱向比較。單機版的數據分析系統處理的都是單個年份的數據,只能對各個院校的數據進行橫向比較,而無法實現每個高校數據的縱向比較。而對于用戶來說,數據分析不僅需要在各個院校之間進行橫向的比較,同時也需要縱向比較。在本系統中,增加了縱向比較功能,通過對歷年的數據對比分析,以折線圖的表現方式直觀表現數據的變化,根據圖表對未來數據項進行預測。
(3)無法實現資源的統一管理和共享。狀態采集平臺目前收集了高職院校的大量數據,這些原始數據作為全社會一個公共的教育資源,應該進行統一管理和共享,不僅為教育部門和高職院校提供決策支持,同時讓更多的人參與了解高職院校的辦學情況、專業狀況等,進一步加強輿論監督的力量。在信息化的今天,資源的統一管理和共享顯得尤為重要。
隨著狀態采集平臺在全省院校中的應用推廣,其作用不僅僅是為了采集數據,更為重要的是對采集到的數據進行統計分析。隨著數據量逐年遞增,數據分析的重要性越來越突顯,分析結果將更具有參考價值。在此情況下,將一些雜亂的大量的沒有規律的數據轉換為有價值的決策信息,輔助各高職院校以及省級教育部門完善教學質量保障體系。因此建設網絡版的省級數據分析系統勢在必行。
2 省級狀態采集平臺數據分析系統的設計
為了增強系統的健壯性,本系統在設計中將狀態采集平臺的原數據與統計匯總的數據完全分開,一方面使得數據相對獨立,另一方面則保證數據分析系統的運行速度。系統的設計框架如圖1所示。
圖1 系統框架
狀態采集平臺的數據項以及狀態采集平臺整個系統還在不斷地完善中,每年的數據項、數據的名稱等會發生變化,比如數據庫表的字段名稱會發生變化,數據表會增加,以及數據庫中表的名稱會發生變化等等。在2013年狀態采集平臺中,數據項“學校代碼”修改為“學校標識碼”,“院校名稱”改為“學校名稱”,“應屆畢業生頂崗實習情況的畢業生錄用比例(%)”改為“企業錄用率(%)”,類似這樣的變化的數據項有很多。狀態采集平臺這些數據項的變化必然會導致數據統計系統的變化。為了使數據分析系統具有穩定性和健壯性,在系統的設計中,我們將統計和分析作為兩個獨立的系統,數據統計系統的主要功能就是根據數據分析系統中的需要分析的數據項進行統計,將統計結果寫入數據分析數據庫。數據分析系統則相對獨立,根據數據庫中的數據對各項指標和數據進行對比分析。
系統的設計具有松耦合性,無論狀態采集平臺中的數據項如何變化,數據統計系統會將所需要的統計數據導入數據分析系統的數據庫中,數據分析系統就負責將統計數據對比分析,以可視化的圖表方式呈現給用戶。
3 數據準備
3.1 數據來源
收集的數據是否準確,是否真實和充分,決定數據分析的直接結果。省級狀態采集平臺的數據分析系統作為狀態采集平臺系統的延續,所使用的數據均來自各高職院校通過單機版或者網絡版狀態采集平臺填報的數據。狀態采集平臺經過近幾年的使用,各高職院校目前都能夠熟練使用,并且各級部門和領導也很重視,保證了采集數據的相對準確,從而使得數據分析結果在一定程度上正確反映學校在教育教學等方面的現狀和不足,有利于針對性整改,提高教學質量。
3.2 數據選擇
高等職業院校狀態采集平臺中采集的數據非常多,其中包括學校的硬件設施、固定資產、產學合作、招生、就業、經費收入支出、校內專任教師、兼課教師、專業狀況、實習實訓、學生獎助學情況、學生社團等大概80多個數據表。在實際的數據分析中,不是要對所有的數據全部進行分析,本系統選擇一些對能夠反映高職院校教學質量情況的數據項進行數據分析。狀態采集平臺數據分析系統對院校概況、辦學條件、監測分析、師資概況等11個大類的數據進行分析。在每個類中都包含了很多的數據項。例如監測分析中包括了高級職稱教師占專任教師的比例,生均占地面積,生均宿舍面積等7個數據項。
3.3 數據處理
高職院校狀態采集平臺雖然具有數據位的校驗,數據格式,關聯數據校驗,報錯和提示功能,但是在實際的采集操作過程中,仍然存在不符合規格的數據,因此就需要對數據進行各種處理。數據處理的過程分以下幾個步驟:
(1)清理數據
主要清理的數據有兩種:不符合格式要求的數據;奇異數據。
不符合格式要求的數據:狀態采集平臺中采集的數據有的在數據格式中沒有限制,比如在收集教師基本信息的表中,有一項是在企業中的時間,有的學校職工在填寫中就寫了1天,有的寫的是1*60,這樣的數據格式在統計中是無法進行數學統計,必須對數據進行清理。
奇異數據:所謂奇異數據,是指在采集的過程中,針對同一類數據,個別院校的數據與其他的數據差別很大,一般我們認為相差三個數量級別時,就認為這是個奇異數據,要對其進行核準、處理,從而保證數據分析結果的準確性。
(2)轉換數據格式
狀態采集平臺數據表中的字段基本都是字符型的數據,在數據分析系統中,對數據的統計匯總要通過數學公式來進行計算,字符型的字段無法計算,因此在數據清理完成后,必須將統計匯總的字段轉換為數值型。具體的處理方法,用JAVA語言寫一個批處理程序,實現對數據字段的批量轉換。
(3)數據統計
在將數據準備好之后,就要對選擇的數據進行統計匯總。本系統中對數據的統計一般包括總和,均值,百分比等。比如在校生人數,需要統計全省在校生總數和全省在校生均值;高級職稱教師占校內專任教師,需要統計的是百分比;院校招生中的實際錄取率,實際報到率等,統計的是百分比。數據統計由數據統計系統來完成。
4 系統的數據分析
狀態采集平臺數據分析系統主要采取圖表對比分析的方法。采用圖表方式的優點,易于閱讀,易于理解,直觀。例如各個學校的數據與全省均值的比較,各種類別院校的均值比較,歷年數據的對比分析。對比分析主要通過以下幾種圖表實現:
(1)儀表盤形式。這種儀表盤的對比方式主要適合于各個院校數據與全省均值的對比,儀表盤顯示院校的指標數據,全省均值則顯示在儀表盤的上方,這樣便于兩個數值的比較。同時數據分析系統還顯示了各院校數據在全省的排名。圖2是某個院校的教師數、全省排名以及與全省均值的比較。
圖2 儀表盤數據對比分析
(2)柱狀圖形式。柱狀圖的圖表形式也是我們最常用的一種對比方法。在本系統中主要用于數據各種均值的比較。例如,全省均值,國家示范院校均值,國家骨干院校均值,省級師范院校均值,一般院校均值,綜合師范民族類均值等。圖3是校內專任教師數量的均值比較。
圖3 柱狀圖數據對比分析
(3)折線圖對比形式。數據分析系統中縱向數據的比較適合用折線圖對比形式,表現簡潔,便于理解,能夠明顯看出數據項在幾年中的變化,從而指導學校的進行科學話管理和決策。由于網絡版數據分析系統今年才開始推廣,數據項是從2012年開始的,目前折線圖的對比方式還沒有完全體現出來。
5 結束語
狀態采集平臺數據分析系統的建設,為省級教育部門的決策咨詢提供詳實有力的數據,有利于科學合理的制定宏觀調控政策,強化宏觀管理和指導的針對性,進一步推進高等職業教育的可持續發展;有利于各高職院校查找辦學差距和薄弱環節,整合教學資源配置,提高辦學治校的科學化水平,不斷加強和改善自身的教育教學管理。
參考文獻
[1] 陳方輝.高等職業院校人才培養工作狀態數據采集平臺研究
[J].安徽電子信息職業技術學院學報,2012(1).
[2] 李暢,陳方輝.高等職業院校人才培養工作狀態數據采集平臺
指標分析[J].江蘇經貿職業技術學院學報,2011(6),79-81.
[3] 李果,等.知識管理視角下高職人才培養工作狀態數據采集平
臺的建設與實施[J].職業技術教育,2013(8):55-57.
[4] 田飛.高職院校人才培養工作狀態數據采集平臺分析策略研
究[J].才智,2011(36):337-338.
作者簡介:
篇9
關鍵詞:高校圖書館;數據統計;借閱比例;利用率
1 引言
圖書館作為高校的教學、科研服務和高校文化傳播重地,是重要的教輔單位,紙質圖書是圖書館藏的重要組成部分,因其種類多、 專業涉及面廣、 信息資源豐富,是重點收藏的文獻類型和工作的重點。紙質圖書利用情況的統計分析是圖書館管理工作的重要內容之一,同時,也是讀者閱讀需求最直接的反映,本文真實地統計了廣東海洋大學 2010 -2015 年的圖書館紙質圖書的館藏情況、借閱情況和各類讀者借閱情況,這對圖書館的工作人員掌握讀者的閱讀傾向,動態調整本館的館藏結構,提高圖書館藏書質量,提升讀者滿意度等具有重要的意義。
2 圖書館藏和利用情況分析
2.1館藏圖書整體利用情況
為了動態調整高校圖書館館藏結構,提高藏書質量,進而滿足讀者閱讀需求,圖1統計了2011年-2015年自然科學和社會科學類圖書的借閱和館藏變化情況,可以看出:(1)五年來,學校雖然不斷加大對圖書館紙本藏書的資金投入,社會科學和自然科學類圖書館藏量逐年增長,但圖書流通數量卻逐年減少;特別是2015年的減少幅度最大,達50000多冊次。歸其原因,主要是隨著計算機、網絡、通訊等高新技術的飛速發展,數字圖書館、移動圖書館、手機圖書館等新型圖書館應運而生,讀者獲取圖書資源的途徑越來越廣泛,閱讀方式發生改變,這對提高高校圖書館紙質文獻的利用率帶來一定的挑戰。(2)該校圖書館社會科學類圖書利用率遠遠高于自然科學類圖書,前者是后者的 3倍,由于社科類圖書是通讀類書籍,是幾乎所有高校師生都研讀的,但閱讀自然科學類圖書的讀者多受專業限制,為理工科類專業背景的讀者。
2.2 22大類圖書藏書利用情況
紙質圖書利用率的大小與圖書資源的更新速度和所購圖書資源與讀者的真正需求有關,是體現高校圖書館利用價值的重要指標[1],為了能夠清楚反應高校讀者使用各類圖書的情況,通過五年內的統計數據來分析讀者對圖書的借閱需求和各類圖書的利用率,以便動態調整圖書的館藏結構,滿足讀者需求。圖2統計了2010-2015年該館22大類圖書的年利用率,從圖2可以看到:(1)雖然每年22大類圖書的館藏利用率不斷發生變化,但文學(I)、哲學、宗教(B)、語言文字(H)、藝術(J)類在歷年統計中都位居前4位 ,說明高校讀者比較喜歡這幾類書,利用率高;館藏利用率排行倒數后4位一直為航空航天(V)、自然科學總論(N)、農業科學(S)、環境安全科學(X), 說明高校讀者對這幾類書的需求量較小,利用率低;由于高校每年學科不會發生太大改變,讀者群體的專業、學歷相對穩定,讀者的閱讀需求類似。(2)我館藏書主要以社會科學圖書為主,排名前 10 位圖書大類中,除 T 類和 O 類外,其余均為社會科學類圖書,這些基本上是我館讀者借閱的重點。
2.3 2015圖書借閱比例與館藏比例統計分析
文獻借閱比例是指一段時間內某類圖書借閱冊次與借閱總冊次的比值,館藏比例是指一段時間內某類圖書館藏冊次與館藏總冊次的比值,x者借閱比例與館藏比例應成正比例關系[2],它可以清楚反映讀者需求讀書類別與館藏圖書類別是否一致,也能呈現讀者對某類圖書的相對需求程度,圖 3對比分析了2015年圖書的館藏比例和借閱比例,我們不難發現,我校部分圖書的館藏比例和借閱比例偏差較大,在文學(I)、工業技術(T)三類圖書處有明顯的浮動,I 類的借閱比例明顯高于館藏比例,借閱比例占整個圖書館借閱量的30%,但館藏比例只占圖書館館藏量的10%,反映出學生對文學類的圖書需求相對較高,該館購置的文學類圖書受較多讀者喜愛。工業技術(T)類的借閱比例明顯低于館藏比例,該館藏比例為23%,但借閱比例僅為16%,說明該館這兩類圖書的館藏量明顯高于借閱量。仔細分析T類圖書的二級書目的外借情況,所有工業技術類圖書中,一半是計算機類(TP)圖書,其它圖書借閱量較小。
2.4 不同類型讀者的借閱量分析
由于該校是一所以海洋和水產為特色、多學科協調發展的綜合性大學,現有全日制本科生、研究生、留學生3.1萬余人,在所有讀者種,本科生利用館藏的紙質文獻是最多的,占所有借閱圖書數據的93.8%左右,其次是教職工,占3.5%左右,研究生讀者數量較少,占2.7%,由于本科生人數較多,且興趣愛好廣泛,在校期間主要目標是完成學業所需的科目,學習專業知識,參與科研項目的學生不多,幾乎沒什么科研任務,與專業相關知識的學習難度低,深度較淺,相對于研究生和教職工來說,他們的檢索能力不高,對電子書和數據庫的利用率較低,因此,以治本圖書為主要知識獲取對象[3];相反,碩、博研究生和教職工多利用電子資源查找資料,對圖書館紙本圖書的利用需求相對較少。
3 提高高校圖書館讀者對紙本圖書利用率的建議
3.1 優化館藏結構,激發讀者的閱讀興趣
第一、圖書館館藏應根據適應學校發展需求,動態調整館藏結構,以適應學校的發展,對于借閱比例高于館藏比例的圖書,由于師生的需求量較大,借閱量高,應增加該類圖書的采購量,特別是豐富文學經典圖書館藏,滿足學生對文學類圖書的渴求;相反,借閱比例遠小于館藏比例的圖書,應在豐富圖書種數的同時,減少圖書副本量,有計劃的做好圖書剔舊工作,對于計算機類圖書,根據其更新速度快,圖書價格高等特點,應加強對該類書籍的調研,既要滿足學生對新技術的需求,又要突出重點,保障經典書籍的供給,進而提高該類圖書的利用率。
3.2 加快信息化建設,更好的為讀者服務
信息技術對圖書館管理、服務及其館員的影響是深遠的,隨著數字化技術和網絡技術的發展,圖書館將成為高度發達的信息集散地,圖書館必然將朝著“數字化圖書館”的方向發展[4]。圖書館在前進的過程中應引進先進的技術和設備,使讀者通過各種移動設備(如手機、掌上電腦等)方便靈活的進行圖書信息查詢、瀏覽和獲取圖書信息服務。另外,可引進智能自動借還書功能的、自動化水平高的設備,開發或引入可供讀者利用手機微信等看書、預約、借還書、自動推薦新書等功能的軟件,提高我館的辦事效率和自動化水平,更好的為全校師生服務。
3.3合理巧妙利用網絡媒體,主動適應高校閱讀模式的轉變,做好導讀工作。
隨著互聯網的新媒體層出不窮,異彩紛呈,各種數字化閱讀設備日益便捷,大學生閱讀模式也在發生著改變,紙本閱讀日漸減少,網絡閱讀比重增大,“淺閱讀”和“泛閱讀”逐漸成為潮流[5]。因此,高校圖書館是學校的文獻信息中心,承擔著為高校的教學和科研服務的重任,除了做好館藏建設等工作外,還應通過多種方式開展閱讀輔導,幫助讀者提高閱讀的興趣,增強閱讀的系統性和有序性,引導讀者閱讀傾向,提高閱讀效率。第一、開展靈活多樣的適合年輕大學生的讀書活動,如讀書沙龍、讀書活動月、真人圖書館等;第二、建立網絡閱讀導航服務,建立高校圖書館與學生互動的網絡系統,引導學生研讀名著、主動屏蔽網絡媒體新聞傳播缺陷,鼓勵大家多讀書、讀好書;第三、鑒于網絡的淺層次閱讀無法替代書本的深層次閱讀, 傳統閱讀更利于人們的抽象思維,圖書館有義務大力倡導本館讀者對圖書深層次閱讀的工作。
參考文獻:
[1]李冬梅.圖書館利用率的ARMA模型構建與預測實證分析.圖書館理論與實踐,2011,9:16-18
[2]吳春紅.中文紙質圖書館藏評價―以河南理工大學為例.情報探索, 2015,209(3):99-103
[3]楊軍花,聶江城,王剛.用戶利用高校圖書館館藏資源分析及對策研究―以南開大學圖書館借閱統計為例.圖書館工作與研究,2011,183:66-70
[4]李勝利.當代大學生期刊閱讀傾向的實證研究.案例研究,2011,24(2):164-165
篇10
伴隨著課程改革的實施,如何提升實際教學效果和學生的學科素養、優化教育流程、有效的傳授知識內容、合理的訓練學科能力、恰當的傳授思想方法成為了一個重要的課題?!敖獭迸c“學”之間的相輔相成,對實際學情的理解和分析,因材施教,適時調整策略并進行針對性教學,是實現學科知識、學科能力和學科方法目標的必經之途。把握教育教學的有效性與長效性,促進學生的多元化發展、培養創新意識,塑造高素質人才則是教育教學的必然之由。
關鍵詞:計量數據 歷史知識結構 歷史學科能力 歷史學科素養 教學策略
中圖分類號:G630
引言:
對于高三教育教學和備考復習而言,如何有效的講授知識內容結構、如何合理的訓練學科能力、如何恰當的傳授思想方法、如何培養和提升學科素養是一個多解的命題。要實現這四個角度的教學目標,切實培養學生的學科素質,促進學生的多元化和全面性發展,優化教育效果,提升教學的有效性,那么實事求是的理解學情、科學規范的訓練、及時調整教師“教”與學生“學”之間的差距,是一個不得不面對的技術問題。
在下文中,筆者不揣淺陋,擬就如何有效利用計量統計數據分析學情和調整教學策略的話題略呈管見,希冀能拋磚引玉,敬請方家指正。
維度一:科學規范的命制試題
沒有教育科學就沒有科學的教育,沒有規范的學科訓練就沒有規范的學科思維。規范的訓練可以通過多種途徑來實現,比如課堂教學、研究型學習、史料研讀及遺址考察等,但是最簡單而且教學中使用最多的還是試題測試。科學的試題、科學的測試、科學的訓練對學生的歷史學科能力訓練和歷史學科規范及學科素養的提高是非常有幫助的。
命制科學規范的試題可以建構一個計量統計的模型,以分析學情和調整教學策略,能更好的實現教學目標。
如何才能命制一套較為科學和規范的試題?這不僅需要了解測量技術的相關問題,還需較為深厚的歷史學科專業知識,除此之外,教育經驗和教材的熟悉度也是很重要的一個因素。
一般來講,一套試題從結構上需要體現以下幾個考察的方向:學科基本知識、學科基本能力、學科素養的體現。而學科方法則是溝通上述三個角度的橋梁。
從歷史學科基本知識角度講:內容應該包含高考考察的七個結構模塊,即古代中國、近代中國、現代中國、古希臘羅馬、近代世界、現代世界及選修模塊。從歷史學科能力角度講:文科綜合能力“考試大綱”將歷史學科的高考考核目標表述為獲取和解讀信息、調動和運用知識、描述和闡釋事物、論證和探討問題四個能力要求①。具體來講包括再認再現歷史知識、重構歷史時序、獲取有效歷史信息、理解分析歷史事物、運用歷史方法論證、評價歷史問題。歷史學科素養則是如何應運歷史知識發現新問題、研究新問題、解決新問題的靈活體現,是創新意識培養的必然內核。培養素養“要關注知識的消化,關注它是不是發生了有益于吸收、轉化為有益于生命的酶化”。②“把死知識變活,把活知識變靈”③是知識酶化的主要目的。
規范的命制試題后,設計測試的雙向細目表,建立一個完整的測評模型后便可指導解決實際教學中有效利用計量統計數據分析學情和調整教策略的問題了。
下文,筆者擬就操作中的實例來講述具體過程,以期拋磚引玉。在模型樣本選取上,將本年級文科班分成程度好和程度一般兩類。以較好的為參照系,在程度一般的學生中進行測評和策略檢驗,找出規律并進行驗證。
維度二:利用分數段分布的統計數據分析學情以調整策略
下圖為分數段數據,來源于分組中程度一般的學生。測試后將數據做出統計,結合數據分析學情,調整策略,矯正教學。
分數段分布數據可知如下學情:分數段的分布百分比可確定學生的層次、明晰學生是屬于基本史實掌握不牢固的“知識型不足”,還是史學能力不到位的“技能型不足”;確定教學中重能力還是抓基礎的后續教學重心、調整教學內容的難易度與深淺度。
上圖所示,中間分數段的學生人數較多,反映出大多學生對于基礎知識和主干知識的記憶和理解比較好,可繼續加強和保持效果,確保不出現知識型問題。但非主干知識掌握不牢,如:課本小字部分(即自學內容)、非重點內容。
高分段人數較少,反映出技能型不足的問題。表現為運用歷史方法論證、評價歷史問題能力不足和邏輯思辨能力、史學理論方面存在欠缺。通過試卷作答細化分析發現語言閱讀能力和理解能力不足及規范答題能力欠缺。
根據學生的情況和數據分析采取如下策略:為了能提高高分段人數比重,調整教學難度和深度,通過課本知識的延伸與拓展,擴大學生的知識容量和理論儲備,關注史學研究的新成果,以專題講座的形式講解技能與方法,以提升學生表現出來的能力欠缺。指導和訓練答題技巧,訓練其在作答過程中語言簡明、清晰、嚴密、要點化、序號化的能力。
在下階段訓練跟蹤并在同一模型與難度下測試,如圖所示:
數據統計后,發現效果較明顯。中間分數段的學生人數百分比穩中有升,高分段人數明顯增多,運用歷史方法論證、評價歷史問題能力和邏輯思辨能力、史學理論方面存在欠缺等技能型不足的問題得到修正。
維度三:利用能力結構得分統計數據分析學情以調整策略
、針對此問題調整策略,借鑒語文方法,訓練學生語言能力,如找準關鍵詞、對有效信息的提煉和概括、歷史要素與關鍵詞的關系,題干限定語的查找等。訓練學生的邏輯分析能力,提高學生對歷史名詞內涵與外延的準確理解度,強化學生的邏輯思考習慣,訓練其推理、判斷、論證的能力。系統講授歷史學科方法與理論,如歷史唯物論、辯證法、現代化史觀、全球史觀、文明史觀、社會史觀、生態史觀;樹立學生結合時代特征分析歷史的思維、史論結合及生產力標準等論證和評價歷史的方法。對學生數據進行統計與分析,進行逐個訓練與指導。
在下階段訓練跟蹤并在同一模型與難度下測試,數據統計后,發現效果較明顯。如上圖所示,樣本學生中獲取有效歷史信息和運用歷史方法論證、評價歷史問題兩個方面的不足得到修正,進步明顯。
維度四:利用知識結構統計數據分析學情以調整策略
知識結構的統計分析,可知道學生哪些知識掌握的不到位,以便及時查漏補缺。由于知識模塊范圍太大,在具體分析的時候可以結合雙向細目表及各小題得分率仔細分析,準確找到薄弱環節,再結合能力結構統計數據,分析是知識型問題還是能力型問題,以便更好的掌握學情。
上圖所示,樣本學生在“古代中國史”和“現代中國史”兩個方面存在不足。針對此問題,查找薄弱環節,詳盡分析,調整應對策略,對相關知識進行補充和加強,如古代經濟,古代科技等。理清中國古代史的時代特點及線索和發展脈絡,按通史時序梳理知識?,F代中國史教學中注重時政與歷史的關聯,補充中國現代史中文化、教育、科技等相關內容。利用對世界史的知識優勢,將中國史與世界史交叉起來,通過中外關聯與對比,來加深理解。對基礎知識進行再強化,加深知識的理解程度與深刻性。
在下階段訓練跟蹤并在同一模型與難度下測試,數據統計后,發現效果較明顯。如上圖所示,樣本學生中“古代中國史”和 “現代中國史”兩個方面的不足得到修正,進步明顯,超過了參照系的學生。
五:結語:
課程改革實施下如何提升教學效果和學生的學科素養,優化教育流程,有效傳授知識、合理訓練學科能力、恰當傳授思想方法,培養學生的學科規范和學科素養、傳授技巧和思維方法、挖掘和熟練教材、夯實主干知識的根基、關注史學研究動態、滲透史學研究的理論和方法、廣泛學習和借鑒、科學的訓練、多元的思考、重視培養學生能力和史學素質可能是一個必須面對的話題。“教”與“學”之間的相輔相成,對實際學情的理解和分析,因材施教,適時調整策略并進行針對性教學,是實現學科知識、學科能力和學科方法目標的必經之途。把握教育教學的有效性與長效性,促進學生的多元化發展、培養創新意識,塑造高素質人才則是教育教學的必然之由。
引注:
①《2013年文科?課程標準實驗版?考試說明(考試大綱)》