電子稅務局畢業論文

時間:2023-05-01 10:40:40 論文范文 我要投稿
  • 相關推薦

電子稅務局畢業論文

學校編碼:10384 分類號 密級 學號:X20113287123 UDC

電子稅務局畢業論文

工 程 碩 士 學 位 論 文

某市稅收數據綜合應用平臺

數據質量監控系統的設計與實現

Design and Implementation of Data Quality Monitoring system for Integrated Tax Data Application Platform

李正東

指 導 教 師: 林凡副教授

專 業 名 稱: 軟件工程

論文提交日期: 2011年9月

論文答辯日期: 2011年9月

學位授予日期: 年

指 導 教 師:__________

答辯委員會主席:__________

2015年*月 月

廈門大學學位論文原創性聲明

本人呈交的學位論文是本人在導師指導下,獨立完成的研究成果。本人在論文寫作中參考其他個人或集體已經發表的研究成果,均在文中以適當方式明確標明,并符合法律規范和《廈門大學研究生學術活動規范(試行)》。

另外,該學位論文為()課題(組)的研究成果,獲得( )課題(組)經費或實驗室的資助,在( )實驗室完成。(請在以上括號內填寫課題或課題組負責人或實驗室名稱,未有此項聲明內容的,可以不作特別聲明。)

聲明人(簽名):

年 月 日

廈門大學學位論文著作權使用聲明

本人同意廈門大學根據《中華人民共和國學位條例暫行實施辦法》等規定保留和使用此學位論文,并向主管部門或其指定機構送交學位論文(包括紙質版和電子版),允許學位論文進入廈門大學圖書館及其數據庫被查閱、借閱。本人同意廈門大學將學位論文加入全國博士、碩士學位論文共建單位數據庫進行檢索,將學位論文的標題和摘要匯編出版,采用影印、縮印或者其它方式合理復制學位論文。

本學位論文屬于:

( )1.經廈門大學保密委員會審查核定的保密學位論文,于 年 月 日解密,解密后適用上述授權。

(√)2.不保密,適用上述授權。

(請在以上相應括號內打“√”或填上相應內容。保密學位論文應是已經廈門大學保密委員會審定過的學位論文,未經廈門大學保密委員會審定的學位論文均為公開學位論文。此聲明欄不填寫的,默認為公開學位論文,均適用上述授權。)

聲明人(簽名):

年 月 日

摘 要

稅收征管和納稅服務是稅收工作的兩大核心業務。強化核心業務,關鍵在于提高稅源管理水平。稅源管理水平的高低,很大程度上取決于是否有效地解決“兩個不對稱”問題,即征納雙方之間的信息不對稱、稅務系統內各部門之間的信息不對稱問題。這就要求稅務部門首先要打通稅務系統內各部門之間的、稅務系統和各經濟主管單位之間的信息交互渠道,整合來至其他社會部門的涉稅資源。并在此的基礎上,從稅收工作實際出發,強化稅收情報綜合分析能力,打破“兩個不對稱”的信息藩籬,從源頭上提高稅源管理效益。

我國稅務系統經過多年的信息化建設,尤其是金稅工程的不斷推進,基本實現了稅收征管工作的數字化,但對海量稅收數據的監、管、用缺乏全生命周期的規劃,這成為稅務部門有效發揮其職能作用的瓶頸。利用現代信息處理技術,強化涉稅數據管理與應用,已成為各國稅務部門提升稅源管理水平的突破口。

本文按照總局“信息管稅”的總體要求,針對基層稅務機關的開展稅收征管和納稅服務工作實際需要,結合某市國家稅務局稅收數據綜合應用平臺的建設思路和要求,利用數據倉庫、數據挖掘等信息處理手段,進行分析挖掘等技術手段,對多種來源的涉稅數據進行全生命周期的質量監督和管理,全力確保涉稅信息“采集數據、挖掘信息、發現規律、獲取知識”的稅收數據分析利用鏈條的質量,提升稅收數據信息和價值發現的有效性、可靠性,進一步發揮信息化建設對推進稅收事業發展的支撐作用,推進征管體系現代化,服務經濟、社會發展的“新常態”。

關鍵詞: 稅收數據綜合應用平臺;稅源管理;信息不對稱

I

Abstract

Tax revenue collection and management are two of the main businesses of taxation work。To strengthen the core business, the key is to raise the level of tax source management. And the level of tax source management depends on whether we can solve two kinds of the information asymmetric problem or not. In another words, we need to solve the information asymmetry problem between the taxpayers and collection department, and between different departments in tax system. Hence, this requires us to make ways for information exchange between different departments in tax system and between the tax system and various economic unites, to integrate the tax resources from other social sectors. Given on that, we should Starting from the reality of tax work, strengthening the comprehensive analysis ability in tax information, breaking the obstacles of two asymmetric, so as to improve the efficiency of tax source management from the beginning.

After years of information construction in our tax system, especially the continuing boosting of golden tax project, our county realizes the digitalization in tax collection work. But, for rapid development of social economic environment, it is

still lack of overall plan of tax data monitoring, management and using with the full data life-cycle, which becomes the bottleneck of effectively play functions in tax departments. So using modern information processing technology and strengthening the tax-related data management and application, has become the breach of the tax department to enhance the level of tax source management.

????? 缺33333

Keywords: Tax Data Integrated Application Platform;Tax Source Management; Tax Data Monitoring

目 錄

摘 要 ........................................................................................................... I Abstract .................................................................................................... II 目 錄 ........................................................................................................ IV

第1章

1.1

1.2

1.3

第2章

2.1

2.2

2.4.1

2.4.2

2.4.3

第3章

3.1

3.2

3.2.1

3.2.2

3.2.3

3.2.4

3.2.5

3.3

3.3.1

3.3.2

3.3.3

3.3.4

3.3.5

3.3.6

3.3.7 緒論........................................................................................... 1 項目開發的背景 ...................................................................................... 1 國內外研究現狀綜述 .............................................................................. 2 本文的研究方向及主要工作 .................................................................. 2 項目整體架構 ....................................... 錯誤!未定義書簽。 項目定位與目標 .................................................... 錯誤!未定義書簽。 項目設計原則 ........................................................ 錯誤!未定義書簽。 開放性與獨立性統一原則 .................................... 錯誤!未定義書簽。 可持續發展原則 .................................................... 錯誤!未定義書簽。 先進性與成熟性結合原則 .................................... 錯誤!未定義書簽。 需求分析 .................................................................................. 4 項目需求綜述 .......................................................................................... 4 業務需求 ..........................................http://www.solarmaxlimited.com........................................................ 8 查詢統計 ................................................................ 錯誤!未定義書簽。 報表管理 ................................................................ 錯誤!未定義書簽。 報告管理 ................................................................ 錯誤!未定義書簽。 OLAP分析 ............................................................... 錯誤!未定義書簽。 數據挖掘應用 ........................................................ 錯誤!未定義書簽。 技術需求 ................................................................................................ 12 框架需求 ................................................................ 錯誤!未定義書簽。 性能需求 ................................................................................................ 23 可擴展性需求 ........................................................................................ 24 可操作性需求 ........................................................ 錯誤!未定義書簽。 可靠性需求 ............................................................ 錯誤!未定義書簽。 數據需求 ................................................................ 錯誤!未定義書簽。 數據應用對象需求 ................................................ 錯誤!未定義書簽。

3.3.9

第4章

4.1

4.2

4.3

4.4

4.4.1

4.4.2

4.4.3

第5章

5.1

5.1.1

5.1.2

5.1.3

5.2

5.2.1

5.2.2

5.2.3

5.2.4

5.2.5

5.2.6

5.2.7

5.3

5.3.1

5.3.2

5.3.3

5.3.4

5.3.5

第6章

6.1

6.2

6.3 其他技術需求 ........................................................................................ 25 概要設計 ................................................................................ 26 總體框架設計 ........................................................ 錯誤!未定義書簽。 數據架構設計 ........................................................ 錯誤!未定義書簽。 應用架構設計 ........................................................ 錯誤!未定義書簽。 非功能設計 ............................................................ 錯誤!未定義書簽。 性能設計 ................................................................ 錯誤!未定義書簽。 可靠性設計 ............................................................ 錯誤!未定義書簽。 可維護性設計 ........................................................ 錯誤!未定義書簽。 數據支撐層的詳細設計與實現 ........... 錯誤!未定義書簽。 數據支撐層架構規劃 ............................................ 錯誤!未定義書簽。 生產系統數據層 .................................................... 錯誤!未定義書簽。 數據倉庫層 ............................................................ 錯誤!未定義書簽。 分析應用系統層 .................................................... 錯誤!未定義書簽。 數據模型的設計與實現 ........................................ 錯誤!未定義書簽。 數據層次模型 ........................................................ 錯誤!未定義書簽。 歷史區..................................................................... 錯誤!未定義書簽。 原子區..................................................................... 錯誤!未定義書簽。 匯總層..................................................................... 錯誤!未定義書簽。 主題數據概念模型 ................................................ 錯誤!未定義書簽。 邏輯模型實例 ........................................................ 錯誤!未定義書簽。 模型管理工具 ........................................................ 錯誤!未定義書簽。 數據的抽取、轉換和加載 .................................... 錯誤!未定義書簽。 總體設計 ................................................................ 錯誤!未定義書簽。 數據同步 ................................................................ 錯誤!未定義書簽。 OT-ETL ..................................................................... 錯誤!未定義書簽。 數據加工 ................................................................ 錯誤!未定義書簽。 數據反饋 ................................................................ 錯誤!未定義書簽。 應用支撐層的詳細設計與實現 ............................................ 26 應用層總體架構 .................................................................................... 55 應用支撐功能模塊定義 ........................................ 錯誤!未定義書簽。 應用支撐層的實現 ................................................ 錯誤!未定義書簽。

6.3.2

6.3.3 分析引擎設計 ........................................................ 錯誤!未定義書簽。 通用分析工具設計 ................................................ 錯誤!未定義書簽。

第7章

7.1

7.1.1

7.1.2

7.1.3

7.1.4

7.1.5

7.2

7.2.1

7.2.2 重點功能模塊設計與實現 ................... 錯誤!未定義書簽。 一戶式管理子系統 ................................................ 錯誤!未定義書簽。 一戶式——整體設計 ............................................ 錯誤!未定義書簽。 邏輯結構 ................................................................ 錯誤!未定義書簽。 一戶式——首頁 .................................................... 錯誤!未定義書簽。 一戶式——查詢統計 ............................................ 錯誤!未定義書簽。 界面設計與實現 .................................................... 錯誤!未定義書簽。 收入分析 ................................................................ 錯誤!未定義書簽。 領導駕駛艙設計 .................................................... 錯誤!未定義書簽。 稅源地圖 ................................................................ 錯誤!未定義書簽。

第8章

8.1

8.2

8.3

8.4

8.4.1

8.4.2

8.4.3

8.4.4

8.5 項目測試 ................................................................................ 56 測試目標 ................................................................................................ 56 測試規劃及方案 .................................................................................... 56 測試準備 ................................................................................................ 57 測試內容與結果 .................................................................................... 57 數據和數據庫完整性測試 .................................................................... 57 接口測試 ................................................................................................ 57 功能測試 ................................................................................................ 58 性能測試 ................................................................................................ 59 測試結果分析 ........................................................................................ 64

第9章

9.1

9.2 總結與展望 ............................................................................ 65 總結......................................................................................................... 65 展望......................................................................................................... 65

參考文獻................................................................................................... 67

致 謝 ....................................................................................................... 69

第1章 緒論

1.1 項目開發的背景

經濟決定稅收,稅收影響經濟。近年來,經濟的發展逐漸呈現出從要素驅動、投資驅動轉向創新驅動的“新常態”[1]。作為和經濟密切相關的稅收工作,也必然會呈現出。在社會經濟走向“新常態”的過程中,與之密切相關的稅收工作將會面臨更多的挑戰。目前,我國的稅制結構仍然以間接稅為主,在由10%左右的高速經濟增長向7%左右的中高速經濟增長“新常態”轉變的過程中[2],稅收增長率的減速幅度通常會大于經濟增長率的減速幅度。同時,經濟結構變化必然帶來稅源結構的深刻變化。一方面,經濟實體的組織形式、經營方式不斷增加,發展速度不斷加快 [3]。稅源呈現出復雜性、隱蔽性和流動性越來越突出、越來越普遍的特點[4]。另一方面,隨著房地產稅等涉及個人的直接稅改革的推進,納稅人的范圍將在現有企業、個體工商戶的基礎上增加自然人,納稅人數量將從“大量”變成“海量”;其高容量(Volume)、多樣性(Variety)、速度(Velocity)及價值(Value)的4V特性[5],直接導致了稅務部門的數據來源更加廣泛、數據類型多種多樣。這使得各級稅務機關如何更加有效的“監、管、用”稅收信息,持續提高涉稅數據質量的問題逐漸顯現出來。

同時,在稅收“新常態”下,我國稅務系統不斷“加強稅收征收管理信息系統的現代化建設”[7]!敖鸲惾诠こ獭钡耐茝V建設,一是在全國稅務系統的范圍內,包括國稅系統和地方稅務系統,規范了涉稅數據的采集、處理和管理機制,為信息分析利用準備了數據基礎;二是金稅三期工程主體系統在國家稅務總局、國稅系統和地稅系統的全面應用,實現了全國稅收管理信息系統的統一,為大范圍的涉稅信息分析利用提供了技術條件;三是全國、省級數據大集中、涉稅數據分類管和統一的稅收征管工作要求,為信息分析利用整合了統一的管理體系[8]。

綜上所述,現階段,我國稅務系統既存在強化稅收數據質量監督、規范涉稅數據使用的內在要求,也具備了深度分析利用涉稅數據所需的物質基礎、技術條件和管理體系。

1.2 研究現狀和問題

西方國家,如美國、德國、日本、意大利、澳大利亞等國家,稅收信息化建設起步早、發展快、歷時長、技術沉淀和經驗積累深厚,已經逐漸從簡單的統計分析發展到有理論支撐、技術先進、管理配套的現代稅收數據質量管控系統。例如,美國聯邦稅務局(IRS)通過兩個全國性的總部計算機中心和10個區域性的大區服務中心實現了稅收數據的高度管理,在進行業務管理、實現有效的稅源管理、征收率高達80%以上的同時,稅收直接成本下降到0.4%左右[6]。

我國稅收信息化建設走過了以業務處理為主的、以“單機使用”、“稅網/新稅網”、“省級集中”為標志的信息化建設歷程,進入了以“金稅三期”為標志的“業務處理系統和決策支持并重”、“統一系統、統一流程、統一數據”、全國涉稅數據總局/省局兩級集中的新的發展階段。全國各級稅務部門在不斷探索數據分析和稅源管理工作的過程中,都對如何通過技術手段提高數據質量的問題進行了不斷的研究和實踐。例如,XX國稅利用稅收數據綜合應用平臺,整合了金稅三期系統數據、防偽稅控系統數據、車輛購置數據以及工商、海關、質檢、能源、交通、公安等多個部門的涉稅,通過多方比對的方式排除疑點,提高數據質量。但是,由于局限于當時現實條件,涉稅數據質量的管理能力和效率都較為有限,無法滿足“新常態”下經濟社會發展對稅收工作提出的時代要求。

1.3 本文的研究方向及主要工作

本文按照總局“以信息管稅為依托,努力構建稅源專業化管理新體系”[9]的總體思路,立足金稅三期系統,借鑒其他行業對業務數據質量管控的實踐經驗,針對涉稅數據質量管理“沒人管”、“沒法管”等問題,在某市國家稅務局稅收數據綜合應用平臺的整體框架下,從各種來源的涉稅數據的采集、整理、保存、流轉、使用等多個環節入手,【??????】利用 、 等現代信息處理技術,采用。。。。。。。的手段,不斷豐富涉稅數據質量的跟蹤監控手段,預警數據使用風險,完善涉稅信息“采集數據、挖掘信息、發現規律、獲取知識”的分析利用鏈條,進一步發揮信息化建設對推進稅收事業發展的支撐作用。本項目是XX市國

家稅務局強化數據質量管控、深化數據分析利用,努力適應稅收工作“新常態”的一次新的嘗試和努力。

1.4 本文的組織結構

第1章是緒論。從內部原因和外部原因,既經濟發展“新常態”和稅收工作“新常態”,兩個方面分析了稅收數據質量管控的必要性和可行性,介紹了當前研究的概況以及主要的問題,明確了本文的研究方向,并對論文的組織結構進行了說明。

第2章是需求分析。從業務需求描述,采用流程圖和用例圖描繪了系統的功能需求,包括指標管理需求分析、計劃管理需求分析、支付管理需求分析、銀行管理需求分析、公務卡管理需求分析、工資統發需求分析、數據報表需求分析和系統管理需求分析等。

第3章是系統設計。詳細的介紹了系統的總體框架設計、功能架構設計圖,總體功能設計、數據庫設計和安全設計等。

第4章是系統實現。詳細介紹了系統的實現環境、主要界面設計以及關鍵功能模塊的實現過程,給出了重要功能的實現代碼。

第5章是系統測試。包括系統的測試環境,功能測試用例設計、功能測試結果分析以及性能測試場景設計和性能測試結果分析,并給出了具體的測試分析圖。

第6章是總結與展望部分?偨Y了本文所開展的研究工作,給出了后期系統需要改進的地方。

第2章 需求分析

2.1 項目需求綜述

2.1.1 業務現狀分析

隨著稅務信息化建設不斷向深度和廣度發展,征管數據的采集和覆蓋范圍日益擴大,就實際工作來看,在綜合征管軟件數據采集和處理過程中,出現了部分質量低下、無效、冗余、不合法、不一致的數據,稅務生產系統數據質量現狀不容樂觀,而對于未來稅務大數據的應用來說,數據質量又是一個分析系統的生命力之源。作為目前稅務涉稅信息的數據質量管控還未有信息化的支撐,往往在業務人員發現了數據質量事故發生或被發現之后,由信息化人員采取人工的方式去排錯、去清理。目前這種基于事后,人工管控的數據質量治理手段基于以下流程展開:

目前基于上述流程的人工數據質量管控有以下不足:

1. 所有數據質量的問題發現只能靠事后,實際工作中業務人員被動的發現,

無法提前治理,導致質量事故的發生。

2. 數據質量問題即使分析到數據異常規則,由于無法獲知數據異常的生產

來源,數據質量還會隨著生產數據的產生而產生,無法從根本解決數據質量管控。

3. 整個質量管控的過程成果維護起來費時費力,存在大量的返工,成本加

高。

4. 基于人工的數據質量管控成果信息無法歸集,也無法進行成果分析和宏

觀的預警,無法為輔助決策提供

2.1.2 業務流程分析

面對目前人工執行數據質量管控的弊端,為解決目前稅務局數據倉庫的數據質量管控,依賴信息化系統建設,降低質量管控的難度,在降低成本的同時,增強數據分析的準確性。原則上,可以將數據質量按照業務約束和技術約束來區分,例如行業認定和經營范圍不符合的異常數據,直接影響群體分析的準確性,所以對于這種限制于業務影響的,稱之為業務約束導致的數據質量問題。對于重復記錄、字符類型不符、長度不符的,編碼規范不符的,直接受數據庫技術約束,稱之為技術約束數據質量問題。受技術約束的數據質量問題,一般有估計的解決規則,發現異常可以按照重復的規則處理。受業務約束的數據質量問題,一般需要人工的治理,系統需要能自動識別和任務推送即可。

將傳統人工數據質量管控和信息化相結合的思路,就需要梳理出利用信息化分析的整個基于數據倉庫的數據質量管控系統業務流程,目前結合傳統業務,規劃整個業務系統的流程如下:

如上圖流程,同過引入信息化數據質量管控流程后,和現狀業務相比,數據質量管控具有以下優點:

1. 實現了數據質量規則的維護,成果會有數據保留,利于成果復用和規則

完善。

2. 增加了周期性的自動化掃描分析,降低人工重復查找數據質量難度和時

間,節省了人力和成本。

3. 增加了自動清理環節,對于分析出來的數據質量問題,尤其針對生產數

據無法從源頭解決的數據質量問題,一旦有確定的清理規則,可以結合周期掃描監控來及時自動化進行數據異常數據清理。

4. 系統考慮到有些由于業務操作引起數據質量問題,需要具體業務人員根

據實際具體治理的,則系統提供人工統籌流程,及時提醒提示治理。

5. 在系統流程實現數據質量管控的基礎上,進行各個環節的成果進行分析,

含跟蹤管理和效應分析。

6. 隨著數據質量管控成果知識的積累,可以依賴成果數據進行宏觀預警,

對高發的數據質量問題或高發的群體,自動化分析,提供預警信息。

2.1.3 系統角色分析

按照系統業務流程分析,系統流程可分為制定數據質量模型、管控方案、掃描分析、任務統籌、質量治理、成果分析、監測預警等主要環節。掃描監控為系統后臺功能,在系統流程上可以和管控方案合并為分析監控環節。按照這樣的分析可以將系統共分為:質量模型、分析監控、任務統籌、質量治理、成果分析、監測預警核心業務模塊?紤]該系統需要單獨部署需要單獨的系統管理模塊。所以按照系統業務模塊,劃分系統角色如下:

圖2-1: 圖 2.2 業務需求

2.2.1 質量模型需求

質量模型是將數據質量從業務轉化成技術實現的基礎,是將平時業務人員能看懂的數據質量業務規則通過質量模型的維護,轉化到具體數據表上的邏輯規則定義。質量模型業務上的規劃可分為四層設計思路,分別為數據層、對接層、邏輯層、規則層,分別通過指標元、指標和模型來維護出數據質量模型。應實現數據質量規則管理,在標準的數據質量規范之上,通過數據質量審計和數據一致性

比對來對數據質量進行檢查,發現數據出現差錯的環節。質量模型就是將示意圖如下:

2.2.2 分析監控需求

分析監控主要是將維護的質量模型通過設定分析方案、分析規則、掃描監控、數據質量信息、審核,確定通過定義周期實現執行風險模型自動掃描,最總成果為數據質量信息。分析方案可以維護自動治理規則或者選擇人工質量,需要有自動的監聽執行功能和高效能的分析引擎。分析監控的主要流程圖如下:

2.2.3 任務統籌需求

任務統籌實現對審核通過的數據質量信息,進行任務統籌下發,主要存在多任務的合并和逐級下發功能。處理好任務統籌,就需要對市、區縣、分局三級的用戶人員功能進行操作,任務統籌可以分為主要以下環節:任務定義、任務下發、任務接收、任務合并、任務分配,通過分析可以樹立出目前任務統籌的一個整體流程如下:

2.2.4 質量治理需求

質量治理是最后管控過程的最后一道環節,主要操作對象是科所級的用戶操作。質量治理在方式上要提供給用戶任務辦理和處置的頁面,同時要有對處置結果的檢測功能,確保治理后的效果。同時考慮業務上的需求,該模塊還需要具有審核流程和辦結等處理。所以梳理的質量治理需求流程圖如下:

2.2.5 成果分析需求

1. 過程跟蹤

主要實現質量管控各個環節的成果進行統計跟蹤,包括模型體系的指標元、指標、模型的建立數量;分析監控的方案、掃描分析、數據質量數據等;任務制發、流轉、超限的過程跟蹤;治理的進度和成果進行跟蹤。

2. 效應分析

主要是對治理前的數據質量問題和治理后數據質量問題進行宏觀比對,通過比對算法,對不同業務指標的計算準確性等從治理前到治理后對比,對治理前后

的數據質量問題遺漏情況進行比對效應分析。通過這些分析,驗證業務系統完整性,不斷對質量模型進行優化。

2.2.6 分析預警需求

數據質量管控系統處理結果的積累上,可將數據質量管控結果作為知識積累,一方面對大量的質量數據進行分析,找出問題突出的數據質量問題和來源,有方向有側重點的在某些行業某些區域加大數據質量管控,進行宏觀的輔助決策。其次,利用整個質量管控知識庫,可以根據業務數據依賴規則、數理統計、二八原理、人工智能算法等進行潛在的數據質量問題預警,提高數據質量管控的持續深入發展。核心的業務可以從分析和預警兩個方面考慮:

1. 數據質量管控結果分析的分時間、稅務機關、分質量模型、分行業等維度進行宏觀分析,找出問題突發區域,進行輔助決策。

2. 潛在數據質量問題的預警,依賴進行預警值測算和人工智能算法等方式進行分析,進行潛在關聯的數據質量問題預警。

2.2.7 系統管理需求

系統管理主要是確保系統有獨立的權限控制系統和運維監控功能,主要分為權限管理和日志管理兩方面,對系統安全和優化提供監控數據。

1. 用戶、崗位、角色管理,進行系統用戶密碼、身份的維護;

2. 日志管理,監控系統登錄日志、菜單訪問日志、系統報錯日志、流量監控日志的查詢監控。

2.3 功能需求

本章節采用UML建模中的用例建模來分析業務需求中的需要包含的系統功能需求分析。參照系統角色分析,系統中的用戶可按照角色對應分別為:質量模型維護和分析監控管理工作交由各級信息中心技術人員操作;任務統籌環節,由各級機關設置專門的數據質量管控專員負責各級任務接收流轉;質量治理主要有各業務處室的業務操作人員執行;成果分析用戶和分析預警用戶主要提供給各層級機關局領導使用,進行宏觀輔助決策工作使用;設定單獨的專人做系統管理員。所以該系統的所有用戶為:技術人員、管控專員、業務操作人員、局領導和系統管理員。以下是對系統流程中核心功能模塊的功能需求分析,如下圖(系統整體

用例圖)。

局領導

2.3.1 模型體系管理

質量模型體系在功能上是要將業務上的數據質量規則和要求,通過系統功能進行實現定義出來,分別建立功能點來實現對接層、邏輯層和規則層的功能,所以該模塊在功能上可以分為指標元管理、指標管理、模型管理三個功能來實現。

技術人員

2.3.1.1 指標元維護

指標元維護在功能上主要將數據層到應用層的對接,是將來源數據表的字段定義成可視化的業務名詞,是對底層數據庫到業務層的名詞對照關系維護,指標元維護的主要功能有:指標元新增、指標元修改、指標元移除、指標元導出、批量新增和指標元檢測等主要用例,如下圖所示:

技術人員

表2-1 指標元維護用例表

2.3.1.2 指標維護

指標維護功能對照業務需求質量模型的邏輯層維護功能,是將業務指標的加工規則公式和部分數據函數基于指標元定義出來。指標維護的主要功能有:指標維護、指標修改、指標移除、指標導出、批量維護和指標檢測等主要用例,如下圖所示:

表2-2 指標維護用例表

2.3.1.3 模型維護

模型維護功能對照業務需求質量模型的規則層維護功能,基于指標,定義出來數據質量業務判斷過濾的邏輯規則。模型維護的主要功能有:模型維護、模型修改、模型移除、模型檢查等主要用例,如下圖所示:

表2-3 模型維護用例表

2.3.2 分析監控管理 2.3.2.1 管控方案管理

監控方案管理是設置出數據質量監控的數據范圍和執行規則,包括所使用的質量模型、分析期間、是否周期掃描、行業、稅務機關、清理規則等。主要功能用例如下:

表2-4 監控方案維護用例表

2.3.2.1 掃描監控管理

掃描監控主要是按照維護的質量模型規則和方案規則進行自動化的監控分析,包括觸發開始時間、結束時間、異常信息、結果信息等。掃描監控功能上需要實現一個高能效的分析引擎來保障自動調度和智能算法解析掃描,具體功能如下:

表2-4 掃描監控維護用例表

2.3.3 任務統籌管理

任務統籌管理功能是實現了將數據質量問題清單通過任務流轉方式,最終確定治理人員和質量方式,確保管控流程閉環。主要功能實現省、市、(縣)區、科所人員間的任務流轉,實現數據治理任務流轉到具體的處置人員。主要的功能用例如下:

表2-4 任務統籌維護用例表

2.3.4 數據質量治理

數據質量治理主要是在確定人員和確定方式后,對數據質量問題進行清理,清理后進行下規則檢測,確保數據清理的正確性。主要功能包括異常數據清理和規則檢驗、提交審核、辦結處理。

異常數據清洗、清理、驗證。

表2-4 數據質量治理用例表

2.3.5 管控成果分析

在系統實現數據質量管控的流程環節基礎上,對各個環節的過程成果和過程情況進行分析和跟蹤,含跟蹤管理和效應分析,主要功能用例如下:

表2-4 管控成果分析用例表

2.3.6 分析預警

分析預警主要包括兩部分功能,包括宏觀分析和潛在數據質量問題預警,提供給管理者輔助決策信息。宏觀分析包括分稅務機關、分行業、分質量模型等多維度的成果查詢統計分析。數據質量預警主要通過預警算法維護、預警值測算和監控預警。具體的分析預警用例如下:

分稅種、分行業、分月份、分事項等;

表2-4 分析預警用例表

2.3.7 系統管理

系統管理主要功能為權限管理和日志管理兩個模塊內容,權限管理功能包括用戶管理、角色管理、崗位管理,日志管理主要是用戶登錄情況日志監控、菜單訪問日志、系統報錯日志、流量監控日志的日志監控功能。具體用例如下:

表2-4 系統管理用例表

2.4 非功能需求

2.4.1

性能需求

數據質量管控系統用戶對象為所有內部稅務人員,全局稅務人員6000名,其中主要的用戶群體為信息中心負責數據運維人員使用,預計全局使用用戶為1000名。按照目前的規模評估用戶并峰值在100左右。系統登錄性能要求為平均登錄響應時長不能超過5s,最長不能超過10s。系統核心是對大數據的質量監控,核心的性能問題會集中在數據統計和模型分析引擎的執行性能,既包括分析引擎對服務器的資源占用,分析過程對數據庫的資源占用。性能過程需對應用服務器和數據庫服務均進行性能監控和優化,服務器的CPU占用不能高于60%,內存占用不超過70%。

其他具體系統模塊的性能要求如下: 查詢類業務性能要求:

分析型業務性能要求:

2.4.2 安全性需求

系統接入安全:

1、渠道安全:應用系統對所有的接入渠道進行渠道安全校驗,只有被許可的接入渠道才能接入應用系統。

2、身份認證:應用系統對所有的接入渠道需要通過口令認證方式進行身份認證,只有被許可的接入渠道及提供正確的口令才能使用應用系統提供的服務。

3、權限控制:應用系統對所有的接入交易請求根據渠道進行權限控制,只有被許可的渠道接入及被允許的交易請求才能正常使用應用系統提供的服務。

系統數據安全:

1、傳輸安全:關鍵數據在傳輸過程中,必須加密傳輸,以保證數據的傳輸安全性。

2、存儲安全:根據國家稅務局等級保護三級要求,應用系統必須保證數據的存儲安全。因此,在稅務局內部網絡環境下,必須將與業務相關的數據保存在稅務局內網區域(核心區域)。 2.4.3

可擴展性需求

系統應能適應稅務數據應用需求復雜多變的要求,考慮未來 3-5 年的可擴展性,采用構件化設計思想,系統框架與業務邏輯分離,具備開放的可擴展體系

結構,支持在線升級和擴展,支持多用戶和并行訪問。系統的設計應確保在用戶

系統保存已有和未來至少五年的(共十年以上)最明細的業務數據。進入數據倉庫的數據應與生產系統中的數據保持一致。經過數據清洗、裝載、查詢、展現后為用戶提供準確的數據。 2.4.4

其他技術需求

建立統一的數據模型標準。技術框架采用J2EE架構,JAVA語言為主要開發語言,基于B/S(Browser/Web Server)和關系型數據庫方式實現。具體需求如下:系統后臺采用WINDOWS SERVER、UNIX 等平臺、WEBLOGIC等應用服務和 ORACLE大型數據庫。

第3章 系統設計

3.1 應用體系設計

根據總體設計,操作型業務與分析型業務需要進行分離設計。本系統的模塊可劃分如下:

3.1.1操作型業務

操作型業務設計以生命周期管理為核心,以工作流的驅動方式執行全流程的閉環控制管理。

本子系統的操作型業務有模型體系管理告、任務統籌管理、數據質量治理等業務。

下面重點闡述管控生命周期管理,其它模塊的設計重點為數據模型設計,將在數據體系結構中展開。

1. 數據質量管控的生命周期管理 如下圖所示:

數據質量掃描得到的掃描疑點的明細信息,進入數據信息庫。 ? 處理

數據掃描疑點明細信息,需要進入疑點風險評價環節,該環節是疑點信息量化的主要步驟,將通過排序等手段,生成疑點數據等級等信息。

? 消除

數據疑點信息在應對完畢之后,通過應對系統的反饋,消除該數據疑點信息。 2. 數據質量管理閉環控制

數據質量管控管理是一個閉環操作,圍繞數據疑點管理戰略目標實施,通過疑點數據識別、分析、評價、應對、管理全程監控及結果評估構成閉環,同時通

過不斷的監控、分析報告對整個管理過程進行持續改進。

閉環需要較為完備的流程控制,以上描述的生命周期管理,將以工作流的驅動方式進行管理,工作流程圖如下所示:

說明:

綜合分析數據質量管控的主要功能模塊,以及數據質量管控與其他子系統的關聯使用,得到以下體系結構圖:

數據質量管控體系結構圖

說明:

1. 總體技術架構

公司的技術架構,包含前端、web、框架、通信各個層面解決手段。 2. 指標管理平臺

數據質量管控基于指標管理平臺設計,指標管理平臺提供豐富的支撐功能。 3. 核心服務

系統的核心服務,如組件管理,運維管理等。 4. 業務邏輯層

業務邏輯的封裝,隔離底層與界面層的交互。 5. Web應用功能 1) 界面層

數據質量管控主要分為7個模塊:

6. 接口

數據質量管控的接口層,與外部系統的接口都在此層面規劃。

3.1.2分析型業務

數據質量管控的分析型業務主要有指標預警值測算和風險掃描等,這兩個業務都是依賴指標管理平臺,如下圖所示:

指標預警值測算是數據掃描的一個必要輸入,在掃描過程中,可能會使用到指標的預警信息如均值、上下限等,這些都是需要事先預處理的,指標管理平臺提供相關的指標測算服務。

掃描是對掃描方案的執行過程,在分解了掃描方案之后,主要的工作就是調用指標管理平臺的分析引擎服務,執行相關的操作,并保存結果。

3.2 架構設計

3.2.1技術架構

本項目采用J2EE相關的架構進行開發,技術架構圖如下:

31

架構說明:

1. 整個架構主要由客戶層、中間層(web層、架構層、EJB層)、資源層組成。

2. 客戶層:系統最終用戶的使用界面和設備。一般為基于瀏覽器的瘦客戶端,比如IE等;本項目中使用了SUI來實現展現效果。

3. 中間層:用戶和系統之間的交互管理,提供用戶層的展現邏輯和對資源層的訪問接口。該層主要采用Front Controller, Request Processor, Command, View Dispatcher,DAO、工廠等設計模式來實現。本項目在WEB層使用Webfaster,在架構層使用SOA。

4. 資源層(EIS):各種信息系統資源,在本系統中主要用到了:RDBMS(數據庫),以及文件數據容器(主要是在分析引擎中使用)。

3.2.2體系架構

界面管理模塊的執行過程如下圖所示:

32

展現層

說明:

1.

用戶通過操作界面與系統進行交互。

2. 用戶操作的數據經過展現層、接口層、核心層,最終存儲到數據層中。 3. 展現層包括了傳統架構分層中的界面層、web層、架構層、業務邏輯層

的一部分。

4. 接口層、業務核心層是對傳統業務邏輯層的進一步細化,業務核心層包

含了傳統業務邏輯層的大部分內容;部分功能遵循此結構。

應用執行體系將設計期和運行期分離設計,將部分功能充分松耦合,達到靈活性、可擴展性和復用性,如下圖所示:

說明:

掃描方案執行器接收到掃描方案實體對象,將對象解析后調用指標管理平臺

33

提供的算法和子系統內部處理邏輯,完成掃描,輸出掃描結果信息。

在設計期,系統只需要生成樣掃描方案等內容,將這些內容存于數據庫即可。 在運行期,通過手動觸發或者系統自動任務監聽,讀取并解析設計期的成果,生成相關的執行實例,調用分析引擎等工具,執行得到結果,寫入執行結果相關數據庫表。

方案是數據質量管控的關鍵數據對象,是掃描的基礎,它需要滿足風掃描這一動態執行功能的業務和技術兩方面的要求,這個要求如果再做一個邏輯抽象,可以很直觀地將方案劃分為兩個執行部分:方案的執行實體和方案執行參數。

除此之外,方案還要能提交到知識庫與大家分享,方案可以方便展現出來。 綜上分析,這個關鍵數據對象的劃分如下圖所示:

執行實體指明的是掃描執行的具體業務對象、風險分析算法等內容,執行參數則是用于支撐動態執行所必須的周期頻率、執行時間等參數。

更具體的設計內容見“關鍵設計”章節。

風險方案執行器在接收到掃描方案實體對像后,先進行對象的檢測,以確定對象是否適應當前的執行環境。

檢測通過之后,執行對象的解析,產生可以計算的實體對象,如指標信息,計分規則信息等。然后依據對象的類別調用不同的執行器實現類執行運算,運算過程中根據需要調用指標管理平臺提供的算法,最終完成運算結果的輸出。

具體實現流程如下圖所示:

34

35

說明:

方案如果想正確執行,我們需要知道,方案是否適應當前的環境,因此,方案執行的時候系統將自動觸發方案的檢測,方案的檢測產物主要是方案的檢測狀態和檢測報告。

掃描方案的實體對象在檢測通過之后,進入分解環節,該環節主要的分解結果是模型、指標和運行所需的參數。任務監聽程序會監聽運行參數,在合適的時候啟動掃描流程。

掃描方案執行流程中,首先要處理的就是分解環節的模型、指標信息,這是風險掃描的關鍵所在,預處理通過之后才執行相關的處理流程。

3.3 數據體系設計

3.3.1 概念模型

在設計數據模型時,必須從基于合乎業務基本原理的業務規則出發,根據業務內涵來設計數據存儲的模型。這點能夠大大提升單位數據的處理效率,是有效解決該問題的基礎。合理的數據分層規劃和數據分布設計,能夠更好的理順數據間的關系,從而可以簡化數據的存儲、數據的處理,從而提升效率。 在設計數據模型時必須遵循以下原則:

? 完整性原則:全面覆蓋稅務業務

? 穩定性原則:實現在保持全局穩定的前提下的持續改進 ? 適應性原則:適應各個層級、不同用戶的需求 ? 高效性原則:實現數據的高效訪問

數據質量管控的概念模型設計,主要是從業務處理流程展開,并考慮輔助系統的其他必須數據,總體概念模型設計如下圖:

36

說明:

4 數據質量疑點識別的核心是數據特征庫,主要包含數據指標與模型,其中疑

點數據特征指標,在獲取指標管理平臺的指標相關基本屬性之外,還享有數據管理所需專用屬性。

5 指標預警值是指標預處理的結果,供后續數據疑點分析環節使用。 6 疑點數據分析方案是分析的基礎,是風險疑點數據掃描的支撐。 7 人員權限信息,用于管理系統的人員權限控制。 8 監控信息,保存系統運維的監控數據。

9 日志記錄,數據質量分析流程相關處理操作統一保存在日志信息實體中,便

于操作查看和追溯。

10 配置控制,數據質量管理業務處理過程中將一些系統參數信息保存到配置信

息實體中,方便修改維護。

37

3.3.3 數據結構

表分類說明

平臺的數據庫表可分為以下幾類:

在數據質量管控系統中,分析監控是最核心的業務功能需求,包括方案定義維護和分析監考,這2塊的數據庫設計如下圖:

模型體系及分析監控

38

3.4 部署體系設計

3.4.1 部署結構圖設計

管理部署結構如下圖所示:

部署風險管理應用服務器、文件服務器、緩存服務器,數據庫服務器。部署策略如下:

1. 數據管控管理應用服務器:管理應用完成界面和流程類操作。 2. 數據庫服務器:數據庫分為:數據倉庫,風險管理庫,指標管理庫,統

39

一權限庫。

3. 緩存服務器集群:負責存在子系統產生的實體數據對象。

4. 監聽服務器:風險系統所有的監聽服務獨立部署一個但節點的應用。 3.4.2 部署硬件設計 建議配置如下:

3.5 模塊設計

3.5.1 模塊功能結構

通過對業務需求和業務架構梳理,歸納數據質量管控功能模塊框架。數據質量管控功能模塊框架總體上分為三大部分,一部分是數據質量管控業務流程實現部分,其中包括數據疑點識別、疑點分析、數據疑點評價;第二部分是應對管理部分,其中包括應對管理、疑點處置;第三部分是質效評價。 從界面模塊以及后臺模塊角度考慮,得到以下模塊結構圖:

40

【電子稅務局畢業論文】相關文章:

稅務局電子檔案管理工作經驗交流材料04-29

稅務局介紹信01-23

稅務局工作總結04-26

稅務局季度工作計劃04-29

稅務局工作計劃8篇12-09

稅務局工作計劃四篇12-02

稅務局工作計劃10篇11-30

關于稅務局實習報告4篇08-29

稅務局信訪工作總結01-27

稅務局工作計劃九篇11-23

国产v亚洲v天堂无码网站,综合亚洲欧美日韩一区二区,精品一级毛片A久久久久,欧美一级待黄大片视频
久久9国产影视大全99久 | 伊人色综合网久久天天 | 日本喷奶水中文字幕视频 | 久久免费国产視频 | 五月婷婷丁香视频在线 | 亚洲另类欧美与日本 |