有关数据挖掘的论文选题背景及意义

数据挖掘、OLAP在财务决策中的应用杨春华（杭州商学院财务与会计学院，杭州，310012）[摘要]数据挖掘、OLAP是当前基于大型数据库或数据仓库的新型信息分析技术，在许多领域得到广泛应用，取得了很好的成效。如何将其应用于财务决策以提高决策的正确性、及时性，降低决策的风险，已成为财务管理领域的重要研究课题。本文在介绍数据挖掘、OLAP技术及其相互关系的基础上，分析了财务决策领域应用这两种技术的现实必要性，并进一步论述了财务决策中数据挖掘和OLAP的应用流程。[Abstract]In this paper， the author introduced Data Mining and OLAP at And then， the author analyzed the practical necessity for the firms to apply these two techniques in the area of financial decision- In the end， the author brought forward the flow of the [关键词]数据挖掘，联机分析处理，财务决策[Key words]Data Mining，OnLine Analysis Process(OLAP)，Financial Decision-making正文随着计算机技术和Internet技术的发展，以及企业在以往事务型处理中数据的不断积累，一方面企业数据资源日益丰富，信息超载，另一方面数据资源中蕴涵的知识企业却至今未能得到充分的挖掘和利用，“数据丰富而知识贫乏”是常见现象。如何才能不被信息的汪洋大海所淹没，并能从中及时发现有用的知识，提高信息的利用效率，已成为企业急需面对的一个问题。正是在这种背景下，数据挖掘、OLAP技术应运而生。这是两种基于大量数据库或数据仓库的新型数据分析技术。将其应用到财务决策领域则有利于提高决策的正确性、及时性，降低决策的风险。一、数据挖掘与OLAP1．数据挖掘关于数据挖掘，一种较为公认的定义是由GPiatetsky-Shapiro等人提出的。他们认为：数据挖掘是从大型数据库中提取人们感兴趣的知识，这些知识是隐含的、事先不知的，潜在有用的信息。数据挖掘涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等各个领域。它不仅面向特定数据库的简单检索查询调用，而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理，以指导实际问题的求解，企图发现事件间的相互关联，甚至利用已有的数据对未来的活动进行预测。这样一来，就把人们对数据的应用从低层次的末端查询操作，提高到为各级经营决策者提供决策支持。2．OLAP联机分析处理（OLAP）的概念最早是由关系数据库之父EFCodd于1993年提出的，它是基于大型数据库或数据仓库的信息分析过程，是大型数据库或数据仓库的用户接口部分，其目的是满足决策支持或多维环境特定的查询和报表要求。简单地讲，OLAP就是共享多维信息的快速分析。它是跨部门、面向主题的，其基本特点是快速性、可分析性、多维性、信息性和共享性。也就是说，OLAP能快速响应用户的要求，能处理与应用有关的任何逻辑分析和统计分析，能提供多维数据分析的多维视图，能及时获得信息和管理大容量的信息，以及能在大量用户群中共享潜在的数据。其中“多维性”是其核心灵魂。3．数据挖掘与OLAP数据挖掘和OLAP都是基于大型数据库或数据仓库的数据分析技术，有着一定的联系和区别。数据挖掘和OLAP最本质的区别在于，数据挖掘是一种挖掘性的分析工具，它主要是利用各种分析方法主动地去挖掘大量数据中蕴涵的规律，产生一些假设，帮助人们在这些假设的基础上更有效地进行决策；而OLAP则是一种求证性的分析工具，一般由用户预先设定一些假设，然后使用OLAP去验证这些假设，提供可以使用户很方便地进行数据分析的手段。但就工具而言，数据挖掘和OLAP这两种分析工具本身又是相辅相成的，且界限正在逐渐模糊。OLAP的分析结果可以补充到系统知识库中，给数据挖掘提供分析信息并作为数据挖掘的依据；数据挖掘发现的知识可以指导OLAP的分析处理，拓展OLAP分析的深度，以便发现OLAP所不能发现的更为复杂、细致的信息。二、财务决策中应用数据挖掘、OLAP的必要性财务决策是企业决策中最重要的组成部分之一。任何好的财务决策都需要事实和数字支持。一个财务决策的正确程度取决于所使用的事实和数字的正确程度。随着竞争的增加，财务决策的时效性也变得越来越重要了。因此，在财务决策领域应用数据挖掘、OLAP是企业现实的需要。1．有利于提高财务信息的利用能力。解决企业财务决策问题需要询问为中心的数据图解，其以序列导向和多维为特征。而传统的财务数据查询是一种事务处理（OLTP），它是面向应用，支持日常操作的，对查询得到的数据信息缺乏分析能力，决策者不能够在大量历史数据的支持下对某一主题的相关数据进行多角度的比较、分析，得出科学的分析结果。因此，财务决策问题自身的多维特性驱动了数据挖掘、OLAP在其领域的应用，以提高财务信息的利用能力。2．有利于解决财务信息的噪音问题。科学财务决策必须以尽可能真实、及时、充分的信息为依据。这些信息既包括诸如企业目标、企业现状、事物状况等企业的内部资料，又包括诸如客户、供应商等企业的关联方资料，还包括诸如市场等企业所需的外部资料。由于网络技术的发展，企业可以通过Intranet、Extranet、Internet方便获取各种企业内部、关联方及外部资料。因此，现今的问题已不是信息缺乏，而是信息过量，难以消化，且信息真假难辨，可靠性难以保证。所以，对企业来说，这时就需要高效的数据分析工具——数据挖掘、OLAP在浩瀚的信息流中分辨、析取、整理、挖掘对财务决策有用的信息，减少信息噪音的影响。3．有利于满足财务信息智能化的需求。由于决策本身的动态性、复杂性，决策者本身素质层次的多样性，不同的情况应有不同的处理方式。传统的数据析取是依靠程序人员在系统开发过程中设计的专用程序来实现，非常机械化。随着数据量的增大，查询的复杂化，这种方式越来越不可取。决策者希望信息的析取过程能够智能化，如不仅能对自己想到的信息进行访问，还能对自己想不到却需要的信息进行访问，对同样数据进行多次访问时，不必须做重复操作；不同决策者作相似访问时，也不必进行重复操作等。数据挖掘能够利用现有的数据来获取新的有用信息，支持查询、存储的优化，使信息的析取具有较强的自我学习功能，满足财务信息智能化的需求。三、财务决策中数据挖掘、 OLAP的应用流程基于数据挖掘、OLAP的财务决策支持系统模型数据挖掘、OLAP是在大型数据库或数据仓库基础上进行深入的数据分析，从而获取海量数据中隐藏的关键信息的主要手段。因此，为了进一步提高财务决策的支持能力，可以将它们结合起来构成一种新型的财务决策支持框架，如图1所示。这个模型中，在数据仓库为财务决策提供完整、及时、准确和明了的综合数据的基础上，OLAP 图1 基于数据挖掘、OLAP的财务决策支持系统通过进行有效集中分析和深入研究，可以发现趋势，看到异常，并得到重要细节，而数据挖掘则可通过使用一系列方法进行分析，从中识别和抽取隐含、潜在的有用知识，并充分利用这些知识辅助财务决策。2．财务决策中数据挖掘流程财务决策中的数据挖掘流程一般由财务决策问题识别、数据准备、数据开采和结果表达和解释四个主要阶段构成，如图2所示。图2 数据挖掘流程（1）财务决策问题识别。典型的财务决策有投资决策、筹资决策、成本决策、销售决策等。在进行数据挖掘前，必须先对具体财务决策问题进行识别，即要确定进行什么决策、达到什么样的决策目标等。然后再将财务决策目标转换成数据挖掘目标，并进行定义。（2）数据准备。这个阶段又可分成3个子步骤，即数据集成、数据选择和数据预处理。数据集成是将多文件或多数据库运行环境中的数据进行合并处理，解决语义模糊性、处理数据中的遗漏和清洗脏数据等。数据选择的目的是辨别出需要分析的数据集合，缩小处理范围，提高数据挖掘的质量。而预处理则是为了克服目前数据挖掘工具的局限性。（3）数据采掘。这一阶段主要进行实际的数据挖掘工作，主要包括决定如何产生假设、选择合适的工具、发掘知识的操作和证实发现的知识等步骤。（4）结果表达和解释。根据用户的财务决策目的对提取的信息进行分析，把最有价值的信息区分出来，并提交给用户。如果结果不能让决策者满意，则重复进行上述过程。3．财务决策支持中OLAP流程财务决策中的OLAP流程一般由财务决策信息确认、维度分析、信息集成、数据切片和数据掘进五个主要阶段构成，如图3所示。图3 OLAP流程（1）财务决策信息确认。在进行OLAP之前，必须先确认要查询、分析的目标数据及其属性，即事实和维。然后用事实表来存储与之相关联的维信息和事实信息。（2）维度分析。对每个目标属性做进一步的分析，如维的层次、成员类别等，并将这些信息用维表保存下来。维表与事实表通过关键字相关联。（3）信息集成。当维数增加和事实表增大时，采用一定的综合、汇总等方法将信息进行集成，并用综合表存储。在综合表中，数据由多维构成，每个维又划分为多个汇总层次，所有元素及其层次关系构成树型结构。各维的层次划分，基本确定了每一维垂直的汇总路径。（4）数据切片。在综合表中，将某一路径与不同方向的其他若干路径作任意组合，就可实现面与块的切割，获取任意组合信息。（6）数据掘进。在数据切片中，沿其中任一条路径进行自上而下的分析，就可获取相应的详细信息。参考文献[1]马丽娜、刘弘、张希林数据挖掘、 OLAP在决策支持系统中的应用[J] 计算机应用研究，2001，（11）：10-[2]胡彦基于数据仓库的决策支持工具的比较研究[J] 计算机应用，2000，20（6）：20-[3]喻钢、周定康联机分析处理（OLAP）技术的研究[J] 计算机应用，2001，21（11）：80-[4]於丹数据挖掘走向Internet——孟小峰先生谈面向Internet的数据挖掘技术[J] 微电脑世界，2000，14（3）：36-[5]胡侃、夏绍玮基于大型数据仓库的数据采掘：研究综述[J] 软件学报，1998，9（1）：53-[6]范小军、王方华数据挖掘在营销领域中的应用[J] 外国经济与管理，2001，23（12）：38-[7]刘明杰、张晓京、刘洪杰、王秀峰、王治宝数据仓库在证券交易中的研究与应用[J]计算机工程，2000，26（2）：47-49、[8]李竹平、吴相林基于数据仓库的企业管理型会计信息系统研究[J] 华中理工大学学报，28（

寿险行业数据挖掘应用分析　　寿险是保险行业的一个重要分支，具有巨大的市场发展空间，因此，随着寿险市场的开放、外资公司的介入，竞争逐步升级，群雄逐鹿已成定局。如何保持自身的核心竞争力，使自己始终立于不败之地，是每个企业必须面对的问题。信息技术的应用无疑是提高企业竞争力的有效手段之一。寿险信息系统经过了多年的发展，已逐步成熟完善，并积累了相当数量的数据资源，为数据挖掘提供了坚实的基础，而通过数据挖掘发现知识，并用于科学决策越来越普遍受到寿险公司的重视。　　数据挖掘　　数据挖掘（Data Mining，DM）是指从大量不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、有用的信息和知识的过程。其表现形式为概念（Concepts）、规则(Rules)、模式(Patterns)等形式。　　目前业内已有很多成熟的数据挖掘方法论，为实际应用提供了理想的指导模型。CRISP-DM（Cross-Industry Standard Process for Data Mining）就是公认的、较有影响的方法论之一。CRISP-DM强调，DM不单是数据的组织或者呈现，也不仅是数据分析和统计建模，而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。CRISP-DM将整个挖掘过程分为以下六个阶段：商业理解（Business Understanding），数据理解(Data Understanding)，数据准备(Data Preparation)，建模(Modeling)，评估(Evaluation)和发布(Deployment)。　　商业理解就是对企业运作、业务流程和行业背景的了解；数据理解是对现有企业应用系统的了解；数据准备就是从企业大量数据中取出一个与要探索问题相关的样板数据子集。建模是根据对业务问题的理解，在数据准备的基础上，选择一种更为实用的挖掘模型，形成挖掘的结论。评估就是在实际中检验挖掘的结论，如果达到了预期的效果，就可将结论发布。在实际项目中，CRISP-DM模型中的数据理解、数据准备、建模、评估并不是单向运作的，而是一个多次反复、多次调整、不断修订完善的过程。　　行业数据挖掘　　经过多年的系统运营，寿险公司已积累了相当可观的保单信息、客户信息、交易信息、财务信息等，也出现了超大规模的数据库系统。同时，数据集中为原有业务水平的提升以及新业务的拓展提供了条件，也为数据挖掘提供了丰厚的土壤。　　根据CRISP-DM模型，数据挖掘首先应该做的是对业务的理解、寻找数据挖掘的目标和问题。这些问题包括：代理人的甄选、欺诈识别以及市场细分等，其中市场细分对企业制定经营战略具有极高的指导意义，它是关系到企业能否生存与发展、企业市场营销战略制定与实现的首要问题。　　针对寿险经营的特点，我们可以从不同的角度对客户群体进行分类归纳，从而形成各种客户分布统计，作为管理人员决策的依据。从寿险产品入手，分析客户对不同险种的偏好程度，指导代理人进行重点推广，是比较容易实现的挖掘思路。由于国内经济发展状况不同，各省差异较大，因此必须限定在一个经济水平相当的区域进行分析数据的采样。同时，市场波动也是必须要考虑的问题，一个模型从建立到废弃有一个生命周期，周期根据模型的适应性和命中率确定，因此模型需要不断修订。　　挖掘系统架构　　挖掘系统包括规则生成子系统和应用评估子系统两个部分。　　规则生成子系统主要完成根据数据仓库提供的保单历史数据，统计并产生相关规律，并输出相关结果。具体包括数据抽取转换、挖掘数据库建立、建模（其中包括了参数设置）、模型评估、结果发布。发布的对象是高层决策者，同时将模型提交给应用评估子系统根据效果每月动态生成新的模型。　　应用评估子系统可以理解为生产系统中的挖掘代理程序，根据生成子系统产生的规则按照一定的策略对保单数据进行非类预测。通过系统的任务计划对生产数据产生评估指标。具体包括核心业务系统数据自动转入数据平台、规则实时评估、评估结果动态显示、实际效果评估。规则评估子系统根据规则进行检测。经过一段时间的检测，可利用规则生成子系统重新学习，获得新的规则，不断地更新规则库，直到规则库稳定。　　目前比较常用的分析指标有: 险种、交费年期、被保人职业、被保人年收入、被保人年龄段、被保人性别、被保人婚姻状况等。　　实践中，可结合实际数据状况，对各要素进行适当的取舍，并做不同程度的概括，以形成较为满意的判定树，产生可解释的结论成果。

有关数据挖掘的论文选题背景和意义

云速数据挖掘在企业信息化建设过程中有一套固定的应用流程，即将各种不同信息转换为企业需要的商业知识。以数据挖掘的具体流程作为基础，对企业信息化建设具有促进作用。

有关数据挖掘的论文选题背景

数据挖掘（Data Mining，DM）又称数据库中的知识发现（Knowledge Discover in Database，KDD），是目前人工智能和数据库领域研究的热点问题，所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程，它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等，高度自动化地分析企业的数据，做出归纳性的推理，从中挖掘出潜在的模式，帮助决策者调整市场策略，减少风险，做出正确的决策。知识发现过程由以下三个阶段组成：（1）数据准备，（2）数据挖掘，（3）结果表达和解释。数据挖掘可以与用户或知识库交互。数据挖掘数据挖掘数据挖掘是通过分析每个数据，从大量数据中寻找其规律的技术，主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集；规律寻找是用某种方法将数据集所含的规律找出来；规律表示是尽可能以用户可理解的方式（如可视化）将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析，等等。并非所有的信息发现任务都被视为数据挖掘。例如，使用数据库管理系统查找个别的记录，或通过因特网的搜索引擎查找特定的Web页面，则是信息检索（information retrieval）领域的任务。虽然这些任务是重要的，可能涉及使用复杂的算法和数据结构，但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构，从而有效地组织和检索信息。尽管如此，数据挖掘技术也已用来增强信息检索系统的能力。起源需要是发明之母。近年来，数据挖掘引起了信息产业界的极大关注，其主要原因是存在大量数据，可以广泛使用，并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用，包括商务管理，生产控制，市场分析，工程设计和科学探索等。数据挖掘利用了来自如下一些领域的思想：(1) 来自统计学的抽样、估计和假设检验，(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想，这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地，需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能（并行）计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据，并且当数据不能集中到一起处理时更是至关重要。发展阶段第一阶段：电子邮件阶段这个阶段可以认为是从70年代开始，平均的通讯量以每年几倍的速度增长。第二阶段：信息发布阶段从1995年起，以Web技术为代表的信息发布系统，爆炸式地成长起来，成为目前Internet的主要应用。中小企业如何把握好从“粗放型”到“精准型”营销时代的电子商务。第三阶段： EC(Electronic Commerce），即电子商务阶段EC在美国也才刚刚开始，之所以把EC列为一个划时代的东西，是因为Internet的最终主要商业用途，就是电子商务。同时反过来也可以说，若干年后的商业信息，主要是通过Internet传递。Internet即将成为我们这个商业信息社会的神经系统。1997年底在加拿大温哥华举行的第五次亚太经合组织非正式首脑会议（APEC）上美国总统克林顿提出敦促各国共同促进电子商务发展的议案，其引起了全球首脑的关注，IBM、HP和Sun等国际著名的信息技术厂商已经宣布1998年为电子商务年。第四阶段：全程电子商务阶段随着SaaS（Software as a service）软件服务模式的出现，软件纷纷登陆互联网[5]，延长了电子商务链条，形成了当下最新的“全程电子商务”概念模式。

数据挖掘得概念，关键技术及应用数据挖掘的分类方法、概念、关键技术、图形图像得应用数据挖掘的关联规则、概念、算法（以两种算法规则为例）归纳算法过程

就是写一些关于你所选题目的现今研究的相关情况，比如：前人研究的成果，所选题目到目前所研究到的状况，而你又对选题有何特别看法，为何会选此题，对前人的研究成果和看法有何异议或者是有何更深入的观点，前人的研究有哪些不足值得你再加以研究等等，可综合所选题目的相关学科对它的影响来说。

据学术堂了解，论文选题背景就是写一些关于论文题目的研究情况，为什么选这个题目，值不值得研究等问题，论文选题背景主要有以下几个写作点：　　交代社会大环境　　再交代这个行业的大环境　　再交代目前急需解决的问题　　论文选题背景写作的主要内容和要求如下：　　一、选题的意义与价值　　本部分是要点出为什么要写本篇论文的问题，也就是写作的意图、缘由。意义与价值如果能区分开，就分开论述;如果不能，就合在一起说明。一般而言，主要从2个大的方面去写。一是理论意义与价值;二是实践意义与价值。　　理论意义与价值　　一般有以下几种情况：　　(1)就哲学的高度而言，需要研究的价值意义　　(2)就专业或学科角度而言，需要研究的价值意义　　(3)就某个理论角度而言，需要研究的价值意义　　实践意义与价值　　主要包括：　　(1)就实际的工作实践活动未来发展趋势、前景而言，需要研究的价值意义　　(2)就实际的现在工作的实践活动而言，需要研究的价值意义　　(3)就实际的现在工作的实践活动改进而言，需要研究的价值意义　　二、研究综述研究　　综述是梳理前人在本课题相关领域内所做的工作和尚存的知识空白，目的是为了确定自己论文写作的理由。　　一般主要是从三个方面进行表述：　　要写明本选题相关领域内研究对象的简要历史回顾。如历史由来、目前现状、未来发展趋势。　　要做国内外情况的横向比较。　　要对这些研究作出自己的评价。　　本部分的内容也可以将开题报告与文献综述中的内容加工后完成。在论文中，研究综述存在的问题主要表现是缺少分析评价。有的只是开列出了别人研究的论着，没有任何分析，以开列篇目代替自己的综述。　　综述具有三个基本特征。　　论述的资料有一定的数量　　研究所论述的内容相对集中　　研究的系统而全面性还需要做进一步的整理　　三、选题的研究意义与目的　　确定自己研究的逻辑起点，也就是要讲明在别人研究的基础上自己将要做的探讨是什么?即为什么写这篇论文以及要解决什么问题。　　历史性意义　　实践意义

关于数据挖掘的论文选题背景

懒惰阿。。。开题还是论文？这个没有，你问多少人也不会为这点分给你现写的。告诉你个好方法：从中国知网（没账号密码？不好意思，再悬赏200分自己问去吧）上搜索往年的论文，然后把NK格式的大论文的前言部分找自己需要的粘贴下来，再自己添几句话使之看起来不象别人的文章，多搜几篇1000字很好搞定，就看你想不想做了。话已至此，得分~~

当今时代，电脑已经成为人们生活以及公司发展的必需品。现在和未来一切都是电脑，所以现在电脑技术还是很有前途的，只要你的技术过硬，找到一份好工作，获得高额薪水，一切都不是问题。

有关数据挖掘的论文选题背景怎么写

这个的话我帮你写好以后发到你的QQ邮箱里吧。

选题的意义与价值。理论意义与价值　　一般有以下几种情况：（1）就哲学的高度而言，需要研究的价值意义（2）就专业或学科角度而言，需要研究的价值意义（3）就某个理论角度而言，需要研究的价值意义实践意义与价值　　主要包括：（1）就实际的工作实践活动未来发展趋势、前景而言，需要研究的价值意义（2）就实际的现在工作的实践活动而言，需要研究的价值意义（3）就实际的现在工作的实践活动改进而言，需要研究的价值意义确定自己研究的逻辑起点，也就是要讲明在别人研究的基础上自己将要做的探讨是什么？即为什么写这篇论文以及要解决什么问题。