论文投稿百科

毕业论文模糊聚类分析

发布时间:2024-07-03 03:30:21

毕业论文模糊聚类分析

数学专业毕业论文选题方向如下:

1、并行组合数学模型方式研究及初步应用。

2、数学规划在非系统风险投资组合中的应用。

3、金融经济学中的组合数学问题。

4、竞赛数学中的组合恒等式。

5、概率方法在组合数学中的应用。

6、组合数学中的代数方法。

7、组合电器局部放电超高频信号数学模型构建和模式识别研究。

8、概率方法在组合数学中的某些应用。

9、组合投资数学模型发展的研究。

10、高炉炉温组合预报和十字测温数学建模。

11、基于数学形态学-小波分析组合算法的牵引网故障判定方法。

12、证券组合投资的灰色优化数学模型的研究。

13、一些算子在组合数学中的应用。

14、概率方法在组合数学及混合超图染色理论中的应用。

15、竞赛数学中的组合恒等式。

毕业论文(graduation study),按一门课程计,是普通中等专业学校、高等专科学校、本科院校、高等教育自学考试本科及研究生学历专业教育学业的最后一个环节,为对本专业学生集中进行科学研究训练而要求学生在毕业前总结性独立作业、撰写的论文。

我帮楼主查了一些文献,由于这里篇幅有限,就只能把题目提供一下,如果需要详细的文献,请发消息给我:) 在数据分类中,常用的分类方法有多元统计中的系统聚类法〔‘」、模糊聚类分析[2]等.在模糊聚类分析中,首先要计算模糊相似矩阵,而不同的模糊相似矩阵会产生不同的分类结果;即使采用相同的模糊相似矩阵,不同的阑值也会产生不同的分类结果.“如何确定这些分类的有效性”便成为模糊聚类和模糊 识别研究中的一个重要问题.文献【3一5」把有效性不满意的原因归结于数据集几何结构的不理想.但笔者认为,不同的几何结构是对实际需要的反映,我们不能排除实际需要而追求所谓的“理想几何结构”,不理想的分类不应归因于数据集的几何结构.针对同一模糊相似矩阵,文献【2,6〕建立了确定模糊聚类有效性的方法.文献【2」用固定的显著性水平,在不同分类的F一统计量和F检验临界值的差中选最大者,即为有效分类.但是,当显著性水平变化时,此方法的结果也会变化.文献〔2〕引进了一种模糊划分嫡来评价模糊聚类的有效性,并人为规定当两类的嫡大于一数时,此两类可合并,通过逐次合并,最终得到有效分类.此方法人为干预较多,当这个规定数不同时,也会得到不同的结果.另外这两种方法也未比较不同模糊相似矩阵的分类结果. 现列举一些应用: 1.模糊聚类分析法在分析数据评估上的应用 2.模糊聚类分析在领口性能评价系统中的应用 3.花椒园棉蚜及其捕食性天敌动态的模糊聚类分析 4.南美斑潜蝇及其寄生蜂种群动态的模糊聚类分析 5.长三角城市经济发展的模糊聚类分析 6.模糊聚类分析在沥青路面养护路段划分中的应用 7.基于模糊聚类分析的冷连轧负荷分配修正 8.城市防空中目标优化分配的模糊聚类分析 9.抚河流域水环境质量模糊聚类分析 10.模糊聚类分析在经销商选择评估中的应用

模糊聚类分析和聚类分析只是数据处理的差别,就是模糊聚类是把输入的样本编程0~1之间的数,然后再进行运算,而聚类分析是把输入的样本变成0或者1,只是这两个数,然后计算。比较经典的就是zadeh的论文,你可以在google上搜索。然后中文的建议你看一下教材,看看离散数学和《模糊聚类分析及其应用》,西安电子科技大学出版的。要是需要文献,可以和我联系。

模糊聚类分析论文参考文献

测绘工程论文参考文献

参考文献的著录格式是否规范反映作者论文写作经验和治学态度,下同时也是论文的重要构成部分,也是学术研究过程之中对于所涉及到的所有文献资料的总结与概括。以下是我精心整理的测绘工程论文参考文献,欢迎大家借鉴与参考,希望对大家有所帮助。

[1]于武盛,王守杰,吕锦有等.辽宁省地表水资源分布及成因分析[J].农业科技与装.(2):25-29

[2]李智慧,姜延辉,郁凌峰.辽宁省水资源时空分布特点及对策[J].东北水利水电.2011(11):30-34

[3]赵秀风,弓丨水隧洞洞内消能问题的研究[D]:(硕士学位论文).郑州:华北水电学院,2006.

[4]袁丹青,陈向阳,白滨等.水力机械空化空蚀问题的研究进展[J]#灌机械,(27):269-272

[5]肖富仁,苏玮,消能工的发展及其在工程中旳应用[J].水电站设计,(1):63-69.

[6]李超,管道内部锥阀水流水力特性及消能研究[D]:(硕士学位论文).西安:西安理工大学,2008.

[7]王才欢,肖兴斌,底流消能设计研究与应用现状述评[J].四川水力发电,(1):79-85.

[8]张慧丽,王爱华,张力春,底流消能及其在工程上的应用[J].黑龙江水利科技.

[9]方神光,吴保生,南水北调中线干渠闸前变水位运行方式探讨[J].水动力学研究与进展,.

[10]李冰,变水头无压输水隧洞洞内消能和稳定输水研究[D]:(硕士学位论文).郑州.华北水电学院,.

[11]武汉水利电力学院水力学教研室.水力计算手册[M].水利出版社,1980.

[12]SL20~92.水工建筑物测流规范[S].中国:水利电力出版社,1992.

[13]赵昕,赵明登等,水力学[M],北京:中国电力出版社,2009.

[14]刘亚坤等.水力学[M],北京:中国水利水电出版社,2008.

[15]李桂芬.水工水力学研究进展与展望[J].中国水利水电科学研究院学报,(3):183-189

[16]左东启等.模型试验的理论和方法[M],北京:水利电力出版社,1988.

[17]SL155—95.水工(常规)模型试验规程[S].中国:水利水电出版社,1995.

[18]中国水利水电科学研究院,水工(专题)模型试验规范(SL156~165-95)[M],水利水电出版社.

[19]电力部水利部水利水电规划设计总院、华北水利水电学院北京研究生部陈肇和等人翻译,泄水建筑物水力计算手册[M],.

[20]刘士和.高速水流[M].北京:科学出版社,2005.

[21]水利水电科学研究院,南京水利科学研究院编,水工模型试验(第二版)[D],水利出版社,1985.

[1]黄杏元,马劲松,汤勤.地理信息系统概论[M].修订版.北京:高等教育出版社,1990:165-171.

[2]《第二次全国土地调查技术规程》,TD/T1014-2007.北京,中华人民共和国国土资源部,2007.

[3]陈泽民.中国矢量数据交换格式的应用研究[J].武汉大学学报信息科学版,2004,29(5):451-455.

[4]吴文新,史文中.地理信息系统原理与算法[M].北京:科学出版社,2003,28-29.

[5]Kang-tsungChang著,陈建飞等译.地理信息系统导论[M].北京:科学出版社,2003,43-44.

[6]唐原彬,张丰,刘仁义.一种维护线状地物基本单元属性逻辑一致性的平差方法[J].武汉大学学报信息科学版,2011,36(7):853-856.

[7]黄杏元,汤勤.地理信息系统概论[M].北京:高等教育出版社,1990:130-133.

[8]陈先伟,郭仁忠,闫浩文.土地利用数据库综合中图斑拓扑关系的创建和一致性维护[J].武汉大学报信息科学版,2005,30(4):370-373.

[9]毋河海.关于GIS中缓冲区的建立问题[J].武汉测绘科技大学学报[J].1997,22(4):358-364.

[10]张国辉,胡闻达,李慧智.基于GDI+的缓冲区建立及边界描述方法[J].测绘科学技术学报,2010,27(3):292-232.

[11]冯花平,连文娟,卢新明.求缓冲区算法[J].山东大学学报自然科学版,2005,24(3):57-59.

[12]张欣,陈国雄,钟耳顺.优化栅格细化算法的`线状地物提取[J].地球信息科学,2007,9(3):25-27.

[13]潘瑜春,钟耳顺,刘巧芹.土地资源数据库中线状地物面积扣除技术研究[J].资源科学,2001,24(6):12-17.

[14]唐原彬,张丰,刘仁义.一种维护线状地物基本单元属性逻辑一致性的平差方法[J].武汉大学学报·信息科学版,2011,36(7):853-856.

[15]尹为华,刘盛庆.ARCGIS在地类面积统计中的应用[J].科技资讯,2012:29.

[16]刘洪江,曹玉香.基于ArcGIS实现地类图斑净面积的计算[J].城市勘测,2012(10)114-116.

[17]边馥苓.地理信息系统原理和方法[M].北京:测绘出版社,1996.

[18]任娜,张道军.基于空间推理及语义的图斑扣除线状地物面积关键算法及其在土地调查建库中的应用[J].安徽农业科学,39(35):22013-22016.

[19]计长飞.土地利用现状图的矢量化方法研究[J].测绘与空间地理信息,2011,34(4):159-163.

[20]马欣,吴绍洪,康相武.线状地物的区域影响模型及其在综合评价中的应用[J].地理科学进展,2007,26(1):87-94.

[1]韩绍伟.GPS组合观测值理论及应用.测绘学报,1995,21(2):8-13.

[2]常青等.GPS载波相位组合观测值理论研究.航空学报,1998,5(19):614-616.

[3]王泽民,柳景斌.Galileo卫星定位系统相位组合观测值的模型研究[J].武汉大学学报(信息科学版),2003,28(6):723-727.

[4]申俊飞,何海波,郭海荣,王爱兵.三频观测量线性组合在北斗导航中的应用[J].全球定位系统,2012,37(6):690-695.

[5]中国卫星导航系统管理办公室.北斗卫星导航系统发展报告(版)[R].2013,12:3-6.

[6]邢喆,王泽明,伍岳.利用模糊聚类方法筛选GPS载波相位组合观测值[J].武汉大学学报(信息科学版),2006,31(1):23-26.

[7]黄令勇,宋力杰,刘先冬.基于自适应聚类算法的GPS三频载波相位组合观测值优化选取[J].大地测量与地球动力学,2011,31(4):99-102.

[8]高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2003.

[9]李征航,黄劲松.GPS测量与数据处理[M].武汉大学出版社,2008.

[10]熊伟,伍岳,孙振冰,王泽民.多频数据组合在周跳探测和修复上的应用[J].武汉大学学报(信息科学版),2007,32(4):319-322.

[11]伍岳.第二代导航卫星系统多频数据处理理论及应用[D].武汉大学,2005.

[12]楼晓俊,李隽颖,刘海涛.距离修正的模糊C均值聚类算法[J].计算机应用,2012,32(3):646-648.

[13]徐军,陶庭叶,高飞.GLONASS三种载波频率组合值研究[J].大地测量与地球动力学,2013,33(1):86-89.

[14]陶庭叶,高飞,李晓莉.一种高精度GPS卫星钟差预报方法[J].中国空间科学技术,2013-4:56-61.

[15]何伟,陶庭叶,王志平.基于改进FCM的北斗三频组合观测值选取[J].中国空间科学技术(已录用).

[16]何伟,李明,阚起源.抗差加权非等时距GM(1,1)模型在大型建筑物沉降预测中的应用[J].测绘工程,2014-3,34-37.

[17]徐军,陶庭叶,高飞,张京奎.基于GLONASS三频组合观测值的周跳探测与修复[J].大地测量与地球动力学,2013,33(6):45-49.

[18]罗腾,白征东,过静珺.两种周跳探测方法在北斗三频中的应用比较研究[J].测绘通报,2011(4):1-3.

[19]范建军,王飞雪,郭桂蓉.GPS三频非差观测数据周跳的自动探测与改正研究[J].测绘科学,2006,31(5):24-26.

[20]刘旭春,伍岳,黄学斌等.多频组合数据在原始载波观测值预处理中的应用[J].测绘通报,2007(2):14-17.

[21]梁开龙,张玉册.现代化GPS信号的宽巷组合及其求解模糊度研究.测绘通报,2002年第4期:l-3

[22]张成军,许其凤,李作虎.对伪距/相位组合量探测与修复周跳算法的改进[J].测绘学报,2009,38(4):402-407.

[23]刘旭春,伍岳,张正禄.GPS三频数据在周跳和粗差探测与修复中的应用[J].煤炭学报,2006,31(5):334-339.

[24]王帅,高井祥.利用三频组合观测值进行GPS周跳探测与修复[J].测绘科学,2012,37(5):40-42.

参考文献是文章或著作等写作过程中参考过的文献。

因参考文献的著录格式各刊不尽相同,投稿前作者应注意杂志稿约的有关规定,至少得先看看有关期刊发表的论文的参考文献是如何标注的,以了解有关期刊的参考文献的著录格式,以免出错。许多作者投递的稿件书写格式包括参考文献的著录格式与杂志所要求的不同。

坦率地讲,编辑和审稿专家也是人,工作中多少也有感情因素。如果拿到手中的是一篇书写格式不合要求的文章,别的暂且不论,就书写格式不规范这一条,就足以给编辑留下不好的印象,甚至让编辑做出退稿的决定。

就算最后没有被退稿,此类稿件较书写格式规范的稿件被录用的可能性大大降低。其实作者犯的是一个很低级的错误,让编辑很自然地联想到,该作者不太尊重期刊,还有期刊的编辑以及审稿专家。

因此,作者在投稿前一定要注意期刊参考文献的著录方式,以免产生不必要的负面影响。其实,并不复杂,只要稍稍留意即可。

模糊聚类分析论文开题报告

问题一:聚类分析的意义是什么 科技名词定义中文名称:聚类分析 英文名称:cluster *** ysis 定义1:按照某种距离算法对数据点分类。 应用学科:地理学(一级学科);数量地理学(二级学科) 定义2:把观测或变量按一定规则分成组或类的数学分析方法。 应用学科:生态学(一级学科);数学生态学(二级学工) 聚类分析指将物理或抽象对象的 *** 分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。 问题二:数据挖掘,聚类分析算法研究的目的和意义是什么! 15分 图像分割 基本原理:根据图像的组成结构和应用需求将图像划分为若干个互不相交的子区域的过程。这些子区域四某种意义下具有共同属性的像素的连通 *** 。常用方法有: 1) 以区域为对象进行分割,以相似性原则作为分割的依据,即可根据图像的灰度、色彩、变换关系等方面的特征相似来划分图像的子区域,并将各像素划归到相应物体或区域的像素聚类方法,即区域法; 2) 以物体边界为对象进行分割,通过直接确定区域间的边界来实现分割; 3) 先检测边缘像素,再将边缘像素连接起来构成边界形成分割。 具体的阈值分割: 阈值分割方法分为以下3类: 1) 全局阈值:T=T[p(x,y)〕,即仅根据f(x,y)来选取阈值,阈值仅与各个图像像素的本身性质有关。 2) 局部阈值:T=T[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。 3) 动态阈值:T=T[x,y,f(x,y),p(x,y)],阈值与像素坐标,图像像素的本身性质和局部区域性质相关。 全局阈值对整幅图像仅设置一个分割阈值,通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像,并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果,但存在几个缺点: 1) 每幅子图像的尺寸不能太小,否则统计出的结果无意义。 2) 每幅图像的分割是任意的,如果有一幅子图像正好落在目标区域或背景区域,而根据统计结果对其进行分割,也许会产生更差的结果。 3) 局部阈值法对每一幅子图像都要进行统计,速度慢,难以适应实时性的要求。 全局阈值分割方法在图像处理中应用比较多,它在整幅图像内采用固定的阈值分割图像。考虑到全局阈值分割方法应用的广泛性,本文所着重讨论的就是全局阈值分割方法中的直方图双峰法和基于遗传算法的最大类间方差法。在本节中,将重点讨论灰度直方图双峰法,最大类间方差法以及基于遗传算法的最大类间方差法留待下章做继续深入地讨论。 参详《数字图像处理》工具:MATLAB或VC++ 问题三:聚类分析方法有什么好处 5分 聚类分析:将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似。 常用聚类方法:系统聚类法,K-均值法,模糊聚类法,有序样品的聚类,分解法,加入法。 注意事项: 1. 系统聚类法可对变量或者记录进行分类,K-均值法只能对记录进行分类; 2. K-均值法要求分析人员事先知道样品分为多少类; 3. 对变量的多元正态性,方差齐性等要求较高。 应用领域:细分市场,消费行为划分,设计抽样方案等 优点:聚类分析模型的优点就是直观,结论形式简明。 缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映珐试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。 问题四:聚类分析的结果分成几类,但是这几类有什么关系呢,这几类有什么含义。 5分 这个要看你是面对什么问题了,如:用聚类做财务舞弊,则会有以下几类:正常财务报表、虚增利润舞弊财务报表、关联交易财务舞弊报表等 问题五:SPSS新手求问聚类分析 聚类分析主要作用是把一些数据分成未知的几类这样理解对吗? 系统聚类的 建议买本spss的教程,可以更加系统的学习。要是写论文的话, 可以帮忙数据 he 分析。 问题六:主成分分析法和聚类分析法的区别 问题七:如何评价spss系统聚类分析结果? 用方差分析来判定聚类结果好坏,类与类之间是否差异性显著,呵呵~~ 问题八:聚类分析主要解决什么类型的实际问题 主要解决实现不知道类别标签的样本集的分类问题.聚类其实也是实现分类的功能.聚类和分类的区别:分类是用知道类别标签的样本集去训练一个分类器,然后用该分类器对其他未知类别的样本进行归类,由于训练分类器用到了知道类别的样本,所以属于有导师学习;聚类是完全不知道各个样本的类别,按照一定的聚类度量准则直接进行聚类,所以属于无导师的学习. 聚类可以用在图像处理,模式识别,客户信息分析,金融分析,医学等很多领域.用模糊聚类进行图像分割就是一个非常典型的应

模糊聚类是采用模糊数学方法,依据客观事物间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事物进行分类的一门多元技术。其算法主要有传递闭包法、动态直接聚类法和最大树法等,其中动态直接聚类法计算量最少。在实际应用中必须经过数据预处理、特别是归一化等处理步骤,选取合适的模糊关系建立模糊相似矩阵,然后进行聚类和模式识别。糊聚类分析在学生素质评定中的应用学生素质的评定工作,对学校的发展具有重要的作用。本文就学生素质从德、智、体、能、劳5个方面作出评价。首先,对得到的数据进行规格化;接着,构造模糊相似矩阵;最后,利用编网法对学生素质的评定进行聚类分析,该方法简单易懂且计算量小达到了预期的效果。模糊数学在畜禽血液蛋白多态性聚类分析中的应用我国动植叨蛋白多态性的研究进展迅速,国内外有关这方面的报道越来越多.但这一研究已有近百年的历史,真正发展是近=十年的事.我国起步较晚,近年的研究和应用较快,现已推向地,县级阶段,可见这一研究和应用的普及在我国为时不远1.西南民族学院2.西昌农业专科学校3.面昌市畜牧局了..本研究表明我国畜牧兽医工作进入了分子水平阶段.由于蛋白多态性的研究和方法简便,节时省钱,基层单位均可应用.但此法的关键问题是聚类分析.聚类分析的方法很多,如遗传距离聚类分析中的最短遗传距离聚类分析,类平均法聚类分析再如遗传相似系数分析中我们见有矩阵法,但在畜禽蛋白多态性聚类分析上,均无统一的具体分析方法.为此,我们根据模糊数学集合论的原理,对遗传相似系数进行聚类分析,现介绍出来,供同行们应用时参考.模糊数学是研究和处理一些模糊现象的数学.但不是把数学变成模糊的东酉,而是在许多控制过程中,用模糊的手段达到精确的目的.在畜禽蛋白多态性研究中,遗传相似系数也是聚类分析中常用的分析指标.模糊数学聚类分析在鲤鱼杂交种后代性状研究中的应用杂交鲤与亲本相似,用数学语言来说是存在模糊性问题。采用模糊数学聚类分析法,首先建立模糊相似矩阵,得到鲤鱼生长性状聚类分类图谱,最后得到三杂交鲤、荷元鲤等F1代与母本相似比父本大的结论。这在鱼类杂交选育理论与生产上有一定意义

聚类分析算法论文

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文,欢迎阅读。

一、引言

聚类分析算法是给定m维空间R中的n个向量,把每个向量归属到k个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。聚类可以理解为:类内的相关性尽量大,类间相关性尽量小。聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数据规律。聚类分析的基本思想是:采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。盐矿区系统是一个多层次、复杂的大系统,涉及诸多模糊、不确定的因素。平顶山市盐矿区的经济分类是以整个平顶山市的所有盐矿区为研究对象,以各盐矿区为基本单元,以经济为中心,以发展战略和合理布局为目标进行经济类型区划。其基本原则是:平顶山市的盐矿区资源开发、利用的相对一致性;自然、经济、社会条件的一致性;保持一定行政地域单元的相对稳定性。现行的平顶山市盐矿区行政划分不能反映出各个盐矿区的共同点,有必要通过模糊聚类分析将那些经济实际状况相似的铁矿区归类,剖析、发现各况矿区的差异,对症下药,为制定发展对策提供依据。

二、建立指标体系

1、确定分类指标进行经济区划分,应考虑的指标因素是多种多样的。既要以岩盐矿资源储量为主,又要适当考虑岩盐质量和勘察阶段和开发利用状况;既要有直接指标,又要有间接指标;既要考虑矿区发展的现状,又要考虑矿区发展的过程和矿区发展的未来方向。参考有关资料,结合专家意见,我们确定了对平顶山市盐矿区进行经济区划分的指标。如表1所示。表中列举了具体指标及各指标的原始数据(数据来源于河南省2006年矿产资源储量简表)。表1盐矿区经济划分指标体系及指标数据注:表中N表示缺失数据,勘察阶段1、2、3分别表示:初步勘探、详细普查、详细勘探,利用状况1~7分别表示:近期不宜进一步工作、可供进一步工作、近期难以利用、推荐近期利用、计划近期利用、基建矿区、开采矿区。

2、转换指标数据由于不同变量之间存在不同量纲由于不同变量之间存在不同量纲、不同数量级,为使各个变量更具有可比性,有必要对数据进行转换。目前进行数据处理的方法大致有三种,即标准化、极差标准化和正规化。为便于更直观的比较各市之间同一指标的数值大小,我们采用了正规化转换方式。其计算公式为:为了方便叙述,做如下设定:设Xi(i=1,2,3,…,21)为具体指标层中第i个评价指标的值,Pi(i=1,2,3,…,21)为第i个指标正规化后的值,0≤Pi≤1,Xs,i(Xs,i=Xmax-Xmin),为第i个评价指标的标准值,Xmax为最大值,Xmin为最小值。(1)对于越高越好的`指标①Xi≥Xmax,则Pi=1;②Xi≤Xmin,则Pi=0;③Xmin

三、聚类分析

1、聚类步骤(Stage).从1~3表示聚类的先后顺序。

2、个案合并(ClusterCombined)。表示在某步中合并的个案,如第一步中个案1叶县田庄盐矿段和个案2叶县马庄盐矿段合并,合并以后用第一项的个案号表示生成的新类。

3、相似系数(Coefficients).据聚类分析的基本原理,个案之间亲密程度最高即相似系数最接近于1的,最先合并。因此该列中的系数与第一列的聚类步骤相对应,系数值从小到大排列。

4、新类首次出现的步骤(StageClusterFirstAppears)。对应于各聚类步骤参与合并的两项中,如果有一个是新生成的类(即由两个或两个以上个案合并成的类),则在对应列中显示出该新类在哪一步第一次生成。如第三步中该栏第一列显示值为1,表示进行合并的两项中第一项是在第一步第一次生成的新类。如果值为O,则表示对应项还是个案(不是新类)。

5、新类下次出现步骤(NextStage)。表示对应步骤生成的新类将在第几步与其他个案或新类合并。如第一行的值是11,表示第一步聚类生成的新类将在第11步与其他个案或新类合并。

6、解析图DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine聚类树状图(方法:组间平均连接法)图清晰的显示了聚类的全过程。他将实际距离按比例调整到0~25之间,用逐级连线的方式连接性质相近的个案或新类,直至并未一类。在该图上部的距离标尺上根据需要(粗分或细分)选定一个划分类的距离值,然后垂直标尺划线,该垂线将与水平连线相交,则相交的交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。例如,选标尺值为5,则聚为3类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。若选标尺值为10,则聚为2类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。

四、结论

对平顶山市5个盐矿区进行经济区划分,究竟划分为几个区合适,既不是越多越好,也不是越少越好。划分经济区的目的,就是要根据各盐矿经济区资源特点、勘察、开发的不同,分类指导经济活动,使人们的经济活动更加符合当地的实际,使各经济区能充分发挥各自的优势,做到扬长避短,趋利避害,达到投人少、产出多,创造良好的经济效益和社会效益之目的。分区太多,就失去了分区的意义,分区太少,则分类指导很难做到有的放矢。综合以上聚类分析结果,我们可以得出三个方案。其中两个方案比较合适,可供选择。方案一:(当比例尺为5时,分为3类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案一。方案二:(当比例尺为10时,分为2类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案二。平顶山市盐矿区分类图方案2聚类分析的原理就是将矿石质量、资源储量、勘查阶段、利用状况相近或相类似的矿区聚合在一起,其分析结果也是直观易见的。在此结合平顶山市实际行政区划以及矿山企业特征我们对铁矿区划分做一个调整使其理论与实际能够结合的更紧密使其更好的指导实践。

1、叶县田庄盐段、叶县马庄盐矿段为一类,这一类属于矿床规模相当,资源储量接近,勘查开发阶段接近,利用程度相当,故,可以分为一类。

2、叶县娄庄盐矿、叶县五里堡盐矿段为一类,这一类属于勘查开发阶段处于同一阶段。

3、叶县姚寨盐矿为一类,这一类属于储量较高,盐矿品位较高,故其勘察开采规划有别于其它两类。总的说来,运用聚类分析是基本成功的,大部分的分类是符合实际的。综合以上论述盐矿区划分如下表所示:当然聚类分析有其优点也有其缺点:(1)优点:聚类分析模型的优点就是直观,结论形式简明。(2)缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试问内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。

聚类分析论文

基于聚类分析的广西区域经济发展状况研究的论文

【摘要】:本文以广西壮族自治区14个地级市作为研究对象,从地区生产总值、社会消费品零售总额、全社会固定资产投资、公共财政预算收支总额等方面,选取11个具体指标,运用聚类分析方法分析并评价各地级市经济发展状况。研究结果显示,广西14个地级市可划分为四类经济区域,不同城市之间的经济发展水平存在较大差异。在此基础上,从加强各地级市之间的经济合作、积极推动开放型经济发展、强化科技创新以推动产业结构优化升级等方面提出具体建议,为促进广西区域经济的全面发展提供参考。

【关键词】:聚类分析;广西;经济发展;政策建议

一、引言

近年来,随着中国—东盟自由贸易区的建成,中国与东盟各国贸易投资增长,经济融合加深,经贸往来愈加频繁。广西作为中国—东盟自由贸易区的门户省份,加之“一带一路”战略的提出与实施,良好的区位优势和资源环境承载能力,无疑将会为推动广西区域经济的腾飞提供持续的动力和良好的机遇,发展前景十分广阔。但由于历史的原因,加上人口、社会和基础设施等因素的影响,广西的经济发展水平和人均地区生产总值在内陆31个省、市、自治区中仍处于中下水平,与上述提到拥有的区位优势、经济优势是极不相称的。广西下辖的14个地级市经济发展程度和产业结构也存在一定的差异。一直以来,区域经济发展问题都是区域经济学、经济地理学等学科关注和研究的对象,区域经济发展中出现差距,是各国经济发展中存在的普遍现象[1]。如何就广西下辖的14个地级市进行经济发展程度的分析和分类,对于正确认识广西各地级市经济发展所处的发展阶段,制定正确的宏观政策,以促进各地区的良好协调发展具有重要的理论和现实意义。

二、研究区域概况

广西壮族自治区,简称“桂”,首府南宁,位于中国华南地区西部,与广东、湖南等省份接壤,南濒北部湾,面向东南亚,是中国唯一一个沿海自治区,自然条件优越,资源丰富,尤以海洋资源和矿产资源为甚。截至2015年12月,全区辖14个地级市,县级行政区111个,行政区划面积万平方公里。2015年全区总人口为5518万人,地区生产总值亿元,占全国的。人均地区生产总值为39150元。但由于历史的原因,加上人口、社会和基础设施等因素的影响,广西的经济发展水平,无论是地区生产总值还是三大产业结构完善程度等方面,在内陆31个省市中均处于中下水平。区内下辖的14个地级市,经济发展水平和产业结构各异,部分地级市经济发展程度相对滞后。近年来,随着中国—东盟自由贸易区的建成和“一带一路”战略的实施,广西吸引着国内外大量的资本和人力涌入,显现出广阔的发展前景。

三、聚类分析方法研究设计

(一)指标选择及数据来源

区域经济发展状况的研究,依靠单一的指标,是无法对其进行综合、全面的评价与分析的。因此,在对广西区域经济发展水平分析评价的过程中,需要借助多个评价指标,构建合理完善的评价指标体系。本着建立评价指标体系要遵循科学性、系统性、全面性、独立性、可操作性等原则,本文在参考以往文献资料的基础上,根据广西各地级市经济发展状况、人口条件、社会资源等方面的实际情况选取了11个具体指标,分别是:行政区划土地面积(平方公里)、地区生产总值(亿元)、人均地区生产总值(元)、户籍年末总人口(万人)、固定资产投资(亿元,不含农户)、公共财政预算收入(亿元)、公共财政预算支出(亿元)、农民居民人均纯收入(元)、城镇居民人均可支配收入(元)、社会消费品零售总额(亿元)、进出口总额(人民币,万元)。为方便后续各指标数据的处理,分别以X1、X2、X3、X4、X5、X6、X7、X8、X9、X10和X11指代。各指标详细数据均来自《广西统计年鉴2016》和《2015年广西壮族自治区国民经济与社会发展统计公报》。

(二)数据处理

本文利用对反映广西14个地级市经济发展状况的指标进行聚类分析。由上述内容可知,研究所选取的11个指标由于它们原始数据量刚的不同,为防止指标取值的分散程度较大,需对各指标的取值做标准化处理。

各指标数据经过标准化处理后,X2(地区生产总值)与X5(固定资产投资)、X6(公共财政预算收入)、X10(社会消费品零售总额)的相关系数都大于,故而这四个指标不必均作为聚类变量,选择其中一个即可,本文选择X2(地区生产总值)。接着,运用不同的聚类方法进行聚类分析。

(三)结果分析

本文利用对广西14个地级市经济发展状况进行聚类分析,在对选定的11个聚类变量的数据经过标准化处理后,依据结果聚类个数的不同,而相继运用系统聚类和K—均值聚类法进行聚类分析,并得出结果。参考以往文献资料对广西14个地级市经济发展状况的分类,以及广西各地区实际的经济、社会和人口状况,本文认为对广西14个地级市经济发展水平的分类,聚类个数分为四类比较适宜。对于广西14个地级市经济发展水平的分类应为:南宁、北海、钦州为第一类;柳州、桂林、梧州、贵港、玉林、百色、贺州、河池、来宾为第二类;防城港为第三类;崇左为第四类。

由聚类分析结果可知,南宁、北海、钦州为第一类,这三个地级市经济相对发达。南宁是广西的首府,全区的政治、经济、文化、金融和信息中心,经济发展程度高,产业结构相对完整,良好的区位优势、众多的政策支持以及坚实的经济发展基础,使得南宁在多方面的发展都领跑于广西区的其他地级市。北海是全国14个沿海开放城市之一,处于泛北湾经济合作区域结合部的中心位置,便捷、高效的交通设施,众多经济圈的发展福利,以及丰富的海洋资源、繁荣的旅游业,都推动着北海经济社会的快速发展。钦州,南海之滨,北部湾经济区南的中心位置,是大西南最便捷的出海通道,依托于得天独厚的港口优势,大力发展进出口贸易。

柳州、桂林、梧州、贵港、玉林、百色、贺州、河池、来宾为第二类,这9个地级市经济发展水平较高,三大产业结构相对完善,各自依托于自身的经济发展优势,经济发展增速较快。

防城港和崇左分别是第三和第四类。防城港是中国的深水良港,是中国25个沿海主要港口之一,对外贸易额较高,在中国—东盟自由贸易区、泛北部湾区域合作中具有特殊重要的战略地位。崇左位于广西西南部,地理位置相对较差,工业基础薄弱,交通设施落后,虽然资源丰富,但限于人力资源的短板,是广西经济发展较为落后的地级市。

四、结论及政策建议

本文利用对广西14个地级市经济发展状况进行聚类分析,将广西14个地级市经济发展水平分为四类,分别是南宁、北海、钦州为第一类;柳州、桂林、梧州、贵港、玉林、百色、贺州、河池、来宾为第二类;防城港为第三类;崇左为第四类。从聚类分析的结果来看,就如何促进广西区域经济的快速、协调发展,可从以下几个方面着手:

(一)加强各地级市之间的经济合作,增强较发达地区的经济辐射力度

广西各地区经济发展水平差异显著,各自依托的经济发展要素也不尽相同,例如人力资本、环境资源、基础设施完善程度和地理位置等就相差较大。因此,各地区根据自身的条件优势,因地制宜地制定经济发展策略,就显得尤为重要。因地制宜地制定经济发展策略的同时,加强各地级市之间的经济合作,实现资源、信息的共享互通,人力、资金的自由流通,各自取长补短,将为促进各地区的快速、协调发展发挥重要作用。以南宁、桂林和柳州为主的老牌较发达地区,拥有较发达的工业基础、第三产业和相对完善的基础设施,在立足自身优势发展,加强与各地级市之间的经济合作中,要发挥好领头羊的作用,率先做出垂范,积极探索出可供借鉴的合作模式,增强对周边地级市的经济辐射力度,以少带多,以强扶弱,真正促进广西经济发展迈上新台阶。

(二)依托良好的区位优势和叠加的'政策优势,积极推动开放型经济发展

随着经济全球化和区域经济一体化的发展,我国经济和世界经济发展的融合在不断加深,积极推动外向型经济的发展,成为了我国及各地区经济转型升级的关键所在。2015年3月,国家发改委、外交部和商务部联合发布了《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》,广西借助于自身的区位优势,被纳入国家“一带一路”建设规划,发展开放型经济面临着重大的历史机遇。广西的外向型经济近些年来虽有发展,但整体情况仍不容乐观,相对薄弱的经济基础制约着开放型经济的发展后劲以及支撑开放型经济发展的高级要素也存在不足[2]。借助于“一带一路”战略实施的机遇和叠加密集的国家开发政策,依托沿海、沿江、沿边的区位优势,借鉴东部沿海典型的开放型经济发展模式,例如上海模式和东莞模式,积极推动广西的外向型经济发展,才能快速、协调地完成广西经济的转型升级。

(三)强化科技创新,加速推动产业结构优化升级

科技创新与产业结构优化升级是长期的协调关系,依托于科技创新能有效推动产业结构优化升级。一般来说,产业结构指的是一二三产业所占的比重,产业结构优化升级有两个含义:一个是产业结构合理化,另一个是产业结构高级化,如果第三产业所占的比重越大,那么可以说它的高级化程度越大[3]。未来一段时间,可以从以下几个方面强化科技创新,加速广西产业结构的转型升级:一是加强科技创新方面的改革,建立完善的科技管理协调机制和信息公开机制,优化科技资源配置机制,以统筹科技创新全方位管理;二是加大对科技创新的财政支持,保证各项用于科技创新的资金行使到位;三是优化科技创新体系,不仅要保证建立完善的科技创新管理机制,更要全面扩大科技创新的主体,落实科技创新成果的投入使用。

(四)完善各地区的基础设施建设,大力发展地区特色经济

广西各地区经济发展水平差异显著,相对发达的地区,例如南宁、柳州和桂林等,除主城经济区外,基础设施建设仍不尽完善。河池、百色、崇左等市地处偏远地区,交通不便,基础设施建设更是落后。良好的交通条件、便利的通讯设施、覆盖全面的水利、电力设施等是居民和企业的共同物质基础,更是物质生产和劳动力再生产的重要条件。因此,各地区应把完善基础设施建设放在重要位置,适当扩大社会固定资产投资总量,积极利用本地区丰富的人文资源,打好“侨牌”,让更多拥有广西籍的海外华人华侨参与到广西的经济建设之中,尽快完善基础设施建设,为经济的快速发展提供良好的基础。同时,各地区应找准自身的发展定位,结合地区优势,大力发展地区特色经济。

参考文献:

[1]孟倩.基于主成分分析和聚类分析的山东省区域经济协调发展研究[J].区域经济,2016(1):138-139

[2]李继宏.“一带一路”建设背景下广西开放型经济发展模式及实现路径[J].广西社会科学,2016(4):14-19

[3]徐晓慧.广西科技创新对产业结构升级的影响[J].合作经济与科技,2016(11):19-21

聚类分析算法论文

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文,欢迎阅读。

一、引言

聚类分析算法是给定m维空间R中的n个向量,把每个向量归属到k个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。聚类可以理解为:类内的相关性尽量大,类间相关性尽量小。聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数据规律。聚类分析的基本思想是:采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。盐矿区系统是一个多层次、复杂的大系统,涉及诸多模糊、不确定的因素。平顶山市盐矿区的经济分类是以整个平顶山市的所有盐矿区为研究对象,以各盐矿区为基本单元,以经济为中心,以发展战略和合理布局为目标进行经济类型区划。其基本原则是:平顶山市的盐矿区资源开发、利用的相对一致性;自然、经济、社会条件的一致性;保持一定行政地域单元的相对稳定性。现行的平顶山市盐矿区行政划分不能反映出各个盐矿区的共同点,有必要通过模糊聚类分析将那些经济实际状况相似的铁矿区归类,剖析、发现各况矿区的差异,对症下药,为制定发展对策提供依据。

二、建立指标体系

1、确定分类指标进行经济区划分,应考虑的指标因素是多种多样的。既要以岩盐矿资源储量为主,又要适当考虑岩盐质量和勘察阶段和开发利用状况;既要有直接指标,又要有间接指标;既要考虑矿区发展的现状,又要考虑矿区发展的过程和矿区发展的未来方向。参考有关资料,结合专家意见,我们确定了对平顶山市盐矿区进行经济区划分的指标。如表1所示。表中列举了具体指标及各指标的原始数据(数据来源于河南省2006年矿产资源储量简表)。表1盐矿区经济划分指标体系及指标数据注:表中N表示缺失数据,勘察阶段1、2、3分别表示:初步勘探、详细普查、详细勘探,利用状况1~7分别表示:近期不宜进一步工作、可供进一步工作、近期难以利用、推荐近期利用、计划近期利用、基建矿区、开采矿区。

2、转换指标数据由于不同变量之间存在不同量纲由于不同变量之间存在不同量纲、不同数量级,为使各个变量更具有可比性,有必要对数据进行转换。目前进行数据处理的方法大致有三种,即标准化、极差标准化和正规化。为便于更直观的比较各市之间同一指标的数值大小,我们采用了正规化转换方式。其计算公式为:为了方便叙述,做如下设定:设Xi(i=1,2,3,…,21)为具体指标层中第i个评价指标的值,Pi(i=1,2,3,…,21)为第i个指标正规化后的值,0≤Pi≤1,Xs,i(Xs,i=Xmax-Xmin),为第i个评价指标的标准值,Xmax为最大值,Xmin为最小值。(1)对于越高越好的`指标①Xi≥Xmax,则Pi=1;②Xi≤Xmin,则Pi=0;③Xmin

三、聚类分析

1、聚类步骤(Stage).从1~3表示聚类的先后顺序。

2、个案合并(ClusterCombined)。表示在某步中合并的个案,如第一步中个案1叶县田庄盐矿段和个案2叶县马庄盐矿段合并,合并以后用第一项的个案号表示生成的新类。

3、相似系数(Coefficients).据聚类分析的基本原理,个案之间亲密程度最高即相似系数最接近于1的,最先合并。因此该列中的系数与第一列的聚类步骤相对应,系数值从小到大排列。

4、新类首次出现的步骤(StageClusterFirstAppears)。对应于各聚类步骤参与合并的两项中,如果有一个是新生成的类(即由两个或两个以上个案合并成的类),则在对应列中显示出该新类在哪一步第一次生成。如第三步中该栏第一列显示值为1,表示进行合并的两项中第一项是在第一步第一次生成的新类。如果值为O,则表示对应项还是个案(不是新类)。

5、新类下次出现步骤(NextStage)。表示对应步骤生成的新类将在第几步与其他个案或新类合并。如第一行的值是11,表示第一步聚类生成的新类将在第11步与其他个案或新类合并。

6、解析图DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine聚类树状图(方法:组间平均连接法)图清晰的显示了聚类的全过程。他将实际距离按比例调整到0~25之间,用逐级连线的方式连接性质相近的个案或新类,直至并未一类。在该图上部的距离标尺上根据需要(粗分或细分)选定一个划分类的距离值,然后垂直标尺划线,该垂线将与水平连线相交,则相交的交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。例如,选标尺值为5,则聚为3类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。若选标尺值为10,则聚为2类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。

四、结论

对平顶山市5个盐矿区进行经济区划分,究竟划分为几个区合适,既不是越多越好,也不是越少越好。划分经济区的目的,就是要根据各盐矿经济区资源特点、勘察、开发的不同,分类指导经济活动,使人们的经济活动更加符合当地的实际,使各经济区能充分发挥各自的优势,做到扬长避短,趋利避害,达到投人少、产出多,创造良好的经济效益和社会效益之目的。分区太多,就失去了分区的意义,分区太少,则分类指导很难做到有的放矢。综合以上聚类分析结果,我们可以得出三个方案。其中两个方案比较合适,可供选择。方案一:(当比例尺为5时,分为3类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案一。方案二:(当比例尺为10时,分为2类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案二。平顶山市盐矿区分类图方案2聚类分析的原理就是将矿石质量、资源储量、勘查阶段、利用状况相近或相类似的矿区聚合在一起,其分析结果也是直观易见的。在此结合平顶山市实际行政区划以及矿山企业特征我们对铁矿区划分做一个调整使其理论与实际能够结合的更紧密使其更好的指导实践。

1、叶县田庄盐段、叶县马庄盐矿段为一类,这一类属于矿床规模相当,资源储量接近,勘查开发阶段接近,利用程度相当,故,可以分为一类。

2、叶县娄庄盐矿、叶县五里堡盐矿段为一类,这一类属于勘查开发阶段处于同一阶段。

3、叶县姚寨盐矿为一类,这一类属于储量较高,盐矿品位较高,故其勘察开采规划有别于其它两类。总的说来,运用聚类分析是基本成功的,大部分的分类是符合实际的。综合以上论述盐矿区划分如下表所示:当然聚类分析有其优点也有其缺点:(1)优点:聚类分析模型的优点就是直观,结论形式简明。(2)缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试问内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。

聚类分析数学建模论文

首先当然要根据某些特定的标准剔除过多的数据啦,spss,SAS,EXCEL等软件都是不错的选择,在对余下的数据进行处理,当数据实在还是过多的时候,我们可以把相类似的数据看作是一个个数据群,再基于这些群进行研究,你可以尝试一下SPSs里面的聚类分析之类的功能

聚类分析算法论文

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文,欢迎阅读。

一、引言

聚类分析算法是给定m维空间R中的n个向量,把每个向量归属到k个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。聚类可以理解为:类内的相关性尽量大,类间相关性尽量小。聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数据规律。聚类分析的基本思想是:采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系。盐矿区系统是一个多层次、复杂的大系统,涉及诸多模糊、不确定的因素。平顶山市盐矿区的经济分类是以整个平顶山市的所有盐矿区为研究对象,以各盐矿区为基本单元,以经济为中心,以发展战略和合理布局为目标进行经济类型区划。其基本原则是:平顶山市的盐矿区资源开发、利用的相对一致性;自然、经济、社会条件的一致性;保持一定行政地域单元的相对稳定性。现行的平顶山市盐矿区行政划分不能反映出各个盐矿区的共同点,有必要通过模糊聚类分析将那些经济实际状况相似的铁矿区归类,剖析、发现各况矿区的差异,对症下药,为制定发展对策提供依据。

二、建立指标体系

1、确定分类指标进行经济区划分,应考虑的指标因素是多种多样的。既要以岩盐矿资源储量为主,又要适当考虑岩盐质量和勘察阶段和开发利用状况;既要有直接指标,又要有间接指标;既要考虑矿区发展的现状,又要考虑矿区发展的过程和矿区发展的未来方向。参考有关资料,结合专家意见,我们确定了对平顶山市盐矿区进行经济区划分的指标。如表1所示。表中列举了具体指标及各指标的原始数据(数据来源于河南省2006年矿产资源储量简表)。表1盐矿区经济划分指标体系及指标数据注:表中N表示缺失数据,勘察阶段1、2、3分别表示:初步勘探、详细普查、详细勘探,利用状况1~7分别表示:近期不宜进一步工作、可供进一步工作、近期难以利用、推荐近期利用、计划近期利用、基建矿区、开采矿区。

2、转换指标数据由于不同变量之间存在不同量纲由于不同变量之间存在不同量纲、不同数量级,为使各个变量更具有可比性,有必要对数据进行转换。目前进行数据处理的方法大致有三种,即标准化、极差标准化和正规化。为便于更直观的比较各市之间同一指标的数值大小,我们采用了正规化转换方式。其计算公式为:为了方便叙述,做如下设定:设Xi(i=1,2,3,…,21)为具体指标层中第i个评价指标的值,Pi(i=1,2,3,…,21)为第i个指标正规化后的值,0≤Pi≤1,Xs,i(Xs,i=Xmax-Xmin),为第i个评价指标的标准值,Xmax为最大值,Xmin为最小值。(1)对于越高越好的`指标①Xi≥Xmax,则Pi=1;②Xi≤Xmin,则Pi=0;③Xmin

三、聚类分析

1、聚类步骤(Stage).从1~3表示聚类的先后顺序。

2、个案合并(ClusterCombined)。表示在某步中合并的个案,如第一步中个案1叶县田庄盐矿段和个案2叶县马庄盐矿段合并,合并以后用第一项的个案号表示生成的新类。

3、相似系数(Coefficients).据聚类分析的基本原理,个案之间亲密程度最高即相似系数最接近于1的,最先合并。因此该列中的系数与第一列的聚类步骤相对应,系数值从小到大排列。

4、新类首次出现的步骤(StageClusterFirstAppears)。对应于各聚类步骤参与合并的两项中,如果有一个是新生成的类(即由两个或两个以上个案合并成的类),则在对应列中显示出该新类在哪一步第一次生成。如第三步中该栏第一列显示值为1,表示进行合并的两项中第一项是在第一步第一次生成的新类。如果值为O,则表示对应项还是个案(不是新类)。

5、新类下次出现步骤(NextStage)。表示对应步骤生成的新类将在第几步与其他个案或新类合并。如第一行的值是11,表示第一步聚类生成的新类将在第11步与其他个案或新类合并。

6、解析图DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine聚类树状图(方法:组间平均连接法)图清晰的显示了聚类的全过程。他将实际距离按比例调整到0~25之间,用逐级连线的方式连接性质相近的个案或新类,直至并未一类。在该图上部的距离标尺上根据需要(粗分或细分)选定一个划分类的距离值,然后垂直标尺划线,该垂线将与水平连线相交,则相交的交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。例如,选标尺值为5,则聚为3类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。若选标尺值为10,则聚为2类:叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。

四、结论

对平顶山市5个盐矿区进行经济区划分,究竟划分为几个区合适,既不是越多越好,也不是越少越好。划分经济区的目的,就是要根据各盐矿经济区资源特点、勘察、开发的不同,分类指导经济活动,使人们的经济活动更加符合当地的实际,使各经济区能充分发挥各自的优势,做到扬长避短,趋利避害,达到投人少、产出多,创造良好的经济效益和社会效益之目的。分区太多,就失去了分区的意义,分区太少,则分类指导很难做到有的放矢。综合以上聚类分析结果,我们可以得出三个方案。其中两个方案比较合适,可供选择。方案一:(当比例尺为5时,分为3类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段为一类,叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案一。方案二:(当比例尺为10时,分为2类)叶县田庄盐段、叶县马庄盐矿段为一类,叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案二。平顶山市盐矿区分类图方案2聚类分析的原理就是将矿石质量、资源储量、勘查阶段、利用状况相近或相类似的矿区聚合在一起,其分析结果也是直观易见的。在此结合平顶山市实际行政区划以及矿山企业特征我们对铁矿区划分做一个调整使其理论与实际能够结合的更紧密使其更好的指导实践。

1、叶县田庄盐段、叶县马庄盐矿段为一类,这一类属于矿床规模相当,资源储量接近,勘查开发阶段接近,利用程度相当,故,可以分为一类。

2、叶县娄庄盐矿、叶县五里堡盐矿段为一类,这一类属于勘查开发阶段处于同一阶段。

3、叶县姚寨盐矿为一类,这一类属于储量较高,盐矿品位较高,故其勘察开采规划有别于其它两类。总的说来,运用聚类分析是基本成功的,大部分的分类是符合实际的。综合以上论述盐矿区划分如下表所示:当然聚类分析有其优点也有其缺点:(1)优点:聚类分析模型的优点就是直观,结论形式简明。(2)缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试问内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。

①根据某些特定的标准剔除过多的数据,比如:spss,SAS,EXCEL;②对余下的数据进行处理,;③数据过多的时候,把相类似的数据看作是一个数据群,再基于这些群进行研究;④可以尝试一下SPSs里面的聚类分析之类的功能。补充:数学建模是利用数学方法解决实际问题的一种实践。即通过抽象、简化、假设、引进变量等处理过程后,将实际问题用数学方式表达,建立起数学模型,然后运用先进的数学方法及计算机技术进行求解。 数学建模将各种知识综合应用于解决实际问题中,是培养和提高学生应用所学知识分析问题、解决问题的能力的必备手段之一。数学建模是使用数学模型解决实际问题。

单纯的数字数据还好,可以直接应用统计软件

相关百科
热门百科
首页
发表服务