模糊聚类分析算法的设计与实现
摘要
聚类就是按照事物间的相似性进行区分和分类的过程,在这一过程中没有教师指导,因此是一种无监督的分类。聚类分析则是用数学方法研究和处理所给定对象的分类。传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某个类中,具有非此即彼的性质,因此这种分类的类别界限是分明的。而实际上大多数对象并没有严格的属性,它们在性态和类属方面存在着中介性,适合进行软划分。Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析。
模糊聚类分析算法的一般包括三个步骤:第一步:数据标准化;第二步:建立模糊相似矩阵;第三步:聚类。本文对模糊聚类分析中的两种算法进行了重点研究。最后利用matlab实现了一个模糊聚类算法,并用实例加以验证。
关键词:模糊集合,模糊聚类分析,模糊等价矩阵,传递闭包
Abstract
This paper will illustrate “clustering analysis” thoroughly. Cluster is a process that assorts things by their similarity. There is no adviser in this process, so it is a non-supervised classification. “Clustering analysis” research and process assort things by mathematical means. Traditional Clustering analysis assorts things strictly: therefore the limit of the classification is very clearly. But in fact most of the things have no obvious attribute by each: their limit is vague, as a result soft classification is a better way to process them. Professor Zadeh introduced the theory of fuzzy sets, which offer a powerful means to solve the problem. People begin to use fuzzy way to deal with clustering problem, and call it “fuzzy clustering analysis”.
“Fuzzy clustering analysis” contains three steps. The first is data standardization; the second is to establish fuzzy similar matrix; the third is clustering. This paper will research two arithmetic of the Fuzzy clustering analysis. Finally, the paper will accomplish Fuzzy clustering analysis program by matlab. It is significant to use data to validate it.
Key words: fuzzy set, fuzzy clustering analysis, fuzzy equivalent matrix, transitive closure
本文的研究对象与工作
本文通过阐述模糊集合知识,引出模糊数学中一个重要的研究领域,即模糊聚类分析,综述了当前常见模糊聚类分析的原理及方法,并对模糊聚类分析中两种重要的方法即基于模糊等价矩阵的模糊聚类分析法和ISODATA法进行了重点研究,之后给出改进算法。最后使用Matlab语言实现一个模糊聚类分析程序。
本文的内容组织
本文的内容一共分为五章。
第一章为“引言”,介绍模糊聚类分析的背景意义、研究现状和发展情况,本文的研究对象与工作概述及内容组织。
第二章为“模糊聚类分析综述”,先介绍模糊集合的基本概念,然后阐述模糊集合的基本运算方法,给出分解定理,它是联系模糊集合与经典集合的桥梁。接着介绍了几种当前较为常见的模糊聚类分析方法的主要思路。 [资料来源:http://doc163.com]
第三章为“基于模糊等价矩阵的模糊聚类分析”,说明模糊聚类分析是如何通过模糊矩阵的变化来实现的,以及模糊聚类分析的步骤和能实现分类的各种方法。
第四章为“基于目标函数的模糊ISODATA聚类分析”,介绍了ISODATA算法的主要思路,给出了一些改进的思路。
第五章为“模糊聚类分析算法的实例实现”,用Matlab语言实现了一个模糊聚类分析程序。
最后为“结束语”,是对全文的总结与展望。
模糊集合的基本概念
人们所熟悉的经典集(为了与模糊集相区别,故称之为经典集)论要求:对论域中的任何元素,或者属于某一集合,或者不属于这个集合,两者必居其一且仅居其一。然而在现实世界中,有许多概念都是很模糊的,比如说“天气好”、“水温很低”、“个子很高”等都是模糊的概念。这样就使得经典集合论对于这样的概念显得力不从心了,因为模糊概念很难简单地用“属于”或“不属于”来表示,而只能通过属于的程度来描述。换句话说,就是论域中的元素符合某一概念的程度不能仅仅用0或1来表示,而需要借助于介于0到1之间的实数来表示。
目录 20000字
第1章 引言 1
1.1研究背景 1
1.2本文的研究对象与工作 3
1.3本文的内容组织 3
第2章 模糊聚类分析综述 4
2.1模糊集合的基本概念 4
2.2 模糊集合的表示法 4
2.3 模糊集的运算及性质 5
2.4 模糊集的分解定理 6
2.5 模糊矩阵 7
2.6 模糊聚类分析算法综述 14
第3章 基于模糊等价矩阵的模糊聚类分析 19
3.1基于模糊等价矩阵的模糊聚类分析的主要步骤 19
3.2 基于模糊等价矩阵的模糊聚类分析方法的评价 27
第4章 基于目标函数的模糊ISODATA聚类分析 30
4.1 模糊ISODATA聚类分析方法 30
4.2 聚类效果的检验 32
4.3 模糊ISODATA算法的改进 33
第5章 模糊聚类分析算法的实例实现 34 [资料来源:www.doc163.com]
5.1 求模糊相似矩阵 35
5.2 计算 的传递闭包 35
5.3 计算 截矩阵 36
结束语 37
参考文献 40
致谢 42
外文资料原文 43
外文资料译文 46 [资料来源:http://Doc163.com]