【聚类】-FreeNAS中文网

admin 管理员组

文章数量: 887021

【聚类】

ref

1 目的

已知很多样本点之间的相互距离（以欧式距离为例），但是不知道每个样本点的具体坐标，MDS分析就是要求解出每个样本点的原始坐标，然后保证这些样本点的原始坐标尽量符合这个距离矩阵关系。

MDS利用的是成对样本间相似性，目的是利用这个信息去构建合适的低维空间，是的样本在此空间的距离和在高维空间中的样本间的相似性尽可能的保持一致。

如
已知几大城市之间的距离，但是不知道他们的经纬度，现在要求他们之间的相对位置关系。

计算步骤

1）从距离矩阵D中，求解出B。

其中，B的含义如下式：
X代表每个数据的原始坐标，在本例中，X也就代表这些城市的坐标信息。

公式2与公式1是可以相互推导的。

接下来的分析就跟PCA有点相似了。我们知道在PCA中，也是首先求出原始数据的协方差矩阵，然后再计算协方差矩阵的前n个特征值对应的特征向量，就是原始样本点的几个重要的方向。

（2）计算B的特征值与特征向量，找到前n个值对应的特征向量。用这些特征值特征向量把B对角化

B = F’ A F

其中A是以前n个特征值为对角线元素的对角阵，F是特征向量组成的矩阵。

然后就可以画出来相对位置了。在选择前n个特征值的时候，如果选择1个，那么会得到他们之间的1维关系，如果n = 2，那么会得到他们之间的二维关系。

import numpy as np
import matplotlib.pyplot as pltdef mds(D,q):D = np.asarray(D)DSquare = D**2totalMean = np.mean(DSquare)columnMean = np.mean(DSquare, axis = 0)rowMean = np.mean(DSquare, axis = 1)B = np.zeros(DSquare.shape)for i in range(B.shape[0]):for j in range(B.shape[1]):B[i][j] = -0.5*(DSquare[i][j] - rowMean[i] - columnMean[j]+totalMean)eigVal,eigVec = np.linalg.eig(B)X = np.dot(eigVec[:,:q],np.sqrt(np.diag(eigVal[:q])))return XD = [[0,587,1212,701,1936,604,748,2139,2182,543],
[587,0,920,940,1745,1188,713,1858,1737,597],
[1212,920,0,879,831,1726,1631,949,1021,1494],
[701,940,879,0,1374,968,1420,1645,1891,1220],
[1936,1745,831,1374,0,2339,2451,347,959,2300],
[604,1188,1726,968,2339,0,1092,2594,2734,923],
[748,713,1631,1420,2451,1092,0,2571,2408,205],
[2139,1858,949,1645,347,2594,2571,0,678,2442],
[2182,1737,1021,1891,959,2734,2408,678,0,2329],
[543,597,1494,1220,2300,923,205,2442,2329,0]]label = ['Atlanta','Chicago','Denver','Houston','Los Angeles','Miami','New York','San Francisco','Seattle','Washington, DC']
X = mds(D,2)
plt.plot(X[:,0],X[:,1],'o')
for i in range(X.shape[0]):plt.text(X[i,0]+25,X[i,1]-15,label[i])
plt.show()

本文标签：聚类

版权声明：本文标题：【聚类】内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1730800193h1385031.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

技术交流 – FreeNAS中文网

【聚类】

【聚类】

计算步骤

更多相关文章

聚类

Canopy算法中T值选取的优化及聚类效果的改进

sklearn k-means聚类参数

基于Python的自然语言数据处理系统的设计与实现

python聚类函数

【聚类】

发表评论

推荐文章

Android高性能音频之理清Binder结构(五)

Windows10系统简单使用与优化设置

黑鲨重装计算机安装无法继续,黑鲨教你重装系统解决电脑开机无法进入系统问题...

2008系统服务器,Windows Server 2008操作系统

【YOLO部署Android安卓手机APP】YOLOv11部署到安卓实时目标检测识别——以火焰烟雾目标检测识别举例（可自定义更换其他目标）

热门文章

windows系统找不到设置

AIX常见问题

latex 粗体的坑

i18n 中如何传递参数

Coursera—Andrew Ng机器学习—课程笔记 Lecture 5 Octave Tutorial

Windows版Ros环境的搭建以及Rviz显示激光点云信息

国内的linux系统,盘点2011国内仅存的几款Linux操作系统

华为手机如何与台式计算机连接不上,华为手机怎样与电脑连接？USB数据线及WLAN无线两种连接电脑方式介绍...

Windows 安装ubuntu 子系统

联想拯救者新机重装Win10后触摸板失灵问题解决方法

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

技术交流 – FreeNAS中文网

【聚类】

【聚类】

计算步骤

更多相关文章

聚类

Canopy算法中T值选取的优化及聚类效果的改进

sklearn k-means聚类参数

基于Python的自然语言数据处理系统的设计与实现

python聚类函数

【聚类】

发表评论

推荐文章

Android高性能音频之理清Binder结构(五)

Windows10系统简单使用与优化设置

黑鲨重装计算机安装无法继续,黑鲨教你重装系统解决电脑开机无法进入系统问题...

2008系统服务器,Windows Server 2008操作系统

【YOLO部署Android安卓手机APP】YOLOv11部署到安卓实时目标检测识别——以火焰烟雾目标检测识别举例（可自定义更换其他目标）

热门文章

windows系统找不到设置

AIX常见问题

latex 粗体的坑

i18n 中如何传递参数

Coursera—Andrew Ng机器学习—课程笔记 Lecture 5 Octave Tutorial

Windows版Ros环境的搭建以及Rviz显示激光点云信息

国内的linux系统,盘点2011国内仅存的几款Linux操作系统

华为手机如何与台式计算机连接不上,华为手机怎样与电脑连接？USB数据线及WLAN无线两种连接电脑方式介绍...

Windows 安装ubuntu 子系统

联想拯救者新机重装Win10后触摸板失灵问题解决方法

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

（Windows系统）详细介绍Windows系统含有英文版