多维标准MDS
多维标准(multidimensional scaling, MDS),是一种将研究对象之间间隔或者不类似度的曲看展现,较为典型的研究对象是天文位置,当然也能够是看点、颜色等肆意各类实体或笼统概念,好比茶的口味不类似情状。多维标准的目标是将间隔停止可视化展现。
多维标准MDS凡是分为两类,别离是度量MDS(metric multidimensional scaling, mMDS)和非度量MDS(nonmetric multidimensional scaling, nMDS)。二者的利用上,凡是情状下,假设研究对象之间的间隔代表其实在间隔,那么利用度量MDS较为合适,并且此类间隔凡是可抉择利用欧式间隔停止计算,假设研究对象之间的间隔代表次序(即相对间隔非实在间隔,好比功效排名),那么利用非度量MDS较为合适。
多维标准MDS案例
1 布景
当前有中国有8大核心城市的间隔数据,期看利用多维标准法曲看展现该8大城市的间隔情状,数据如下图所示:
展开全文
图中右下角数据为1,其代表本身,以及数据闪现出完全对称关系。上述数据中数字代表现实间隔,因而应该利用‘度量MDS法’,而且数据格局为n*n格局。可抉择‘计算欧氏间隔’。
2 理论
多维标准MDS涉及2品种型,别离是度量MDS和非度量MDS,以及SPSSAU撑持两种数据格局。详细如下事例阐明:
假设研究的是‘饮料口味类似度’,类似下图如许的n*n构造数据,数字代表的间隔只是一种‘次序’非现实间隔(好比coffee和milk之间的数字为6代表间隔较远,但beer和wine之间的数字为1代表间隔十分近),此类数据一般利用‘非度量MDS’法,数据格局为n*n构造数据;
除此之外,还有一种数据为‘原始数据’格局,好比研究中国31省市在8个维度的消费情状,以即可视化闪现各省市居民的类似情状,如下图所示:
上图展现中国31省市在8个维度上的消费数据,数字代表现实消费情状,因而此类数据应该利用‘度量MDS’,并且选中‘计算欧氏间隔’,并且上述图中数据格局为‘原始数据’格局,其并不是n*n格局数据。
3 操做
本例子操做如下:
因为数字为现实间隔值,因而利用‘度量MDS’法,而且选中‘计算欧式间隔’,以及当前数据格局为n*n格局。
4 SPSSAU输出成果
SPSSAU共输出2个表格和1个图。别离如下阐明:
5文字阐发
上表格展现MDS模子的根本设置,本次案例利用度量MDS法停止研究,输进数据为n*n格局,而且要求先计算欧式间隔后再进进模子阐发。
上表格MDS间隔模子的详细坐标数据,下图为MDS间隔模子,图示能够看见北京和天津的间隔十分近,并且上海和杭州的间隔很近。但郑州离其余七个城市均有很远的间隔,那与事实情状完全吻合。足以证明MDS模子能够很好的可视化展现间隔数据。
6 分析
涉及以下几个关键点,别离如下:
关于SPSSAU中‘计算欧式间隔’参数?
假设是度量MDS数据,可选中‘计算欧式间隔’,即让系统先计算出各研究对象之间的欧式间隔后然后进进模子停止阐发,当然那由研究者本身决定,凡是需要选入彀算。
假设供给的是‘原始数据格局’(非n*n格局时),此时系统主动管帐算出各研究对象之间的欧式间隔,然后构建出数据后停止MDS间隔模子计算,此时不管能否选中‘欧式间隔’,系统会会先辈行研究对象欧式间隔计算后再进进MDS模子。