基于网格的探索性数据分析方法

描述了基于网格的探索性数据分析方法,其中可以改变网格单元的大小。此处描述的探索性数据分析的主要工具是聚类分析。提供了关于不同类型的聚类算法及其实效的背景信息。然后描述了一种基于网格的探索性和聚类分析方法。对一系列不同大小的网格单元进行探索性分析和聚类分析。使用两个营销数据集来说明市场研究人员经常面临的研究问题。第一个是城市的聚类分析,用于创建分层以选择具有代表性的概率样本。第二个例子是为了定位广告...

简介

本文的目的是介绍一种探索性数据分析的新方法,其中“探索性数据分析”被 Tukey (1977) 定义为旨在探索数据空间而不是确认结构存在的方法的集合.这种方法基于可调整的网格系统,其中数据集中的每个观察值都分配给指定的子空间。这些子空间称为“n 立方体”。 n 立方体的大小是可调的,以便可以对 n 立方体大小范围内的每个值进行分析。这种能力使研究人员能够避免因选择 n 立方体大小而产生的偏见。这种方法的第二部分是 n 立方体的聚类分析。簇由彼此靠近但与其他 n 立方体隔离的填充 n 立方体形成。目的是在结构存在时在数据中找到结构,在结构不存在时验证结构不存在。当前的聚类算法会在不存在聚类时报告聚类的存在。...

Not a subscriber?

Schedule your live demo with our team today