一、数据准备阶段：构建分析基础

1.1 数据录入规范

SPSS的数据录入界面采用”数据视图”与”变量视图”双模式设计。在变量视图中需完成以下关键设置：

变量命名规则：采用英文命名（如age、gender），避免特殊字符，长度不超过8字节
数据类型定义：数值型（Scale）、分类型（Nominal/Ordinal）、日期型（Date）需根据变量特征选择
测量尺度设置：连续变量设为Scale，分类变量设为Nominal，有序分类设为Ordinal
值标签映射：为分类变量建立值标签（如1=男，2=女），提升数据可读性

示例：创建包含年龄、性别、收入三个变量的数据集

[变量视图配置]
Name    Type    Width    Decimals    Measure    Role    Values
age     Numeric  8        2           Scale      Input   
gender  Numeric  8        0           Nominal    Input   1=Male, 2=Female
income  Numeric  8        0           Scale      Input

1.2 高效数据导入

对于大规模数据集，推荐使用外部导入功能：

文件格式支持：Excel(.xlsx)、CSV、TXT、SAS、Stata等15+格式
导入优化技巧：
- CSV文件导入时，在”文本向导”中指定分隔符类型
- Excel文件导入时，勾选”读取变量名”自动匹配首行标题
- 日期变量处理：通过”数据”→”定义日期”设置日期格式模板
编码问题处理：遇到中文乱码时，在导入对话框中选择UTF-8编码

二、数据清洗与预处理

2.1 缺失值处理策略

通过”分析”→”描述统计”→”描述”生成缺失值报告：

低比例缺失（<5%）：
- 数值变量：均值/中位数插补（转换→替换缺失值）
- 分类变量：众数插补
高比例缺失（>20%）：
- 考虑删除变量或使用多重插补法
- 示例代码：
```
MULTIPLE IMPUTATION age income /IMPUTE METHOD=MONOTONE NIMPUTATIONS=5.
```

2.2 异常值检测与修正

箱线图检测：图形→旧对话框→箱图，识别1.5倍四分位距外的异常值
处理方案：
- 数据录入错误：直接修正（如年龄-99改为99）
- 真实极端值：
  - Winsor化处理：将极端值替换为第5/95百分位数
  - 对数转换：对偏态分布数据应用LG10()函数
Z分数法：通过”分析”→”描述统计”→”描述”计算标准化值，筛选|Z|>3的记录

2.3 数据一致性验证

值标签检查：通过”数据”→”定义变量属性”验证分类变量取值范围

逻辑校验：创建新变量进行交叉验证

COMPUTE check = (gender=1 & marital_status=2).  /* 验证未婚男性记录
FREQUENCIES check.

三、数据转换与重构

3.1 变量计算与派生

算术运算：使用COMPUTE命令创建新变量

COMPUTE total_score = q1 + q2 + q3.  /* 计算总分
COMPUTE log_income = LG10(income+1).  /* 对数转换

条件赋值：通过IF语句实现分组编码

IF (age < 18) young=1.
IF (age GE 18 AND age LE 60) adult=1.
IF (age > 60) senior=1.
EXECUTE.

3.2 数据集重构

长宽格式转换：
- 宽转长：数据→重构→将多个变量转换为案例
- 长转宽：数据→重构→将案例转换为多个变量
记录拆分：数据→选择案例，按条件拆分数据集
记录合并：数据→合并文件→添加变量/案例

四、数据分析实施

4.1 基础统计分析

描述统计：分析→描述统计→频率/描述/探索
交叉分析：分析→描述统计→交叉表，支持卡方检验
T检验实现：
- 独立样本T检验：分析→比较均值→独立样本T检验
- 配对样本T检验：分析→比较均值→配对样本T检验

4.2 高级建模应用

线性回归：分析→回归→线性
- 模型诊断：通过残差图验证假设
- 变量筛选：逐步法/向前法/向后法
因子分析：分析→降维→因子
- KMO检验：判断数据适切性
- 旋转方法：方差最大旋转/直接斜交旋转

五、结果输出与报告

5.1 输出文档管理

输出导航器：通过窗口→输出导航器管理分析结果
结果导出：文件→导出→选择PDF/Word/HTML格式
脚本自动化：使用语法编辑器保存分析流程（.sps文件）

5.2 可视化呈现

图表构建器：图形→图表构建器，支持拖拽式操作
专业图表修改：
- 双击图表进入编辑模式
- 通过”元素属性”调整颜色/字体/坐标轴
- 导出为高分辨率图片（300dpi以上）

六、最佳实践建议

版本控制：定期保存数据文件（.sav）和分析脚本（.sps）
数据备份：建立原始数据、清洗数据、分析数据三级存储体系
文档规范：在变量视图中添加变量说明，在语法文件中添加注释
性能优化：
- 大数据集处理时关闭自动计算统计量
- 使用SPLIT FILE命令进行分组分析
- 合理使用FILTER命令筛选案例

通过系统掌握上述操作流程，研究者可显著提升SPSS数据分析效率，确保从数据准备到结果输出的全流程质量。建议结合具体研究场景，建立标准化的分析模板，实现分析流程的可复用性。

SPSS数据分析全流程操作指南