第1章 系统部署与基础环境搭建
1.1 操作系统安装全流程
系统安装是运维工作的起点,需完成三项核心准备:
- 镜像文件准备:从开源社区或主流云服务商获取ISO镜像,建议选择LTS版本以获得长期支持。对于生产环境,推荐使用最小化安装镜像以减少安全风险。
- 虚拟化环境配置:在物理服务器部署时,需配置RAID阵列并验证存储可靠性;虚拟机部署则需调整CPU/内存资源分配,建议为系统盘分配至少40GB空间。
- 安装过程关键步骤:
- 分区方案建议:
/boot(1GB)、/(剩余空间70%)、/var(20%)、swap(内存≤8GB时设为2倍内存,>8GB时设为8-16GB) - 网络配置需记录MAC地址与预设IP的对应关系
- 安全策略预置:禁用root远程登录、配置SSH密钥认证
- 分区方案建议:
1.2 基础环境标准化配置
完成安装后需立即执行10项关键配置:
1.2.1 主机与网络配置
# 修改主机名(需重启生效)hostnamectl set-hostname web-server-01# 永久配置IP地址(以CentOS为例)cat > /etc/sysconfig/network-scripts/ifcfg-ens33 <<EOFBOOTPROTO=staticIPADDR=192.168.1.100NETMASK=255.255.255.0GATEWAY=192.168.1.1DNS1=8.8.8.8EOF
1.2.2 用户权限管理
遵循最小权限原则创建三类用户:
- 系统管理账户:添加到wheel组并配置sudo权限
- 应用运行账户:禁止登录shell(
/bin/false) - 审计账户:仅授予日志查看权限
1.2.3 软件源优化
配置本地Yum仓库时需注意:
- 优先使用国内镜像源(如教育网镜像)
- 对于离线环境,需搭建内部仓库服务器
- 定期执行
yum clean all清理缓存
1.2.4 安全加固措施
# 防火墙配置(推荐使用firewalld)systemctl enable --now firewalldfirewall-cmd --permanent --add-service={http,https,ssh}# SELinux策略调整(生产环境建议保持enforcing模式)setenforce 0 # 临时关闭sed -i 's/^SELINUX=.*/SELINUX=permissive/' /etc/selinux/config # 永久修改# SSH服务强化sed -i 's/^#PermitRootLogin.*/PermitRootLogin no/' /etc/ssh/sshd_configsed -i 's/^#ClientAliveInterval.*/ClientAliveInterval 300/' /etc/ssh/sshd_config
1.2.5 资源限制调整
修改/etc/security/limits.conf文件设置:
* soft nofile 65535* hard nofile 65535* soft nproc 65535* hard nproc 65535
第2章 系统架构深度解析
2.1 目录结构标准化规范
2.1.1 FHS标准遵循
| 目录路径 | 核心作用 | 权限建议 |
|---|---|---|
/etc |
全局配置文件存储 | 755 root:root |
/var/log |
日志文件集中存储 | 750 root:adm |
/opt |
第三方应用安装目录 | 755 root:root |
/usr/local |
管理员自定义安装目录 | 755 root:staff |
2.1.2 关键子目录说明
/etc/skel/:新用户默认配置模板/dev/shm/:临时内存文件系统/run/:系统运行时数据(包含PID文件)
2.2 核心配置文件管理
2.2.1 网络配置矩阵
| 文件路径 | 配置内容 | 修改影响范围 |
|---|---|---|
/etc/hosts |
静态主机名解析 | 本地名称解析 |
/etc/resolv.conf |
DNS服务器配置 | 所有网络请求 |
/etc/sysconfig/network |
默认网关设置 | 系统全局网络参数 |
2.2.2 启动管理文件
/etc/fstab:设备挂载配置(需验证UUID的正确性)/etc/rc.local:系统启动脚本(需添加执行权限)/etc/cron.d/:定时任务扩展目录(优于直接修改crontab)
2.2.3 安全配置矩阵
# 密码策略配置(/etc/login.defs)PASS_MAX_DAYS 90PASS_MIN_DAYS 1PASS_WARN_AGE 7# 审计规则配置(/etc/audit/auditd.conf)max_log_file = 100num_logs = 5
第3章 企业级运维实践
3.1 自动化部署方案
推荐使用Ansible实现批量配置:
# playbook示例:基础环境初始化- hosts: web_serverstasks:- name: 配置SSH端口lineinfile:path: /etc/ssh/sshd_configregexp: '^#Port'line: 'Port 2222'notify: Restart sshd- name: 创建应用用户user:name: appusergroups: wheelshell: /bin/bashhandlers:- name: Restart sshdservice:name: sshdstate: restarted
3.2 监控告警体系
建议构建三级监控体系:
- 基础监控:CPU/内存/磁盘使用率(通过
/proc/meminfo采集) - 应用监控:服务可用性(使用
curl -I检测HTTP状态码) - 业务监控:关键交易指标(需应用层埋点)
3.3 灾备方案设计
实施3-2-1备份策略:
- 3份数据副本
- 2种存储介质(如磁盘+磁带)
- 1份异地备份
关键系统建议采用LVM快照+rsync增量备份的组合方案,定期验证备份数据的可恢复性。
结语
本文系统阐述了Linux运维从基础搭建到企业级实践的全流程,涵盖20余项关键配置项和3大类实战场景。运维人员应建立标准化操作流程(SOP),结合自动化工具提升管理效率,同时定期进行安全审计和性能调优。对于大型企业,建议构建统一的运维管理平台,整合CMDB、自动化运维、监控告警等核心功能,实现全生命周期管理。