这里总结一下运维工作范畴
要让一切变得清晰, 可见, 高效
一、 资源管理
- 域名管理: 域名购买, 续费, 解析等
- 主机管理: 主机购买, 续费, 迁移, 注销等
账号管理:
- 域名服务商账号
- 主机服务商账号
- 主机账号
- webmaster账号
- 工具站点账号
二、 服务监控
- 网站是否正常运行: 网站是否能正常提供服务
- 服务是否正常运行: 电子邮件系统是否正常
- 服务器健康状况: 负载情况, 内存状况, 磁盘状况, cpu状况
三、 安全防护
- 网站防火墙的规则, 以及定期的检查
- 使用工具定期对网站进行安全扫描
- 合理配置权限
四、 日志分析
- 合理的采集和切分网站日志
- 通过 ELK 分析网站日志
- 检查防火墙规则, 观察 client 被 ban 的情况
- 安装 pwiki 日志工具, 可视化的分析网站的访问情况
五、 服务部署
- 目前人工安装所有服务, 比较低效, 希望能够尽可能实现自动化,尤其是对于通用环境。
- 探索 docker 对于我们的业务部署是否有价值和意义,多看一些相关的资料
- 探索 jenkins 工具, 对于我们的业务部署,日常代码上线是否有价值和意义,多看一些相关的资料
六、 脚本分发
- 熟练使用 ansible , 便于通过一台机器管理多台机器
- crontab 的管理, 日志的分析: 脚本要有输出, 输出要有采集, 采集要易于查看
- 数据备份日志分析: 脚本要有输出, 输出要有采集, 采集要易于查看
七、 SEO工作
- 理清 SEO 工作范畴: 制作网站, 制作页面, 上线网站, 更新网站, 提交 sitemap
- 理清 SEO 工作流程, 脚本, 工具, 部署的要求。
- 理清 SEO 工作标准, 如何测试, 检查。
八、 做好总结工作
- 每次对服务器做了变动和修改, 需要记录日志: 某月某日, 做了什么事情
- 每次服务器出现异常, 需要分析清楚原因, 并提出改善的方案
- 尽量避免误操作, 一旦发现误操作, 应当总结反思, 避免重蹈覆辙