CHECKLIST.md 2.6 KB

DataOps Platform 部署检查清单

部署前

  • 服务器为 Ubuntu 20.04/22.04,可 sudo
  • Python 3.8+ 已安装(python3 --version
  • Supervisor 已安装并运行(systemctl status supervisor
  • PostgreSQL 可连接(DATABASE_URL 测试通过)
  • Neo4j 可连接(Bolt 7687 / HTTP 7474)
  • MinIO 可访问,bucket dataops-bucket 已创建
  • MinIO access key / secret key 与 dataops.env 一致
  • n8n 可访问,API Key 有效
  • DeepSeek API Key 已申请且有余额
  • 发布包已上传(deployment/dataops-platform-release-*.tar.gz
  • /data/upload/data/archive 磁盘空间充足

首次部署

  • chmod +x deploy_dataops.sh scripts/*.sh
  • sudo bash deploy_dataops.sh(首次会生成 env 并退出)
  • 编辑 /etc/dataops-platform/dataops.env
    • SECRET_KEY 已改为长随机字符串
    • DEEPSEEK_API_KEY 已填入真实密钥
    • N8N_API_KEY 已填入真实密钥
    • DATABASE_URL / NEO4J_* / MINIO_* 与生产环境一致
    • LLM_BASE_URL=https://api.deepseek.com(无 /v1 后缀)
    • LLM_MODEL_NAME=deepseek-v4-pro(或实际使用模型)
    • LOG_FILE 为绝对路径
  • sudo chown root:ubuntu /etc/dataops-platform/dataops.env
  • sudo chmod 640 /etc/dataops-platform/dataops.env
  • 再次执行 sudo bash deploy_dataops.sh

部署后验证

  • supervisorctl status dataops-platform 为 RUNNING
  • curl http://127.0.0.1:5500/api/system/health 返回 200
  • 日志无 ERROR:tail -50 /opt/dataops-platform/logs/flask_production.log
  • 日志含 DeepSeek 加载信息(base_url、model)
  • 翻译 API 返回英文标识符: bash curl -X POST http://127.0.0.1:5500/api/system/translate \ -H "Content-Type: application/json" \ -d '{"node_name":"测试宁波数据加工"}' - [ ] MinIO 上传接口正常(业务域上传测试) - [ ] DDL 解析接口不 504(若走 Nginx,确认 ddlparse 超时 300s) ## Nginx / HTTPS(可选) - [ ] config/nginx-dataops-platform.conf 证书路径已修改 - [ ] nginx -t 通过 - [ ] 公网 https://company.citupro.com:18183/api/system/health 可达 ## 安全 - [ ] dataops.env 权限为 640,属主 root:ubuntu - [ ] 未将 API Key 提交到 Git - [ ] 防火墙仅开放必要端口(18183 / 22 等) ## 回滚准备 - [ ] 已备份上一版 /opt/dataops-platform/app - [ ] 已备份 /etc/dataops-platform/dataops.env - [ ] 知晓回滚命令:sudo supervisorctl stop dataops-platform + 恢复目录