5 月之前 · 04e48d41f1
--- a/.claude/settings.local.json
+++ b/.claude/settings.local.json
@@ -16,7 +16,8 @@
 
				       "Bash(.venv/Scripts/python.exe:*)",
			
 
				       "Bash(mv:*)",
			
 
				       "Bash(rm:*)",
			
 
				-      "Bash(.venv/bin/python:*)"
			
 
				+      "Bash(.venv/bin/python:*)",
			
 
				+      "Bash(./.venv/Scripts/python.exe:*)"
			
 
				     ],
			
 
				     "deny": []
			
 
				   }
			
--- a/agent/citu_agent.py
+++ b/agent/citu_agent.py
@@ -4,6 +4,7 @@ from langgraph.graph import StateGraph, END
 
				 from langchain.agents import AgentExecutor, create_openai_tools_agent
			
 
				 from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
			
 
				 from langchain_core.messages import SystemMessage, HumanMessage
			
 
				+from core.logging import get_agent_logger
			
 
				 
			
 
				 from agent.state import AgentState
			
 
				 from agent.classifier import QuestionClassifier
			
@@ -15,39 +16,42 @@ class CituLangGraphAgent:
 
				     """Citu LangGraph智能助手主类 - 使用@tool装饰器 + Agent工具调用"""
			
 
				     
			
 
				     def __init__(self):
			
 
				+        # 初始化日志
			
 
				+        self.logger = get_agent_logger("CituAgent")
			
 
				+        
			
 
				         # 加载配置
			
 
				         try:
			
 
				             from agent.config import get_current_config, get_nested_config
			
 
				             self.config = get_current_config()
			
 
				-            print("[CITU_AGENT] 加载Agent配置完成")
			
 
				+            self.logger.info("加载Agent配置完成")
			
 
				         except ImportError:
			
 
				             self.config = {}
			
 
				-            print("[CITU_AGENT] 配置文件不可用，使用默认配置")
			
 
				+            self.logger.warning("配置文件不可用，使用默认配置")
			
 
				         
			
 
				         self.classifier = QuestionClassifier()
			
 
				         self.tools = TOOLS
			
 
				         self.llm = get_compatible_llm()
			
 
				         
			
 
				         # 注意：现在使用直接工具调用模式，不再需要预创建Agent执行器
			
 
				-        print("[CITU_AGENT] 使用直接工具调用模式")
			
 
				+        self.logger.info("使用直接工具调用模式")
			
 
				         
			
 
				         # 不在构造时创建workflow，改为动态创建以支持路由模式参数
			
 
				         # self.workflow = self._create_workflow()
			
 
				-        print("[CITU_AGENT] LangGraph Agent with Direct Tools初始化完成")
			
 
				+        self.logger.info("LangGraph Agent with Direct Tools初始化完成")
			
 
				     
			
 
				     def _create_workflow(self, routing_mode: str = None) -> StateGraph:
			
 
				         """根据路由模式创建不同的工作流"""
			
 
				         # 确定使用的路由模式
			
 
				         if routing_mode:
			
 
				             QUESTION_ROUTING_MODE = routing_mode
			
 
				-            print(f"[CITU_AGENT] 创建工作流，使用传入的路由模式: {QUESTION_ROUTING_MODE}")
			
 
				+            self.logger.info(f"创建工作流，使用传入的路由模式: {QUESTION_ROUTING_MODE}")
			
 
				         else:
			
 
				             try:
			
 
				                 from app_config import QUESTION_ROUTING_MODE
			
 
				-                print(f"[CITU_AGENT] 创建工作流，使用配置文件路由模式: {QUESTION_ROUTING_MODE}")
			
 
				+                self.logger.info(f"创建工作流，使用配置文件路由模式: {QUESTION_ROUTING_MODE}")
			
 
				             except ImportError:
			
 
				                 QUESTION_ROUTING_MODE = "hybrid"
			
 
				-                print(f"[CITU_AGENT] 配置导入失败，使用默认路由模式: {QUESTION_ROUTING_MODE}")
			
 
				+                self.logger.warning(f"配置导入失败，使用默认路由模式: {QUESTION_ROUTING_MODE}")
			
 
				         
			
 
				         workflow = StateGraph(AgentState)
			
 
				         
			
@@ -137,12 +141,12 @@ class CituLangGraphAgent:
 
				             state["current_step"] = "direct_database_init"
			
 
				             state["execution_path"].append("init_direct_database")
			
 
				             
			
 
				-            print(f"[DIRECT_DATABASE] 直接数据库模式初始化完成")
			
 
				+            self.logger.info("直接数据库模式初始化完成")
			
 
				             
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 直接数据库模式初始化异常: {str(e)}")
			
 
				+            self.logger.error(f"直接数据库模式初始化异常: {str(e)}")
			
 
				             state["error"] = f"直接数据库模式初始化失败: {str(e)}"
			
 
				             state["error_code"] = 500
			
 
				             state["execution_path"].append("init_direct_database_error")
			
@@ -163,12 +167,12 @@ class CituLangGraphAgent:
 
				             state["current_step"] = "direct_chat_init"
			
 
				             state["execution_path"].append("init_direct_chat")
			
 
				             
			
 
				-            print(f"[DIRECT_CHAT] 直接聊天模式初始化完成")
			
 
				+            self.logger.info("直接聊天模式初始化完成")
			
 
				             
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 直接聊天模式初始化异常: {str(e)}")
			
 
				+            self.logger.error(f"直接聊天模式初始化异常: {str(e)}")
			
 
				             state["error"] = f"直接聊天模式初始化失败: {str(e)}"
			
 
				             state["error_code"] = 500
			
 
				             state["execution_path"].append("init_direct_chat_error")
			
@@ -180,12 +184,12 @@ class CituLangGraphAgent:
 
				             # 从state中获取路由模式，而不是从配置文件读取
			
 
				             routing_mode = state.get("routing_mode", "hybrid")
			
 
				             
			
 
				-            print(f"[CLASSIFY_NODE] 开始分类问题: {state['question']}")
			
 
				+            self.logger.info(f"开始分类问题: {state['question']}")
			
 
				             
			
 
				             # 获取上下文类型（如果有的话）
			
 
				             context_type = state.get("context_type")
			
 
				             if context_type:
			
 
				-                print(f"[CLASSIFY_NODE] 检测到上下文类型: {context_type}")
			
 
				+                self.logger.info(f"检测到上下文类型: {context_type}")
			
 
				             
			
 
				             # 使用渐进式分类策略，传递路由模式
			
 
				             classification_result = self.classifier.classify(state["question"], context_type, routing_mode)
			
@@ -199,13 +203,13 @@ class CituLangGraphAgent:
 
				             state["current_step"] = "classified"
			
 
				             state["execution_path"].append("classify")
			
 
				             
			
 
				-            print(f"[CLASSIFY_NODE] 分类结果: {classification_result.question_type}, 置信度: {classification_result.confidence}")
			
 
				-            print(f"[CLASSIFY_NODE] 路由模式: {routing_mode}, 分类方法: {classification_result.method}")
			
 
				+            self.logger.info(f"分类结果: {classification_result.question_type}, 置信度: {classification_result.confidence}")
			
 
				+            self.logger.info(f"路由模式: {routing_mode}, 分类方法: {classification_result.method}")
			
 
				             
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 问题分类异常: {str(e)}")
			
 
				+            self.logger.error(f"问题分类异常: {str(e)}")
			
 
				             state["error"] = f"问题分类失败: {str(e)}"
			
 
				             state["error_code"] = 500
			
 
				             state["execution_path"].append("classify_error")
			
@@ -214,12 +218,12 @@ class CituLangGraphAgent:
 
				     async def _agent_sql_generation_node(self, state: AgentState) -> AgentState:
			
 
				         """SQL生成验证节点 - 负责生成SQL、验证SQL和决定路由"""
			
 
				         try:
			
 
				-            print(f"[SQL_GENERATION] 开始处理SQL生成和验证: {state['question']}")
			
 
				+            self.logger.info(f"开始处理SQL生成和验证: {state['question']}")
			
 
				             
			
 
				             question = state["question"]
			
 
				             
			
 
				             # 步骤1：生成SQL
			
 
				-            print(f"[SQL_GENERATION] 步骤1：生成SQL")
			
 
				+            self.logger.info("步骤1：生成SQL")
			
 
				             sql_result = generate_sql.invoke({"question": question, "allow_llm_to_see_data": True})
			
 
				             
			
 
				             if not sql_result.get("success"):
			
@@ -228,7 +232,7 @@ class CituLangGraphAgent:
 
				                 error_type = sql_result.get("error_type", "")
			
 
				                 
			
 
				                 #print(f"[SQL_GENERATION] SQL生成失败: {error_message}")
			
 
				-                print(f"[DEBUG] error_type = '{error_type}'")
			
 
				+                self.logger.debug(f"error_type = '{error_type}'")
			
 
				                 
			
 
				                 # 根据错误类型生成用户提示
			
 
				                 if "no relevant tables" in error_message.lower() or "table not found" in error_message.lower():
			
@@ -244,7 +248,7 @@ class CituLangGraphAgent:
 
				                     state["validation_error_type"] = "llm_explanation"
			
 
				                     state["current_step"] = "sql_generation_completed"
			
 
				                     state["execution_path"].append("agent_sql_generation")
			
 
				-                    print(f"[SQL_GENERATION] 返回LLM解释性答案: {error_message}")
			
 
				+                    self.logger.info(f"返回LLM解释性答案: {error_message}")
			
 
				                     return state
			
 
				                 else:
			
 
				                     user_prompt = "无法生成有效的SQL查询，请尝试重新描述您的问题。"
			
@@ -257,7 +261,7 @@ class CituLangGraphAgent:
 
				                 state["current_step"] = "sql_generation_failed"
			
 
				                 state["execution_path"].append("agent_sql_generation_failed")
			
 
				                 
			
 
				-                print(f"[SQL_GENERATION] 生成失败: {failure_reason} - {user_prompt}")
			
 
				+                self.logger.warning(f"生成失败: {failure_reason} - {user_prompt}")
			
 
				                 return state
			
 
				             
			
 
				             sql = sql_result.get("sql")
			
@@ -273,13 +277,13 @@ class CituLangGraphAgent:
 
				                 state["validation_error_type"] = "llm_explanation"
			
 
				                 state["current_step"] = "sql_generation_completed"
			
 
				                 state["execution_path"].append("agent_sql_generation")
			
 
				-                print(f"[SQL_GENERATION] 返回LLM解释性答案: {explanation}")
			
 
				+                self.logger.info(f"返回LLM解释性答案: {explanation}")
			
 
				                 return state
			
 
				             
			
 
				             if sql:
			
 
				-                print(f"[SQL_GENERATION] SQL生成成功: {sql}")
			
 
				+                self.logger.info(f"SQL生成成功: {sql}")
			
 
				             else:
			
 
				-                print(f"[SQL_GENERATION] SQL为空，但不是解释性响应")
			
 
				+                self.logger.warning("SQL为空，但不是解释性响应")
			
 
				                 # 这种情况应该很少见，但为了安全起见保留原有的错误处理
			
 
				                 return state
			
 
				             
			
@@ -292,12 +296,12 @@ class CituLangGraphAgent:
 
				                 state["validation_error_type"] = "invalid_sql_format"
			
 
				                 state["current_step"] = "sql_generation_completed"  
			
 
				                 state["execution_path"].append("agent_sql_generation")
			
 
				-                print(f"[SQL_GENERATION] 内容不是有效SQL，当作解释返回: {sql}")
			
 
				+                self.logger.info(f"内容不是有效SQL，当作解释返回: {sql}")
			
 
				                 return state
			
 
				             
			
 
				             # 步骤2：SQL验证（如果启用）
			
 
				             if self._is_sql_validation_enabled():
			
 
				-                print(f"[SQL_GENERATION] 步骤2：验证SQL")
			
 
				+                self.logger.info("步骤2：验证SQL")
			
 
				                 validation_result = await self._validate_sql_with_custom_priority(sql)
			
 
				                 
			
 
				                 if not validation_result.get("valid"):
			
@@ -306,7 +310,7 @@ class CituLangGraphAgent:
 
				                     error_message = validation_result.get("error_message")
			
 
				                     can_repair = validation_result.get("can_repair", False)
			
 
				                     
			
 
				-                    print(f"[SQL_GENERATION] SQL验证失败: {error_type} - {error_message}")
			
 
				+                    self.logger.warning(f"SQL验证失败: {error_type} - {error_message}")
			
 
				                     
			
 
				                     if error_type == "forbidden_keywords":
			
 
				                         # 禁止词错误，直接失败，不尝试修复
			
@@ -316,12 +320,12 @@ class CituLangGraphAgent:
 
				                         state["validation_error_type"] = "forbidden_keywords"
			
 
				                         state["current_step"] = "sql_validation_failed"
			
 
				                         state["execution_path"].append("forbidden_keywords_failed")
			
 
				-                        print(f"[SQL_GENERATION] 禁止词验证失败，直接结束")
			
 
				+                        self.logger.warning("禁止词验证失败，直接结束")
			
 
				                         return state
			
 
				                     
			
 
				                     elif error_type == "syntax_error" and can_repair and self._is_auto_repair_enabled():
			
 
				                         # 语法错误，尝试修复（仅一次）
			
 
				-                        print(f"[SQL_GENERATION] 尝试修复SQL语法错误(仅一次): {error_message}")
			
 
				+                        self.logger.info(f"尝试修复SQL语法错误(仅一次): {error_message}")
			
 
				                         state["sql_repair_attempted"] = True
			
 
				                         
			
 
				                         repair_result = await self._attempt_sql_repair_once(sql, error_message)
			
@@ -335,12 +339,12 @@ class CituLangGraphAgent:
 
				                             state["sql_repair_success"] = True
			
 
				                             state["current_step"] = "sql_generation_completed"
			
 
				                             state["execution_path"].append("sql_repair_success")
			
 
				-                            print(f"[SQL_GENERATION] SQL修复成功: {repaired_sql}")
			
 
				+                            self.logger.info(f"SQL修复成功: {repaired_sql}")
			
 
				                             return state
			
 
				                         else:
			
 
				                             # 修复失败，直接结束
			
 
				                             repair_error = repair_result.get("error", "修复失败")
			
 
				-                            print(f"[SQL_GENERATION] SQL修复失败: {repair_error}")
			
 
				+                            self.logger.warning(f"SQL修复失败: {repair_error}")
			
 
				                             state["sql_generation_success"] = False
			
 
				                             state["sql_validation_success"] = False
			
 
				                             state["sql_repair_success"] = False
			
@@ -357,13 +361,13 @@ class CituLangGraphAgent:
 
				                         state["validation_error_type"] = error_type
			
 
				                         state["current_step"] = "sql_validation_failed"
			
 
				                         state["execution_path"].append("sql_validation_failed")
			
 
				-                        print(f"[SQL_GENERATION] SQL验证失败，不尝试修复")
			
 
				+                        self.logger.warning("SQL验证失败，不尝试修复")
			
 
				                         return state
			
 
				                 else:
			
 
				-                    print(f"[SQL_GENERATION] SQL验证通过")
			
 
				+                    self.logger.info("SQL验证通过")
			
 
				                     state["sql_validation_success"] = True
			
 
				             else:
			
 
				-                print(f"[SQL_GENERATION] 跳过SQL验证（未启用）")
			
 
				+                self.logger.info("跳过SQL验证（未启用）")
			
 
				                 state["sql_validation_success"] = True
			
 
				             
			
 
				             # 生成和验证都成功
			
@@ -371,13 +375,13 @@ class CituLangGraphAgent:
 
				             state["current_step"] = "sql_generation_completed"
			
 
				             state["execution_path"].append("agent_sql_generation")
			
 
				             
			
 
				-            print(f"[SQL_GENERATION] SQL生成验证完成，准备执行")
			
 
				+            self.logger.info("SQL生成验证完成，准备执行")
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] SQL生成验证节点异常: {str(e)}")
			
 
				+            self.logger.error(f"SQL生成验证节点异常: {str(e)}")
			
 
				             import traceback
			
 
				-            print(f"[ERROR] 详细错误信息: {traceback.format_exc()}")
			
 
				+            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
			
 
				             state["sql_generation_success"] = False
			
 
				             state["sql_validation_success"] = False
			
 
				             state["user_prompt"] = f"SQL生成验证异常: {str(e)}"
			
@@ -389,13 +393,13 @@ class CituLangGraphAgent:
 
				     def _agent_sql_execution_node(self, state: AgentState) -> AgentState:
			
 
				         """SQL执行节点 - 负责执行已验证的SQL和生成摘要"""
			
 
				         try:
			
 
				-            print(f"[SQL_EXECUTION] 开始执行SQL: {state.get('sql', 'N/A')}")
			
 
				+            self.logger.info(f"开始执行SQL: {state.get('sql', 'N/A')}")
			
 
				             
			
 
				             sql = state.get("sql")
			
 
				             question = state["question"]
			
 
				             
			
 
				             if not sql:
			
 
				-                print(f"[SQL_EXECUTION] 没有可执行的SQL")
			
 
				+                self.logger.warning("没有可执行的SQL")
			
 
				                 state["error"] = "没有可执行的SQL语句"
			
 
				                 state["error_code"] = 500
			
 
				                 state["current_step"] = "sql_execution_error"
			
@@ -403,11 +407,11 @@ class CituLangGraphAgent:
 
				                 return state
			
 
				             
			
 
				             # 步骤1：执行SQL
			
 
				-            print(f"[SQL_EXECUTION] 步骤1：执行SQL")
			
 
				+            self.logger.info("步骤1：执行SQL")
			
 
				             execute_result = execute_sql.invoke({"sql": sql})
			
 
				             
			
 
				             if not execute_result.get("success"):
			
 
				-                print(f"[SQL_EXECUTION] SQL执行失败: {execute_result.get('error')}")
			
 
				+                self.logger.error(f"SQL执行失败: {execute_result.get('error')}")
			
 
				                 state["error"] = execute_result.get("error", "SQL执行失败")
			
 
				                 state["error_code"] = 500
			
 
				                 state["current_step"] = "sql_execution_error"
			
@@ -416,15 +420,15 @@ class CituLangGraphAgent:
 
				             
			
 
				             query_result = execute_result.get("data_result")
			
 
				             state["query_result"] = query_result
			
 
				-            print(f"[SQL_EXECUTION] SQL执行成功，返回 {query_result.get('row_count', 0)} 行数据")
			
 
				+            self.logger.info(f"SQL执行成功，返回 {query_result.get('row_count', 0)} 行数据")
			
 
				             
			
 
				             # 步骤2：生成摘要（根据配置和数据情况）
			
 
				             if ENABLE_RESULT_SUMMARY and query_result.get('row_count', 0) > 0:
			
 
				-                print(f"[SQL_EXECUTION] 步骤2：生成摘要")
			
 
				+                self.logger.info("步骤2：生成摘要")
			
 
				                 
			
 
				                 # 重要：提取原始问题用于摘要生成，避免历史记录循环嵌套
			
 
				                 original_question = self._extract_original_question(question)
			
 
				-                print(f"[SQL_EXECUTION] 原始问题: {original_question}")
			
 
				+                self.logger.debug(f"原始问题: {original_question}")
			
 
				                 
			
 
				                 summary_result = generate_summary.invoke({
			
 
				                     "question": original_question,  # 使用原始问题而不是enhanced_question
			
@@ -433,26 +437,26 @@ class CituLangGraphAgent:
 
				                 })
			
 
				                 
			
 
				                 if not summary_result.get("success"):
			
 
				-                    print(f"[SQL_EXECUTION] 摘要生成失败: {summary_result.get('message')}")
			
 
				+                    self.logger.warning(f"摘要生成失败: {summary_result.get('message')}")
			
 
				                     # 摘要生成失败不是致命错误，使用默认摘要
			
 
				                     state["summary"] = f"查询执行完成，共返回 {query_result.get('row_count', 0)} 条记录。"
			
 
				                 else:
			
 
				                     state["summary"] = summary_result.get("summary")
			
 
				-                    print(f"[SQL_EXECUTION] 摘要生成成功")
			
 
				+                    self.logger.info("摘要生成成功")
			
 
				             else:
			
 
				-                print(f"[SQL_EXECUTION] 跳过摘要生成（ENABLE_RESULT_SUMMARY={ENABLE_RESULT_SUMMARY}，数据行数={query_result.get('row_count', 0)}）")
			
 
				+                self.logger.info(f"跳过摘要生成（ENABLE_RESULT_SUMMARY={ENABLE_RESULT_SUMMARY}，数据行数={query_result.get('row_count', 0)}）")
			
 
				                 # 不生成摘要时，不设置summary字段，让格式化响应节点决定如何处理
			
 
				             
			
 
				             state["current_step"] = "sql_execution_completed"
			
 
				             state["execution_path"].append("agent_sql_execution")
			
 
				             
			
 
				-            print(f"[SQL_EXECUTION] SQL执行完成")
			
 
				+            self.logger.info("SQL执行完成")
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] SQL执行节点异常: {str(e)}")
			
 
				+            self.logger.error(f"SQL执行节点异常: {str(e)}")
			
 
				             import traceback
			
 
				-            print(f"[ERROR] 详细错误信息: {traceback.format_exc()}")
			
 
				+            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
			
 
				             state["error"] = f"SQL执行失败: {str(e)}"
			
 
				             state["error_code"] = 500
			
 
				             state["current_step"] = "sql_execution_error"
			
@@ -467,17 +471,17 @@ class CituLangGraphAgent:
 
				         保留此方法仅为向后兼容，新的工作流使用拆分后的节点
			
 
				         """
			
 
				         try:
			
 
				-            print(f"[DATABASE_AGENT] ⚠️  使用已废弃的database节点，建议使用新的拆分节点")
			
 
				-            print(f"[DATABASE_AGENT] 开始处理数据库查询: {state['question']}")
			
 
				+            self.logger.warning("使用已废弃的database节点，建议使用新的拆分节点")
			
 
				+            self.logger.info(f"开始处理数据库查询: {state['question']}")
			
 
				             
			
 
				             question = state["question"]
			
 
				             
			
 
				             # 步骤1：生成SQL
			
 
				-            print(f"[DATABASE_AGENT] 步骤1：生成SQL")
			
 
				+            self.logger.info("步骤1：生成SQL")
			
 
				             sql_result = generate_sql.invoke({"question": question, "allow_llm_to_see_data": True})
			
 
				             
			
 
				             if not sql_result.get("success"):
			
 
				-                print(f"[DATABASE_AGENT] SQL生成失败: {sql_result.get('error')}")
			
 
				+                self.logger.error(f"SQL生成失败: {sql_result.get('error')}")
			
 
				                 state["error"] = sql_result.get("error", "SQL生成失败")
			
 
				                 state["error_code"] = 500
			
 
				                 state["current_step"] = "database_error"
			
@@ -486,7 +490,7 @@ class CituLangGraphAgent:
 
				             
			
 
				             sql = sql_result.get("sql")
			
 
				             state["sql"] = sql
			
 
				-            print(f"[DATABASE_AGENT] SQL生成成功: {sql}")
			
 
				+            self.logger.info(f"SQL生成成功: {sql}")
			
 
				             
			
 
				             # 步骤1.5：检查是否为解释性响应而非SQL
			
 
				             error_type = sql_result.get("error_type")
			
@@ -496,7 +500,7 @@ class CituLangGraphAgent:
 
				                 state["chat_response"] = explanation + " 请尝试提问其它问题。"
			
 
				                 state["current_step"] = "database_completed"
			
 
				                 state["execution_path"].append("agent_database")
			
 
				-                print(f"[DATABASE_AGENT] 返回LLM解释性答案: {explanation}")
			
 
				+                self.logger.info(f"返回LLM解释性答案: {explanation}")
			
 
				                 return state
			
 
				             
			
 
				             # 额外验证：检查SQL格式（防止工具误判）
			
@@ -506,15 +510,15 @@ class CituLangGraphAgent:
 
				                 state["chat_response"] = sql + " 请尝试提问其它问题。"
			
 
				                 state["current_step"] = "database_completed"  
			
 
				                 state["execution_path"].append("agent_database")
			
 
				-                print(f"[DATABASE_AGENT] 内容不是有效SQL，当作解释返回: {sql}")
			
 
				+                self.logger.info(f"内容不是有效SQL，当作解释返回: {sql}")
			
 
				                 return state
			
 
				             
			
 
				             # 步骤2：执行SQL
			
 
				-            print(f"[DATABASE_AGENT] 步骤2：执行SQL")
			
 
				+            self.logger.info("步骤2：执行SQL")
			
 
				             execute_result = execute_sql.invoke({"sql": sql})
			
 
				             
			
 
				             if not execute_result.get("success"):
			
 
				-                print(f"[DATABASE_AGENT] SQL执行失败: {execute_result.get('error')}")
			
 
				+                self.logger.error(f"SQL执行失败: {execute_result.get('error')}")
			
 
				                 state["error"] = execute_result.get("error", "SQL执行失败")
			
 
				                 state["error_code"] = 500
			
 
				                 state["current_step"] = "database_error"
			
@@ -523,15 +527,15 @@ class CituLangGraphAgent:
 
				             
			
 
				             query_result = execute_result.get("data_result")
			
 
				             state["query_result"] = query_result
			
 
				-            print(f"[DATABASE_AGENT] SQL执行成功，返回 {query_result.get('row_count', 0)} 行数据")
			
 
				+            self.logger.info(f"SQL执行成功，返回 {query_result.get('row_count', 0)} 行数据")
			
 
				             
			
 
				             # 步骤3：生成摘要（可通过配置控制，仅在有数据时生成）
			
 
				             if ENABLE_RESULT_SUMMARY and query_result.get('row_count', 0) > 0:
			
 
				-                print(f"[DATABASE_AGENT] 步骤3：生成摘要")
			
 
				+                self.logger.info("步骤3：生成摘要")
			
 
				                 
			
 
				                 # 重要：提取原始问题用于摘要生成，避免历史记录循环嵌套
			
 
				                 original_question = self._extract_original_question(question)
			
 
				-                print(f"[DATABASE_AGENT] 原始问题: {original_question}")
			
 
				+                self.logger.debug(f"原始问题: {original_question}")
			
 
				                 
			
 
				                 summary_result = generate_summary.invoke({
			
 
				                     "question": original_question,  # 使用原始问题而不是enhanced_question
			
@@ -540,26 +544,26 @@ class CituLangGraphAgent:
 
				                 })
			
 
				                 
			
 
				                 if not summary_result.get("success"):
			
 
				-                    print(f"[DATABASE_AGENT] 摘要生成失败: {summary_result.get('message')}")
			
 
				+                    self.logger.warning(f"摘要生成失败: {summary_result.get('message')}")
			
 
				                     # 摘要生成失败不是致命错误，使用默认摘要
			
 
				                     state["summary"] = f"查询执行完成，共返回 {query_result.get('row_count', 0)} 条记录。"
			
 
				                 else:
			
 
				                     state["summary"] = summary_result.get("summary")
			
 
				-                    print(f"[DATABASE_AGENT] 摘要生成成功")
			
 
				+                    self.logger.info("摘要生成成功")
			
 
				             else:
			
 
				-                print(f"[DATABASE_AGENT] 跳过摘要生成（ENABLE_RESULT_SUMMARY={ENABLE_RESULT_SUMMARY}，数据行数={query_result.get('row_count', 0)}）")
			
 
				+                self.logger.info(f"跳过摘要生成（ENABLE_RESULT_SUMMARY={ENABLE_RESULT_SUMMARY}，数据行数={query_result.get('row_count', 0)}）")
			
 
				                 # 不生成摘要时，不设置summary字段，让格式化响应节点决定如何处理
			
 
				             
			
 
				             state["current_step"] = "database_completed"
			
 
				             state["execution_path"].append("agent_database")
			
 
				             
			
 
				-            print(f"[DATABASE_AGENT] 数据库查询完成")
			
 
				+            self.logger.info("数据库查询完成")
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 数据库Agent异常: {str(e)}")
			
 
				+            self.logger.error(f"数据库Agent异常: {str(e)}")
			
 
				             import traceback
			
 
				-            print(f"[ERROR] 详细错误信息: {traceback.format_exc()}")
			
 
				+            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
			
 
				             state["error"] = f"数据库查询失败: {str(e)}"
			
 
				             state["error_code"] = 500
			
 
				             state["current_step"] = "database_error"
			
@@ -569,7 +573,7 @@ class CituLangGraphAgent:
 
				     def _agent_chat_node(self, state: AgentState) -> AgentState:
			
 
				         """聊天Agent节点 - 直接工具调用模式"""
			
 
				         try:
			
 
				-            print(f"[CHAT_AGENT] 开始处理聊天: {state['question']}")
			
 
				+            self.logger.info(f"开始处理聊天: {state['question']}")
			
 
				             
			
 
				             question = state["question"]
			
 
				             
			
@@ -584,7 +588,7 @@ class CituLangGraphAgent:
 
				                 pass
			
 
				             
			
 
				             # 直接调用general_chat工具
			
 
				-            print(f"[CHAT_AGENT] 调用general_chat工具")
			
 
				+            self.logger.info("调用general_chat工具")
			
 
				             chat_result = general_chat.invoke({
			
 
				                 "question": question,
			
 
				                 "context": context
			
@@ -592,22 +596,22 @@ class CituLangGraphAgent:
 
				             
			
 
				             if chat_result.get("success"):
			
 
				                 state["chat_response"] = chat_result.get("response", "")
			
 
				-                print(f"[CHAT_AGENT] 聊天处理成功")
			
 
				+                self.logger.info("聊天处理成功")
			
 
				             else:
			
 
				                 # 处理失败，使用备用响应
			
 
				                 state["chat_response"] = chat_result.get("response", "抱歉，我暂时无法处理您的问题。请稍后再试。")
			
 
				-                print(f"[CHAT_AGENT] 聊天处理失败，使用备用响应: {chat_result.get('error')}")
			
 
				+                self.logger.warning(f"聊天处理失败，使用备用响应: {chat_result.get('error')}")
			
 
				             
			
 
				             state["current_step"] = "chat_completed"
			
 
				             state["execution_path"].append("agent_chat")
			
 
				             
			
 
				-            print(f"[CHAT_AGENT] 聊天处理完成")
			
 
				+            self.logger.info("聊天处理完成")
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 聊天Agent异常: {str(e)}")
			
 
				+            self.logger.error(f"聊天Agent异常: {str(e)}")
			
 
				             import traceback
			
 
				-            print(f"[ERROR] 详细错误信息: {traceback.format_exc()}")
			
 
				+            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
			
 
				             state["chat_response"] = "抱歉，我暂时无法处理您的问题。请稍后再试，或者尝试询问数据相关的问题。"
			
 
				             state["current_step"] = "chat_error"
			
 
				             state["execution_path"].append("agent_chat_error")
			
@@ -616,7 +620,7 @@ class CituLangGraphAgent:
 
				     def _format_response_node(self, state: AgentState) -> AgentState:
			
 
				         """格式化最终响应节点"""
			
 
				         try:
			
 
				-            print(f"[FORMAT_NODE] 开始格式化响应，问题类型: {state['question_type']}")
			
 
				+            self.logger.info(f"开始格式化响应，问题类型: {state['question_type']}")
			
 
				             
			
 
				             state["current_step"] = "completed"
			
 
				             state["execution_path"].append("format_response")
			
@@ -737,11 +741,11 @@ class CituLangGraphAgent:
 
				                     }
			
 
				                 }
			
 
				             
			
 
				-            print(f"[FORMAT_NODE] 响应格式化完成")
			
 
				+            self.logger.info("响应格式化完成")
			
 
				             return state
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 响应格式化异常: {str(e)}")
			
 
				+            self.logger.error(f"响应格式化异常: {str(e)}")
			
 
				             state["final_response"] = {
			
 
				                 "success": False,
			
 
				                 "error": f"响应格式化异常: {str(e)}",
			
@@ -760,7 +764,7 @@ class CituLangGraphAgent:
 
				         """
			
 
				         sql_generation_success = state.get("sql_generation_success", False)
			
 
				         
			
 
				-        print(f"[ROUTE] SQL生成路由: success={sql_generation_success}")
			
 
				+        self.logger.debug(f"SQL生成路由: success={sql_generation_success}")
			
 
				         
			
 
				         if sql_generation_success:
			
 
				             return "continue_execution"  # 路由到SQL执行节点
			
@@ -780,7 +784,7 @@ class CituLangGraphAgent:
 
				         question_type = state["question_type"]
			
 
				         confidence = state["classification_confidence"]
			
 
				         
			
 
				-        print(f"[ROUTE] 分类路由: {question_type}, 置信度: {confidence} (完全信任分类器决策)")
			
 
				+        self.logger.debug(f"分类路由: {question_type}, 置信度: {confidence} (完全信任分类器决策)")
			
 
				         
			
 
				         if question_type == "DATABASE":
			
 
				             return "DATABASE"
			
@@ -803,11 +807,11 @@ class CituLangGraphAgent:
 
				             Dict包含完整的处理结果
			
 
				         """
			
 
				         try:
			
 
				-            print(f"[CITU_AGENT] 开始处理问题: {question}")
			
 
				+            self.logger.info(f"开始处理问题: {question}")
			
 
				             if context_type:
			
 
				-                print(f"[CITU_AGENT] 上下文类型: {context_type}")
			
 
				+                self.logger.info(f"上下文类型: {context_type}")
			
 
				             if routing_mode:
			
 
				-                print(f"[CITU_AGENT] 使用指定路由模式: {routing_mode}")
			
 
				+                self.logger.info(f"使用指定路由模式: {routing_mode}")
			
 
				             
			
 
				             # 动态创建workflow（基于路由模式）
			
 
				             workflow = self._create_workflow(routing_mode)
			
@@ -826,12 +830,12 @@ class CituLangGraphAgent:
 
				             # 提取最终结果
			
 
				             result = final_state["final_response"]
			
 
				             
			
 
				-            print(f"[CITU_AGENT] 问题处理完成: {result.get('success', False)}")
			
 
				+            self.logger.info(f"问题处理完成: {result.get('success', False)}")
			
 
				             
			
 
				             return result
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] Agent执行异常: {str(e)}")
			
 
				+            self.logger.error(f"Agent执行异常: {str(e)}")
			
 
				             return {
			
 
				                 "success": False,
			
 
				                 "error": f"Agent系统异常: {str(e)}",
			
@@ -1127,7 +1131,7 @@ class CituLangGraphAgent:
 
				             return question.strip()
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 提取原始问题失败: {str(e)}")
			
 
				+            self.logger.warning(f"提取原始问题失败: {str(e)}")
			
 
				             return question.strip()
			
 
				 
			
 
				     async def health_check(self) -> Dict[str, Any]:
			
--- a/agent/classifier.py
+++ b/agent/classifier.py
@@ -2,6 +2,7 @@
 
				 import re
			
 
				 from typing import Dict, Any, List, Optional
			
 
				 from dataclasses import dataclass
			
 
				+from core.logging import get_agent_logger
			
 
				 
			
 
				 @dataclass
			
 
				 class ClassificationResult:
			
@@ -16,6 +17,9 @@ class QuestionClassifier:
 
				     """
			
 
				     
			
 
				     def __init__(self):
			
 
				+        # 初始化日志
			
 
				+        self.logger = get_agent_logger("Classifier")
			
 
				+        
			
 
				         # 从配置文件加载阈值参数
			
 
				         try:
			
 
				             from agent.config import get_current_config, get_nested_config
			
@@ -27,7 +31,8 @@ class QuestionClassifier:
 
				             self.confidence_increment = get_nested_config(config, "classification.confidence_increment", 0.08)
			
 
				             self.llm_fallback_confidence = get_nested_config(config, "classification.llm_fallback_confidence", 0.5)
			
 
				             self.uncertain_confidence = get_nested_config(config, "classification.uncertain_confidence", 0.2)
			
 
				-            print("[CLASSIFIER] 从配置文件加载分类器参数完成")
			
 
				+            self.medium_confidence_threshold = get_nested_config(config, "classification.medium_confidence_threshold", 0.6)
			
 
				+            self.logger.info("从配置文件加载分类器参数完成")
			
 
				         except ImportError:
			
 
				             self.high_confidence_threshold = 0.7
			
 
				             self.low_confidence_threshold = 0.4
			
@@ -36,7 +41,8 @@ class QuestionClassifier:
 
				             self.confidence_increment = 0.08
			
 
				             self.llm_fallback_confidence = 0.5
			
 
				             self.uncertain_confidence = 0.2
			
 
				-            print("[CLASSIFIER] 配置文件不可用，使用默认分类器参数")
			
 
				+            self.medium_confidence_threshold = 0.6
			
 
				+            self.logger.warning("配置文件不可用，使用默认分类器参数")
			
 
				         
			
 
				         # 基于高速公路服务区业务的精准关键词
			
 
				         self.strong_business_keywords = {
			
@@ -159,14 +165,14 @@ class QuestionClassifier:
 
				         # 确定使用的路由模式
			
 
				         if routing_mode:
			
 
				             QUESTION_ROUTING_MODE = routing_mode
			
 
				-            print(f"[CLASSIFIER] 使用传入的路由模式: {QUESTION_ROUTING_MODE}")
			
 
				+            self.logger.info(f"使用传入的路由模式: {QUESTION_ROUTING_MODE}")
			
 
				         else:
			
 
				             try:
			
 
				                 from app_config import QUESTION_ROUTING_MODE
			
 
				-                print(f"[CLASSIFIER] 使用配置文件路由模式: {QUESTION_ROUTING_MODE}")
			
 
				+                self.logger.info(f"使用配置文件路由模式: {QUESTION_ROUTING_MODE}")
			
 
				             except ImportError:
			
 
				                 QUESTION_ROUTING_MODE = "hybrid"
			
 
				-                print(f"[CLASSIFIER] 配置导入失败，使用默认路由模式: {QUESTION_ROUTING_MODE}")
			
 
				+                self.logger.info(f"配置导入失败，使用默认路由模式: {QUESTION_ROUTING_MODE}")
			
 
				         
			
 
				         # 根据路由模式选择分类策略
			
 
				         if QUESTION_ROUTING_MODE == "database_direct":
			
@@ -196,36 +202,36 @@ class QuestionClassifier:
 
				         2. 如果置信度不够且有上下文，考虑上下文辅助
			
 
				         3. 检测话题切换，避免错误继承
			
 
				         """
			
 
				-        print(f"[CLASSIFIER] 渐进式分类 - 问题: {question}")
			
 
				+        self.logger.info(f"渐进式分类 - 问题: {question}")
			
 
				         if context_type:
			
 
				-            print(f"[CLASSIFIER] 上下文类型: {context_type}")
			
 
				+            self.logger.info(f"上下文类型: {context_type}")
			
 
				         
			
 
				         # 第一步：只基于问题本身分类
			
 
				         primary_result = self._hybrid_classify(question)
			
 
				-        print(f"[CLASSIFIER] 主分类结果: {primary_result.question_type}, 置信度: {primary_result.confidence}")
			
 
				+        self.logger.info(f"主分类结果: {primary_result.question_type}, 置信度: {primary_result.confidence}")
			
 
				         
			
 
				         # 如果没有上下文，直接返回主分类结果
			
 
				         if not context_type:
			
 
				-            print(f"[CLASSIFIER] 无上下文，使用主分类结果")
			
 
				+            self.logger.debug("无上下文，使用主分类结果")
			
 
				             return primary_result
			
 
				         
			
 
				         # 如果置信度足够高，直接使用主分类结果
			
 
				         if primary_result.confidence >= self.high_confidence_threshold:
			
 
				-            print(f"[CLASSIFIER] 高置信度({primary_result.confidence}≥{self.high_confidence_threshold})，使用主分类结果")
			
 
				+            self.logger.info(f"高置信度({primary_result.confidence}≥{self.high_confidence_threshold})，使用主分类结果")
			
 
				             return primary_result
			
 
				         
			
 
				         # 检测明显的话题切换
			
 
				         if self._is_topic_switch(question):
			
 
				-            print(f"[CLASSIFIER] 检测到话题切换，忽略上下文")
			
 
				+            self.logger.info("检测到话题切换，忽略上下文")
			
 
				             return primary_result
			
 
				         
			
 
				         # 如果置信度较低，考虑上下文辅助
			
 
				         if primary_result.confidence < self.medium_confidence_threshold:
			
 
				-            print(f"[CLASSIFIER] 低置信度({primary_result.confidence}<{self.medium_confidence_threshold})，考虑上下文辅助")
			
 
				+            self.logger.info(f"低置信度({primary_result.confidence}<{self.medium_confidence_threshold})，考虑上下文辅助")
			
 
				             
			
 
				             # 检测是否为追问型问题
			
 
				             if self._is_follow_up_question(question):
			
 
				-                print(f"[CLASSIFIER] 检测到追问型问题，继承上下文类型: {context_type}")
			
 
				+                self.logger.info(f"检测到追问型问题，继承上下文类型: {context_type}")
			
 
				                 return ClassificationResult(
			
 
				                     question_type=context_type,
			
 
				                     confidence=0.75,  # 给予中等置信度
			
@@ -234,7 +240,7 @@ class QuestionClassifier:
 
				                 )
			
 
				         
			
 
				         # 中等置信度或其他情况，保持主分类结果
			
 
				-        print(f"[CLASSIFIER] 保持主分类结果")
			
 
				+        self.logger.debug("保持主分类结果")
			
 
				         return primary_result
			
 
				 
			
 
				     def _is_follow_up_question(self, question: str) -> bool:
			
@@ -426,11 +432,11 @@ class QuestionClassifier:
 
				             
			
 
				         except FileNotFoundError:
			
 
				             error_msg = f"无法找到业务上下文文件: {prompt_file}"
			
 
				-            print(f"[ERROR] {error_msg}")
			
 
				+            self.logger.error(error_msg)
			
 
				             raise FileNotFoundError(error_msg)
			
 
				         except Exception as e:
			
 
				             error_msg = f"读取业务上下文文件失败: {str(e)}"
			
 
				-            print(f"[ERROR] {error_msg}")
			
 
				+            self.logger.error(error_msg)
			
 
				             raise RuntimeError(error_msg)
			
 
				 
			
 
				     def _enhanced_llm_classify(self, question: str) -> ClassificationResult:
			
@@ -506,7 +512,7 @@ class QuestionClassifier:
 
				             
			
 
				         except (FileNotFoundError, RuntimeError) as e:
			
 
				             # 业务上下文加载失败，返回错误状态
			
 
				-            print(f"[ERROR] LLM分类失败，业务上下文不可用: {str(e)}")
			
 
				+            self.logger.error(f"LLM分类失败，业务上下文不可用: {str(e)}")
			
 
				             return ClassificationResult(
			
 
				                 question_type="CHAT",  # 失败时默认为CHAT，更安全
			
 
				                 confidence=0.1,  # 很低的置信度表示分类不可靠
			
@@ -514,7 +520,7 @@ class QuestionClassifier:
 
				                 method="llm_context_error"
			
 
				             )
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 增强LLM分类失败: {str(e)}")
			
 
				+            self.logger.warning(f"增强LLM分类失败: {str(e)}")
			
 
				             return ClassificationResult(
			
 
				                 question_type="CHAT",  # 失败时默认为CHAT，更安全
			
 
				                 confidence=self.llm_fallback_confidence,
			
--- a/agent/tools/general_chat.py
+++ b/agent/tools/general_chat.py
@@ -2,6 +2,10 @@
 
				 from langchain.tools import tool
			
 
				 from typing import Dict, Any, Optional
			
 
				 from common.vanna_instance import get_vanna_instance
			
 
				+from core.logging import get_agent_logger
			
 
				+
			
 
				+# Initialize logger
			
 
				+logger = get_agent_logger("GeneralChat")
			
 
				 
			
 
				 @tool
			
 
				 def general_chat(question: str, context: Optional[str] = None) -> Dict[str, Any]:
			
@@ -21,7 +25,7 @@ def general_chat(question: str, context: Optional[str] = None) -> Dict[str, Any]
 
				         }
			
 
				     """
			
 
				     try:
			
 
				-        print(f"[TOOL:general_chat] 处理聊天问题: {question}")
			
 
				+        logger.info(f"处理聊天问题: {question}")
			
 
				         
			
 
				         system_prompt = """
			
 
				 你是Citu智能数据问答平台的AI助手，为用户提供全面的帮助和支持。
			
@@ -58,7 +62,7 @@ def general_chat(question: str, context: Optional[str] = None) -> Dict[str, Any]
 
				         )
			
 
				         
			
 
				         if response:
			
 
				-            print(f"[TOOL:general_chat] 聊天响应生成成功: {response[:100]}...")
			
 
				+            logger.info(f"聊天响应生成成功: {response[:100]}...")
			
 
				             return {
			
 
				                 "success": True,
			
 
				                 "response": response.strip(),
			
@@ -72,7 +76,7 @@ def general_chat(question: str, context: Optional[str] = None) -> Dict[str, Any]
 
				             }
			
 
				             
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 通用聊天异常: {str(e)}")
			
 
				+        logger.error(f"通用聊天异常: {str(e)}")
			
 
				         return {
			
 
				             "success": False,
			
 
				             "response": _get_fallback_response(question),
			
--- a/agent/tools/sql_execution.py
+++ b/agent/tools/sql_execution.py
@@ -6,6 +6,10 @@ import time
 
				 import functools
			
 
				 from common.vanna_instance import get_vanna_instance
			
 
				 from app_config import API_MAX_RETURN_ROWS
			
 
				+from core.logging import get_agent_logger
			
 
				+
			
 
				+# Initialize logger
			
 
				+logger = get_agent_logger("SQLExecution")
			
 
				 
			
 
				 def retry_on_failure(max_retries: int = 2, delay: float = 1.0, backoff_factor: float = 2.0):
			
 
				     """
			
@@ -29,7 +33,7 @@ def retry_on_failure(max_retries: int = 2, delay: float = 1.0, backoff_factor: f
 
				                         if retries < max_retries:
			
 
				                             retries += 1
			
 
				                             wait_time = delay * (backoff_factor ** (retries - 1))
			
 
				-                            print(f"[RETRY] {func.__name__} 执行失败，等待 {wait_time:.1f} 秒后重试 ({retries}/{max_retries})")
			
 
				+                            logger.warning(f"{func.__name__} 执行失败，等待 {wait_time:.1f} 秒后重试 ({retries}/{max_retries})")
			
 
				                             time.sleep(wait_time)
			
 
				                             continue
			
 
				                     
			
@@ -39,10 +43,10 @@ def retry_on_failure(max_retries: int = 2, delay: float = 1.0, backoff_factor: f
 
				                     retries += 1
			
 
				                     if retries <= max_retries:
			
 
				                         wait_time = delay * (backoff_factor ** (retries - 1))
			
 
				-                        print(f"[RETRY] {func.__name__} 异常: {str(e)}, 等待 {wait_time:.1f} 秒后重试 ({retries}/{max_retries})")
			
 
				+                        logger.warning(f"{func.__name__} 异常: {str(e)}, 等待 {wait_time:.1f} 秒后重试 ({retries}/{max_retries})")
			
 
				                         time.sleep(wait_time)
			
 
				                     else:
			
 
				-                        print(f"[RETRY] {func.__name__} 达到最大重试次数 ({max_retries})，抛出异常")
			
 
				+                        logger.error(f"{func.__name__} 达到最大重试次数 ({max_retries})，抛出异常")
			
 
				                         raise
			
 
				             
			
 
				             # 不应该到达这里，但为了安全性
			
@@ -75,7 +79,7 @@ def execute_sql(sql: str, max_rows: int = None) -> Dict[str, Any]:
 
				     if max_rows is None:
			
 
				         max_rows = API_MAX_RETURN_ROWS if API_MAX_RETURN_ROWS is not None else DEFAULT_MAX_RETURN_ROWS
			
 
				     try:
			
 
				-        print(f"[TOOL:execute_sql] 开始执行SQL: {sql[:100]}...")
			
 
				+        logger.info(f"开始执行SQL: {sql[:100]}...")
			
 
				         
			
 
				         vn = get_vanna_instance()
			
 
				         df = vn.run_sql(sql)
			
@@ -118,7 +122,7 @@ def execute_sql(sql: str, max_rows: int = None) -> Dict[str, Any]:
 
				         rows = _process_dataframe_rows(limited_df.to_dict(orient="records"))
			
 
				         columns = list(df.columns)
			
 
				         
			
 
				-        print(f"[TOOL:execute_sql] 查询成功，返回 {len(rows)} 行数据")
			
 
				+        logger.info(f"查询成功，返回 {len(rows)} 行数据")
			
 
				         
			
 
				         result = {
			
 
				             "success": True,
			
@@ -139,7 +143,7 @@ def execute_sql(sql: str, max_rows: int = None) -> Dict[str, Any]:
 
				         
			
 
				     except Exception as e:
			
 
				         error_msg = str(e)
			
 
				-        print(f"[ERROR] SQL执行异常: {error_msg}")
			
 
				+        logger.error(f"SQL执行异常: {error_msg}")
			
 
				         
			
 
				         return {
			
 
				             "success": False,
			
--- a/agent/tools/sql_generation.py
+++ b/agent/tools/sql_generation.py
@@ -2,6 +2,10 @@
 
				 from langchain.tools import tool
			
 
				 from typing import Dict, Any
			
 
				 from common.vanna_instance import get_vanna_instance
			
 
				+from core.logging import get_agent_logger
			
 
				+
			
 
				+# Initialize logger
			
 
				+logger = get_agent_logger("SQLGeneration")
			
 
				 
			
 
				 @tool
			
 
				 def generate_sql(question: str, allow_llm_to_see_data: bool = True) -> Dict[str, Any]:
			
@@ -22,7 +26,7 @@ def generate_sql(question: str, allow_llm_to_see_data: bool = True) -> Dict[str,
 
				         }
			
 
				     """
			
 
				     try:
			
 
				-        print(f"[TOOL:generate_sql] 开始生成SQL: {question}")
			
 
				+        logger.info(f"开始生成SQL: {question}")
			
 
				         
			
 
				         vn = get_vanna_instance()
			
 
				         sql = vn.generate_sql(question=question, allow_llm_to_see_data=allow_llm_to_see_data)
			
@@ -58,7 +62,7 @@ def generate_sql(question: str, allow_llm_to_see_data: bool = True) -> Dict[str,
 
				                 "can_retry": True
			
 
				             }
			
 
				         
			
 
				-        print(f"[TOOL:generate_sql] 成功生成SQL: {sql}")
			
 
				+        logger.info(f"成功生成SQL: {sql}")
			
 
				         return {
			
 
				             "success": True,
			
 
				             "sql": sql,
			
@@ -67,7 +71,7 @@ def generate_sql(question: str, allow_llm_to_see_data: bool = True) -> Dict[str,
 
				         }
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] SQL生成异常: {str(e)}")
			
 
				+        logger.error(f"SQL生成异常: {str(e)}")
			
 
				         return {
			
 
				             "success": False,
			
 
				             "sql": None,
			
--- a/agent/tools/summary_generation.py
+++ b/agent/tools/summary_generation.py
@@ -3,6 +3,10 @@ from langchain.tools import tool
 
				 from typing import Dict, Any
			
 
				 import pandas as pd
			
 
				 from common.vanna_instance import get_vanna_instance
			
 
				+from core.logging import get_agent_logger
			
 
				+
			
 
				+# Initialize logger
			
 
				+logger = get_agent_logger("SummaryGeneration")
			
 
				 
			
 
				 @tool
			
 
				 def generate_summary(question: str, query_result: Dict[str, Any], sql: str) -> Dict[str, Any]:
			
@@ -23,7 +27,7 @@ def generate_summary(question: str, query_result: Dict[str, Any], sql: str) -> D
 
				         }
			
 
				     """
			
 
				     try:
			
 
				-        print(f"[TOOL:generate_summary] 开始生成摘要，问题: {question}")
			
 
				+        logger.info(f"开始生成摘要，问题: {question}")
			
 
				         
			
 
				         if not query_result or not query_result.get("rows"):
			
 
				             return {
			
@@ -50,7 +54,7 @@ def generate_summary(question: str, query_result: Dict[str, Any], sql: str) -> D
 
				             # 生成默认摘要
			
 
				             summary = _generate_default_summary(question, query_result, sql)
			
 
				         
			
 
				-        print(f"[TOOL:generate_summary] 摘要生成成功: {summary[:100]}...")
			
 
				+        logger.info(f"摘要生成成功: {summary[:100]}...")
			
 
				         
			
 
				         return {
			
 
				             "success": True,
			
@@ -59,7 +63,7 @@ def generate_summary(question: str, query_result: Dict[str, Any], sql: str) -> D
 
				         }
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 摘要生成异常: {str(e)}")
			
 
				+        logger.error(f"摘要生成异常: {str(e)}")
			
 
				         
			
 
				         # 生成备用摘要
			
 
				         fallback_summary = _generate_fallback_summary(question, query_result, sql)
			
@@ -82,7 +86,7 @@ def _reconstruct_dataframe(query_result: Dict[str, Any]) -> pd.DataFrame:
 
				         return pd.DataFrame(rows, columns=columns)
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[WARNING] DataFrame重构失败: {str(e)}")
			
 
				+        logger.warning(f"DataFrame重构失败: {str(e)}")
			
 
				         return pd.DataFrame()
			
 
				 
			
 
				 def _generate_default_summary(question: str, query_result: Dict[str, Any], sql: str) -> str:
			
--- a/agent/tools/utils.py
+++ b/agent/tools/utils.py
@@ -7,6 +7,10 @@ import json
 
				 from typing import Dict, Any, Callable, List, Optional
			
 
				 from langchain_core.messages import BaseMessage, AIMessage, HumanMessage, SystemMessage, ToolMessage
			
 
				 from langchain_core.tools import BaseTool
			
 
				+from core.logging import get_agent_logger
			
 
				+
			
 
				+# Initialize logger
			
 
				+logger = get_agent_logger("AgentUtils")
			
 
				 
			
 
				 def handle_tool_errors(func: Callable) -> Callable:
			
 
				     """
			
@@ -17,7 +21,7 @@ def handle_tool_errors(func: Callable) -> Callable:
 
				         try:
			
 
				             return func(*args, **kwargs)
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 工具 {func.__name__} 执行失败: {str(e)}")
			
 
				+            logger.error(f"工具 {func.__name__} 执行失败: {str(e)}")
			
 
				             return {
			
 
				                 "success": False,
			
 
				                 "error": f"工具执行异常: {str(e)}",
			
@@ -50,7 +54,7 @@ class LLMWrapper:
 
				                 return self._invoke_without_tools(messages, **kwargs)
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] LLM包装器调用失败: {str(e)}")
			
 
				+            logger.error(f"LLM包装器调用失败: {str(e)}")
			
 
				             return AIMessage(content=f"LLM调用失败: {str(e)}")
			
 
				     
			
 
				     def _should_use_tools(self, messages: List[BaseMessage]) -> bool:
			
@@ -88,7 +92,7 @@ class LLMWrapper:
 
				                 return AIMessage(content=response)
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 工具调用失败: {str(e)}")
			
 
				+            logger.error(f"工具调用失败: {str(e)}")
			
 
				             return self._invoke_without_tools(messages, **kwargs)
			
 
				     
			
 
				     def _invoke_without_tools(self, messages: List[BaseMessage], **kwargs):
			
@@ -206,26 +210,26 @@ def get_compatible_llm():
 
				                     model=llm_config.get("model"),
			
 
				                     temperature=llm_config.get("temperature", 0.7)
			
 
				                 )
			
 
				-                print("[INFO] 使用标准OpenAI兼容API")
			
 
				+                logger.info("使用标准OpenAI兼容API")
			
 
				                 return llm
			
 
				             except ImportError:
			
 
				-                print("[WARNING] langchain_openai 未安装，使用 Vanna 实例包装器")
			
 
				+                logger.warning("langchain_openai 未安装，使用 Vanna 实例包装器")
			
 
				         
			
 
				         # 优先使用统一的 Vanna 实例
			
 
				         from common.vanna_instance import get_vanna_instance
			
 
				         vn = get_vanna_instance()
			
 
				-        print("[INFO] 使用Vanna实例包装器")
			
 
				+        logger.info("使用Vanna实例包装器")
			
 
				         return LLMWrapper(vn)
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 获取 Vanna 实例失败: {str(e)}")
			
 
				+        logger.error(f"获取 Vanna 实例失败: {str(e)}")
			
 
				         # 回退到原有逻辑
			
 
				         from common.utils import get_current_llm_config
			
 
				         from customllm.qianwen_chat import QianWenChat
			
 
				         
			
 
				         llm_config = get_current_llm_config()
			
 
				         custom_llm = QianWenChat(config=llm_config)
			
 
				-        print("[INFO] 使用QianWen包装器")
			
 
				+        logger.info("使用QianWen包装器")
			
 
				         return LLMWrapper(custom_llm)
			
 
				 
			
 
				 def _is_valid_sql_format(sql_text: str) -> bool:
			
--- a/app_config.py
+++ b/app_config.py
@@ -169,7 +169,7 @@ REDIS_PASSWORD = None
 
				 
			
 
				 # 缓存开关配置
			
 
				 ENABLE_CONVERSATION_CONTEXT = True      # 是否启用对话上下文
			
 
				-ENABLE_QUESTION_ANSWER_CACHE = True     # 是否启用问答结果缓存
			
 
				+ENABLE_QUESTION_ANSWER_CACHE = False     # 是否启用问答结果缓存
			
 
				 ENABLE_EMBEDDING_CACHE = True           # 是否启用embedding向量缓存
			
 
				 
			
 
				 # TTL配置（单位：秒）
			
--- a/citu_app.py
+++ b/citu_app.py
@@ -1,4 +1,8 @@
 
				 # 给dataops 对话助手返回结果
			
 
				+# 初始化日志系统 - 必须在最前面
			
 
				+from core.logging import initialize_logging, get_app_logger, set_log_context, clear_log_context
			
 
				+initialize_logging()
			
 
				+
			
 
				 from vanna.flask import VannaFlaskApp
			
 
				 from core.vanna_llm_factory import create_vanna_instance
			
 
				 from flask import request, jsonify
			
@@ -31,6 +35,9 @@ from app_config import (  # 添加Redis相关配置导入
 
				     ENABLE_QUESTION_ANSWER_CACHE
			
 
				 )
			
 
				 
			
 
				+# 创建app logger
			
 
				+logger = get_app_logger("CituApp")
			
 
				+
			
 
				 # 设置默认的最大返回行数
			
 
				 DEFAULT_MAX_RETURN_ROWS = 200
			
 
				 MAX_RETURN_ROWS = API_MAX_RETURN_ROWS if API_MAX_RETURN_ROWS is not None else DEFAULT_MAX_RETURN_ROWS
			
@@ -131,9 +138,9 @@ def ask_full():
 
				                 if ENABLE_RESULT_SUMMARY:
			
 
				                     try:
			
 
				                         summary = vn.generate_summary(question=question, df=df)
			
 
				-                        print(f"[INFO] 成功生成摘要: {summary}")
			
 
				+                        logger.info(f"成功生成摘要: {summary}")
			
 
				                     except Exception as e:
			
 
				-                        print(f"[WARNING] 生成摘要失败: {str(e)}")
			
 
				+                        logger.warning(f"生成摘要失败: {str(e)}")
			
 
				                         summary = None
			
 
				 
			
 
				         # 构建返回数据
			
@@ -156,7 +163,7 @@ def ask_full():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] ask_full执行失败: {str(e)}")
			
 
				+        logger.error(f"ask_full执行失败: {str(e)}")
			
 
				         
			
 
				         # 即使发生异常，也检查是否有业务层面的解释
			
 
				         if hasattr(vn, 'last_llm_explanation') and vn.last_llm_explanation:
			
@@ -219,7 +226,7 @@ def citu_run_sql():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] citu_run_sql执行失败: {str(e)}")
			
 
				+        logger.error(f"citu_run_sql执行失败: {str(e)}")
			
 
				         from common.result import internal_error_response
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text=f"SQL执行失败，请检查SQL语句是否正确"
			
@@ -245,27 +252,27 @@ def ask_cached():
 
				     try:
			
 
				         # 生成conversation_id
			
 
				         # 调试：查看generate_id的实际行为
			
 
				-        print(f"[DEBUG] 输入问题: '{question}'")
			
 
				+        logger.debug(f"输入问题: '{question}'")
			
 
				         conversation_id = app.cache.generate_id(question=question)
			
 
				-        print(f"[DEBUG] 生成的conversation_id: {conversation_id}")
			
 
				+        logger.debug(f"生成的conversation_id: {conversation_id}")
			
 
				         
			
 
				         # 再次用相同问题测试
			
 
				         conversation_id2 = app.cache.generate_id(question=question)
			
 
				-        print(f"[DEBUG] 再次生成的conversation_id: {conversation_id2}")
			
 
				-        print(f"[DEBUG] 两次ID是否相同: {conversation_id == conversation_id2}")
			
 
				+        logger.debug(f"再次生成的conversation_id: {conversation_id2}")
			
 
				+        logger.debug(f"两次ID是否相同: {conversation_id == conversation_id2}")
			
 
				         
			
 
				         # 检查缓存
			
 
				         cached_sql = app.cache.get(id=conversation_id, field="sql")
			
 
				         
			
 
				         if cached_sql is not None:
			
 
				             # 缓存命中
			
 
				-            print(f"[CACHE HIT] 使用缓存结果: {conversation_id}")
			
 
				+            logger.info(f"[CACHE HIT] 使用缓存结果: {conversation_id}")
			
 
				             sql = cached_sql
			
 
				             df = app.cache.get(id=conversation_id, field="df")
			
 
				             summary = app.cache.get(id=conversation_id, field="summary")
			
 
				         else:
			
 
				             # 缓存未命中，执行新查询
			
 
				-            print(f"[CACHE MISS] 执行新查询: {conversation_id}")
			
 
				+            logger.info(f"[CACHE MISS] 执行新查询: {conversation_id}")
			
 
				             
			
 
				             sql, df, _ = vn.ask(
			
 
				                 question=question,
			
@@ -301,9 +308,9 @@ def ask_cached():
 
				             if ENABLE_RESULT_SUMMARY and isinstance(df, pd.DataFrame) and not df.empty:
			
 
				                 try:
			
 
				                     summary = vn.generate_summary(question=question, df=df)
			
 
				-                    print(f"[INFO] 成功生成摘要: {summary}")
			
 
				+                    logger.info(f"成功生成摘要: {summary}")
			
 
				                 except Exception as e:
			
 
				-                    print(f"[WARNING] 生成摘要失败: {str(e)}")
			
 
				+                    logger.warning(f"生成摘要失败: {str(e)}")
			
 
				                     summary = None
			
 
				             
			
 
				             app.cache.set(id=conversation_id, field="summary", value=summary)
			
@@ -348,7 +355,7 @@ def ask_cached():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] ask_cached执行失败: {str(e)}")
			
 
				+        logger.error(f"ask_cached执行失败: {str(e)}")
			
 
				         from common.result import internal_error_response
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="查询处理失败，请稍后重试"
			
@@ -386,10 +393,10 @@ def citu_train_question_sql():
 
				         # 正确的调用方式：同时传递question和sql
			
 
				         if question:
			
 
				             training_id = vn.train(question=question, sql=sql)
			
 
				-            print(f"训练成功，训练ID为：{training_id}，问题：{question}，SQL：{sql}")
			
 
				+            logger.info(f"训练成功，训练ID为：{training_id}，问题：{question}，SQL：{sql}")
			
 
				         else:
			
 
				             training_id = vn.train(sql=sql)
			
 
				-            print(f"训练成功，训练ID为：{training_id}，SQL：{sql}")
			
 
				+            logger.info(f"训练成功，训练ID为：{training_id}，SQL：{sql}")
			
 
				 
			
 
				         from common.result import success_response
			
 
				         return jsonify(success_response(
			
@@ -418,23 +425,23 @@ def get_citu_langraph_agent():
 
				     if citu_langraph_agent is None:
			
 
				         try:
			
 
				             from agent.citu_agent import CituLangGraphAgent
			
 
				-            print("[CITU_APP] 开始创建LangGraph Agent实例...")
			
 
				+            logger.info("开始创建LangGraph Agent实例...")
			
 
				             citu_langraph_agent = CituLangGraphAgent()
			
 
				-            print("[CITU_APP] LangGraph Agent实例创建成功")
			
 
				+            logger.info("LangGraph Agent实例创建成功")
			
 
				         except ImportError as e:
			
 
				-            print(f"[CRITICAL] Agent模块导入失败: {str(e)}")
			
 
				-            print("[CRITICAL] 请检查agent模块是否存在以及依赖是否正确安装")
			
 
				+            logger.critical(f"Agent模块导入失败: {str(e)}")
			
 
				+            logger.critical("请检查agent模块是否存在以及依赖是否正确安装")
			
 
				             raise Exception(f"Agent模块导入失败: {str(e)}")
			
 
				         except Exception as e:
			
 
				-            print(f"[CRITICAL] LangGraph Agent实例创建失败: {str(e)}")
			
 
				-            print(f"[CRITICAL] 错误类型: {type(e).__name__}")
			
 
				+            logger.critical(f"LangGraph Agent实例创建失败: {str(e)}")
			
 
				+            logger.critical(f"错误类型: {type(e).__name__}")
			
 
				             # 提供更有用的错误信息
			
 
				             if "config" in str(e).lower():
			
 
				-                print("[CRITICAL] 可能是配置文件问题，请检查配置")
			
 
				+                logger.critical("可能是配置文件问题，请检查配置")
			
 
				             elif "llm" in str(e).lower():
			
 
				-                print("[CRITICAL] 可能是LLM连接问题，请检查LLM配置")
			
 
				+                logger.critical("可能是LLM连接问题，请检查LLM配置")
			
 
				             elif "tool" in str(e).lower():
			
 
				-                print("[CRITICAL] 可能是工具加载问题，请检查工具模块")
			
 
				+                logger.critical("可能是工具加载问题，请检查工具模块")
			
 
				             raise Exception(f"Agent初始化失败: {str(e)}")
			
 
				     return citu_langraph_agent
			
 
				 
			
@@ -495,15 +502,15 @@ def ask_agent():
 
				                         metadata = message.get("metadata", {})
			
 
				                         context_type = metadata.get("type")
			
 
				                         if context_type:
			
 
				-                            print(f"[AGENT_API] 检测到上下文类型: {context_type}")
			
 
				+                            logger.info(f"[AGENT_API] 检测到上下文类型: {context_type}")
			
 
				                             break
			
 
				             except Exception as e:
			
 
				-                print(f"[WARNING] 获取上下文类型失败: {str(e)}")
			
 
				+                logger.warning(f"获取上下文类型失败: {str(e)}")
			
 
				         
			
 
				         # 4. 检查缓存（新逻辑：放宽使用条件，严控存储条件）
			
 
				         cached_answer = redis_conversation_manager.get_cached_answer(question, context)
			
 
				         if cached_answer:
			
 
				-            print(f"[AGENT_API] 使用缓存答案")
			
 
				+            logger.info(f"[AGENT_API] 使用缓存答案")
			
 
				             
			
 
				             # 确定缓存答案的助手回复内容（使用与非缓存相同的优先级逻辑）
			
 
				             cached_response_type = cached_answer.get("type", "UNKNOWN")
			
@@ -567,31 +574,31 @@ def ask_agent():
 
				         # 6. 构建带上下文的问题
			
 
				         if context:
			
 
				             enhanced_question = f"\n[CONTEXT]\n{context}\n\n[CURRENT]\n{question}"
			
 
				-            print(f"[AGENT_API] 使用上下文，长度: {len(context)}字符")
			
 
				+            logger.info(f"[AGENT_API] 使用上下文，长度: {len(context)}字符")
			
 
				         else:
			
 
				             enhanced_question = question
			
 
				-            print(f"[AGENT_API] 新对话，无上下文")
			
 
				+            logger.info(f"[AGENT_API] 新对话，无上下文")
			
 
				         
			
 
				         # 7. 确定最终使用的路由模式（优先级逻辑）
			
 
				         if api_routing_mode:
			
 
				             # API传了参数，优先使用
			
 
				             effective_routing_mode = api_routing_mode
			
 
				-            print(f"[AGENT_API] 使用API指定的路由模式: {effective_routing_mode}")
			
 
				+            logger.info(f"[AGENT_API] 使用API指定的路由模式: {effective_routing_mode}")
			
 
				         else:
			
 
				             # API没传参数，使用配置文件
			
 
				             try:
			
 
				                 from app_config import QUESTION_ROUTING_MODE
			
 
				                 effective_routing_mode = QUESTION_ROUTING_MODE
			
 
				-                print(f"[AGENT_API] 使用配置文件路由模式: {effective_routing_mode}")
			
 
				+                logger.info(f"[AGENT_API] 使用配置文件路由模式: {effective_routing_mode}")
			
 
				             except ImportError:
			
 
				                 effective_routing_mode = "hybrid"
			
 
				-                print(f"[AGENT_API] 配置文件读取失败，使用默认路由模式: {effective_routing_mode}")
			
 
				+                logger.info(f"[AGENT_API] 配置文件读取失败，使用默认路由模式: {effective_routing_mode}")
			
 
				         
			
 
				         # 8. 现有Agent处理逻辑（修改为传递路由模式）
			
 
				         try:
			
 
				             agent = get_citu_langraph_agent()
			
 
				         except Exception as e:
			
 
				-            print(f"[CRITICAL] Agent初始化失败: {str(e)}")
			
 
				+            logger.critical(f"Agent初始化失败: {str(e)}")
			
 
				             return jsonify(service_unavailable_response(
			
 
				                 response_text="AI服务暂时不可用，请稍后重试",
			
 
				                 can_retry=True
			
@@ -687,7 +694,7 @@ def ask_agent():
 
				             )), error_code
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] ask_agent执行失败: {str(e)}")
			
 
				+        logger.error(f"ask_agent执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="查询处理失败，请稍后重试"
			
 
				         )), 500
			
@@ -784,9 +791,9 @@ def agent_health():
 
				                 health_data["status"] = "degraded"
			
 
				                 health_data["message"] = "部分组件异常"
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 健康检查异常: {str(e)}")
			
 
				+            logger.error(f"健康检查异常: {str(e)}")
			
 
				             import traceback
			
 
				-            print(f"[ERROR] 详细健康检查错误: {traceback.format_exc()}")
			
 
				+            logger.error(f"详细健康检查错误: {traceback.format_exc()}")
			
 
				             health_data["status"] = "degraded"
			
 
				             health_data["message"] = f"完整测试失败: {str(e)}"
			
 
				         
			
@@ -803,9 +810,9 @@ def agent_health():
 
				             return jsonify(health_error_response(**health_data)), 503
			
 
				             
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 顶层健康检查异常: {str(e)}")
			
 
				+        logger.error(f"顶层健康检查异常: {str(e)}")
			
 
				         import traceback
			
 
				-        print(f"[ERROR] 详细错误信息: {traceback.format_exc()}")
			
 
				+        logger.error(f"详细错误信息: {traceback.format_exc()}")
			
 
				         from common.result import internal_error_response
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="健康检查失败，请稍后重试"
			
@@ -1517,7 +1524,7 @@ def training_error_question_sql():
 
				         question = data.get('question')
			
 
				         sql = data.get('sql')
			
 
				         
			
 
				-        print(f"[DEBUG] 接收到错误SQL训练请求: question={question}, sql={sql}")
			
 
				+        logger.debug(f"接收到错误SQL训练请求: question={question}, sql={sql}")
			
 
				         
			
 
				         if not question or not sql:
			
 
				             from common.result import bad_request_response
			
@@ -1535,7 +1542,7 @@ def training_error_question_sql():
 
				         # 使用vn实例的train_error_sql方法存储错误SQL
			
 
				         id = vn.train_error_sql(question=question, sql=sql)
			
 
				         
			
 
				-        print(f"[INFO] 成功存储错误SQL，ID: {id}")
			
 
				+        logger.info(f"成功存储错误SQL，ID: {id}")
			
 
				         
			
 
				         from common.result import success_response
			
 
				         return jsonify(success_response(
			
@@ -1547,7 +1554,7 @@ def training_error_question_sql():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 存储错误SQL失败: {str(e)}")
			
 
				+        logger.error(f"存储错误SQL失败: {str(e)}")
			
 
				         from common.result import internal_error_response
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="存储错误SQL失败，请稍后重试"
			
@@ -1593,7 +1600,7 @@ def get_user_conversations(user_id: str):
 
				                     conversation['conversation_title'] = "空对话"
			
 
				                     
			
 
				             except Exception as e:
			
 
				-                print(f"[WARNING] 获取对话标题失败 {conversation_id}: {str(e)}")
			
 
				+                logger.warning(f"获取对话标题失败 {conversation_id}: {str(e)}")
			
 
				                 conversation['conversation_title'] = "对话"
			
 
				         
			
 
				         return jsonify(success_response(
			
@@ -1747,7 +1754,7 @@ def get_user_conversations_with_messages(user_id: str):
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 获取用户完整对话数据失败: {str(e)}")
			
 
				+        logger.error(f"获取用户完整对话数据失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="获取用户对话数据失败，请稍后重试"
			
 
				         )), 500
			
@@ -1770,7 +1777,7 @@ def embedding_cache_stats():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 获取embedding缓存统计失败: {str(e)}")
			
 
				+        logger.error(f"获取embedding缓存统计失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="获取embedding缓存统计失败，请稍后重试"
			
 
				         )), 500
			
@@ -1801,7 +1808,7 @@ def embedding_cache_cleanup():
 
				             )), 500
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 清空embedding缓存失败: {str(e)}")
			
 
				+        logger.error(f"清空embedding缓存失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="清空embedding缓存失败，请稍后重试"
			
 
				         )), 500
			
@@ -1827,15 +1834,15 @@ def get_qa_feedback_manager():
 
				                 elif 'vn' in globals():
			
 
				                     vanna_instance = vn
			
 
				                 else:
			
 
				-                    print("[INFO] 未找到可用的vanna实例，将创建新的数据库连接")
			
 
				+                    logger.info("未找到可用的vanna实例，将创建新的数据库连接")
			
 
				             except Exception as e:
			
 
				-                print(f"[INFO] 获取vanna实例失败: {e}，将创建新的数据库连接")
			
 
				+                logger.info(f"获取vanna实例失败: {e}，将创建新的数据库连接")
			
 
				                 vanna_instance = None
			
 
				             
			
 
				             qa_feedback_manager = QAFeedbackManager(vanna_instance=vanna_instance)
			
 
				-            print("[CITU_APP] QA反馈管理器实例创建成功")
			
 
				+            logger.info("QA反馈管理器实例创建成功")
			
 
				         except Exception as e:
			
 
				-            print(f"[CRITICAL] QA反馈管理器创建失败: {str(e)}")
			
 
				+            logger.critical(f"QA反馈管理器创建失败: {str(e)}")
			
 
				             raise Exception(f"QA反馈管理器初始化失败: {str(e)}")
			
 
				     return qa_feedback_manager
			
 
				 
			
@@ -1904,7 +1911,7 @@ def qa_feedback_query():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] qa_feedback_query执行失败: {str(e)}")
			
 
				+        logger.error(f"qa_feedback_query执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="查询反馈记录失败，请稍后重试"
			
 
				         )), 500
			
@@ -1929,7 +1936,7 @@ def qa_feedback_delete(feedback_id):
 
				             )), 404
			
 
				             
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] qa_feedback_delete执行失败: {str(e)}")
			
 
				+        logger.error(f"qa_feedback_delete执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="删除反馈记录失败，请稍后重试"
			
 
				         )), 500
			
@@ -1973,7 +1980,7 @@ def qa_feedback_update(feedback_id):
 
				             )), 404
			
 
				             
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] qa_feedback_update执行失败: {str(e)}")
			
 
				+        logger.error(f"qa_feedback_update执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="更新反馈记录失败，请稍后重试"
			
 
				         )), 500
			
@@ -2026,7 +2033,7 @@ def qa_feedback_add_to_training():
 
				                         sql=record['sql']
			
 
				                     )
			
 
				                     positive_count += 1
			
 
				-                    print(f"[TRAINING] 正向训练成功 - ID: {record['id']}, TrainingID: {training_id}")
			
 
				+                    logger.info(f"正向训练成功 - ID: {record['id']}, TrainingID: {training_id}")
			
 
				                 else:
			
 
				                     # 负向反馈 - 加入错误SQL训练集
			
 
				                     training_id = vn.train_error_sql(
			
@@ -2034,18 +2041,18 @@ def qa_feedback_add_to_training():
 
				                         sql=record['sql']
			
 
				                     )
			
 
				                     negative_count += 1
			
 
				-                    print(f"[TRAINING] 负向训练成功 - ID: {record['id']}, TrainingID: {training_id}")
			
 
				+                    logger.info(f"负向训练成功 - ID: {record['id']}, TrainingID: {training_id}")
			
 
				                 
			
 
				                 successfully_trained_ids.append(record['id'])
			
 
				                 
			
 
				             except Exception as e:
			
 
				-                print(f"[ERROR] 训练失败 - 反馈ID: {record['id']}, 错误: {e}")
			
 
				+                logger.error(f"训练失败 - 反馈ID: {record['id']}, 错误: {e}")
			
 
				                 error_count += 1
			
 
				         
			
 
				         # 更新训练状态
			
 
				         if successfully_trained_ids:
			
 
				             updated_count = manager.mark_training_status(successfully_trained_ids, True)
			
 
				-            print(f"[TRAINING] 批量更新训练状态完成，影响 {updated_count} 条记录")
			
 
				+            logger.info(f"批量更新训练状态完成，影响 {updated_count} 条记录")
			
 
				         
			
 
				         # 构建响应
			
 
				         total_processed = positive_count + negative_count + already_trained_count + error_count
			
@@ -2070,7 +2077,7 @@ def qa_feedback_add_to_training():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] qa_feedback_add_to_training执行失败: {str(e)}")
			
 
				+        logger.error(f"qa_feedback_add_to_training执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="添加训练数据失败，请稍后重试"
			
 
				         )), 500
			
@@ -2123,7 +2130,7 @@ def qa_feedback_add():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] qa_feedback_add执行失败: {str(e)}")
			
 
				+        logger.error(f"qa_feedback_add执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="创建反馈记录失败，请稍后重试"
			
 
				         )), 500
			
@@ -2158,7 +2165,7 @@ def qa_feedback_stats():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] qa_feedback_stats执行失败: {str(e)}")
			
 
				+        logger.error(f"qa_feedback_stats执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="获取统计信息失败，请稍后重试"
			
 
				         )), 500
			
@@ -2178,7 +2185,7 @@ def qa_cache_stats():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 获取问答缓存统计失败: {str(e)}")
			
 
				+        logger.error(f"获取问答缓存统计失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="获取问答缓存统计失败，请稍后重试"
			
 
				         )), 500
			
@@ -2209,7 +2216,7 @@ def qa_cache_list():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 获取问答缓存列表失败: {str(e)}")
			
 
				+        logger.error(f"获取问答缓存列表失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="获取问答缓存列表失败，请稍后重试"
			
 
				         )), 500
			
@@ -2235,7 +2242,7 @@ def qa_cache_cleanup():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 清空问答缓存失败: {str(e)}")
			
 
				+        logger.error(f"清空问答缓存失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="清空问答缓存失败，请稍后重试"
			
 
				         )), 500
			
@@ -2367,7 +2374,7 @@ def get_total_training_count():
 
				             return len(training_data)
			
 
				         return 0
			
 
				     except Exception as e:
			
 
				-        print(f"[WARNING] 获取训练数据总数失败: {e}")
			
 
				+        logger.warning(f"获取训练数据总数失败: {e}")
			
 
				         return 0
			
 
				 
			
 
				 @app.flask_app.route('/api/v0/training_data/query', methods=['POST'])
			
@@ -2460,7 +2467,7 @@ def training_data_query():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] training_data_query执行失败: {str(e)}")
			
 
				+        logger.error(f"training_data_query执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="查询训练数据失败，请稍后重试"
			
 
				         )), 500
			
@@ -2533,7 +2540,7 @@ def training_data_create():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] training_data_create执行失败: {str(e)}")
			
 
				+        logger.error(f"training_data_create执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="创建训练数据失败，请稍后重试"
			
 
				         )), 500
			
@@ -2605,7 +2612,7 @@ def training_data_delete():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] training_data_delete执行失败: {str(e)}")
			
 
				+        logger.error(f"training_data_delete执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="删除训练数据失败，请稍后重试"
			
 
				         )), 500
			
@@ -2666,7 +2673,7 @@ def training_data_stats():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] training_data_stats执行失败: {str(e)}")
			
 
				+        logger.error(f"training_data_stats执行失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="获取统计信息失败，请稍后重试"
			
 
				         )), 500
			
@@ -2702,7 +2709,7 @@ def cache_overview_full():
 
				         ))
			
 
				         
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 获取综合缓存概览失败: {str(e)}")
			
 
				+        logger.error(f"获取综合缓存概览失败: {str(e)}")
			
 
				         return jsonify(internal_error_response(
			
 
				             response_text="获取缓存概览失败，请稍后重试"
			
 
				         )), 500
			
@@ -2748,5 +2755,5 @@ const chatSession = new ChatSession();
 
				 chatSession.askQuestion("各年龄段客户的流失率如何？");
			
 
				 """
			
 
				 
			
 
				-print("正在启动Flask应用: http://localhost:8084")
			
 
				+logger.info("正在启动Flask应用: http://localhost:8084")
			
 
				 app.run(host="0.0.0.0", port=8084, debug=True)
			
--- a/common/embedding_cache_manager.py
+++ b/common/embedding_cache_manager.py
@@ -5,6 +5,7 @@ import time
 
				 from typing import List, Optional, Dict, Any
			
 
				 from datetime import datetime
			
 
				 import app_config
			
 
				+from core.logging import get_app_logger
			
 
				 
			
 
				 
			
 
				 class EmbeddingCacheManager:
			
@@ -12,6 +13,7 @@ class EmbeddingCacheManager:
 
				     
			
 
				     def __init__(self):
			
 
				         """初始化缓存管理器"""
			
 
				+        self.logger = get_app_logger("EmbeddingCacheManager")
			
 
				         self.redis_client = None
			
 
				         self.cache_enabled = app_config.ENABLE_EMBEDDING_CACHE
			
 
				         
			
@@ -28,9 +30,9 @@ class EmbeddingCacheManager:
 
				                 )
			
 
				                 # 测试连接
			
 
				                 self.redis_client.ping()
			
 
				-                print(f"[DEBUG] Embedding缓存管理器初始化成功")
			
 
				+                self.logger.debug("Embedding缓存管理器初始化成功")
			
 
				             except Exception as e:
			
 
				-                print(f"[WARNING] Redis连接失败，embedding缓存将被禁用: {e}")
			
 
				+                self.logger.warning(f"Redis连接失败，embedding缓存将被禁用: {e}")
			
 
				                 self.cache_enabled = False
			
 
				                 self.redis_client = None
			
 
				     
			
@@ -72,7 +74,7 @@ class EmbeddingCacheManager:
 
				                 'embedding_dimension': str(embedding_config.get('embedding_dimension', 'unknown'))
			
 
				             }
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 获取模型信息失败: {e}")
			
 
				+            self.logger.warning(f"获取模型信息失败: {e}")
			
 
				             return {'model_name': 'unknown', 'embedding_dimension': 'unknown'}
			
 
				     
			
 
				     def get_cached_embedding(self, question: str) -> Optional[List[float]]:
			
@@ -97,13 +99,13 @@ class EmbeddingCacheManager:
 
				                 data = json.loads(cached_data)
			
 
				                 vector = data.get('vector')
			
 
				                 if vector:
			
 
				-                    print(f"[DEBUG] ✓ Embedding缓存命中: {question[:50]}...")
			
 
				+                    self.logger.debug(f"✓ Embedding缓存命中: {question[:50]}...")
			
 
				                     return vector
			
 
				             
			
 
				             return None
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 获取embedding缓存失败: {e}")
			
 
				+            self.logger.warning(f"获取embedding缓存失败: {e}")
			
 
				             return None
			
 
				     
			
 
				     def cache_embedding(self, question: str, vector: List[float]) -> bool:
			
@@ -141,7 +143,7 @@ class EmbeddingCacheManager:
 
				                 json.dumps(cache_data, ensure_ascii=False)
			
 
				             )
			
 
				             
			
 
				-            print(f"[DEBUG] ✓ Embedding向量已缓存: {question[:50]}... (维度: {len(vector)})")
			
 
				+            self.logger.debug(f"✓ Embedding向量已缓存: {question[:50]}... (维度: {len(vector)})")
			
 
				             
			
 
				             # 检查缓存大小并清理
			
 
				             self._cleanup_if_needed()
			
@@ -149,7 +151,7 @@ class EmbeddingCacheManager:
 
				             return True
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 缓存embedding失败: {e}")
			
 
				+            self.logger.warning(f"缓存embedding失败: {e}")
			
 
				             return False
			
 
				     
			
 
				     def _cleanup_if_needed(self):
			
@@ -180,10 +182,10 @@ class EmbeddingCacheManager:
 
				                 
			
 
				                 if keys_to_delete:
			
 
				                     self.redis_client.delete(*keys_to_delete)
			
 
				-                    print(f"[DEBUG] 清理了 {len(keys_to_delete)} 个旧的embedding缓存")
			
 
				+                    self.logger.debug(f"清理了 {len(keys_to_delete)} 个旧的embedding缓存")
			
 
				                     
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 清理embedding缓存失败: {e}")
			
 
				+            self.logger.warning(f"清理embedding缓存失败: {e}")
			
 
				     
			
 
				     def get_cache_stats(self) -> Dict[str, Any]:
			
 
				         """
			
@@ -217,7 +219,7 @@ class EmbeddingCacheManager:
 
				                     stats["memory_usage_mb"] = round(total_size_bytes / (1024 * 1024), 2)
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 获取缓存统计失败: {e}")
			
 
				+            self.logger.warning(f"获取缓存统计失败: {e}")
			
 
				         
			
 
				         return stats
			
 
				     
			
@@ -237,14 +239,14 @@ class EmbeddingCacheManager:
 
				             
			
 
				             if keys:
			
 
				                 self.redis_client.delete(*keys)
			
 
				-                print(f"[DEBUG] 已清空所有embedding缓存 ({len(keys)} 条)")
			
 
				+                self.logger.debug(f"已清空所有embedding缓存 ({len(keys)} 条)")
			
 
				                 return True
			
 
				             else:
			
 
				-                print(f"[DEBUG] 没有embedding缓存需要清空")
			
 
				+                self.logger.debug("没有embedding缓存需要清空")
			
 
				                 return True
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[WARNING] 清空embedding缓存失败: {e}")
			
 
				+            self.logger.warning(f"清空embedding缓存失败: {e}")
			
 
				             return False
			
 
				 
			
 
				 
			
--- a/common/qa_feedback_manager.py
+++ b/common/qa_feedback_manager.py
@@ -8,6 +8,7 @@ from sqlalchemy.exc import OperationalError, ProgrammingError
 
				 from datetime import datetime
			
 
				 from typing import List, Dict, Any, Optional, Tuple
			
 
				 import logging
			
 
				+from core.logging import get_app_logger
			
 
				 
			
 
				 class QAFeedbackManager:
			
 
				     """QA反馈数据管理器 - 复用Vanna连接版本"""
			
@@ -18,6 +19,9 @@ class QAFeedbackManager:
 
				         Args:
			
 
				             vanna_instance: 可选的vanna实例，用于复用其数据库连接
			
 
				         """
			
 
				+        # 初始化日志
			
 
				+        self.logger = get_app_logger("QAFeedbackManager")
			
 
				+        
			
 
				         self.engine = None
			
 
				         self.vanna_instance = vanna_instance
			
 
				         self._init_database_connection()
			
@@ -29,7 +33,7 @@ class QAFeedbackManager:
 
				             # 方案1: 优先尝试复用vanna连接
			
 
				             if self.vanna_instance and hasattr(self.vanna_instance, 'engine'):
			
 
				                 self.engine = self.vanna_instance.engine
			
 
				-                print(f"[QAFeedbackManager] 复用Vanna数据库连接")
			
 
				+                self.logger.info("复用Vanna数据库连接")
			
 
				                 return
			
 
				             
			
 
				             # 方案2: 创建新的连接（原有方式）
			
@@ -52,10 +56,10 @@ class QAFeedbackManager:
 
				             with self.engine.connect() as conn:
			
 
				                 conn.execute(text("SELECT 1"))
			
 
				             
			
 
				-            print(f"[QAFeedbackManager] 数据库连接成功: {db_config['host']}:{db_config['port']}/{db_config['dbname']}")
			
 
				+            self.logger.info(f"数据库连接成功: {db_config['host']}:{db_config['port']}/{db_config['dbname']}")
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] QAFeedbackManager数据库连接失败: {e}")
			
 
				+            self.logger.error(f"QAFeedbackManager数据库连接失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def _ensure_table_exists(self):
			
@@ -91,10 +95,10 @@ class QAFeedbackManager:
 
				                     for index_sql in create_indexes_sql:
			
 
				                         conn.execute(text(index_sql))
			
 
				                     
			
 
				-            print("[QAFeedbackManager] qa_feedback表检查/创建成功")
			
 
				+            self.logger.info("qa_feedback表检查/创建成功")
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] qa_feedback表创建失败: {e}")
			
 
				+            self.logger.error(f"qa_feedback表创建失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def add_feedback(self, question: str, sql: str, is_thumb_up: bool, user_id: str = "guest") -> int:
			
@@ -127,11 +131,11 @@ class QAFeedbackManager:
 
				                     })
			
 
				                     feedback_id = result.fetchone()[0]
			
 
				                 
			
 
				-            print(f"[QAFeedbackManager] 反馈记录创建成功, ID: {feedback_id}")
			
 
				+            self.logger.info(f"反馈记录创建成功, ID: {feedback_id}")
			
 
				             return feedback_id
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 添加反馈记录失败: {e}")
			
 
				+            self.logger.error(f"添加反馈记录失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def query_feedback(self, page: int = 1, page_size: int = 20, 
			
@@ -232,7 +236,7 @@ class QAFeedbackManager:
 
				             return records, total
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 查询反馈记录失败: {e}")
			
 
				+            self.logger.error(f"查询反馈记录失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def delete_feedback(self, feedback_id: int) -> bool:
			
@@ -252,14 +256,14 @@ class QAFeedbackManager:
 
				                     result = conn.execute(text(delete_sql), {'id': feedback_id})
			
 
				                 
			
 
				                 if result.rowcount > 0:
			
 
				-                    print(f"[QAFeedbackManager] 反馈记录删除成功, ID: {feedback_id}")
			
 
				+                    self.logger.info(f"反馈记录删除成功, ID: {feedback_id}")
			
 
				                     return True
			
 
				                 else:
			
 
				-                    print(f"[WARNING] 反馈记录不存在, ID: {feedback_id}")
			
 
				+                    self.logger.warning(f"反馈记录不存在, ID: {feedback_id}")
			
 
				                     return False
			
 
				                     
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 删除反馈记录失败: {e}")
			
 
				+            self.logger.error(f"删除反馈记录失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def update_feedback(self, feedback_id: int, **kwargs) -> bool:
			
@@ -284,7 +288,7 @@ class QAFeedbackManager:
 
				                 params[field] = value
			
 
				         
			
 
				         if not update_fields:
			
 
				-            print("[WARNING] 没有有效的更新字段")
			
 
				+            self.logger.warning("没有有效的更新字段")
			
 
				             return False
			
 
				         
			
 
				         update_fields.append("update_time = :update_time")
			
@@ -301,14 +305,14 @@ class QAFeedbackManager:
 
				                     result = conn.execute(text(update_sql), params)
			
 
				                 
			
 
				                 if result.rowcount > 0:
			
 
				-                    print(f"[QAFeedbackManager] 反馈记录更新成功, ID: {feedback_id}")
			
 
				+                    self.logger.info(f"反馈记录更新成功, ID: {feedback_id}")
			
 
				                     return True
			
 
				                 else:
			
 
				-                    print(f"[WARNING] 反馈记录不存在或无变化, ID: {feedback_id}")
			
 
				+                    self.logger.warning(f"反馈记录不存在或无变化, ID: {feedback_id}")
			
 
				                     return False
			
 
				                     
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 更新反馈记录失败: {e}")
			
 
				+            self.logger.error(f"更新反馈记录失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def get_feedback_by_ids(self, feedback_ids: List[int]) -> List[Dict]:
			
@@ -354,7 +358,7 @@ class QAFeedbackManager:
 
				                 return records
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 根据ID查询反馈记录失败: {e}")
			
 
				+            self.logger.error(f"根据ID查询反馈记录失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def mark_training_status(self, feedback_ids: List[int], status: bool = True) -> int:
			
@@ -386,9 +390,9 @@ class QAFeedbackManager:
 
				                 with conn.begin():
			
 
				                     result = conn.execute(text(update_sql), params)
			
 
				                 
			
 
				-                print(f"[QAFeedbackManager] 批量更新训练状态成功, 影响行数: {result.rowcount}")
			
 
				+                self.logger.info(f"批量更新训练状态成功, 影响行数: {result.rowcount}")
			
 
				                 return result.rowcount
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 批量更新训练状态失败: {e}")
			
 
				+            self.logger.error(f"批量更新训练状态失败: {e}")
			
 
				             raise
			
--- a/common/redis_conversation_manager.py
+++ b/common/redis_conversation_manager.py
@@ -12,12 +12,14 @@ from app_config import (
 
				     ENABLE_CONVERSATION_CONTEXT, ENABLE_QUESTION_ANSWER_CACHE,
			
 
				     DEFAULT_ANONYMOUS_USER
			
 
				 )
			
 
				+from core.logging import get_app_logger
			
 
				 
			
 
				 class RedisConversationManager:
			
 
				     """Redis对话管理器 - 修正版"""
			
 
				     
			
 
				     def __init__(self):
			
 
				         """初始化Redis连接"""
			
 
				+        self.logger = get_app_logger("RedisConversationManager")
			
 
				         try:
			
 
				             self.redis_client = redis.Redis(
			
 
				                 host=REDIS_HOST,
			
@@ -30,9 +32,9 @@ class RedisConversationManager:
 
				             )
			
 
				             # 测试连接
			
 
				             self.redis_client.ping()
			
 
				-            print(f"[REDIS_CONV] Redis连接成功: {REDIS_HOST}:{REDIS_PORT}")
			
 
				+            self.logger.info(f"Redis连接成功: {REDIS_HOST}:{REDIS_PORT}")
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] Redis连接失败: {str(e)}")
			
 
				+            self.logger.error(f"Redis连接失败: {str(e)}")
			
 
				             self.redis_client = None
			
 
				     
			
 
				     def is_available(self) -> bool:
			
@@ -59,16 +61,16 @@ class RedisConversationManager:
 
				         
			
 
				         # 1. 优先使用登录用户ID
			
 
				         if login_user_id:
			
 
				-            print(f"[REDIS_CONV] 使用登录用户ID: {login_user_id}")
			
 
				+            self.logger.debug(f"使用登录用户ID: {login_user_id}")
			
 
				             return login_user_id
			
 
				         
			
 
				         # 2. 如果没有登录，尝试从请求参数获取user_id
			
 
				         if user_id_from_request:
			
 
				-            print(f"[REDIS_CONV] 使用请求参数user_id: {user_id_from_request}")
			
 
				+            self.logger.debug(f"使用请求参数user_id: {user_id_from_request}")
			
 
				             return user_id_from_request
			
 
				         
			
 
				         # 3. 都没有则为匿名用户（统一为guest）
			
 
				-        print(f"[REDIS_CONV] 使用匿名用户: {DEFAULT_ANONYMOUS_USER}")
			
 
				+        self.logger.debug(f"使用匿名用户: {DEFAULT_ANONYMOUS_USER}")
			
 
				         return DEFAULT_ANONYMOUS_USER
			
 
				     
			
 
				     def resolve_conversation_id(self, user_id: str, conversation_id_input: Optional[str], 
			
@@ -87,13 +89,13 @@ class RedisConversationManager:
 
				         # 1. 如果指定了conversation_id，验证后使用
			
 
				         if conversation_id_input:
			
 
				             if self._is_valid_conversation(conversation_id_input, user_id):
			
 
				-                print(f"[REDIS_CONV] 使用指定对话: {conversation_id_input}")
			
 
				+                self.logger.debug(f"使用指定对话: {conversation_id_input}")
			
 
				                 return conversation_id_input, {
			
 
				                     "status": "existing",
			
 
				                     "message": "继续已有对话"
			
 
				                 }
			
 
				             else:
			
 
				-                print(f"[WARN] 无效的conversation_id: {conversation_id_input}，创建新对话")
			
 
				+                self.logger.warning(f"无效的conversation_id: {conversation_id_input}，创建新对话")
			
 
				                 new_conversation_id = self.create_conversation(user_id)
			
 
				                 return new_conversation_id, {
			
 
				                     "status": "invalid_id_new",
			
@@ -105,7 +107,7 @@ class RedisConversationManager:
 
				         if continue_conversation:
			
 
				             recent_conversation = self._get_recent_conversation(user_id)
			
 
				             if recent_conversation:
			
 
				-                print(f"[REDIS_CONV] 继续最近对话: {recent_conversation}")
			
 
				+                self.logger.debug(f"继续最近对话: {recent_conversation}")
			
 
				                 return recent_conversation, {
			
 
				                     "status": "existing",
			
 
				                     "message": "继续最近对话"
			
@@ -113,7 +115,7 @@ class RedisConversationManager:
 
				         
			
 
				         # 3. 创建新对话
			
 
				         new_conversation_id = self.create_conversation(user_id)
			
 
				-        print(f"[REDIS_CONV] 创建新对话: {new_conversation_id}")
			
 
				+        self.logger.debug(f"创建新对话: {new_conversation_id}")
			
 
				         return new_conversation_id, {
			
 
				             "status": "new",
			
 
				             "message": "创建新对话"
			
@@ -180,11 +182,11 @@ class RedisConversationManager:
 
				             # 添加到用户的对话列表
			
 
				             self._add_conversation_to_user(user_id, conversation_id)
			
 
				             
			
 
				-            print(f"[REDIS_CONV] 创建对话成功: {conversation_id}")
			
 
				+            self.logger.info(f"创建对话成功: {conversation_id}")
			
 
				             return conversation_id
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 创建对话失败: {str(e)}")
			
 
				+            self.logger.error(f"创建对话失败: {str(e)}")
			
 
				             return conversation_id  # 返回ID但可能未存储
			
 
				     
			
 
				     def save_message(self, conversation_id: str, role: str, content: str, 
			
@@ -223,7 +225,7 @@ class RedisConversationManager:
 
				             return True
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 保存消息失败: {str(e)}")
			
 
				+            self.logger.error(f"保存消息失败: {str(e)}")
			
 
				             return False
			
 
				     
			
 
				     def get_context(self, conversation_id: str, count: Optional[int] = None) -> str:
			
@@ -262,11 +264,11 @@ class RedisConversationManager:
 
				                     continue
			
 
				             
			
 
				             context = "\n".join(context_parts)
			
 
				-            print(f"[REDIS_CONV] 获取上下文成功: {len(context_parts)}条消息")
			
 
				+            self.logger.debug(f"获取上下文成功: {len(context_parts)}条消息")
			
 
				             return context
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取上下文失败: {str(e)}")
			
 
				+            self.logger.error(f"获取上下文失败: {str(e)}")
			
 
				             return ""
			
 
				         
			
 
				     def get_context_for_display(self, conversation_id: str, count: Optional[int] = None) -> str:
			
@@ -307,11 +309,11 @@ class RedisConversationManager:
 
				                     continue
			
 
				             
			
 
				             context = "\n".join(context_parts)
			
 
				-            print(f"[REDIS_CONV] 获取显示上下文成功: {len(context_parts)}条消息")
			
 
				+            self.logger.debug(f"获取显示上下文成功: {len(context_parts)}条消息")
			
 
				             return context
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取显示上下文失败: {str(e)}")
			
 
				+            self.logger.error(f"获取显示上下文失败: {str(e)}")
			
 
				             return ""
			
 
				     
			
 
				     
			
@@ -341,7 +343,7 @@ class RedisConversationManager:
 
				             return parsed_messages
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取对话消息失败: {str(e)}")
			
 
				+            self.logger.error(f"获取对话消息失败: {str(e)}")
			
 
				             return []
			
 
				     
			
 
				     def get_conversation_meta(self, conversation_id: str) -> Dict:
			
@@ -353,7 +355,7 @@ class RedisConversationManager:
 
				             meta_data = self.redis_client.hgetall(f"conversation:{conversation_id}:meta")
			
 
				             return meta_data if meta_data else {}
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取对话元信息失败: {str(e)}")
			
 
				+            self.logger.error(f"获取对话元信息失败: {str(e)}")
			
 
				             return {}
			
 
				     
			
 
				     def get_conversations(self, user_id: str, limit: int = None) -> List[Dict]:
			
@@ -379,7 +381,7 @@ class RedisConversationManager:
 
				             return conversations
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取用户对话列表失败: {str(e)}")
			
 
				+            self.logger.error(f"获取用户对话列表失败: {str(e)}")
			
 
				             return []
			
 
				     
			
 
				     # ==================== 智能缓存（修正版）====================
			
@@ -396,13 +398,13 @@ class RedisConversationManager:
 
				             
			
 
				             if cached_answer:
			
 
				                 context_info = "有上下文" if context else "无上下文"
			
 
				-                print(f"[REDIS_CONV] 缓存命中: {cache_key} ({context_info})")
			
 
				+                self.logger.debug(f"缓存命中: {cache_key} ({context_info})")
			
 
				                 return json.loads(cached_answer)
			
 
				             
			
 
				             return None
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取缓存答案失败: {str(e)}")
			
 
				+            self.logger.error(f"获取缓存答案失败: {str(e)}")
			
 
				             return None
			
 
				     
			
 
				     def cache_answer(self, question: str, answer: Dict, context: str = ""):
			
@@ -412,7 +414,7 @@ class RedisConversationManager:
 
				         
			
 
				         # 新增：如果有上下文，不缓存
			
 
				         if context:
			
 
				-            print(f"[REDIS_CONV] 跳过缓存存储：存在上下文")
			
 
				+            self.logger.debug("跳过缓存存储：存在上下文")
			
 
				             return
			
 
				         
			
 
				         try:
			
@@ -432,10 +434,10 @@ class RedisConversationManager:
 
				                 json.dumps(answer_with_meta)
			
 
				             )
			
 
				             
			
 
				-            print(f"[REDIS_CONV] 缓存答案成功: {cache_key}")
			
 
				+            self.logger.debug(f"缓存答案成功: {cache_key}")
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 缓存答案失败: {str(e)}")
			
 
				+            self.logger.error(f"缓存答案失败: {str(e)}")
			
 
				     
			
 
				     def _get_cache_key(self, question: str) -> str:
			
 
				         """生成缓存键 - 简化版，只基于问题本身"""
			
@@ -464,7 +466,7 @@ class RedisConversationManager:
 
				             )
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 添加对话到用户列表失败: {str(e)}")
			
 
				+            self.logger.error(f"添加对话到用户列表失败: {str(e)}")
			
 
				     
			
 
				     def _update_conversation_meta(self, conversation_id: str):
			
 
				         """更新对话元信息"""
			
@@ -482,7 +484,7 @@ class RedisConversationManager:
 
				             )
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 更新对话元信息失败: {str(e)}")
			
 
				+            self.logger.error(f"更新对话元信息失败: {str(e)}")
			
 
				     
			
 
				     # ==================== 管理方法 ====================
			
 
				     
			
@@ -510,7 +512,7 @@ class RedisConversationManager:
 
				             return stats
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取统计信息失败: {str(e)}")
			
 
				+            self.logger.error(f"获取统计信息失败: {str(e)}")
			
 
				             return {"available": False, "error": str(e)}
			
 
				     
			
 
				     def cleanup_expired_conversations(self):
			
@@ -542,10 +544,10 @@ class RedisConversationManager:
 
				                         # 重新设置TTL
			
 
				                         self.redis_client.expire(user_key, USER_CONVERSATIONS_TTL)
			
 
				             
			
 
				-            print(f"[REDIS_CONV] 清理完成，移除了 {cleaned_count} 个无效对话引用")
			
 
				+            self.logger.info(f"清理完成，移除了 {cleaned_count} 个无效对话引用")
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 清理失败: {str(e)}")
			
 
				+            self.logger.error(f"清理失败: {str(e)}")
			
 
				     
			
 
				     # ==================== 问答缓存管理方法 ====================
			
 
				     
			
@@ -579,7 +581,7 @@ class RedisConversationManager:
 
				             return stats
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取问答缓存统计失败: {str(e)}")
			
 
				+            self.logger.error(f"获取问答缓存统计失败: {str(e)}")
			
 
				             return {"available": False, "error": str(e)}
			
 
				     
			
 
				     def get_qa_cache_list(self, limit: int = 50) -> List[Dict]:
			
@@ -621,7 +623,7 @@ class RedisConversationManager:
 
				                     # 跳过无效的JSON数据
			
 
				                     continue
			
 
				                 except Exception as e:
			
 
				-                    print(f"[WARNING] 处理缓存项 {key} 失败: {e}")
			
 
				+                    self.logger.warning(f"处理缓存项 {key} 失败: {e}")
			
 
				                     continue
			
 
				             
			
 
				             # 按缓存时间倒序排列
			
@@ -630,7 +632,7 @@ class RedisConversationManager:
 
				             return cache_list
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 获取问答缓存列表失败: {str(e)}")
			
 
				+            self.logger.error(f"获取问答缓存列表失败: {str(e)}")
			
 
				             return []
			
 
				     
			
 
				     def clear_all_qa_cache(self) -> int:
			
@@ -644,12 +646,12 @@ class RedisConversationManager:
 
				             
			
 
				             if keys:
			
 
				                 deleted_count = self.redis_client.delete(*keys)
			
 
				-                print(f"[REDIS_CONV] 清空问答缓存成功，删除了 {deleted_count} 个缓存项")
			
 
				+                self.logger.info(f"清空问答缓存成功，删除了 {deleted_count} 个缓存项")
			
 
				                 return deleted_count
			
 
				             else:
			
 
				-                print(f"[REDIS_CONV] 没有找到问答缓存项")
			
 
				+                self.logger.info("没有找到问答缓存项")
			
 
				                 return 0
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 清空问答缓存失败: {str(e)}")
			
 
				+            self.logger.error(f"清空问答缓存失败: {str(e)}")
			
 
				             return 0 
			
--- a/common/utils.py
+++ b/common/utils.py
@@ -2,6 +2,10 @@
 
				 配置相关的工具函数
			
 
				 用于处理不同模型类型的配置选择逻辑
			
 
				 """
			
 
				+from core.logging import get_app_logger
			
 
				+
			
 
				+# 初始化logger
			
 
				+_logger = get_app_logger("ConfigUtils")
			
 
				 
			
 
				 def get_current_embedding_config():
			
 
				     """
			
@@ -180,12 +184,12 @@ def print_current_config():
 
				     """
			
 
				     try:
			
 
				         model_info = get_current_model_info()
			
 
				-        print("=== 当前模型配置 ===")
			
 
				-        print(f"LLM提供商: {model_info['llm_type']}")
			
 
				-        print(f"LLM模型: {model_info['llm_model']}")
			
 
				-        print(f"Embedding提供商: {model_info['embedding_type']}")
			
 
				-        print(f"Embedding模型: {model_info['embedding_model']}")
			
 
				-        print(f"向量数据库: {model_info['vector_db']}")
			
 
				-        print("==================")
			
 
				+        _logger.info("=== 当前模型配置 ===")
			
 
				+        _logger.info(f"LLM提供商: {model_info['llm_type']}")
			
 
				+        _logger.info(f"LLM模型: {model_info['llm_model']}")
			
 
				+        _logger.info(f"Embedding提供商: {model_info['embedding_type']}")
			
 
				+        _logger.info(f"Embedding模型: {model_info['embedding_model']}")
			
 
				+        _logger.info(f"向量数据库: {model_info['vector_db']}")
			
 
				+        _logger.info("==================")
			
 
				     except Exception as e:
			
 
				-        print(f"无法获取配置信息: {e}") 
			
 
				+        _logger.error(f"无法获取配置信息: {e}") 
			
--- a/common/vanna_combinations.py
+++ b/common/vanna_combinations.py
@@ -2,13 +2,17 @@
 
				 Vanna LLM与向量数据库的组合类
			
 
				 统一管理所有LLM提供商与向量数据库的组合
			
 
				 """
			
 
				+from core.logging import get_app_logger
			
 
				+
			
 
				+# 初始化logger
			
 
				+_logger = get_app_logger("VannaCombinations")
			
 
				 
			
 
				 # 向量数据库导入
			
 
				 from vanna.chromadb import ChromaDB_VectorStore
			
 
				 try:
			
 
				     from custompgvector import PG_VectorStore
			
 
				 except ImportError:
			
 
				-    print("警告: 无法导入 PG_VectorStore，PGVector相关组合类将不可用")
			
 
				+    _logger.warning("无法导入 PG_VectorStore，PGVector相关组合类将不可用")
			
 
				     PG_VectorStore = None
			
 
				 
			
 
				 # LLM提供商导入 - 使用新的重构后的实现
			
@@ -17,7 +21,7 @@ from customllm.deepseek_chat import DeepSeekChat
 
				 try:
			
 
				     from customllm.ollama_chat import OllamaChat
			
 
				 except ImportError:
			
 
				-    print("警告: 无法导入 OllamaChat，Ollama相关组合类将不可用")
			
 
				+    _logger.warning("无法导入 OllamaChat，Ollama相关组合类将不可用")
			
 
				     OllamaChat = None
			
 
				 
			
 
				 
			
@@ -168,19 +172,19 @@ def list_available_combinations():
 
				 
			
 
				 def print_available_combinations():
			
 
				     """打印所有可用的组合"""
			
 
				-    print("可用的LLM与向量数据库组合:")
			
 
				-    print("=" * 40)
			
 
				+    _logger.info("可用的LLM与向量数据库组合:")
			
 
				+    _logger.info("=" * 40)
			
 
				     
			
 
				     combinations = list_available_combinations()
			
 
				     
			
 
				     for llm_type, vector_dbs in combinations.items():
			
 
				-        print(f"\n{llm_type.upper()} LLM:")
			
 
				+        _logger.info(f"\n{llm_type.upper()} LLM:")
			
 
				         for vector_db in vector_dbs:
			
 
				             class_name = LLM_CLASS_MAP[llm_type][vector_db].__name__
			
 
				-            print(f"  + {vector_db} -> {class_name}")
			
 
				+            _logger.info(f"  + {vector_db} -> {class_name}")
			
 
				     
			
 
				     if not any(combinations.values()):
			
 
				-        print("没有可用的组合，请检查依赖是否正确安装")
			
 
				+        _logger.warning("没有可用的组合，请检查依赖是否正确安装")
			
 
				 
			
 
				 
			
 
				 # ===== 向后兼容性支持 =====
			
--- a/common/vanna_instance.py
+++ b/common/vanna_instance.py
@@ -4,6 +4,10 @@ Vanna实例单例管理器
 
				 """
			
 
				 import threading
			
 
				 from typing import Optional
			
 
				+from core.logging import get_app_logger
			
 
				+
			
 
				+# 初始化logger
			
 
				+_logger = get_app_logger("VannaSingleton")
			
 
				 
			
 
				 # 全局变量
			
 
				 _vanna_instance: Optional[object] = None
			
@@ -22,14 +26,14 @@ def get_vanna_instance():
 
				     if _vanna_instance is None:
			
 
				         with _instance_lock:
			
 
				             if _vanna_instance is None:
			
 
				-                print("[VANNA_SINGLETON] 创建 Vanna 实例...")
			
 
				+                _logger.info("创建 Vanna 实例...")
			
 
				                 try:
			
 
				                     # 延迟导入，避免循环导入
			
 
				                     from core.vanna_llm_factory import create_vanna_instance
			
 
				                     _vanna_instance = create_vanna_instance()
			
 
				-                    print("[VANNA_SINGLETON] Vanna 实例创建成功")
			
 
				+                    _logger.info("Vanna 实例创建成功")
			
 
				                 except Exception as e:
			
 
				-                    print(f"[ERROR] Vanna 实例创建失败: {str(e)}")
			
 
				+                    _logger.error(f"Vanna 实例创建失败: {str(e)}")
			
 
				                     raise
			
 
				     
			
 
				     return _vanna_instance
			
@@ -41,7 +45,7 @@ def reset_vanna_instance():
 
				     global _vanna_instance
			
 
				     with _instance_lock:
			
 
				         if _vanna_instance is not None:
			
 
				-            print("[VANNA_SINGLETON] 重置 Vanna 实例")
			
 
				+            _logger.info("重置 Vanna 实例")
			
 
				             _vanna_instance = None
			
 
				 
			
 
				 def get_instance_status() -> dict:
			
--- a/core/embedding_function.py
+++ b/core/embedding_function.py
@@ -2,6 +2,7 @@ import requests
 
				 import time
			
 
				 import numpy as np
			
 
				 from typing import List, Callable
			
 
				+from core.logging import get_vanna_logger
			
 
				 
			
 
				 class EmbeddingFunction:
			
 
				     def __init__(self, model_name: str, api_key: str, base_url: str, embedding_dimension: int):
			
@@ -16,6 +17,9 @@ class EmbeddingFunction:
 
				         self.max_retries = 3  # 设置默认的最大重试次数
			
 
				         self.retry_interval = 2  # 设置默认的重试间隔秒数
			
 
				         self.normalize_embeddings = True # 设置默认是否归一化
			
 
				+        
			
 
				+        # 初始化日志
			
 
				+        self.logger = get_vanna_logger("EmbeddingFunction")
			
 
				 
			
 
				     def _normalize_vector(self, vector: List[float]) -> List[float]:
			
 
				         """
			
@@ -54,7 +58,7 @@ class EmbeddingFunction:
 
				                 vector = self.generate_embedding(text)
			
 
				                 embeddings.append(vector)
			
 
				             except Exception as e:
			
 
				-                print(f"为文本 '{text}' 生成embedding失败: {e}")
			
 
				+                self.logger.error(f"为文本 '{text}' 生成embedding失败: {e}")
			
 
				                 # 重新抛出异常，不返回零向量
			
 
				                 raise e
			
 
				                 
			
@@ -135,7 +139,7 @@ class EmbeddingFunction:
 
				                         retries += 1
			
 
				                         if retries <= self.max_retries:
			
 
				                             wait_time = self.retry_interval * (2 ** (retries - 1))  # 指数退避
			
 
				-                            print(f"API请求失败，等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				+                            self.logger.warning(f"API请求失败，等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				                             time.sleep(wait_time)
			
 
				                             continue
			
 
				                     
			
@@ -155,14 +159,14 @@ class EmbeddingFunction:
 
				                         # 验证向量维度
			
 
				                         actual_dim = len(vector)
			
 
				                         if actual_dim != self.embedding_dimension:
			
 
				-                            print(f"警告: 向量维度不匹配: 期望 {self.embedding_dimension}, 实际 {actual_dim}")
			
 
				+                            self.logger.warning(f"向量维度不匹配: 期望 {self.embedding_dimension}, 实际 {actual_dim}")
			
 
				                     
			
 
				                     # 如果需要归一化
			
 
				                     if self.normalize_embeddings:
			
 
				                         vector = self._normalize_vector(vector)
			
 
				                     
			
 
				                     # 添加成功生成embedding的debug日志
			
 
				-                    print(f"[DEBUG] ✓ 成功生成embedding向量，维度: {len(vector)}")
			
 
				+                    self.logger.debug(f"成功生成embedding向量，维度: {len(vector)}")
			
 
				                     
			
 
				                     return vector
			
 
				                 else:
			
@@ -174,7 +178,7 @@ class EmbeddingFunction:
 
				                 
			
 
				                 if retries <= self.max_retries:
			
 
				                     wait_time = self.retry_interval * (2 ** (retries - 1))  # 指数退避
			
 
				-                    print(f"生成embedding时出错: {str(e)}, 等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				+                    self.logger.warning(f"生成embedding时出错: {str(e)}, 等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				                     time.sleep(wait_time)
			
 
				                 else:
			
 
				                     # 抛出异常而不是返回零向量，确保问题不被掩盖
			
@@ -203,8 +207,8 @@ class EmbeddingFunction:
 
				         }
			
 
				         
			
 
				         try:
			
 
				-            print(f"测试嵌入模型连接 - 模型: {self.model_name}")
			
 
				-            print(f"API服务地址: {self.base_url}")
			
 
				+            self.logger.info(f"测试嵌入模型连接 - 模型: {self.model_name}")
			
 
				+            self.logger.info(f"API服务地址: {self.base_url}")
			
 
				             
			
 
				             # 验证配置
			
 
				             if not self.api_key:
			
@@ -241,6 +245,7 @@ def test_embedding_connection() -> dict:
 
				     Returns:
			
 
				         dict: 测试结果，包括成功/失败状态、错误消息等
			
 
				     """
			
 
				+    logger = get_vanna_logger("EmbeddingTest")
			
 
				     try:
			
 
				         # 获取嵌入函数实例
			
 
				         embedding_function = get_embedding_function()
			
@@ -249,18 +254,18 @@ def test_embedding_connection() -> dict:
 
				         test_result = embedding_function.test_connection()
			
 
				         
			
 
				         if test_result["success"]:
			
 
				-            print(f"嵌入模型连接测试成功!")
			
 
				+            logger.info(f"嵌入模型连接测试成功!")
			
 
				             if "警告" in test_result["message"]:
			
 
				-                print(test_result["message"])
			
 
				-                print(f"建议将app_config.py中的EMBEDDING_CONFIG['embedding_dimension']修改为{test_result['actual_dimension']}")
			
 
				+                logger.warning(test_result["message"])
			
 
				+                logger.warning(f"建议将app_config.py中的EMBEDDING_CONFIG['embedding_dimension']修改为{test_result['actual_dimension']}")
			
 
				         else:
			
 
				-            print(f"嵌入模型连接测试失败: {test_result['message']}")
			
 
				+            logger.error(f"嵌入模型连接测试失败: {test_result['message']}")
			
 
				             
			
 
				         return test_result
			
 
				         
			
 
				     except Exception as e:
			
 
				         error_message = f"无法测试嵌入模型连接: {str(e)}"
			
 
				-        print(error_message)
			
 
				+        logger.error(error_message)
			
 
				         return {
			
 
				             "success": False,
			
 
				             "message": error_message
			
--- a/core/vanna_llm_factory.py
+++ b/core/vanna_llm_factory.py
@@ -4,6 +4,10 @@ Vanna LLM 工厂文件，支持多种LLM提供商和向量数据库
 
				 import app_config, os
			
 
				 from core.embedding_function import get_embedding_function
			
 
				 from common.vanna_combinations import get_vanna_class, print_available_combinations
			
 
				+from core.logging import get_vanna_logger
			
 
				+
			
 
				+# 初始化日志
			
 
				+logger = get_vanna_logger("VannaFactory")
			
 
				 
			
 
				 def create_vanna_instance(config_module=None):
			
 
				     """
			
@@ -48,11 +52,11 @@ def create_vanna_instance(config_module=None):
 
				         vector_db_type = model_info["vector_db"].lower()
			
 
				         
			
 
				         cls = get_vanna_class(llm_type, vector_db_type)
			
 
				-        print(f"创建{llm_type.upper()}+{vector_db_type.upper()}实例")
			
 
				+        logger.info(f"创建{llm_type.upper()}+{vector_db_type.upper()}实例")
			
 
				         
			
 
				     except ValueError as e:
			
 
				-        print(f"错误: {e}")
			
 
				-        print("\n可用的组合:")
			
 
				+        logger.error(f"{e}")
			
 
				+        logger.info("可用的组合:")
			
 
				         print_available_combinations()
			
 
				         raise
			
 
				     
			
@@ -62,24 +66,24 @@ def create_vanna_instance(config_module=None):
 
				     # 配置向量数据库
			
 
				     if model_info["vector_db"] == "chromadb":
			
 
				         config["path"] = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))  # 返回项目根目录
			
 
				-        print(f"已配置使用ChromaDB，路径：{config['path']}")
			
 
				+        logger.info(f"已配置使用ChromaDB，路径：{config['path']}")
			
 
				     elif model_info["vector_db"] == "pgvector":
			
 
				         # 构建PostgreSQL连接字符串
			
 
				         connection_string = f"postgresql://{vector_db_config['user']}:{vector_db_config['password']}@{vector_db_config['host']}:{vector_db_config['port']}/{vector_db_config['dbname']}"
			
 
				         config["connection_string"] = connection_string
			
 
				-        print(f"已配置使用PgVector，连接字符串: {connection_string}")
			
 
				+        logger.info(f"已配置使用PgVector，连接字符串: {connection_string}")
			
 
				     
			
 
				     # 配置embedding函数
			
 
				     embedding_function = get_embedding_function()
			
 
				     config["embedding_function"] = embedding_function
			
 
				-    print(f"已配置使用{model_info['embedding_type'].upper()}嵌入模型: {model_info['embedding_model']}")
			
 
				+    logger.info(f"已配置使用{model_info['embedding_type'].upper()}嵌入模型: {model_info['embedding_model']}")
			
 
				     
			
 
				     # 创建实例
			
 
				     vn = cls(config=config)
			
 
				 
			
 
				     # 连接到业务数据库
			
 
				     vn.connect_to_postgres(**config_module.APP_DB_CONFIG)           
			
 
				-    print(f"已连接到业务数据库: "
			
 
				+    logger.info(f"已连接到业务数据库: "
			
 
				           f"{config_module.APP_DB_CONFIG['host']}:"
			
 
				           f"{config_module.APP_DB_CONFIG['port']}/"
			
 
				           f"{config_module.APP_DB_CONFIG['dbname']}")
			
--- a/customembedding/ollama_embedding.py
+++ b/customembedding/ollama_embedding.py
@@ -2,6 +2,7 @@ import requests
 
				 import time
			
 
				 import numpy as np
			
 
				 from typing import List, Callable
			
 
				+from core.logging import get_vanna_logger
			
 
				 
			
 
				 class OllamaEmbeddingFunction:
			
 
				     def __init__(self, model_name: str, base_url: str, embedding_dimension: int):
			
@@ -10,6 +11,9 @@ class OllamaEmbeddingFunction:
 
				         self.embedding_dimension = embedding_dimension
			
 
				         self.max_retries = 3
			
 
				         self.retry_interval = 2
			
 
				+        
			
 
				+        # 初始化日志
			
 
				+        self.logger = get_vanna_logger("OllamaEmbedding")
			
 
				 
			
 
				     def __call__(self, input) -> List[List[float]]:
			
 
				         """为文本列表生成嵌入向量"""
			
@@ -22,7 +26,7 @@ class OllamaEmbeddingFunction:
 
				                 embedding = self.generate_embedding(text)
			
 
				                 embeddings.append(embedding)
			
 
				             except Exception as e:
			
 
				-                print(f"获取embedding时出错: {e}")
			
 
				+                self.logger.error(f"获取embedding时出错: {e}")
			
 
				                 embeddings.append([0.0] * self.embedding_dimension)
			
 
				                 
			
 
				         return embeddings
			
@@ -37,10 +41,10 @@ class OllamaEmbeddingFunction:
 
				     
			
 
				     def generate_embedding(self, text: str) -> List[float]:
			
 
				         """为单个文本生成嵌入向量"""
			
 
				-        print(f"生成Ollama嵌入向量，文本长度: {len(text)} 字符")
			
 
				+        self.logger.debug(f"生成Ollama嵌入向量，文本长度: {len(text)} 字符")
			
 
				         
			
 
				         if not text or len(text.strip()) == 0:
			
 
				-            print("输入文本为空，返回零向量")
			
 
				+            self.logger.debug("输入文本为空，返回零向量")
			
 
				             return [0.0] * self.embedding_dimension
			
 
				 
			
 
				         url = f"{self.base_url}/api/embeddings"
			
@@ -60,13 +64,13 @@ class OllamaEmbeddingFunction:
 
				                 
			
 
				                 if response.status_code != 200:
			
 
				                     error_msg = f"Ollama API请求错误: {response.status_code}, {response.text}"
			
 
				-                    print(error_msg)
			
 
				+                    self.logger.error(error_msg)
			
 
				                     
			
 
				                     if response.status_code in (429, 500, 502, 503, 504):
			
 
				                         retries += 1
			
 
				                         if retries <= self.max_retries:
			
 
				                             wait_time = self.retry_interval * (2 ** (retries - 1))
			
 
				-                            print(f"等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				+                            self.logger.info(f"等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				                             time.sleep(wait_time)
			
 
				                             continue
			
 
				                     
			
@@ -80,7 +84,7 @@ class OllamaEmbeddingFunction:
 
				                     # 验证向量维度
			
 
				                     actual_dim = len(vector)
			
 
				                     if actual_dim != self.embedding_dimension:
			
 
				-                        print(f"向量维度不匹配: 期望 {self.embedding_dimension}, 实际 {actual_dim}")
			
 
				+                        self.logger.debug(f"向量维度不匹配: 期望 {self.embedding_dimension}, 实际 {actual_dim}")
			
 
				                         # 如果维度不匹配，可以选择截断或填充
			
 
				                         if actual_dim > self.embedding_dimension:
			
 
				                             vector = vector[:self.embedding_dimension]
			
@@ -88,23 +92,23 @@ class OllamaEmbeddingFunction:
 
				                             vector.extend([0.0] * (self.embedding_dimension - actual_dim))
			
 
				                     
			
 
				                     # 添加成功生成embedding的debug日志
			
 
				-                    print(f"[DEBUG] ✓ 成功生成Ollama embedding向量，维度: {len(vector)}")
			
 
				+                    self.logger.debug(f"✓ 成功生成Ollama embedding向量，维度: {len(vector)}")
			
 
				                     return vector
			
 
				                 else:
			
 
				                     error_msg = f"Ollama API返回格式异常: {result}"
			
 
				-                    print(error_msg)
			
 
				+                    self.logger.error(error_msg)
			
 
				                     raise ValueError(error_msg)
			
 
				                 
			
 
				             except Exception as e:
			
 
				-                print(f"生成Ollama embedding时出错: {str(e)}")
			
 
				+                self.logger.error(f"生成Ollama embedding时出错: {str(e)}")
			
 
				                 retries += 1
			
 
				                 
			
 
				                 if retries <= self.max_retries:
			
 
				                     wait_time = self.retry_interval * (2 ** (retries - 1))
			
 
				-                    print(f"等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				+                    self.logger.info(f"等待 {wait_time} 秒后重试 ({retries}/{self.max_retries})")
			
 
				                     time.sleep(wait_time)
			
 
				                 else:
			
 
				-                    print(f"已达到最大重试次数 ({self.max_retries})，生成embedding失败")
			
 
				+                    self.logger.error(f"已达到最大重试次数 ({self.max_retries})，生成embedding失败")
			
 
				                     return [0.0] * self.embedding_dimension
			
 
				         
			
 
				         raise RuntimeError("生成Ollama embedding失败")
			
@@ -121,8 +125,8 @@ class OllamaEmbeddingFunction:
 
				         }
			
 
				         
			
 
				         try:
			
 
				-            print(f"测试Ollama嵌入模型连接 - 模型: {self.model_name}")
			
 
				-            print(f"Ollama服务地址: {self.base_url}")
			
 
				+            self.logger.info(f"测试Ollama嵌入模型连接 - 模型: {self.model_name}")
			
 
				+            self.logger.info(f"Ollama服务地址: {self.base_url}")
			
 
				             
			
 
				             vector = self.generate_embedding(test_text)
			
 
				             actual_dimension = len(vector)
			
--- a/customllm/base_llm_chat.py
+++ b/customllm/base_llm_chat.py
@@ -4,6 +4,7 @@ from typing import List, Dict, Any, Optional, Union, Tuple
 
				 import pandas as pd
			
 
				 import plotly.graph_objs
			
 
				 from vanna.base import VannaBase
			
 
				+from core.logging import get_vanna_logger
			
 
				 # 导入配置参数
			
 
				 from app_config import REWRITE_QUESTION_ENABLED, DISPLAY_RESULT_THINKING
			
 
				 
			
@@ -14,18 +15,21 @@ class BaseLLMChat(VannaBase, ABC):
 
				     def __init__(self, config=None):
			
 
				         VannaBase.__init__(self, config=config)
			
 
				 
			
 
				+        # 初始化日志
			
 
				+        self.logger = get_vanna_logger("BaseLLMChat")
			
 
				+
			
 
				         # 存储LLM解释性文本
			
 
				         self.last_llm_explanation = None
			
 
				         
			
 
				-        print("传入的 config 参数如下：")
			
 
				+        self.logger.info("传入的 config 参数如下：")
			
 
				         for key, value in self.config.items():
			
 
				-            print(f"  {key}: {value}")
			
 
				+            self.logger.info(f"  {key}: {value}")
			
 
				         
			
 
				         # 默认参数
			
 
				         self.temperature = 0.7
			
 
				         
			
 
				         if "temperature" in config:
			
 
				-            print(f"temperature is changed to: {config['temperature']}")
			
 
				+            self.logger.info(f"temperature is changed to: {config['temperature']}")
			
 
				             self.temperature = config["temperature"]
			
 
				         
			
 
				         # 加载错误SQL提示配置
			
@@ -36,32 +40,32 @@ class BaseLLMChat(VannaBase, ABC):
 
				         try:
			
 
				             import app_config
			
 
				             enable_error_sql = getattr(app_config, 'ENABLE_ERROR_SQL_PROMPT', False)
			
 
				-            print(f"[DEBUG] 错误SQL提示配置: ENABLE_ERROR_SQL_PROMPT = {enable_error_sql}")
			
 
				+            self.logger.debug(f"错误SQL提示配置: ENABLE_ERROR_SQL_PROMPT = {enable_error_sql}")
			
 
				             return enable_error_sql
			
 
				         except (ImportError, AttributeError) as e:
			
 
				-            print(f"[WARNING] 无法加载错误SQL提示配置: {e}，使用默认值 False")
			
 
				+            self.logger.warning(f"无法加载错误SQL提示配置: {e}，使用默认值 False")
			
 
				             return False
			
 
				 
			
 
				     def system_message(self, message: str) -> dict:
			
 
				         """创建系统消息格式"""
			
 
				-        print(f"system_content: {message}")
			
 
				+        self.logger.debug(f"system_content: {message}")
			
 
				         return {"role": "system", "content": message}
			
 
				 
			
 
				     def user_message(self, message: str) -> dict:
			
 
				         """创建用户消息格式"""
			
 
				-        print(f"\nuser_content: {message}")
			
 
				+        self.logger.debug(f"\nuser_content: {message}")
			
 
				         return {"role": "user", "content": message}
			
 
				 
			
 
				     def assistant_message(self, message: str) -> dict:
			
 
				         """创建助手消息格式"""
			
 
				-        print(f"assistant_content: {message}")
			
 
				+        self.logger.debug(f"assistant_content: {message}")
			
 
				         return {"role": "assistant", "content": message}
			
 
				 
			
 
				     def get_sql_prompt(self, initial_prompt: str, question: str, question_sql_list: list, ddl_list: list, doc_list: list, **kwargs):
			
 
				         """
			
 
				         基于VannaBase源码实现，在第7点添加中文别名指令
			
 
				         """
			
 
				-        print(f"[DEBUG] 开始生成SQL提示词，问题: {question}")
			
 
				+        self.logger.debug(f"开始生成SQL提示词，问题: {question}")
			
 
				         
			
 
				         if initial_prompt is None:
			
 
				             initial_prompt = f"You are a {self.dialect} expert. " + \
			
@@ -101,7 +105,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				             try:
			
 
				                 error_sql_list = self.get_related_error_sql(question, **kwargs)
			
 
				                 if error_sql_list:
			
 
				-                    print(f"[DEBUG] 找到 {len(error_sql_list)} 个相关的错误SQL示例")
			
 
				+                    self.logger.debug(f"找到 {len(error_sql_list)} 个相关的错误SQL示例")
			
 
				                     
			
 
				                     # 构建格式化的负面提示内容
			
 
				                     negative_prompt_content = "===Negative Examples\n"
			
@@ -110,33 +114,36 @@ class BaseLLMChat(VannaBase, ABC):
 
				                     for i, error_example in enumerate(error_sql_list, 1):
			
 
				                         if "question" in error_example and "sql" in error_example:
			
 
				                             similarity = error_example.get('similarity', 'N/A')
			
 
				-                            print(f"[DEBUG] 错误SQL示例 {i}: 相似度={similarity}")
			
 
				+                            self.logger.debug(f"错误SQL示例 {i}: 相似度={similarity}")
			
 
				                             negative_prompt_content += f"问题: {error_example['question']}\n"
			
 
				                             negative_prompt_content += f"错误的SQL: {error_example['sql']}\n\n"
			
 
				                     
			
 
				                     # 将负面提示添加到初始提示中
			
 
				                     initial_prompt += negative_prompt_content
			
 
				                 else:
			
 
				-                    print("[DEBUG] 未找到相关的错误SQL示例")
			
 
				+                    self.logger.debug("未找到相关的错误SQL示例")
			
 
				             except Exception as e:
			
 
				-                print(f"[WARNING] 获取错误SQL示例失败: {e}")
			
 
				+                self.logger.warning(f"获取错误SQL示例失败: {e}")
			
 
				 
			
 
				         initial_prompt += (
			
 
				             "===Response Guidelines \n"
			
 
				             "1. If the provided context is sufficient, please generate a valid SQL query without any explanations for the question. \n"
			
 
				             "2. If the provided context is almost sufficient but requires knowledge of a specific string in a particular column, please generate an intermediate SQL query to find the distinct strings in that column. Prepend the query with a comment saying intermediate_sql \n"
			
 
				             "3. If the provided context is insufficient, please explain why it can't be generated. \n"
			
 
				-            "4. Please use the most relevant table(s). \n"
			
 
				-            "5. If the question has been asked and answered before, please repeat the answer exactly as it was given before. \n"
			
 
				-            f"6. Ensure that the output SQL is {self.dialect}-compliant and executable, and free of syntax errors. \n"
			
 
				-            "7. 在生成 SQL 查询时，如果出现 ORDER BY 子句，请遵循以下规则：\n"
			
 
				+            "4. **Context Understanding**: If the question follows [CONTEXT]...[CURRENT] format, replace pronouns in [CURRENT] with specific entities from [CONTEXT].\n"
			
 
				+            "   - Example: If context mentions 'Nancheng Service Area has the most stalls', and current question is 'How many dining stalls does this service area have?', \n"
			
 
				+            "     interpret it as 'How many dining stalls does Nancheng Service Area have?'\n"
			
 
				+            "5. Please use the most relevant table(s). \n"
			
 
				+            "6. If the question has been asked and answered before, please repeat the answer exactly as it was given before. \n"
			
 
				+            f"7. Ensure that the output SQL is {self.dialect}-compliant and executable, and free of syntax errors. \n"
			
 
				+            "8. 在生成 SQL 查询时，如果出现 ORDER BY 子句，请遵循以下规则：\n"
			
 
				             "   - 对所有的排序字段（如聚合字段 SUM()、普通列等），请在 ORDER BY 中显式添加 NULLS LAST。\n"
			
 
				             "   - 不论是否使用 LIMIT，只要排序字段存在，都必须添加 NULLS LAST，以防止 NULL 排在结果顶部。\n"
			
 
				             "   - 示例参考：\n"
			
 
				             "     - ORDER BY total DESC NULLS LAST\n"
			
 
				             "     - ORDER BY zf_order DESC NULLS LAST\n"
			
 
				             "     - ORDER BY SUM(c.customer_count) DESC NULLS LAST \n"
			
 
				-            "8. 【重要】请在SQL查询中为所有SELECT的列都使用中文别名：\n"
			
 
				+            "9. 【重要】请在SQL查询中为所有SELECT的列都使用中文别名：\n"
			
 
				             "   - 每个列都必须使用 AS 中文别名 的格式，没有例外\n"
			
 
				             "   - 包括原始字段名也要添加中文别名，例如：SELECT gender AS 性别, card_category AS 卡片类型\n"
			
 
				             "   - 计算字段也要有中文别名，例如：SELECT COUNT(*) AS 持卡人数\n"
			
@@ -147,7 +154,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				 
			
 
				         for example in question_sql_list:
			
 
				             if example is None:
			
 
				-                print("example is None")
			
 
				+                self.logger.warning("example is None")
			
 
				             else:
			
 
				                 if example is not None and "question" in example and "sql" in example:
			
 
				                     message_log.append(self.user_message(example["question"]))
			
@@ -225,7 +232,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				         if not DISPLAY_RESULT_THINKING:
			
 
				             original_code = plotly_code
			
 
				             plotly_code = self._remove_thinking_content(plotly_code)
			
 
				-            print(f"[DEBUG] generate_plotly_code隐藏thinking内容 - 原始长度: {len(original_code)}, 处理后长度: {len(plotly_code)}")
			
 
				+            self.logger.debug(f"generate_plotly_code隐藏thinking内容 - 原始长度: {len(original_code)}, 处理后长度: {len(plotly_code)}")
			
 
				 
			
 
				         return self._sanitize_plotly_code(self._extract_python_code(plotly_code))
			
 
				 
			
@@ -270,12 +277,12 @@ class BaseLLMChat(VannaBase, ABC):
 
				         对于Flask应用，这个方法决定了前端是否显示图表生成按钮
			
 
				         """
			
 
				         if df is None or df.empty:
			
 
				-            print(f"[DEBUG] should_generate_chart: df为空，返回False")
			
 
				+            self.logger.debug("should_generate_chart: df为空，返回False")
			
 
				             return False
			
 
				         
			
 
				         # 如果数据有多行或多列，通常适合生成图表
			
 
				         result = len(df) > 1 or len(df.columns) > 1
			
 
				-        print(f"[DEBUG] should_generate_chart: df.shape={df.shape}, 返回{result}")
			
 
				+        self.logger.debug(f"should_generate_chart: df.shape={df.shape}, 返回{result}")
			
 
				         
			
 
				         if result:
			
 
				             return True
			
@@ -290,12 +297,12 @@ class BaseLLMChat(VannaBase, ABC):
 
				             # 清空上次的解释性文本
			
 
				             self.last_llm_explanation = None
			
 
				             
			
 
				-            print(f"[DEBUG] 尝试为问题生成SQL: {question}")
			
 
				+            self.logger.debug(f"尝试为问题生成SQL: {question}")
			
 
				             # 调用父类的 generate_sql
			
 
				             sql = super().generate_sql(question, **kwargs)
			
 
				             
			
 
				             if not sql or sql.strip() == "":
			
 
				-                print(f"[WARNING] 生成的SQL为空")
			
 
				+                self.logger.warning("生成的SQL为空")
			
 
				                 explanation = "无法生成SQL查询，可能是问题描述不够清晰或缺少必要的数据表信息。"
			
 
				                 # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
			
 
				                 if not DISPLAY_RESULT_THINKING:
			
@@ -319,38 +326,38 @@ class BaseLLMChat(VannaBase, ABC):
 
				             
			
 
				             for indicator in error_indicators:
			
 
				                 if indicator in sql_lower:
			
 
				-                    print(f"[WARNING] LLM返回错误信息而非SQL: {sql}")
			
 
				+                    self.logger.warning(f"LLM返回错误信息而非SQL: {sql}")
			
 
				                     # 保存LLM的解释性文本，并根据配置处理thinking内容
			
 
				                     explanation = sql
			
 
				                     if not DISPLAY_RESULT_THINKING:
			
 
				                         explanation = self._remove_thinking_content(explanation)
			
 
				-                        print(f"[DEBUG] 隐藏thinking内容 - SQL生成解释性文本")
			
 
				+                        self.logger.debug("隐藏thinking内容 - SQL生成解释性文本")
			
 
				                     self.last_llm_explanation = explanation
			
 
				                     return None
			
 
				             
			
 
				             # 简单检查是否像SQL语句（至少包含一些SQL关键词）
			
 
				             sql_keywords = ["select", "insert", "update", "delete", "with", "from", "where"]
			
 
				             if not any(keyword in sql_lower for keyword in sql_keywords):
			
 
				-                print(f"[WARNING] 返回内容不像有效SQL: {sql}")
			
 
				+                self.logger.warning(f"返回内容不像有效SQL: {sql}")
			
 
				                 # 保存LLM的解释性文本，并根据配置处理thinking内容
			
 
				                 explanation = sql
			
 
				                 if not DISPLAY_RESULT_THINKING:
			
 
				                     explanation = self._remove_thinking_content(explanation)
			
 
				-                    print(f"[DEBUG] 隐藏thinking内容 - SQL生成非有效SQL内容")
			
 
				+                    self.logger.debug("隐藏thinking内容 - SQL生成非有效SQL内容")
			
 
				                 self.last_llm_explanation = explanation
			
 
				                 return None
			
 
				                 
			
 
				-            print(f"[SUCCESS] 成功生成SQL:\n {sql}")
			
 
				+            self.logger.info(f"成功生成SQL:\n {sql}")
			
 
				             # 清空解释性文本
			
 
				             self.last_llm_explanation = None
			
 
				             return sql
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] SQL生成过程中出现异常: {str(e)}")
			
 
				-            print(f"[ERROR] 异常类型: {type(e).__name__}")
			
 
				+            self.logger.error(f"SQL生成过程中出现异常: {str(e)}")
			
 
				+            self.logger.error(f"异常类型: {type(e).__name__}")
			
 
				             # 导入traceback以获取详细错误信息
			
 
				             import traceback
			
 
				-            print(f"[ERROR] 详细错误信息: {traceback.format_exc()}")
			
 
				+            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
			
 
				             explanation = f"SQL生成过程中出现异常: {str(e)}"
			
 
				             # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
			
 
				             if not DISPLAY_RESULT_THINKING:
			
@@ -372,7 +379,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				         if not DISPLAY_RESULT_THINKING:
			
 
				             original_response = response
			
 
				             response = self._remove_thinking_content(response)
			
 
				-            print(f"[DEBUG] generate_question隐藏thinking内容 - 原始长度: {len(original_response)}, 处理后长度: {len(response)}")
			
 
				+            self.logger.debug(f"generate_question隐藏thinking内容 - 原始长度: {len(original_response)}, 处理后长度: {len(response)}")
			
 
				         
			
 
				         return response
			
 
				 
			
@@ -390,7 +397,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				     #         response = self.submit_prompt(prompt, **kwargs)
			
 
				     #         return response
			
 
				     #     except Exception as e:
			
 
				-    #         print(f"[ERROR] LLM对话失败: {str(e)}")
			
 
				+    #         self.logger.error(f"LLM对话失败: {str(e)}")
			
 
				     #         return f"抱歉，我暂时无法回答您的问题。请稍后再试。"
			
 
				 
			
 
				     def chat_with_llm(self, question: str, system_prompt: str = None, **kwargs) -> str:
			
@@ -421,12 +428,12 @@ class BaseLLMChat(VannaBase, ABC):
 
				             if not DISPLAY_RESULT_THINKING:
			
 
				                 original_response = response
			
 
				                 response = self._remove_thinking_content(response)
			
 
				-                print(f"[DEBUG] chat_with_llm隐藏thinking内容 - 原始长度: {len(original_response)}, 处理后长度: {len(response)}")
			
 
				+                self.logger.debug(f"chat_with_llm隐藏thinking内容 - 原始长度: {len(original_response)}, 处理后长度: {len(response)}")
			
 
				             
			
 
				             return response
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] LLM对话失败: {str(e)}")
			
 
				+            self.logger.error(f"LLM对话失败: {str(e)}")
			
 
				             return f"抱歉，我暂时无法回答您的问题。请稍后再试。"
			
 
				 
			
 
				     def generate_rewritten_question(self, last_question: str, new_question: str, **kwargs) -> str:
			
@@ -443,12 +450,12 @@ class BaseLLMChat(VannaBase, ABC):
 
				         """
			
 
				         # 如果未启用合并功能或没有上一个问题，直接返回新问题
			
 
				         if not REWRITE_QUESTION_ENABLED or last_question is None:
			
 
				-            print(f"[DEBUG] 问题合并功能{'未启用' if not REWRITE_QUESTION_ENABLED else '上一个问题为空'}，直接返回新问题")
			
 
				+            self.logger.debug(f"问题合并功能{'未启用' if not REWRITE_QUESTION_ENABLED else '上一个问题为空'}，直接返回新问题")
			
 
				             return new_question
			
 
				         
			
 
				-        print(f"[DEBUG] 启用问题合并功能，尝试合并问题")
			
 
				-        print(f"[DEBUG] 上一个问题: {last_question}")
			
 
				-        print(f"[DEBUG] 新问题: {new_question}")
			
 
				+        self.logger.debug("启用问题合并功能，尝试合并问题")
			
 
				+        self.logger.debug(f"上一个问题: {last_question}")
			
 
				+        self.logger.debug(f"新问题: {new_question}")
			
 
				         
			
 
				         try:
			
 
				             prompt = [
			
@@ -466,13 +473,13 @@ class BaseLLMChat(VannaBase, ABC):
 
				             if not DISPLAY_RESULT_THINKING:
			
 
				                 original_question = rewritten_question
			
 
				                 rewritten_question = self._remove_thinking_content(rewritten_question)
			
 
				-                print(f"[DEBUG] generate_rewritten_question隐藏thinking内容 - 原始长度: {len(original_question)}, 处理后长度: {len(rewritten_question)}")
			
 
				+                self.logger.debug(f"generate_rewritten_question隐藏thinking内容 - 原始长度: {len(original_question)}, 处理后长度: {len(rewritten_question)}")
			
 
				             
			
 
				-            print(f"[DEBUG] 合并后的问题: {rewritten_question}")
			
 
				+            self.logger.debug(f"合并后的问题: {rewritten_question}")
			
 
				             return rewritten_question
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 问题合并失败: {str(e)}")
			
 
				+            self.logger.error(f"问题合并失败: {str(e)}")
			
 
				             # 如果合并失败，返回新问题
			
 
				             return new_question
			
 
				 
			
@@ -494,14 +501,14 @@ class BaseLLMChat(VannaBase, ABC):
 
				             
			
 
				             # 确保 df 是 pandas DataFrame
			
 
				             if not isinstance(df, pd.DataFrame):
			
 
				-                print(f"[WARNING] df 不是 pandas DataFrame，类型: {type(df)}")
			
 
				+                self.logger.warning(f"df 不是 pandas DataFrame，类型: {type(df)}")
			
 
				                 return "无法生成摘要：数据格式不正确"
			
 
				             
			
 
				             if df.empty:
			
 
				                 return "查询结果为空，无数据可供摘要。"
			
 
				             
			
 
				-            print(f"[DEBUG] 生成摘要 - 问题: {question}")
			
 
				-            print(f"[DEBUG] DataFrame 形状: {df.shape}")
			
 
				+            self.logger.debug(f"生成摘要 - 问题: {question}")
			
 
				+            self.logger.debug(f"DataFrame 形状: {df.shape}")
			
 
				             
			
 
				             # 构建包含中文指令的系统消息
			
 
				             system_content = (
			
@@ -531,15 +538,15 @@ class BaseLLMChat(VannaBase, ABC):
 
				                 # 移除 <think></think> 标签及其内容
			
 
				                 original_summary = summary
			
 
				                 summary = self._remove_thinking_content(summary)
			
 
				-                print(f"[DEBUG] 隐藏thinking内容 - 原始长度: {len(original_summary)}, 处理后长度: {len(summary)}")
			
 
				+                self.logger.debug(f"隐藏thinking内容 - 原始长度: {len(original_summary)}, 处理后长度: {len(summary)}")
			
 
				             
			
 
				-            print(f"[DEBUG] 生成的摘要: {summary[:100]}...")
			
 
				+            self.logger.debug(f"生成的摘要: {summary[:100]}...")
			
 
				             return summary
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 生成摘要失败: {str(e)}")
			
 
				+            self.logger.error(f"生成摘要失败: {str(e)}")
			
 
				             import traceback
			
 
				-            print(f"[ERROR] 详细错误信息: {traceback.format_exc()}")
			
 
				+            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
			
 
				             return f"生成摘要时出现错误：{str(e)}"
			
 
				 
			
 
				     def _remove_thinking_content(self, text: str) -> str:
			
@@ -598,7 +605,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				         try:
			
 
				             sql = self.generate_sql(question=question, allow_llm_to_see_data=allow_llm_to_see_data)
			
 
				         except Exception as e:
			
 
				-            print(e)
			
 
				+            self.logger.error(f"SQL generation error: {e}")
			
 
				             self.last_llm_explanation = str(e)
			
 
				             if print_results:
			
 
				                 return None
			
@@ -608,7 +615,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				         # 如果SQL为空，说明有解释性文本，按照正常流程返回None
			
 
				         # API层会检查 last_llm_explanation 来获取解释
			
 
				         if sql is None:
			
 
				-            print(f"[INFO] 无法生成SQL，解释: {self.last_llm_explanation}")
			
 
				+            self.logger.info(f"无法生成SQL，解释: {self.last_llm_explanation}")
			
 
				             if print_results:
			
 
				                 return None
			
 
				             else:
			
@@ -616,10 +623,10 @@ class BaseLLMChat(VannaBase, ABC):
 
				 
			
 
				         # 以下是正常的SQL执行流程（保持VannaBase原有逻辑）
			
 
				         if print_results:
			
 
				-            print(sql)
			
 
				+            self.logger.info(f"Generated SQL: {sql}")
			
 
				 
			
 
				         if self.run_sql_is_set is False:
			
 
				-            print("If you want to run the SQL query, connect to a database first.")
			
 
				+            self.logger.info("If you want to run the SQL query, connect to a database first.")
			
 
				             if print_results:
			
 
				                 return None
			
 
				             else:
			
@@ -629,7 +636,7 @@ class BaseLLMChat(VannaBase, ABC):
 
				             df = self.run_sql(sql)
			
 
				             
			
 
				             if df is None:
			
 
				-                print("The SQL query returned no results.")
			
 
				+                self.logger.info("The SQL query returned no results.")
			
 
				                 if print_results:
			
 
				                     return None
			
 
				                 else:
			
@@ -638,17 +645,17 @@ class BaseLLMChat(VannaBase, ABC):
 
				             if print_results:
			
 
				                 # 显示结果表格
			
 
				                 if len(df) > 10:
			
 
				-                    print(df.head(10).to_string())
			
 
				-                    print(f"... ({len(df)} rows)")
			
 
				+                    self.logger.info(f"Query results (first 10 rows):\n{df.head(10).to_string()}")
			
 
				+                    self.logger.info(f"... ({len(df)} rows)")
			
 
				                 else:
			
 
				-                    print(df.to_string())
			
 
				+                    self.logger.info(f"Query results:\n{df.to_string()}")
			
 
				 
			
 
				             # 如果启用了自动训练，添加问题-SQL对到训练集
			
 
				             if auto_train:
			
 
				                 try:
			
 
				                     self.add_question_sql(question=question, sql=sql)
			
 
				                 except Exception as e:
			
 
				-                    print(f"Could not add question and sql to training data: {e}")
			
 
				+                    self.logger.warning(f"Could not add question and sql to training data: {e}")
			
 
				 
			
 
				             if visualize:
			
 
				                 try:
			
@@ -668,25 +675,25 @@ class BaseLLMChat(VannaBase, ABC):
 
				                             )
			
 
				                             if fig is not None:
			
 
				                                 if print_results:
			
 
				-                                    print("Chart generated (use fig.show() to display)")
			
 
				+                                    self.logger.info("Chart generated (use fig.show() to display)")
			
 
				                                 return sql, df, fig
			
 
				                             else:
			
 
				-                                print("Could not generate chart")
			
 
				+                                self.logger.warning("Could not generate chart")
			
 
				                                 return sql, df, None
			
 
				                         else:
			
 
				-                            print("No chart generated")
			
 
				+                            self.logger.info("No chart generated")
			
 
				                             return sql, df, None
			
 
				                     else:
			
 
				-                        print("Not generating chart for this data")
			
 
				+                        self.logger.info("Not generating chart for this data")
			
 
				                         return sql, df, None
			
 
				                 except Exception as e:
			
 
				-                    print(f"Couldn't generate chart: {e}")
			
 
				+                    self.logger.error(f"Couldn't generate chart: {e}")
			
 
				                     return sql, df, None
			
 
				             else:
			
 
				                 return sql, df, None
			
 
				 
			
 
				         except Exception as e:
			
 
				-            print("Couldn't run sql: ", e)
			
 
				+            self.logger.error(f"Couldn't run sql: {e}")
			
 
				             if print_results:
			
 
				                 return None
			
 
				             else:
			
--- a/customllm/deepseek_chat.py
+++ b/customllm/deepseek_chat.py
@@ -7,8 +7,8 @@ class DeepSeekChat(BaseLLMChat):
 
				     """DeepSeek AI聊天实现"""
			
 
				     
			
 
				     def __init__(self, config=None):
			
 
				-        print("...DeepSeekChat init...")
			
 
				         super().__init__(config=config)
			
 
				+        self.logger.info("DeepSeekChat init")
			
 
				 
			
 
				         if config is None:
			
 
				             self.client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
			
@@ -43,7 +43,7 @@ class DeepSeekChat(BaseLLMChat):
 
				         # DeepSeek API约束：enable_thinking=True时建议使用stream=True
			
 
				         # 如果stream=False但enable_thinking=True，则忽略enable_thinking
			
 
				         if enable_thinking and not stream_mode:
			
 
				-            print("WARNING: enable_thinking=True 不生效，因为它需要 stream=True")
			
 
				+            self.logger.warning("enable_thinking=True 不生效，因为它需要 stream=True")
			
 
				             enable_thinking = False
			
 
				 
			
 
				         # 确定使用的模型
			
@@ -68,18 +68,18 @@ class DeepSeekChat(BaseLLMChat):
 
				 
			
 
				         # 模型兼容性提示（但不强制切换）
			
 
				         if enable_thinking and model not in ["deepseek-reasoner"]:
			
 
				-            print(f"提示：模型 {model} 可能不支持推理功能，推理相关参数将被忽略")
			
 
				+            self.logger.warning(f"提示：模型 {model} 可能不支持推理功能，推理相关参数将被忽略")
			
 
				 
			
 
				-        print(f"\nUsing model {model} for {num_tokens} tokens (approx)")
			
 
				-        print(f"Enable thinking: {enable_thinking}, Stream mode: {stream_mode}")
			
 
				+        self.logger.info(f"\nUsing model {model} for {num_tokens} tokens (approx)")
			
 
				+        self.logger.info(f"Enable thinking: {enable_thinking}, Stream mode: {stream_mode}")
			
 
				 
			
 
				         # 方案1：通过 system prompt 控制中文输出（DeepSeek 不支持 language 参数）
			
 
				         # 检查配置中的语言设置，并在 system prompt 中添加中文指令
			
 
				         # language_setting = self.config.get("language", "").lower() if self.config else ""
			
 
				-        # print(f"DEBUG: language_setting='{language_setting}', model='{model}', enable_thinking={enable_thinking}")
			
 
				+        # self.logger.debug(f"language_setting='{language_setting}', model='{model}', enable_thinking={enable_thinking}")
			
 
				         
			
 
				         # if language_setting == "chinese" and enable_thinking:
			
 
				-        #     print("DEBUG: ✅ 触发中文指令添加")
			
 
				+        #     self.logger.debug("触发中文指令添加")
			
 
				         #     # 为推理模型添加中文思考指令
			
 
				         #     chinese_instruction = {"role": "system", "content": "请用中文进行思考和回答。在推理过程中，请使用中文进行分析和思考。<think></think>之间也请使用中文"}
			
 
				         #     # 如果第一条消息不是 system 消息，则添加中文指令
			
@@ -90,7 +90,7 @@ class DeepSeekChat(BaseLLMChat):
 
				         #         existing_content = prompt[0]["content"]
			
 
				         #         prompt[0]["content"] = f"{existing_content}\n\n请用中文进行思考和回答。在推理过程中，请使用中文进行分析和思考。<think></think>之间也请使用中文"
			
 
				         # else:
			
 
				-        #     print(f"DEBUG: ❌ 未触发中文指令 - language_setting==chinese: {language_setting == 'chinese'}, model==deepseek-reasoner: {model == 'deepseek-reasoner'}, enable_thinking: {enable_thinking}")
			
 
				+        #     self.logger.debug(f"未触发中文指令 - language_setting==chinese: {language_setting == 'chinese'}, model==deepseek-reasoner: {model == 'deepseek-reasoner'}, enable_thinking: {enable_thinking}")
			
 
				 
			
 
				         # 构建 API 调用参数
			
 
				         api_params = {
			
@@ -112,7 +112,7 @@ class DeepSeekChat(BaseLLMChat):
 
				             unsupported_params = ['top_p', 'presence_penalty', 'frequency_penalty', 'logprobs', 'top_logprobs']
			
 
				             for param in unsupported_params:
			
 
				                 if param in filtered_kwargs:
			
 
				-                    print(f"警告：deepseek-reasoner 不支持参数 {param}，已忽略")
			
 
				+                    self.logger.warning(f"deepseek-reasoner 不支持参数 {param}，已忽略")
			
 
				                     filtered_kwargs.pop(param, None)
			
 
				         else:
			
 
				             # deepseek-chat 等其他模型，只过滤明确会导致错误的参数
			
@@ -125,9 +125,9 @@ class DeepSeekChat(BaseLLMChat):
 
				         if stream_mode:
			
 
				             # 流式处理模式
			
 
				             if model == "deepseek-reasoner" and enable_thinking:
			
 
				-                print("使用流式处理模式，启用推理功能")
			
 
				+                self.logger.info("使用流式处理模式，启用推理功能")
			
 
				             else:
			
 
				-                print("使用流式处理模式，常规聊天")
			
 
				+                self.logger.info("使用流式处理模式，常规聊天")
			
 
				             
			
 
				             response_stream = self.client.chat.completions.create(**api_params)
			
 
				             
			
@@ -151,7 +151,7 @@ class DeepSeekChat(BaseLLMChat):
 
				                 # 可选：打印推理过程
			
 
				                 if collected_reasoning:
			
 
				                     reasoning_text = "".join(collected_reasoning)
			
 
				-                    print("Model reasoning process:\n", reasoning_text)
			
 
				+                    self.logger.debug("Model reasoning process:\n" + reasoning_text)
			
 
				                 
			
 
				                 # 方案2：返回包含 <think></think> 标签的完整内容，与 QianWen 保持一致
			
 
				                 final_content = "".join(collected_content)
			
@@ -173,9 +173,9 @@ class DeepSeekChat(BaseLLMChat):
 
				         else:
			
 
				             # 非流式处理模式
			
 
				             if model == "deepseek-reasoner" and enable_thinking:
			
 
				-                print("使用非流式处理模式，启用推理功能")
			
 
				+                self.logger.info("使用非流式处理模式，启用推理功能")
			
 
				             else:
			
 
				-                print("使用非流式处理模式，常规聊天")
			
 
				+                self.logger.info("使用非流式处理模式，常规聊天")
			
 
				             
			
 
				             response = self.client.chat.completions.create(**api_params)
			
 
				             
			
@@ -187,7 +187,7 @@ class DeepSeekChat(BaseLLMChat):
 
				                 reasoning_content = ""
			
 
				                 if hasattr(message, 'reasoning_content') and message.reasoning_content:
			
 
				                     reasoning_content = message.reasoning_content
			
 
				-                    print("Model reasoning process:\n", reasoning_content)
			
 
				+                    self.logger.debug("Model reasoning process:\n" + reasoning_content)
			
 
				                 
			
 
				                 # 方案2：返回包含 <think></think> 标签的完整内容，与 QianWen 保持一致
			
 
				                 final_content = message.content
			
--- a/customllm/ollama_chat.py
+++ b/customllm/ollama_chat.py
@@ -9,8 +9,8 @@ class OllamaChat(BaseLLMChat):
 
				     """Ollama AI聊天实现"""
			
 
				     
			
 
				     def __init__(self, config=None):
			
 
				-        print("...OllamaChat init...")
			
 
				         super().__init__(config=config)
			
 
				+        self.logger.info("OllamaChat init")
			
 
				 
			
 
				         # Ollama特定的配置参数
			
 
				         self.base_url = config.get("base_url", "http://localhost:11434") if config else "http://localhost:11434"
			
@@ -31,13 +31,13 @@ class OllamaChat(BaseLLMChat):
 
				         try:
			
 
				             response = requests.get(f"{self.base_url}/api/tags", timeout=5)
			
 
				             if response.status_code == 200:
			
 
				-                print(f"✅ Ollama 服务连接正常: {self.base_url}")
			
 
				+                self.logger.info(f"Ollama 服务连接正常: {self.base_url}")
			
 
				                 return True
			
 
				             else:
			
 
				-                print(f"⚠️ Ollama 服务响应异常: {response.status_code}")
			
 
				+                self.logger.warning(f"Ollama 服务响应异常: {response.status_code}")
			
 
				                 return False
			
 
				         except requests.exceptions.RequestException as e:
			
 
				-            print(f"❌ Ollama 服务连接失败: {e}")
			
 
				+            self.logger.error(f"Ollama 服务连接失败: {e}")
			
 
				             return False
			
 
				 
			
 
				     def submit_prompt(self, prompt, **kwargs) -> str:
			
@@ -61,7 +61,7 @@ class OllamaChat(BaseLLMChat):
 
				         # Ollama 约束：enable_thinking=True时建议使用stream=True
			
 
				         # 如果stream=False但enable_thinking=True，则忽略enable_thinking
			
 
				         if enable_thinking and not stream_mode:
			
 
				-            print("WARNING: enable_thinking=True 不生效，因为它需要 stream=True")
			
 
				+            self.logger.warning("enable_thinking=True 不生效，因为它需要 stream=True")
			
 
				             enable_thinking = False
			
 
				 
			
 
				         # 智能模型选择
			
@@ -72,10 +72,10 @@ class OllamaChat(BaseLLMChat):
 
				         
			
 
				         # 模型兼容性提示（但不强制切换）
			
 
				         if enable_thinking and not is_reasoning_model:
			
 
				-            print(f"提示：模型 {model} 不是专门的推理模型，但仍会尝试启用推理功能")
			
 
				+            self.logger.warning(f"提示：模型 {model} 不是专门的推理模型，但仍会尝试启用推理功能")
			
 
				 
			
 
				-        print(f"\nUsing Ollama model {model} for {num_tokens} tokens (approx)")
			
 
				-        print(f"Enable thinking: {enable_thinking}, Stream mode: {stream_mode}")
			
 
				+        self.logger.info(f"\nUsing Ollama model {model} for {num_tokens} tokens (approx)")
			
 
				+        self.logger.info(f"Enable thinking: {enable_thinking}, Stream mode: {stream_mode}")
			
 
				 
			
 
				         # 准备Ollama API请求
			
 
				         url = f"{self.base_url}/api/chat"
			
@@ -91,22 +91,22 @@ class OllamaChat(BaseLLMChat):
 
				             if stream_mode:
			
 
				                 # 流式处理模式
			
 
				                 if enable_thinking:
			
 
				-                    print("使用流式处理模式，启用推理功能")
			
 
				+                    self.logger.info("使用流式处理模式，启用推理功能")
			
 
				                 else:
			
 
				-                    print("使用流式处理模式，常规聊天")
			
 
				+                    self.logger.info("使用流式处理模式，常规聊天")
			
 
				                 
			
 
				                 return self._handle_stream_response(url, payload, enable_thinking)
			
 
				             else:
			
 
				                 # 非流式处理模式
			
 
				                 if enable_thinking:
			
 
				-                    print("使用非流式处理模式，启用推理功能")
			
 
				+                    self.logger.info("使用非流式处理模式，启用推理功能")
			
 
				                 else:
			
 
				-                    print("使用非流式处理模式，常规聊天")
			
 
				+                    self.logger.info("使用非流式处理模式，常规聊天")
			
 
				                 
			
 
				                 return self._handle_non_stream_response(url, payload, enable_thinking)
			
 
				                 
			
 
				         except requests.exceptions.RequestException as e:
			
 
				-            print(f"Ollama API请求失败: {e}")
			
 
				+            self.logger.error(f"Ollama API请求失败: {e}")
			
 
				             raise Exception(f"Ollama API调用失败: {str(e)}")
			
 
				 
			
 
				     def _handle_stream_response(self, url: str, payload: dict, enable_reasoning: bool) -> str:
			
@@ -146,7 +146,7 @@ class OllamaChat(BaseLLMChat):
 
				             reasoning_content, final_content = self._extract_reasoning(full_content)
			
 
				             
			
 
				             if reasoning_content:
			
 
				-                print("Model reasoning process:\n", reasoning_content)
			
 
				+                self.logger.debug("Model reasoning process:\n" + reasoning_content)
			
 
				                 return final_content
			
 
				         
			
 
				         return full_content
			
@@ -169,7 +169,7 @@ class OllamaChat(BaseLLMChat):
 
				             reasoning_content, final_content = self._extract_reasoning(content)
			
 
				             
			
 
				             if reasoning_content:
			
 
				-                print("Model reasoning process:\n", reasoning_content)
			
 
				+                self.logger.debug("Model reasoning process:\n" + reasoning_content)
			
 
				                 return final_content
			
 
				         
			
 
				         return content
			
@@ -197,17 +197,17 @@ class OllamaChat(BaseLLMChat):
 
				                 
			
 
				                 # 检查目标模型是否存在
			
 
				                 if self.model not in result["available_models"]:
			
 
				-                    print(f"警告：模型 {self.model} 不存在，尝试拉取...")
			
 
				+                    self.logger.warning(f"模型 {self.model} 不存在，尝试拉取...")
			
 
				                     if not self.pull_model(self.model):
			
 
				                         result["message"] = f"模型 {self.model} 不存在且拉取失败"
			
 
				                         return result
			
 
				             except Exception as e:
			
 
				-                print(f"获取模型列表失败: {e}")
			
 
				+                self.logger.error(f"获取模型列表失败: {e}")
			
 
				                 result["available_models"] = [self.model]
			
 
				             
			
 
				-            print(f"测试Ollama连接 - 模型: {self.model}")
			
 
				-            print(f"Ollama服务地址: {self.base_url}")
			
 
				-            print(f"可用模型: {', '.join(result['available_models'])}")
			
 
				+            self.logger.info(f"测试Ollama连接 - 模型: {self.model}")
			
 
				+            self.logger.info(f"Ollama服务地址: {self.base_url}")
			
 
				+            self.logger.info(f"可用模型: {', '.join(result['available_models'])}")
			
 
				             
			
 
				             # 测试简单对话
			
 
				             prompt = [self.user_message(test_prompt)]
			
@@ -243,10 +243,10 @@ class OllamaChat(BaseLLMChat):
 
				                     if reasoning_models:
			
 
				                         return reasoning_models[0]  # 选择第一个推理模型
			
 
				                     else:
			
 
				-                        print("警告：未找到推理模型，使用默认模型")
			
 
				+                        self.logger.warning("未找到推理模型，使用默认模型")
			
 
				                         return self.model
			
 
				                 except Exception as e:
			
 
				-                    print(f"获取模型列表时出错: {e}，使用默认模型")
			
 
				+                    self.logger.error(f"获取模型列表时出错: {e}，使用默认模型")
			
 
				                     return self.model
			
 
				             else:
			
 
				                 # 根据 token 数量选择模型
			
@@ -258,7 +258,7 @@ class OllamaChat(BaseLLMChat):
 
				                         if long_context_models:
			
 
				                             return long_context_models[0]
			
 
				                     except Exception as e:
			
 
				-                        print(f"获取模型列表时出错: {e}，使用默认模型")
			
 
				+                        self.logger.error(f"获取模型列表时出错: {e}，使用默认模型")
			
 
				                 
			
 
				                 return self.model
			
 
				 
			
@@ -357,26 +357,26 @@ class OllamaChat(BaseLLMChat):
 
				             models = [model["name"] for model in data.get("models", [])]
			
 
				             return models if models else [self.model]  # 如果没有模型，返回默认模型
			
 
				         except requests.exceptions.RequestException as e:
			
 
				-            print(f"获取模型列表失败: {e}")
			
 
				+            self.logger.error(f"获取模型列表失败: {e}")
			
 
				             return [self.model]  # 返回默认模型
			
 
				         except Exception as e:
			
 
				-            print(f"解析模型列表失败: {e}")
			
 
				+            self.logger.error(f"解析模型列表失败: {e}")
			
 
				             return [self.model]  # 返回默认模型
			
 
				 
			
 
				     def pull_model(self, model_name: str) -> bool:
			
 
				         """拉取模型"""
			
 
				         try:
			
 
				-            print(f"正在拉取模型: {model_name}")
			
 
				+            self.logger.info(f"正在拉取模型: {model_name}")
			
 
				             response = requests.post(
			
 
				                 f"{self.base_url}/api/pull",
			
 
				                 json={"name": model_name},
			
 
				                 timeout=300  # 拉取模型可能需要较长时间
			
 
				             )
			
 
				             response.raise_for_status()
			
 
				-            print(f"✅ 模型 {model_name} 拉取成功")
			
 
				+            self.logger.info(f"模型 {model_name} 拉取成功")
			
 
				             return True
			
 
				         except requests.exceptions.RequestException as e:
			
 
				-            print(f"❌ 模型 {model_name} 拉取失败: {e}")
			
 
				+            self.logger.error(f"模型 {model_name} 拉取失败: {e}")
			
 
				             return False
			
 
				 
			
 
				     def delete_model(self, model_name: str) -> bool:
			
@@ -388,10 +388,10 @@ class OllamaChat(BaseLLMChat):
 
				                 timeout=self.timeout
			
 
				             )
			
 
				             response.raise_for_status()
			
 
				-            print(f"✅ 模型 {model_name} 删除成功")
			
 
				+            self.logger.info(f"模型 {model_name} 删除成功")
			
 
				             return True
			
 
				         except requests.exceptions.RequestException as e:
			
 
				-            print(f"❌ 模型 {model_name} 删除失败: {e}")
			
 
				+            self.logger.error(f"模型 {model_name} 删除失败: {e}")
			
 
				             return False
			
 
				 
			
 
				     def get_model_info(self, model_name: str) -> Optional[Dict]:
			
@@ -405,7 +405,7 @@ class OllamaChat(BaseLLMChat):
 
				             response.raise_for_status()
			
 
				             return response.json()
			
 
				         except requests.exceptions.RequestException as e:
			
 
				-            print(f"获取模型信息失败: {e}")
			
 
				+            self.logger.error(f"获取模型信息失败: {e}")
			
 
				             return None
			
 
				 
			
 
				     def get_system_info(self) -> Dict:
			
--- a/customllm/qianwen_chat.py
+++ b/customllm/qianwen_chat.py
@@ -7,8 +7,8 @@ class QianWenChat(BaseLLMChat):
 
				     """千问AI聊天实现"""
			
 
				     
			
 
				     def __init__(self, client=None, config=None):
			
 
				-        print("...QianWenChat init...")
			
 
				         super().__init__(config=config)
			
 
				+        self.logger.info("QianWenChat init")
			
 
				 
			
 
				         if "api_type" in config:
			
 
				             raise Exception(
			
@@ -65,7 +65,7 @@ class QianWenChat(BaseLLMChat):
 
				         # 千问API约束：enable_thinking=True时必须stream=True
			
 
				         # 如果stream=False但enable_thinking=True，则忽略enable_thinking
			
 
				         if enable_thinking and not stream_mode:
			
 
				-            print("WARNING: enable_thinking=True 不生效，因为它需要 stream=True")
			
 
				+            self.logger.warning("enable_thinking=True 不生效，因为它需要 stream=True")
			
 
				             enable_thinking = False
			
 
				         
			
 
				         # 创建一个干净的kwargs副本，移除可能导致API错误的自定义参数
			
@@ -112,15 +112,15 @@ class QianWenChat(BaseLLMChat):
 
				                 model = "qwen-plus"
			
 
				             common_params["model"] = model
			
 
				         
			
 
				-        print(f"\nUsing model {model} for {num_tokens} tokens (approx)")
			
 
				-        print(f"Enable thinking: {enable_thinking}, Stream mode: {stream_mode}")
			
 
				+        self.logger.info(f"\nUsing model {model} for {num_tokens} tokens (approx)")
			
 
				+        self.logger.info(f"Enable thinking: {enable_thinking}, Stream mode: {stream_mode}")
			
 
				         
			
 
				         if stream_mode:
			
 
				             # 流式处理模式
			
 
				             if enable_thinking:
			
 
				-                print("使用流式处理模式，启用thinking功能")
			
 
				+                self.logger.info("使用流式处理模式，启用thinking功能")
			
 
				             else:
			
 
				-                print("使用流式处理模式，不启用thinking功能")
			
 
				+                self.logger.info("使用流式处理模式，不启用thinking功能")
			
 
				             
			
 
				             response_stream = self.client.chat.completions.create(**common_params)
			
 
				             
			
@@ -144,7 +144,7 @@ class QianWenChat(BaseLLMChat):
 
				             # 可以在这里处理thinking的展示逻辑，如保存到日志等
			
 
				             if enable_thinking and collected_thinking:
			
 
				                 thinking_text = "".join(collected_thinking)
			
 
				-                print("Model thinking process:\n", thinking_text)
			
 
				+                self.logger.debug("Model thinking process:\n" + thinking_text)
			
 
				             
			
 
				             # 返回包含 <think></think> 标签的完整内容，与界面显示需求保持一致
			
 
				             final_content = "".join(collected_content)
			
@@ -155,7 +155,7 @@ class QianWenChat(BaseLLMChat):
 
				                 return final_content
			
 
				         else:
			
 
				             # 非流式处理模式
			
 
				-            print("使用非流式处理模式")
			
 
				+            self.logger.info("使用非流式处理模式")
			
 
				             response = self.client.chat.completions.create(**common_params)
			
 
				             
			
 
				             # Find the first response from the chatbot that has text in it (some responses may not have text)
			
--- a/custompgvector/pgvector.py
+++ b/custompgvector/pgvector.py
@@ -7,6 +7,7 @@ import pandas as pd
 
				 from langchain_core.documents import Document
			
 
				 from langchain_postgres.vectorstores import PGVector
			
 
				 from sqlalchemy import create_engine, text
			
 
				+from core.logging import get_vanna_logger
			
 
				 
			
 
				 from vanna.exceptions import ValidationError
			
 
				 from vanna.base import VannaBase
			
@@ -23,6 +24,9 @@ class PG_VectorStore(VannaBase):
 
				                 "A valid 'config' dictionary with a 'connection_string' is required.")
			
 
				 
			
 
				         VannaBase.__init__(self, config=config)
			
 
				+        
			
 
				+        # 初始化日志
			
 
				+        self.logger = get_vanna_logger("PGVector")
			
 
				 
			
 
				         if config and "connection_string" in config:
			
 
				             self.connection_string = config.get("connection_string")
			
@@ -135,7 +139,7 @@ class PG_VectorStore(VannaBase):
 
				                 if generated_embedding:
			
 
				                     embedding_cache.cache_embedding(question, generated_embedding)
			
 
				             except Exception as e:
			
 
				-                print(f"[WARNING] 缓存embedding失败: {e}")
			
 
				+                self.logger.warning(f"缓存embedding失败: {e}")
			
 
				 
			
 
				         results = []
			
 
				         for doc, score in docs_with_scores:
			
@@ -146,12 +150,16 @@ class PG_VectorStore(VannaBase):
 
				             similarity = round(1 - score, 4)
			
 
				 
			
 
				             # 每条记录单独打印
			
 
				-            print(f"[DEBUG] SQL Match: {base.get('question', '')} | similarity: {similarity}")
			
 
				+            self.logger.debug(f"SQL Match: {base.get('question', '')} | similarity: {similarity}")
			
 
				 
			
 
				             # 添加 similarity 字段
			
 
				             base["similarity"] = similarity
			
 
				             results.append(base)
			
 
				 
			
 
				+        # 检查原始查询结果是否为空
			
 
				+        if not results:
			
 
				+            self.logger.warning(f"向量查询未找到任何相似的SQL问答对，问题: {question}")
			
 
				+
			
 
				         # 应用阈值过滤
			
 
				         filtered_results = self._apply_score_threshold_filter(
			
 
				             results, 
			
@@ -159,6 +167,10 @@ class PG_VectorStore(VannaBase):
 
				             "SQL"
			
 
				         )
			
 
				 
			
 
				+        # 检查过滤后结果是否为空
			
 
				+        if results and not filtered_results:
			
 
				+            self.logger.warning(f"向量查询找到了 {len(results)} 条SQL问答对，但全部被阈值过滤掉，问题: {question}")
			
 
				+
			
 
				         return filtered_results
			
 
				 
			
 
				     def get_related_ddl(self, question: str, **kwargs) -> list:
			
@@ -186,7 +198,7 @@ class PG_VectorStore(VannaBase):
 
				                 if generated_embedding:
			
 
				                     embedding_cache.cache_embedding(question, generated_embedding)
			
 
				             except Exception as e:
			
 
				-                print(f"[WARNING] 缓存embedding失败: {e}")
			
 
				+                self.logger.warning(f"缓存embedding失败: {e}")
			
 
				 
			
 
				         results = []
			
 
				         for doc, score in docs_with_scores:
			
@@ -194,7 +206,7 @@ class PG_VectorStore(VannaBase):
 
				             similarity = round(1 - score, 4)
			
 
				 
			
 
				             # 每条记录单独打印
			
 
				-            print(f"[DEBUG] DDL Match: {doc.page_content[:50]}... | similarity: {similarity}")
			
 
				+            self.logger.debug(f"DDL Match: {doc.page_content[:50]}... | similarity: {similarity}")
			
 
				 
			
 
				             # 添加 similarity 字段
			
 
				             result = {
			
@@ -203,6 +215,10 @@ class PG_VectorStore(VannaBase):
 
				             }
			
 
				             results.append(result)
			
 
				 
			
 
				+        # 检查原始查询结果是否为空
			
 
				+        if not results:
			
 
				+            self.logger.warning(f"向量查询未找到任何相关的DDL表结构，问题: {question}")
			
 
				+
			
 
				         # 应用阈值过滤
			
 
				         filtered_results = self._apply_score_threshold_filter(
			
 
				             results, 
			
@@ -210,6 +226,10 @@ class PG_VectorStore(VannaBase):
 
				             "DDL"
			
 
				         )
			
 
				 
			
 
				+        # 检查过滤后结果是否为空
			
 
				+        if results and not filtered_results:
			
 
				+            self.logger.warning(f"向量查询找到了 {len(results)} 条DDL表结构，但全部被阈值过滤掉，问题: {question}")
			
 
				+
			
 
				         return filtered_results
			
 
				 
			
 
				     def get_related_documentation(self, question: str, **kwargs) -> list:
			
@@ -237,7 +257,7 @@ class PG_VectorStore(VannaBase):
 
				                 if generated_embedding:
			
 
				                     embedding_cache.cache_embedding(question, generated_embedding)
			
 
				             except Exception as e:
			
 
				-                print(f"[WARNING] 缓存embedding失败: {e}")
			
 
				+                self.logger.warning(f"缓存embedding失败: {e}")
			
 
				 
			
 
				         results = []
			
 
				         for doc, score in docs_with_scores:
			
@@ -245,7 +265,7 @@ class PG_VectorStore(VannaBase):
 
				             similarity = round(1 - score, 4)
			
 
				 
			
 
				             # 每条记录单独打印
			
 
				-            print(f"[DEBUG] Doc Match: {doc.page_content[:50]}... | similarity: {similarity}")
			
 
				+            self.logger.debug(f"Doc Match: {doc.page_content[:50]}... | similarity: {similarity}")
			
 
				 
			
 
				             # 添加 similarity 字段
			
 
				             result = {
			
@@ -254,6 +274,10 @@ class PG_VectorStore(VannaBase):
 
				             }
			
 
				             results.append(result)
			
 
				 
			
 
				+        # 检查原始查询结果是否为空
			
 
				+        if not results:
			
 
				+            self.logger.warning(f"向量查询未找到任何相关的文档，问题: {question}")
			
 
				+
			
 
				         # 应用阈值过滤
			
 
				         filtered_results = self._apply_score_threshold_filter(
			
 
				             results, 
			
@@ -261,6 +285,10 @@ class PG_VectorStore(VannaBase):
 
				             "DOC"
			
 
				         )
			
 
				 
			
 
				+        # 检查过滤后结果是否为空
			
 
				+        if results and not filtered_results:
			
 
				+            self.logger.warning(f"向量查询找到了 {len(results)} 条文档，但全部被阈值过滤掉，问题: {question}")
			
 
				+
			
 
				         return filtered_results
			
 
				 
			
 
				     def _apply_score_threshold_filter(self, results: list, threshold_config_key: str, result_type: str) -> list:
			
@@ -284,19 +312,19 @@ class PG_VectorStore(VannaBase):
 
				             enable_threshold = getattr(app_config, 'ENABLE_RESULT_VECTOR_SCORE_THRESHOLD', False)
			
 
				             threshold = getattr(app_config, threshold_config_key, 0.65)
			
 
				         except (ImportError, AttributeError) as e:
			
 
				-            print(f"[WARNING] 无法加载阈值配置: {e}，使用默认值")
			
 
				+            self.logger.warning(f"无法加载阈值配置: {e}，使用默认值")
			
 
				             enable_threshold = False
			
 
				             threshold = 0.65
			
 
				         
			
 
				         # 如果未启用阈值过滤，直接返回原结果
			
 
				         if not enable_threshold:
			
 
				-            print(f"[DEBUG] {result_type} 阈值过滤未启用，返回全部 {len(results)} 条结果")
			
 
				+            self.logger.debug(f"{result_type} 阈值过滤未启用，返回全部 {len(results)} 条结果")
			
 
				             return results
			
 
				         
			
 
				         total_count = len(results)
			
 
				         min_required = max((total_count + 1) // 2, 1)
			
 
				         
			
 
				-        print(f"[DEBUG] {result_type} 阈值过滤: 总数={total_count}, 阈值={threshold}, 最少保留={min_required}")
			
 
				+        self.logger.debug(f"{result_type} 阈值过滤: 总数={total_count}, 阈值={threshold}, 最少保留={min_required}")
			
 
				         
			
 
				         # 按相似度降序排序（确保最相似的在前面）
			
 
				         sorted_results = sorted(results, key=lambda x: x.get('similarity', 0), reverse=True)
			
@@ -309,20 +337,20 @@ class PG_VectorStore(VannaBase):
 
				             # 情况1: 满足阈值的结果数量 >= 最少保留数量，返回满足阈值的结果
			
 
				             filtered_results = above_threshold
			
 
				             filtered_count = len(above_threshold)
			
 
				-            print(f"[DEBUG] {result_type} 过滤结果: 保留 {filtered_count} 条, 过滤掉 {total_count - filtered_count} 条 (全部满足阈值)")
			
 
				+            self.logger.debug(f"{result_type} 过滤结果: 保留 {filtered_count} 条, 过滤掉 {total_count - filtered_count} 条 (全部满足阈值)")
			
 
				         else:
			
 
				             # 情况2: 满足阈值的结果数量 < 最少保留数量，强制保留前 min_required 条
			
 
				             filtered_results = sorted_results[:min_required]
			
 
				             above_count = len(above_threshold)
			
 
				             below_count = min_required - above_count
			
 
				             filtered_count = min_required
			
 
				-            print(f"[DEBUG] {result_type} 过滤结果: 保留 {filtered_count} 条, 过滤掉 {total_count - filtered_count} 条 (满足阈值: {above_count}, 强制保留: {below_count})")
			
 
				+            self.logger.debug(f"{result_type} 过滤结果: 保留 {filtered_count} 条, 过滤掉 {total_count - filtered_count} 条 (满足阈值: {above_count}, 强制保留: {below_count})")
			
 
				         
			
 
				         # 打印过滤详情
			
 
				         for i, result in enumerate(filtered_results):
			
 
				             similarity = result.get('similarity', 0)
			
 
				             status = "✓" if similarity >= threshold else "✗"
			
 
				-            print(f"[DEBUG] {result_type} 保留 {i+1}: similarity={similarity} {status}")
			
 
				+            self.logger.debug(f"{result_type} 保留 {i+1}: similarity={similarity} {status}")
			
 
				         
			
 
				         return filtered_results
			
 
				 
			
@@ -350,17 +378,17 @@ class PG_VectorStore(VannaBase):
 
				             enable_threshold = getattr(app_config, 'ENABLE_RESULT_VECTOR_SCORE_THRESHOLD', False)
			
 
				             threshold = getattr(app_config, 'RESULT_VECTOR_ERROR_SQL_SCORE_THRESHOLD', 0.5)
			
 
				         except (ImportError, AttributeError) as e:
			
 
				-            print(f"[WARNING] 无法加载错误SQL阈值配置: {e}，使用默认值")
			
 
				+            self.logger.warning(f"无法加载错误SQL阈值配置: {e}，使用默认值")
			
 
				             enable_threshold = False
			
 
				             threshold = 0.5
			
 
				         
			
 
				         # 如果未启用阈值过滤，直接返回原结果
			
 
				         if not enable_threshold:
			
 
				-            print(f"[DEBUG] Error SQL 阈值过滤未启用，返回全部 {len(results)} 条结果")
			
 
				+            self.logger.debug(f"Error SQL 阈值过滤未启用，返回全部 {len(results)} 条结果")
			
 
				             return results
			
 
				         
			
 
				         total_count = len(results)
			
 
				-        print(f"[DEBUG] Error SQL 阈值过滤: 总数={total_count}, 阈值={threshold}")
			
 
				+        self.logger.debug(f"Error SQL 阈值过滤: 总数={total_count}, 阈值={threshold}")
			
 
				         
			
 
				         # 按相似度降序排序（确保最相似的在前面）
			
 
				         sorted_results = sorted(results, key=lambda x: x.get('similarity', 0), reverse=True)
			
@@ -372,13 +400,13 @@ class PG_VectorStore(VannaBase):
 
				         filtered_out_count = total_count - filtered_count
			
 
				         
			
 
				         if filtered_count > 0:
			
 
				-            print(f"[DEBUG] Error SQL 过滤结果: 保留 {filtered_count} 条, 过滤掉 {filtered_out_count} 条")
			
 
				+            self.logger.debug(f"Error SQL 过滤结果: 保留 {filtered_count} 条, 过滤掉 {filtered_out_count} 条")
			
 
				             # 打印保留的结果详情
			
 
				             for i, result in enumerate(filtered_results):
			
 
				                 similarity = result.get('similarity', 0)
			
 
				-                print(f"[DEBUG] Error SQL 保留 {i+1}: similarity={similarity} ✓")
			
 
				+                self.logger.debug(f"Error SQL 保留 {i+1}: similarity={similarity} ✓")
			
 
				         else:
			
 
				-            print(f"[DEBUG] Error SQL 过滤结果: 所有 {total_count} 条结果都低于阈值 {threshold}，返回空列表")
			
 
				+            self.logger.debug(f"Error SQL 过滤结果: 所有 {total_count} 条结果都低于阈值 {threshold}，返回空列表")
			
 
				         
			
 
				         return filtered_results
			
 
				 
			
@@ -610,7 +638,7 @@ class PG_VectorStore(VannaBase):
 
				                     if generated_embedding:
			
 
				                         embedding_cache.cache_embedding(question, generated_embedding)
			
 
				                 except Exception as e:
			
 
				-                    print(f"[WARNING] 缓存embedding失败: {e}")
			
 
				+                    self.logger.warning(f"缓存embedding失败: {e}")
			
 
				             
			
 
				             results = []
			
 
				             for doc, score in docs_with_scores:
			
@@ -622,21 +650,29 @@ class PG_VectorStore(VannaBase):
 
				                     similarity = round(1 - score, 4)
			
 
				                     
			
 
				                     # 每条记录单独打印
			
 
				-                    print(f"[DEBUG] Error SQL Match: {base.get('question', '')} | similarity: {similarity}")
			
 
				+                    self.logger.debug(f"Error SQL Match: {base.get('question', '')} | similarity: {similarity}")
			
 
				                     
			
 
				                     # 添加 similarity 字段
			
 
				                     base["similarity"] = similarity
			
 
				                     results.append(base)
			
 
				                     
			
 
				                 except (ValueError, SyntaxError) as e:
			
 
				-                    print(f"Error parsing error SQL document: {e}")
			
 
				+                    self.logger.error(f"Error parsing error SQL document: {e}")
			
 
				                     continue
			
 
				             
			
 
				+            # 检查原始查询结果是否为空
			
 
				+            if not results:
			
 
				+                self.logger.warning(f"向量查询未找到任何相关的错误SQL示例，问题: {question}")
			
 
				+
			
 
				             # 应用错误SQL特有的阈值过滤逻辑
			
 
				             filtered_results = self._apply_error_sql_threshold_filter(results)
			
 
				             
			
 
				+            # 检查过滤后结果是否为空
			
 
				+            if results and not filtered_results:
			
 
				+                self.logger.warning(f"向量查询找到了 {len(results)} 条错误SQL示例，但全部被阈值过滤掉，问题: {question}")
			
 
				+
			
 
				             return filtered_results
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"Error retrieving error SQL examples: {e}")
			
 
				+            self.logger.error(f"Error retrieving error SQL examples: {e}")
			
 
				             return []
			
--- a/data_pipeline/analyzers/md_analyzer.py
+++ b/data_pipeline/analyzers/md_analyzer.py
@@ -1,6 +1,6 @@
 
				-import logging
			
 
				 from pathlib import Path
			
 
				 from typing import List, Dict, Any
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 
			
 
				 class MDFileAnalyzer:
			
@@ -8,7 +8,7 @@ class MDFileAnalyzer:
 
				     
			
 
				     def __init__(self, output_dir: str):
			
 
				         self.output_dir = Path(output_dir)
			
 
				-        self.logger = logging.getLogger("schema_tools.MDFileAnalyzer")
			
 
				+        self.logger = get_data_pipeline_logger("MDFileAnalyzer")
			
 
				         
			
 
				     async def read_all_md_files(self) -> str:
			
 
				         """
			
--- a/data_pipeline/analyzers/theme_extractor.py
+++ b/data_pipeline/analyzers/theme_extractor.py
@@ -1,9 +1,9 @@
 
				 import asyncio
			
 
				 import json
			
 
				-import logging
			
 
				 from typing import List, Dict, Any
			
 
				 
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 
			
 
				 class ThemeExtractor:
			
@@ -19,7 +19,7 @@ class ThemeExtractor:
 
				         """
			
 
				         self.vn = vn
			
 
				         self.business_context = business_context
			
 
				-        self.logger = logging.getLogger("schema_tools.ThemeExtractor")
			
 
				+        self.logger = get_data_pipeline_logger("ThemeExtractor")
			
 
				         self.config = SCHEMA_TOOLS_CONFIG
			
 
				         
			
 
				     async def extract_themes(self, md_contents: str) -> List[Dict[str, Any]]:
			
--- a/data_pipeline/config.py
+++ b/data_pipeline/config.py
@@ -169,4 +169,6 @@ def validate_config():
 
				 try:
			
 
				     validate_config()
			
 
				 except ValueError as e:
			
 
				-    print(f"警告: {e}")
			
 
				+    # 在配置文件中使用stderr输出警告，避免依赖logging
			
 
				+    import sys
			
 
				+    print(f"警告: {e}", file=sys.stderr)
			
--- a/data_pipeline/ddl_generation/training_data_agent.py
+++ b/data_pipeline/ddl_generation/training_data_agent.py
@@ -1,6 +1,5 @@
 
				 import asyncio
			
 
				 import time
			
 
				-import logging
			
 
				 import os
			
 
				 from typing import List, Dict, Any, Optional
			
 
				 from pathlib import Path
			
@@ -11,8 +10,8 @@ from data_pipeline.utils.file_manager import FileNameManager
 
				 from data_pipeline.utils.system_filter import SystemTableFilter
			
 
				 from data_pipeline.utils.permission_checker import DatabasePermissionChecker
			
 
				 from data_pipeline.utils.table_parser import TableListParser
			
 
				-from data_pipeline.utils.logger import setup_logging
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 class SchemaTrainingDataAgent:
			
 
				     """Schema训练数据生成AI Agent"""
			
@@ -50,7 +49,7 @@ class SchemaTrainingDataAgent:
 
				         }
			
 
				         
			
 
				         self.failed_tables = []
			
 
				-        self.logger = logging.getLogger("schema_tools.Agent")
			
 
				+        self.logger = get_data_pipeline_logger("SchemaTrainingDataAgent")
			
 
				     
			
 
				     async def generate_training_data(self) -> Dict[str, Any]:
			
 
				         """主入口：生成训练数据"""
			
--- a/data_pipeline/metadata_only_generator.py
+++ b/data_pipeline/metadata_only_generator.py
@@ -15,6 +15,7 @@ from data_pipeline.analyzers import MDFileAnalyzer, ThemeExtractor
 
				 from data_pipeline.validators import FileCountValidator
			
 
				 from data_pipeline.utils.logger import setup_logging
			
 
				 from core.vanna_llm_factory import create_vanna_instance
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 
			
 
				 class MetadataOnlyGenerator:
			
@@ -45,10 +46,13 @@ class MetadataOnlyGenerator:
 
				         self.vn = None
			
 
				         self.theme_extractor = None
			
 
				         
			
 
				-        print(f"🎯 元数据生成器初始化完成")
			
 
				-        print(f"📁 输出目录: {output_dir}")
			
 
				-        print(f"🏢 业务背景: {business_context}")
			
 
				-        print(f"💾 数据库: {self.db_name}")
			
 
				+        # 初始化logger
			
 
				+        self.logger = get_data_pipeline_logger("MetadataOnlyGenerator")
			
 
				+        
			
 
				+        self.logger.info(f"🎯 元数据生成器初始化完成")
			
 
				+        self.logger.info(f"📁 输出目录: {output_dir}")
			
 
				+        self.logger.info(f"🏢 业务背景: {business_context}")
			
 
				+        self.logger.info(f"💾 数据库: {self.db_name}")
			
 
				     
			
 
				     async def generate_metadata_only(self) -> Dict[str, Any]:
			
 
				         """
			
@@ -58,50 +62,50 @@ class MetadataOnlyGenerator:
 
				             生成结果报告
			
 
				         """
			
 
				         try:
			
 
				-            print("🚀 开始生成元数据文件...")
			
 
				+            self.logger.info("🚀 开始生成元数据文件...")
			
 
				             
			
 
				             # 1. 验证文件数量
			
 
				-            print("📋 验证文件数量...")
			
 
				+            self.logger.info("📋 验证文件数量...")
			
 
				             validation_result = self.validator.validate(self.table_list_file, str(self.output_dir))
			
 
				             
			
 
				             if not validation_result.is_valid:
			
 
				-                print(f"❌ 文件验证失败: {validation_result.error}")
			
 
				+                self.logger.error(f"❌ 文件验证失败: {validation_result.error}")
			
 
				                 if validation_result.missing_ddl:
			
 
				-                    print(f"缺失DDL文件: {validation_result.missing_ddl}")
			
 
				+                    self.logger.error(f"缺失DDL文件: {validation_result.missing_ddl}")
			
 
				                 if validation_result.missing_md:
			
 
				-                    print(f"缺失MD文件: {validation_result.missing_md}")
			
 
				+                    self.logger.error(f"缺失MD文件: {validation_result.missing_md}")
			
 
				                 raise ValueError(f"文件验证失败: {validation_result.error}")
			
 
				             
			
 
				-            print(f"✅ 文件验证通过: {validation_result.table_count}个表")
			
 
				+            self.logger.info(f"✅ 文件验证通过: {validation_result.table_count}个表")
			
 
				             
			
 
				             # 2. 读取所有MD文件内容
			
 
				-            print("📖 读取MD文件...")
			
 
				+            self.logger.info("📖 读取MD文件...")
			
 
				             md_contents = await self.md_analyzer.read_all_md_files()
			
 
				             
			
 
				             # 3. 初始化LLM相关组件
			
 
				             self._initialize_llm_components()
			
 
				             
			
 
				             # 4. 提取分析主题
			
 
				-            print("🎯 提取分析主题...")
			
 
				+            self.logger.info("🎯 提取分析主题...")
			
 
				             themes = await self.theme_extractor.extract_themes(md_contents)
			
 
				-            print(f"✅ 成功提取 {len(themes)} 个分析主题")
			
 
				+            self.logger.info(f"✅ 成功提取 {len(themes)} 个分析主题")
			
 
				             
			
 
				 
			
 
				             for i, theme in enumerate(themes):
			
 
				                 topic_name = theme.get('topic_name', theme.get('name', ''))
			
 
				                 description = theme.get('description', '')
			
 
				-                print(f"  {i+1}. {topic_name}: {description}")
			
 
				+                self.logger.info(f"  {i+1}. {topic_name}: {description}")
			
 
				             
			
 
				             # 5. 生成metadata.txt文件
			
 
				-            print("📝 生成metadata.txt...")
			
 
				+            self.logger.info("📝 生成metadata.txt...")
			
 
				             metadata_file = await self._generate_metadata_file(themes)
			
 
				             
			
 
				             # 6. 生成metadata_detail.md文件
			
 
				-            print("📝 生成metadata_detail.md...")
			
 
				+            self.logger.info("📝 生成metadata_detail.md...")
			
 
				             metadata_md_file = await self._generate_metadata_md_file(themes)
			
 
				             
			
 
				             # 7. 生成db_query_decision_prompt.txt文件
			
 
				-            print("📝 生成db_query_decision_prompt.txt...")
			
 
				+            self.logger.info("📝 生成db_query_decision_prompt.txt...")
			
 
				             decision_prompt_file = await self._generate_decision_prompt_file(themes, md_contents)
			
 
				             
			
 
				             # 8. 生成报告
			
@@ -119,13 +123,13 @@ class MetadataOnlyGenerator:
 
				             return report
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"❌ 元数据生成失败: {e}")
			
 
				+            self.logger.error(f"❌ 元数据生成失败: {e}")
			
 
				             raise
			
 
				     
			
 
				     def _initialize_llm_components(self):
			
 
				         """初始化LLM相关组件"""
			
 
				         if not self.vn:
			
 
				-            print("🤖 初始化LLM组件...")
			
 
				+            self.logger.info("🤖 初始化LLM组件...")
			
 
				             self.vn = create_vanna_instance()
			
 
				             self.theme_extractor = ThemeExtractor(self.vn, self.business_context)
			
 
				     
			
@@ -188,11 +192,11 @@ class MetadataOnlyGenerator:
 
				                     f.write(f"  '{metrics_str}'\n")
			
 
				                     f.write(");\n\n")
			
 
				             
			
 
				-            print(f"✅ metadata.txt文件已生成: {metadata_file}")
			
 
				+            self.logger.info(f"✅ metadata.txt文件已生成: {metadata_file}")
			
 
				             return metadata_file
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"❌ 生成metadata.txt文件失败: {e}")
			
 
				+            self.logger.error(f"❌ 生成metadata.txt文件失败: {e}")
			
 
				             return None
			
 
				     
			
 
				     async def _generate_metadata_md_file(self, themes: List[Dict]):
			
@@ -240,11 +244,11 @@ class MetadataOnlyGenerator:
 
				                 f.write("- `biz_entities` 表示主题关注的核心对象，例如服务区、车辆、公司；\n")
			
 
				                 f.write("- `biz_metrics` 表示该主题关注的业务分析指标，例如营收对比、趋势变化、占比结构等。\n")
			
 
				             
			
 
				-            print(f"✅ metadata_detail.md文件已生成: {metadata_md_file}")
			
 
				+            self.logger.info(f"✅ metadata_detail.md文件已生成: {metadata_md_file}")
			
 
				             return metadata_md_file
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"❌ 生成metadata_detail.md文件失败: {e}")
			
 
				+            self.logger.error(f"❌ 生成metadata_detail.md文件失败: {e}")
			
 
				             return None
			
 
				     
			
 
				     async def _generate_decision_prompt_file(self, themes: List[Dict], md_contents: str):
			
@@ -259,20 +263,20 @@ class MetadataOnlyGenerator:
 
				             with open(decision_prompt_file, 'w', encoding='utf-8') as f:
			
 
				                 f.write(decision_content)
			
 
				             
			
 
				-            print(f"✅ db_query_decision_prompt.txt文件已生成: {decision_prompt_file}")
			
 
				+            self.logger.info(f"✅ db_query_decision_prompt.txt文件已生成: {decision_prompt_file}")
			
 
				             return decision_prompt_file
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"❌ 生成db_query_decision_prompt.txt文件失败: {e}")
			
 
				+            self.logger.error(f"❌ 生成db_query_decision_prompt.txt文件失败: {e}")
			
 
				             # 如果LLM调用失败，使用回退方案
			
 
				             try:
			
 
				                 fallback_content = await self._generate_fallback_decision_content(themes)
			
 
				                 with open(decision_prompt_file, 'w', encoding='utf-8') as f:
			
 
				                     f.write(fallback_content)
			
 
				-                print(f"⚠️ 使用回退方案生成了 {decision_prompt_file}")
			
 
				+                self.logger.warning(f"⚠️ 使用回退方案生成了 {decision_prompt_file}")
			
 
				                 return decision_prompt_file
			
 
				             except Exception as fallback_error:
			
 
				-                print(f"❌ 回退方案也失败: {fallback_error}")
			
 
				+                self.logger.error(f"❌ 回退方案也失败: {fallback_error}")
			
 
				                 return None
			
 
				     
			
 
				     async def _generate_decision_prompt_with_llm(self, themes: List[Dict], md_contents: str) -> str:
			
@@ -326,7 +330,7 @@ class MetadataOnlyGenerator:
 
				             return response.strip()
			
 
				             
			
 
				         except Exception as e:
			
 
				-            print(f"❌ LLM生成决策提示内容失败: {e}")
			
 
				+            self.logger.error(f"❌ LLM生成决策提示内容失败: {e}")
			
 
				             # 回退方案：生成基础内容
			
 
				             return await self._generate_fallback_decision_content(themes)
			
 
				     
			
@@ -370,7 +374,7 @@ class MetadataOnlyGenerator:
 
				                 raise Exception("LLM返回内容不合理")
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"⚠️ 简化LLM调用也失败，使用完全兜底方案: {e}")
			
 
				+            self.logger.warning(f"⚠️ 简化LLM调用也失败，使用完全兜底方案: {e}")
			
 
				             # 真正的最后兜底
			
 
				             content += f"当前数据库存储的是{self.business_context}的相关数据，主要涉及相关业务数据，包含以下业务数据：\n"
			
 
				         
			
@@ -409,13 +413,13 @@ class MetadataOnlyGenerator:
 
				     
			
 
				     def _print_summary(self, report: Dict):
			
 
				         """打印总结信息"""
			
 
				-        print("=" * 60)
			
 
				-        print("📊 元数据生成总结")
			
 
				-        print(f"  ✅ 分析主题数: {report['total_themes']}")
			
 
				-        print(f"  📄 metadata.txt: {'✅ 已生成' if report['metadata_file'] else '❌ 生成失败'}")
			
 
				-        print(f"  📄 metadata_detail.md: {'✅ 已生成' if report['metadata_md_file'] else '❌ 生成失败'}")
			
 
				-        print(f"  📄 db_query_decision_prompt.txt: {'✅ 已生成' if report['decision_prompt_file'] else '❌ 生成失败'}")
			
 
				-        print("=" * 60)
			
 
				+        self.logger.info("=" * 60)
			
 
				+        self.logger.info("📊 元数据生成总结")
			
 
				+        self.logger.info(f"  ✅ 分析主题数: {report['total_themes']}")
			
 
				+        self.logger.info(f"  📄 metadata.txt: {'✅ 已生成' if report['metadata_file'] else '❌ 生成失败'}")
			
 
				+        self.logger.info(f"  📄 metadata_detail.md: {'✅ 已生成' if report['metadata_md_file'] else '❌ 生成失败'}")
			
 
				+        self.logger.info(f"  📄 db_query_decision_prompt.txt: {'✅ 已生成' if report['decision_prompt_file'] else '❌ 生成失败'}")
			
 
				+        self.logger.info("=" * 60)
			
 
				 
			
 
				 
			
 
				 def setup_argument_parser():
			
@@ -488,12 +492,15 @@ async def main():
 
				     
			
 
				     # 验证参数
			
 
				     output_path = Path(args.output_dir)
			
 
				+    # 初始化logger用于参数验证
			
 
				+    logger = get_data_pipeline_logger("MetadataGeneratorMain")
			
 
				+    
			
 
				     if not output_path.exists():
			
 
				-        print(f"错误: 输出目录不存在: {args.output_dir}")
			
 
				+        logger.error(f"错误: 输出目录不存在: {args.output_dir}")
			
 
				         sys.exit(1)
			
 
				     
			
 
				     if not os.path.exists(args.table_list):
			
 
				-        print(f"错误: 表清单文件不存在: {args.table_list}")
			
 
				+        logger.error(f"错误: 表清单文件不存在: {args.table_list}")
			
 
				         sys.exit(1)
			
 
				     
			
 
				     try:
			
@@ -510,19 +517,19 @@ async def main():
 
				         
			
 
				         # 输出结果
			
 
				         if report['success']:
			
 
				-            print("\n🎉 元数据文件生成成功!")
			
 
				+            logger.info("\n🎉 元数据文件生成成功!")
			
 
				             exit_code = 0
			
 
				         else:
			
 
				-            print("\n❌ 元数据文件生成失败")
			
 
				+            logger.error("\n❌ 元数据文件生成失败")
			
 
				             exit_code = 1
			
 
				         
			
 
				         sys.exit(exit_code)
			
 
				         
			
 
				     except KeyboardInterrupt:
			
 
				-        print("\n\n⏹️  用户中断，程序退出")
			
 
				+        logger.info("\n\n⏹️  用户中断，程序退出")
			
 
				         sys.exit(130)
			
 
				     except Exception as e:
			
 
				-        print(f"\n❌ 程序执行失败: {e}")
			
 
				+        logger.error(f"\n❌ 程序执行失败: {e}")
			
 
				         if args.verbose:
			
 
				             import traceback
			
 
				             traceback.print_exc()
			
--- a/data_pipeline/qa_generation/qs_agent.py
+++ b/data_pipeline/qa_generation/qs_agent.py
@@ -9,7 +9,7 @@ from typing import List, Dict, Any, Optional
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				 from data_pipeline.validators import FileCountValidator
			
 
				 from data_pipeline.analyzers import MDFileAnalyzer, ThemeExtractor
			
 
				-from data_pipeline.utils.logger import setup_logging
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 from core.vanna_llm_factory import create_vanna_instance
			
 
				 
			
 
				 
			
@@ -36,7 +36,7 @@ class QuestionSQLGenerationAgent:
 
				         self.db_name = db_name or "db"
			
 
				         
			
 
				         self.config = SCHEMA_TOOLS_CONFIG
			
 
				-        self.logger = logging.getLogger("schema_tools.QSAgent")
			
 
				+        self.logger = get_data_pipeline_logger("QSAgent")
			
 
				         
			
 
				         # 初始化组件
			
 
				         self.validator = FileCountValidator()
			
--- a/data_pipeline/schema_workflow.py
+++ b/data_pipeline/schema_workflow.py
@@ -14,7 +14,7 @@ from data_pipeline.ddl_generation.training_data_agent import SchemaTrainingDataA
 
				 from data_pipeline.qa_generation.qs_agent import QuestionSQLGenerationAgent
			
 
				 from data_pipeline.validators.sql_validation_agent import SQLValidationAgent
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				-from data_pipeline.utils.logger import setup_logging
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 
			
 
				 class SchemaWorkflowOrchestrator:
			
@@ -56,7 +56,7 @@ class SchemaWorkflowOrchestrator:
 
				         self.output_dir.mkdir(parents=True, exist_ok=True)
			
 
				         
			
 
				         # 初始化日志
			
 
				-        self.logger = logging.getLogger("schema_tools.SchemaWorkflowOrchestrator")
			
 
				+        self.logger = get_data_pipeline_logger("SchemaWorkflow")
			
 
				         
			
 
				         # 工作流程状态
			
 
				         self.workflow_state = {
			
@@ -645,7 +645,8 @@ async def main():
 
				     
			
 
				     # 验证输入文件
			
 
				     if not os.path.exists(args.table_list):
			
 
				-        print(f"错误: 表清单文件不存在: {args.table_list}")
			
 
				+        logger = get_data_pipeline_logger("SchemaWorkflow")
			
 
				+        logger.error(f"错误: 表清单文件不存在: {args.table_list}")
			
 
				         sys.exit(1)
			
 
				     
			
 
				     try:
			
@@ -661,15 +662,16 @@ async def main():
 
				             enable_training_data_load=not args.skip_training_load
			
 
				         )
			
 
				         
			
 
				-        # 显示启动信息
			
 
				-        print(f"🚀 开始执行Schema工作流编排...")
			
 
				-        print(f"📁 输出目录: {args.output_dir}")
			
 
				-        print(f"📋 表清单: {args.table_list}")
			
 
				-        print(f"🏢 业务背景: {args.business_context}")
			
 
				-        print(f"💾 数据库: {orchestrator.db_name}")
			
 
				-        print(f"🔍 SQL验证: {'启用' if not args.skip_validation else '禁用'}")
			
 
				-        print(f"🔧 LLM修复: {'启用' if not args.disable_llm_repair else '禁用'}")
			
 
				-        print(f"🎯 训练数据加载: {'启用' if not args.skip_training_load else '禁用'}")
			
 
				+        # 获取logger用于启动信息
			
 
				+        logger = get_data_pipeline_logger("SchemaWorkflow")
			
 
				+        logger.info(f"🚀 开始执行Schema工作流编排...")
			
 
				+        logger.info(f"📁 输出目录: {args.output_dir}")
			
 
				+        logger.info(f"📋 表清单: {args.table_list}")
			
 
				+        logger.info(f"🏢 业务背景: {args.business_context}")
			
 
				+        logger.info(f"💾 数据库: {orchestrator.db_name}")
			
 
				+        logger.info(f"🔍 SQL验证: {'启用' if not args.skip_validation else '禁用'}")
			
 
				+        logger.info(f"🔧 LLM修复: {'启用' if not args.disable_llm_repair else '禁用'}")
			
 
				+        logger.info(f"🎯 训练数据加载: {'启用' if not args.skip_training_load else '禁用'}")
			
 
				         
			
 
				         # 执行完整工作流程
			
 
				         report = await orchestrator.execute_complete_workflow()
			
@@ -680,23 +682,23 @@ async def main():
 
				         # 输出结果并设置退出码
			
 
				         if report["success"]:
			
 
				             if report["processing_results"].get("sql_validation", {}).get("success_rate", 1.0) >= 0.8:
			
 
				-                print(f"\n🎉 工作流程执行成功!")
			
 
				+                logger.info(f"\n🎉 工作流程执行成功!")
			
 
				                 exit_code = 0  # 完全成功
			
 
				             else:
			
 
				-                print(f"\n⚠️  工作流程执行完成，但SQL验证成功率较低")
			
 
				+                logger.warning(f"\n⚠️  工作流程执行完成，但SQL验证成功率较低")
			
 
				                 exit_code = 1  # 部分成功
			
 
				         else:
			
 
				-            print(f"\n❌ 工作流程执行失败")
			
 
				+            logger.error(f"\n❌ 工作流程执行失败")
			
 
				             exit_code = 2  # 失败
			
 
				         
			
 
				-        print(f"📄 主要输出文件: {report['final_outputs']['primary_output_file']}")
			
 
				+        logger.info(f"📄 主要输出文件: {report['final_outputs']['primary_output_file']}")
			
 
				         sys.exit(exit_code)
			
 
				         
			
 
				     except KeyboardInterrupt:
			
 
				-        print("\n\n⏹️  用户中断，程序退出")
			
 
				+        logger.info("\n\n⏹️  用户中断，程序退出")
			
 
				         sys.exit(130)
			
 
				     except Exception as e:
			
 
				-        print(f"\n❌ 程序执行失败: {e}")
			
 
				+        logger.error(f"\n❌ 程序执行失败: {e}")
			
 
				         if args.verbose:
			
 
				             import traceback
			
 
				             traceback.print_exc()
			
--- a/data_pipeline/tools/base.py
+++ b/data_pipeline/tools/base.py
@@ -1,7 +1,7 @@
 
				 import asyncio
			
 
				 import time
			
 
				-import logging
			
 
				 from abc import ABC, abstractmethod
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 from typing import Dict, Any, Optional, Type, List
			
 
				 from data_pipeline.utils.data_structures import ProcessingResult, TableProcessingContext
			
 
				 
			
@@ -15,7 +15,8 @@ class ToolRegistry:
 
				         """装饰器：注册工具"""
			
 
				         def decorator(tool_class: Type['BaseTool']):
			
 
				             cls._tools[name] = tool_class
			
 
				-            logging.debug(f"注册工具: {name} -> {tool_class.__name__}")
			
 
				+            logger = get_data_pipeline_logger("ToolRegistry")
			
 
				+            logger.debug(f"注册工具: {name} -> {tool_class.__name__}")
			
 
				             return tool_class
			
 
				         return decorator
			
 
				     
			
@@ -32,7 +33,8 @@ class ToolRegistry:
 
				             if hasattr(tool_class, 'needs_llm') and tool_class.needs_llm:
			
 
				                 from core.vanna_llm_factory import create_vanna_instance
			
 
				                 kwargs['vn'] = create_vanna_instance()
			
 
				-                logging.debug(f"为工具 {name} 注入LLM实例")
			
 
				+                logger = get_data_pipeline_logger("ToolRegistry")
			
 
				+                logger.debug(f"为工具 {name} 注入LLM实例")
			
 
				             
			
 
				             cls._instances[name] = tool_class(**kwargs)
			
 
				         
			
@@ -55,7 +57,7 @@ class BaseTool(ABC):
 
				     tool_name: str = ""      # 工具名称
			
 
				     
			
 
				     def __init__(self, **kwargs):
			
 
				-        self.logger = logging.getLogger(f"schema_tools.{self.__class__.__name__}")
			
 
				+        self.logger = get_data_pipeline_logger(f"tools.{self.__class__.__name__}")
			
 
				         
			
 
				         # 如果工具需要LLM，检查是否已注入
			
 
				         if self.needs_llm and 'vn' not in kwargs:
			
@@ -113,7 +115,7 @@ class PipelineExecutor:
 
				     
			
 
				     def __init__(self, pipeline_config: Dict[str, List[str]]):
			
 
				         self.pipeline_config = pipeline_config
			
 
				-        self.logger = logging.getLogger("schema_tools.PipelineExecutor")
			
 
				+        self.logger = get_data_pipeline_logger("tools.PipelineExecutor")
			
 
				     
			
 
				     async def execute_pipeline(self, pipeline_name: str, context: TableProcessingContext) -> Dict[str, ProcessingResult]:
			
 
				         """执行指定的处理链"""
			
--- a/data_pipeline/trainer/vanna_trainer.py
+++ b/data_pipeline/trainer/vanna_trainer.py
@@ -11,6 +11,10 @@ import sys
 
				 import os
			
 
				 sys.path.append(os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__)))))
			
 
				 import app_config
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				+
			
 
				+# 初始化日志
			
 
				+logger = get_data_pipeline_logger("VannaTrainer")
			
 
				 
			
 
				 # 设置正确的项目根目录路径
			
 
				 project_root = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
			
@@ -27,20 +31,20 @@ try:
 
				     embedding_config = get_current_embedding_config()
			
 
				     model_info = get_current_model_info()
			
 
				     
			
 
				-    print(f"\n===== Embedding模型信息 =====")
			
 
				-    print(f"模型类型: {model_info['embedding_type']}")
			
 
				-    print(f"模型名称: {model_info['embedding_model']}")
			
 
				-    print(f"向量维度: {embedding_config.get('embedding_dimension', '未知')}")
			
 
				+    logger.info("===== Embedding模型信息 =====")
			
 
				+    logger.info(f"模型类型: {model_info['embedding_type']}")
			
 
				+    logger.info(f"模型名称: {model_info['embedding_model']}")
			
 
				+    logger.info(f"向量维度: {embedding_config.get('embedding_dimension', '未知')}")
			
 
				     if 'base_url' in embedding_config:
			
 
				-        print(f"API服务: {embedding_config['base_url']}")
			
 
				-    print("==============================")
			
 
				+        logger.info(f"API服务: {embedding_config['base_url']}")
			
 
				+    logger.info("==============================")
			
 
				 except ImportError as e:
			
 
				-    print(f"警告: 无法导入配置工具函数: {e}")
			
 
				-    print("使用默认配置...")
			
 
				+    logger.warning(f"无法导入配置工具函数: {e}")
			
 
				+    logger.info("使用默认配置...")
			
 
				     embedding_config = getattr(app_config, 'API_EMBEDDING_CONFIG', {})
			
 
				-    print(f"\n===== Embedding模型信息 (默认) =====")
			
 
				-    print(f"模型名称: {embedding_config.get('model_name', '未知')}")
			
 
				-    print("==============================")
			
 
				+    logger.info("===== Embedding模型信息 (默认) =====")
			
 
				+    logger.info(f"模型名称: {embedding_config.get('model_name', '未知')}")
			
 
				+    logger.info("==============================")
			
 
				 
			
 
				 # 从app_config获取训练批处理配置
			
 
				 BATCH_PROCESSING_ENABLED = app_config.TRAINING_BATCH_PROCESSING_ENABLED
			
@@ -63,7 +67,7 @@ class BatchProcessor:
 
				         # 是否启用批处理
			
 
				         self.batch_enabled = BATCH_PROCESSING_ENABLED       
			
 
				 
			
 
				-        print(f"[DEBUG] 训练批处理器初始化: 启用={self.batch_enabled}, 批大小={self.batch_size}, 最大工作线程={self.max_workers}")
			
 
				+        logger.debug(f"训练批处理器初始化: 启用={self.batch_enabled}, 批大小={self.batch_size}, 最大工作线程={self.max_workers}")
			
 
				     
			
 
				     def add_item(self, batch_type: str, item: Dict[str, Any]):
			
 
				         """添加一个项目到批处理队列"""
			
@@ -91,14 +95,14 @@ class BatchProcessor:
 
				             elif batch_type == 'question_sql':
			
 
				                 vn.train(question=item['question'], sql=item['sql'])
			
 
				             
			
 
				-            print(f"[DEBUG] 单项处理成功: {batch_type}")
			
 
				+            logger.debug(f"单项处理成功: {batch_type}")
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 处理 {batch_type} 项目失败: {e}")
			
 
				+            logger.error(f"处理 {batch_type} 项目失败: {e}")
			
 
				     
			
 
				     def _process_batch(self, batch_type: str, items: List[Dict[str, Any]]):
			
 
				         """处理一批项目"""
			
 
				-        print(f"[INFO] 开始批量处理 {len(items)} 个 {batch_type} 项")
			
 
				+        logger.info(f"开始批量处理 {len(items)} 个 {batch_type} 项")
			
 
				         start_time = time.time()
			
 
				         
			
 
				         try:
			
@@ -131,46 +135,46 @@ class BatchProcessor:
 
				             if hasattr(vn, 'add_batch') and callable(getattr(vn, 'add_batch')):
			
 
				                 success = vn.add_batch(batch_data)
			
 
				                 if success:
			
 
				-                    print(f"[INFO] 批量处理成功: {len(items)} 个 {batch_type} 项")
			
 
				+                    logger.info(f"批量处理成功: {len(items)} 个 {batch_type} 项")
			
 
				                 else:
			
 
				-                    print(f"[WARNING] 批量处理部分失败: {batch_type}")
			
 
				+                    logger.warning(f"批量处理部分失败: {batch_type}")
			
 
				             else:
			
 
				                 # 如果没有批处理方法，退回到逐条处理
			
 
				-                print(f"[WARNING] 批处理不可用，使用逐条处理: {batch_type}")
			
 
				+                logger.warning(f"批处理不可用，使用逐条处理: {batch_type}")
			
 
				                 for item in items:
			
 
				                     self._process_single_item(batch_type, item)
			
 
				                 
			
 
				         except Exception as e:
			
 
				-            print(f"[ERROR] 批处理 {batch_type} 失败: {e}")
			
 
				+            logger.error(f"批处理 {batch_type} 失败: {e}")
			
 
				             # 如果批处理失败，尝试逐条处理
			
 
				-            print(f"[INFO] 尝试逐条处理...")
			
 
				+            logger.info(f"尝试逐条处理...")
			
 
				             for item in items:
			
 
				                 try:
			
 
				                     self._process_single_item(batch_type, item)
			
 
				                 except Exception as item_e:
			
 
				-                    print(f"[ERROR] 处理项目失败: {item_e}")
			
 
				+                    logger.error(f"处理项目失败: {item_e}")
			
 
				         
			
 
				         elapsed = time.time() - start_time
			
 
				-        print(f"[INFO] 批处理完成 {len(items)} 个 {batch_type} 项，耗时 {elapsed:.2f} 秒")
			
 
				+        logger.info(f"批处理完成 {len(items)} 个 {batch_type} 项，耗时 {elapsed:.2f} 秒")
			
 
				     
			
 
				     def flush_all(self):
			
 
				         """强制处理所有剩余项目"""
			
 
				         with self.lock:
			
 
				             for batch_type, items in self.batches.items():
			
 
				                 if items:
			
 
				-                    print(f"[INFO] 正在处理剩余的 {len(items)} 个 {batch_type} 项")
			
 
				+                    logger.info(f"正在处理剩余的 {len(items)} 个 {batch_type} 项")
			
 
				                     self._process_batch(batch_type, items)
			
 
				             
			
 
				             # 清空队列
			
 
				             self.batches = defaultdict(list)
			
 
				         
			
 
				-        print("[INFO] 所有训练批处理项目已完成")
			
 
				+        logger.info("所有训练批处理项目已完成")
			
 
				     
			
 
				     def shutdown(self):
			
 
				         """关闭处理器和线程池"""
			
 
				         self.flush_all()
			
 
				         self.executor.shutdown(wait=True)
			
 
				-        print("[INFO] 训练批处理器已关闭")
			
 
				+        logger.info("训练批处理器已关闭")
			
 
				 
			
 
				 # 创建全局训练批处理器实例
			
 
				 # 用于所有训练函数的批处理优化
			
@@ -178,16 +182,16 @@ batch_processor = BatchProcessor()
 
				 
			
 
				 # 原始训练函数的批处理增强版本
			
 
				 def train_ddl(ddl_sql: str):
			
 
				-    print(f"[DDL] Training on DDL:\n{ddl_sql}")
			
 
				+    logger.debug(f"Training on DDL:\n{ddl_sql}")
			
 
				     batch_processor.add_item('ddl', {'ddl': ddl_sql})
			
 
				 
			
 
				 def train_documentation(doc: str):
			
 
				-    print(f"[DOC] Training on documentation:\n{doc}")
			
 
				+    logger.debug(f"Training on documentation:\n{doc}")
			
 
				     batch_processor.add_item('documentation', {'documentation': doc})
			
 
				 
			
 
				 def train_sql_example(sql: str):
			
 
				     """训练单个SQL示例，通过SQL生成相应的问题"""
			
 
				-    print(f"[SQL] Training on SQL:\n{sql}")
			
 
				+    logger.debug(f"Training on SQL:\n{sql}")
			
 
				     
			
 
				     try:
			
 
				         # 直接调用generate_question方法
			
@@ -198,15 +202,15 @@ def train_sql_example(sql: str):
 
				             question += "?"
			
 
				             
			
 
				     except Exception as e:
			
 
				-        print(f"[ERROR] 生成问题时出错: {e}")
			
 
				+        logger.error(f"生成问题时出错: {e}")
			
 
				         raise Exception(f"无法为SQL生成问题: {e}")
			
 
				         
			
 
				-    print(f"[SQL] 生成问题: {question}")
			
 
				+    logger.debug(f"生成问题: {question}")
			
 
				     # 使用标准方式存储问题-SQL对
			
 
				     batch_processor.add_item('question_sql', {'question': question, 'sql': sql})
			
 
				 
			
 
				 def train_question_sql_pair(question: str, sql: str):
			
 
				-    print(f"[Q-S] Training on:\nquestion: {question}\nsql: {sql}")
			
 
				+    logger.debug(f"Training on question-sql pair:\nquestion: {question}\nsql: {sql}")
			
 
				     batch_processor.add_item('question_sql', {'question': question, 'sql': sql})
			
 
				 
			
 
				 # 完成训练后刷新所有待处理项
			
--- a/data_pipeline/utils/file_manager.py
+++ b/data_pipeline/utils/file_manager.py
@@ -1,7 +1,7 @@
 
				 import os
			
 
				-import logging
			
 
				 from typing import Dict, Set, Optional
			
 
				 from pathlib import Path
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 class FileNameManager:
			
 
				     """文件名管理器，处理文件命名和冲突"""
			
@@ -10,7 +10,7 @@ class FileNameManager:
 
				         self.output_dir = output_dir
			
 
				         self.used_names: Set[str] = set()
			
 
				         self.name_mapping: Dict[str, str] = {}  # 原始名 -> 实际文件名
			
 
				-        self.logger = logging.getLogger("schema_tools.FileNameManager")
			
 
				+        self.logger = get_data_pipeline_logger("FileNameManager")
			
 
				         
			
 
				         # 扫描已存在的文件
			
 
				         self._scan_existing_files()
			
--- a/data_pipeline/utils/large_table_handler.py
+++ b/data_pipeline/utils/large_table_handler.py
@@ -1,13 +1,13 @@
 
				-import logging
			
 
				 import random
			
 
				 from typing import List, Dict, Any, Optional
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 class LargeTableHandler:
			
 
				     """大表处理策略"""
			
 
				     
			
 
				     def __init__(self):
			
 
				-        self.logger = logging.getLogger("schema_tools.LargeTableHandler")
			
 
				+        self.logger = get_data_pipeline_logger("LargeTableHandler")
			
 
				         self.large_table_threshold = SCHEMA_TOOLS_CONFIG.get("large_table_threshold", 1000000)
			
 
				         self.skip_large_tables = SCHEMA_TOOLS_CONFIG.get("skip_large_tables", False)
			
 
				         self.max_table_size = SCHEMA_TOOLS_CONFIG.get("max_table_size", 10000000)
			
--- a/data_pipeline/utils/logger.py
+++ b/data_pipeline/utils/logger.py
@@ -1,160 +1,50 @@
 
				-import logging
			
 
				-import os
			
 
				-import sys
			
 
				-from datetime import datetime
			
 
				+"""
			
 
				+原有日志系统已被新的统一日志系统替代
			
 
				+保留此文件仅为避免导入错误
			
 
				+"""
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 from typing import Optional
			
 
				+import logging
			
 
				 
			
 
				 def setup_logging(verbose: bool = False, log_file: Optional[str] = None, log_dir: Optional[str] = None):
			
 
				     """
			
 
				-    设置日志系统
			
 
				-    
			
 
				-    Args:
			
 
				-        verbose: 是否启用详细日志
			
 
				-        log_file: 日志文件名
			
 
				-        log_dir: 日志目录
			
 
				+    函数保留以避免调用错误，但不做任何事
			
 
				+    原有日志系统已被统一日志系统替代
			
 
				     """
			
 
				-    # 确定日志级别
			
 
				-    log_level = logging.DEBUG if verbose else logging.INFO
			
 
				-    
			
 
				-    # 创建根logger
			
 
				-    root_logger = logging.getLogger()
			
 
				-    root_logger.setLevel(log_level)
			
 
				-    
			
 
				-    # 清除已有的处理器
			
 
				-    root_logger.handlers.clear()
			
 
				-    
			
 
				-    # 设置日志格式
			
 
				-    console_format = "%(asctime)s [%(levelname)s] %(message)s"
			
 
				-    file_format = "%(asctime)s [%(levelname)s] [%(name)s] %(message)s"
			
 
				-    date_format = "%Y-%m-%d %H:%M:%S"
			
 
				-    
			
 
				-    # 控制台处理器
			
 
				-    console_handler = logging.StreamHandler(sys.stdout)
			
 
				-    console_handler.setLevel(log_level)
			
 
				-    console_formatter = logging.Formatter(console_format, datefmt=date_format)
			
 
				-    console_handler.setFormatter(console_formatter)
			
 
				-    root_logger.addHandler(console_handler)
			
 
				-    
			
 
				-    # 文件处理器（如果指定）
			
 
				-    if log_file:
			
 
				-        # 确定日志文件路径
			
 
				-        if log_dir:
			
 
				-            os.makedirs(log_dir, exist_ok=True)
			
 
				-            log_path = os.path.join(log_dir, log_file)
			
 
				-        else:
			
 
				-            log_path = log_file
			
 
				-        
			
 
				-        # 添加时间戳到日志文件名
			
 
				-        base_name, ext = os.path.splitext(log_path)
			
 
				-        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
			
 
				-        log_path = f"{base_name}_{timestamp}{ext}"
			
 
				-        
			
 
				-        file_handler = logging.FileHandler(log_path, encoding='utf-8')
			
 
				-        file_handler.setLevel(log_level)
			
 
				-        file_formatter = logging.Formatter(file_format, datefmt=date_format)
			
 
				-        file_handler.setFormatter(file_formatter)
			
 
				-        root_logger.addHandler(file_handler)
			
 
				-        
			
 
				-        # 记录日志文件位置
			
 
				-        root_logger.info(f"日志文件: {os.path.abspath(log_path)}")
			
 
				-    
			
 
				-    # 设置schema_tools模块的日志级别
			
 
				-    schema_tools_logger = logging.getLogger("schema_tools")
			
 
				-    schema_tools_logger.setLevel(log_level)
			
 
				-    
			
 
				-    # 设置第三方库的日志级别（避免过多输出）
			
 
				-    logging.getLogger("asyncio").setLevel(logging.WARNING)
			
 
				-    logging.getLogger("asyncpg").setLevel(logging.WARNING)
			
 
				-    logging.getLogger("openai").setLevel(logging.WARNING)
			
 
				-    logging.getLogger("httpx").setLevel(logging.WARNING)
			
 
				-    logging.getLogger("urllib3").setLevel(logging.WARNING)
			
 
				-    
			
 
				-    # 返回schema_tools的logger
			
 
				-    return schema_tools_logger
			
 
				+    pass
			
 
				 
			
 
				-class ColoredFormatter(logging.Formatter):
			
 
				-    """带颜色的日志格式化器（用于控制台）"""
			
 
				-    
			
 
				-    # ANSI颜色代码
			
 
				-    COLORS = {
			
 
				-        'DEBUG': '\033[36m',     # 青色
			
 
				-        'INFO': '\033[32m',      # 绿色
			
 
				-        'WARNING': '\033[33m',   # 黄色
			
 
				-        'ERROR': '\033[31m',     # 红色
			
 
				-        'CRITICAL': '\033[35m',  # 紫色
			
 
				-    }
			
 
				-    RESET = '\033[0m'
			
 
				-    
			
 
				-    def format(self, record):
			
 
				-        # 保存原始级别名
			
 
				-        levelname = record.levelname
			
 
				-        
			
 
				-        # 添加颜色
			
 
				-        if levelname in self.COLORS:
			
 
				-            record.levelname = f"{self.COLORS[levelname]}{levelname}{self.RESET}"
			
 
				-        
			
 
				-        # 格式化消息
			
 
				-        formatted = super().format(record)
			
 
				-        
			
 
				-        # 恢复原始级别名
			
 
				-        record.levelname = levelname
			
 
				-        
			
 
				-        return formatted
			
 
				+def get_logger(name: str = "DataPipeline"):
			
 
				+    """直接返回新的logger"""
			
 
				+    return get_data_pipeline_logger(name)
			
 
				 
			
 
				 def get_colored_console_handler(level=logging.INFO):
			
 
				-    """获取带颜色的控制台处理器"""
			
 
				-    handler = logging.StreamHandler(sys.stdout)
			
 
				-    handler.setLevel(level)
			
 
				-    
			
 
				-    # 检查是否支持颜色（Windows需要特殊处理）
			
 
				-    if sys.platform == "win32":
			
 
				-        try:
			
 
				-            import colorama
			
 
				-            colorama.init()
			
 
				-            use_color = True
			
 
				-        except ImportError:
			
 
				-            use_color = False
			
 
				-    else:
			
 
				-        # Unix/Linux/Mac通常支持ANSI颜色
			
 
				-        use_color = hasattr(sys.stdout, 'isatty') and sys.stdout.isatty()
			
 
				-    
			
 
				-    if use_color:
			
 
				-        formatter = ColoredFormatter(
			
 
				-            "%(asctime)s [%(levelname)s] %(message)s",
			
 
				-            datefmt="%Y-%m-%d %H:%M:%S"
			
 
				-        )
			
 
				-    else:
			
 
				-        formatter = logging.Formatter(
			
 
				-            "%(asctime)s [%(levelname)s] %(message)s",
			
 
				-            datefmt="%Y-%m-%d %H:%M:%S"
			
 
				-        )
			
 
				-    
			
 
				-    handler.setFormatter(formatter)
			
 
				-    return handler
			
 
				+    """兼容性函数，返回None"""
			
 
				+    return None
			
 
				 
			
 
				 class TableProcessingLogger:
			
 
				-    """表处理专用日志器"""
			
 
				+    """兼容性类，实际使用新的日志系统"""
			
 
				     
			
 
				     def __init__(self, logger_name: str = "schema_tools.TableProcessor"):
			
 
				-        self.logger = logging.getLogger(logger_name)
			
 
				+        self.logger = get_data_pipeline_logger("TableProcessor")
			
 
				         self.current_table = None
			
 
				         self.start_time = None
			
 
				     
			
 
				     def start_table(self, table_name: str):
			
 
				         """开始处理表"""
			
 
				+        import time
			
 
				         self.current_table = table_name
			
 
				-        self.start_time = datetime.now()
			
 
				+        self.start_time = time.time()
			
 
				         self.logger.info(f"{'='*60}")
			
 
				         self.logger.info(f"开始处理表: {table_name}")
			
 
				-        self.logger.info(f"开始时间: {self.start_time.strftime('%Y-%m-%d %H:%M:%S')}")
			
 
				     
			
 
				     def end_table(self, success: bool = True):
			
 
				         """结束处理表"""
			
 
				         if self.start_time:
			
 
				-            duration = (datetime.now() - self.start_time).total_seconds()
			
 
				+            import time
			
 
				+            duration = time.time() - self.start_time
			
 
				             status = "成功" if success else "失败"
			
 
				             self.logger.info(f"处理{status}，耗时: {duration:.2f}秒")
			
 
				-        self.logger.info(f"{'='*60}\n")
			
 
				+        self.logger.info(f"{'='*60}")
			
 
				         self.current_table = None
			
 
				         self.start_time = None
			
 
				     
			
@@ -171,4 +61,13 @@ class TableProcessingLogger:
 
				     
			
 
				     def log_error(self, message: str):
			
 
				         """记录错误"""
			
 
				-        self.logger.error(f"  ✗ {message}")
			
 
				+        self.logger.error(f"  ✗ {message}")
			
 
				+
			
 
				+# 兼容性类
			
 
				+class ColoredFormatter:
			
 
				+    """兼容性类，不再使用"""
			
 
				+    def __init__(self, *args, **kwargs):
			
 
				+        pass
			
 
				+    
			
 
				+    def format(self, record):
			
 
				+        return str(record)
			
--- a/data_pipeline/utils/permission_checker.py
+++ b/data_pipeline/utils/permission_checker.py
@@ -1,13 +1,13 @@
 
				-import logging
			
 
				 from typing import Dict, Optional
			
 
				 import asyncio
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 class DatabasePermissionChecker:
			
 
				     """数据库权限检查器"""
			
 
				     
			
 
				     def __init__(self, db_inspector):
			
 
				         self.db_inspector = db_inspector
			
 
				-        self.logger = logging.getLogger("schema_tools.DatabasePermissionChecker")
			
 
				+        self.logger = get_data_pipeline_logger("DatabasePermissionChecker")
			
 
				         self._permission_cache: Optional[Dict[str, bool]] = None
			
 
				     
			
 
				     async def check_permissions(self) -> Dict[str, bool]:
			
--- a/data_pipeline/utils/system_filter.py
+++ b/data_pipeline/utils/system_filter.py
@@ -1,6 +1,6 @@
 
				-import logging
			
 
				 from typing import List, Set
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 class SystemTableFilter:
			
 
				     """系统表过滤器"""
			
@@ -18,7 +18,7 @@ class SystemTableFilter:
 
				     ]
			
 
				     
			
 
				     def __init__(self):
			
 
				-        self.logger = logging.getLogger("schema_tools.SystemTableFilter")
			
 
				+        self.logger = get_data_pipeline_logger("SystemTableFilter")
			
 
				         
			
 
				         # 加载自定义配置
			
 
				         self.custom_prefixes = SCHEMA_TOOLS_CONFIG.get("custom_system_prefixes", [])
			
--- a/data_pipeline/utils/table_parser.py
+++ b/data_pipeline/utils/table_parser.py
@@ -1,12 +1,12 @@
 
				 import os
			
 
				-import logging
			
 
				 from typing import List, Tuple
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 class TableListParser:
			
 
				     """表清单解析器"""
			
 
				     
			
 
				     def __init__(self):
			
 
				-        self.logger = logging.getLogger("schema_tools.TableListParser")
			
 
				+        self.logger = get_data_pipeline_logger("TableListParser")
			
 
				     
			
 
				     def parse_file(self, file_path: str) -> List[str]:
			
 
				         """
			
--- a/data_pipeline/validators/file_count_validator.py
+++ b/data_pipeline/validators/file_count_validator.py
@@ -1,10 +1,10 @@
 
				-import logging
			
 
				 from pathlib import Path
			
 
				 from typing import Dict, List, Tuple, Set
			
 
				 from dataclasses import dataclass, field
			
 
				 
			
 
				 from data_pipeline.utils.table_parser import TableListParser
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 
			
 
				 @dataclass
			
@@ -24,7 +24,7 @@ class FileCountValidator:
 
				     """文件数量验证器"""
			
 
				     
			
 
				     def __init__(self):
			
 
				-        self.logger = logging.getLogger("schema_tools.FileCountValidator")
			
 
				+        self.logger = get_data_pipeline_logger("FileCountValidator")
			
 
				         self.config = SCHEMA_TOOLS_CONFIG
			
 
				         
			
 
				     def validate(self, table_list_file: str, output_dir: str) -> ValidationResult:
			
--- a/data_pipeline/validators/sql_validation_agent.py
+++ b/data_pipeline/validators/sql_validation_agent.py
@@ -8,7 +8,7 @@ from typing import List, Dict, Any, Optional
 
				 
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				 from data_pipeline.validators import SQLValidator, SQLValidationResult, ValidationStats
			
 
				-from data_pipeline.utils.logger import setup_logging
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 
			
 
				 class SQLValidationAgent:
			
@@ -40,7 +40,7 @@ class SQLValidationAgent:
 
				             self.config['enable_sql_repair'] = enable_sql_repair
			
 
				         if modify_original_file is not None:
			
 
				             self.config['modify_original_file'] = modify_original_file
			
 
				-        self.logger = logging.getLogger("schema_tools.SQLValidationAgent")
			
 
				+        self.logger = get_data_pipeline_logger("SQLValidationAgent")
			
 
				         
			
 
				         # 初始化验证器
			
 
				         self.validator = SQLValidator(db_connection)
			
--- a/data_pipeline/validators/sql_validator.py
+++ b/data_pipeline/validators/sql_validator.py
@@ -1,10 +1,10 @@
 
				 import asyncio
			
 
				-import logging
			
 
				 import time
			
 
				 from typing import Dict, Any, List, Optional
			
 
				 from dataclasses import dataclass, field
			
 
				 
			
 
				 from data_pipeline.config import SCHEMA_TOOLS_CONFIG
			
 
				+from core.logging import get_data_pipeline_logger
			
 
				 
			
 
				 
			
 
				 @dataclass
			
@@ -52,7 +52,7 @@ class SQLValidator:
 
				         self.db_connection = db_connection
			
 
				         self.connection_pool = None
			
 
				         self.config = SCHEMA_TOOLS_CONFIG['sql_validation']
			
 
				-        self.logger = logging.getLogger("schema_tools.SQLValidator")
			
 
				+        self.logger = get_data_pipeline_logger("SQLValidator")
			
 
				         
			
 
				     async def _get_connection_pool(self):
			
 
				         """获取或复用现有连接池"""
			
--- a/docs/全局log服务改造方案.md
+++ b/docs/全局log服务改造方案.md
@@ -1,894 +0,0 @@
 
				-# 项目日志系统改造设计方案（精简实用版）
			
 
				-
			
 
				-## 1. 整体设计理念
			
 
				-
			
 
				-基于您的需求，设计一套类似Log4j的统一日志服务，专注核心功能：
			
 
				-- 统一的日志级别管理（info/error/debug/warning）
			
 
				-- 可配置的日志输出路径
			
 
				-- 支持控制台和文件输出
			
 
				-- 不同模块独立日志文件（data_pipeline、agent、vanna等）
			
 
				-- 自动日志轮转和清理
			
 
				-- 与现有vanna/langchain/langgraph技术栈兼容
			
 
				-
			
 
				-## 2. 核心架构设计
			
 
				-
			
 
				-### 2.1 精简的日志服务层次结构
			
 
				-
			
 
				-```
			
 
				-项目根目录/
			
 
				-├── core/
			
 
				-│   └── logging/
			
 
				-│       ├── __init__.py           # 日志服务入口
			
 
				-│       └── log_manager.py        # 核心日志管理器
			
 
				-├── logs/                         # 日志文件目录
			
 
				-│   ├── data_pipeline.log        # data_pipeline模块日志
			
 
				-│   ├── agent.log                # agent模块日志
			
 
				-│   ├── vanna.log                # vanna模块日志
			
 
				-│   ├── langchain.log            # langchain模块日志
			
 
				-│   ├── langgraph.log            # langgraph模块日志
			
 
				-│   └── app.log                  # 主应用日志
			
 
				-└── config/
			
 
				-    └── logging_config.yaml       # 日志配置文件
			
 
				-```
			
 
				-
			
 
				-### 2.2 核心日志管理器设计（增强版）
			
 
				-
			
 
				-基于用户反馈，增强版包含以下特性：
			
 
				-- **异步日志支持**
			
 
				-- **灵活的上下文管理**（user_id可选）
			
 
				-- **错误降级策略**
			
 
				-- **重点支持citu_app.py**
			
 
				-
			
 
				-```python
			
 
				-# core/logging/log_manager.py
			
 
				-import logging
			
 
				-import logging.handlers
			
 
				-import os
			
 
				-from typing import Dict, Optional
			
 
				-from pathlib import Path
			
 
				-import yaml
			
 
				-import asyncio
			
 
				-from concurrent.futures import ThreadPoolExecutor
			
 
				-import contextvars
			
 
				-
			
 
				-# 上下文变量，存储可选的上下文信息
			
 
				-log_context = contextvars.ContextVar('log_context', default={})
			
 
				-
			
 
				-class ContextFilter(logging.Filter):
			
 
				-    """添加上下文信息到日志记录"""
			
 
				-    def filter(self, record):
			
 
				-        ctx = log_context.get()
			
 
				-        # 设置默认值，避免格式化错误
			
 
				-        record.session_id = ctx.get('session_id', 'N/A')
			
 
				-        record.user_id = ctx.get('user_id', 'anonymous')
			
 
				-        record.request_id = ctx.get('request_id', 'N/A')
			
 
				-        return True
			
 
				-
			
 
				-class LogManager:
			
 
				-    """统一日志管理器 - 类似Log4j的功能"""
			
 
				-    
			
 
				-    _instance = None
			
 
				-    _loggers: Dict[str, logging.Logger] = {}
			
 
				-    _initialized = False
			
 
				-    _executor = None
			
 
				-    _fallback_to_console = False  # 标记是否降级到控制台
			
 
				-    
			
 
				-    def __new__(cls):
			
 
				-        if cls._instance is None:
			
 
				-            cls._instance = super().__new__(cls)
			
 
				-        return cls._instance
			
 
				-    
			
 
				-    def __init__(self):
			
 
				-        if not self._initialized:
			
 
				-            self.config = None
			
 
				-            self.base_log_dir = Path("logs")
			
 
				-            self._executor = ThreadPoolExecutor(max_workers=2, thread_name_prefix="log")
			
 
				-            self._setup_base_directory()
			
 
				-            LogManager._initialized = True
			
 
				-    
			
 
				-    def initialize(self, config_path: str = "config/logging_config.yaml"):
			
 
				-        """初始化日志系统"""
			
 
				-        self.config = self._load_config(config_path)
			
 
				-        self._setup_base_directory()
			
 
				-        self._configure_root_logger()
			
 
				-    
			
 
				-    def get_logger(self, name: str, module: str = "default") -> logging.Logger:
			
 
				-        """获取指定模块的logger"""
			
 
				-        logger_key = f"{module}.{name}"
			
 
				-        
			
 
				-        if logger_key not in self._loggers:
			
 
				-            logger = logging.getLogger(logger_key)
			
 
				-            self._configure_logger(logger, module)
			
 
				-            self._loggers[logger_key] = logger
			
 
				-        
			
 
				-        return self._loggers[logger_key]
			
 
				-    
			
 
				-    async def alog(self, logger: logging.Logger, level: str, message: str, **kwargs):
			
 
				-        """异步日志方法"""
			
 
				-        loop = asyncio.get_event_loop()
			
 
				-        await loop.run_in_executor(
			
 
				-            self._executor,
			
 
				-            lambda: getattr(logger, level)(message, **kwargs)
			
 
				-        )
			
 
				-    
			
 
				-    def set_context(self, **kwargs):
			
 
				-        """设置日志上下文（可选）"""
			
 
				-        ctx = log_context.get()
			
 
				-        ctx.update(kwargs)
			
 
				-        log_context.set(ctx)
			
 
				-    
			
 
				-    def clear_context(self):
			
 
				-        """清除日志上下文"""
			
 
				-        log_context.set({})
			
 
				-    
			
 
				-    def _load_config(self, config_path: str) -> dict:
			
 
				-        """加载配置文件（带错误处理）"""
			
 
				-        try:
			
 
				-            with open(config_path, 'r', encoding='utf-8') as f:
			
 
				-                return yaml.safe_load(f)
			
 
				-        except FileNotFoundError:
			
 
				-            print(f"[WARNING] 配置文件 {config_path} 未找到，使用默认配置")
			
 
				-            return self._get_default_config()
			
 
				-        except Exception as e:
			
 
				-            print(f"[ERROR] 加载配置文件失败: {e}，使用默认配置")
			
 
				-            return self._get_default_config()
			
 
				-    
			
 
				-    def _setup_base_directory(self):
			
 
				-        """创建日志目录（带降级策略）"""
			
 
				-        try:
			
 
				-            self.base_log_dir.mkdir(parents=True, exist_ok=True)
			
 
				-            self._fallback_to_console = False
			
 
				-        except Exception as e:
			
 
				-            print(f"[WARNING] 无法创建日志目录 {self.base_log_dir}，将只使用控制台输出: {e}")
			
 
				-            self._fallback_to_console = True
			
 
				-    
			
 
				-    def _configure_logger(self, logger: logging.Logger, module: str):
			
 
				-        """配置具体的logger（支持降级）"""
			
 
				-        module_config = self.config.get('modules', {}).get(module, self.config['default'])
			
 
				-        
			
 
				-        # 设置日志级别
			
 
				-        level = getattr(logging, module_config['level'].upper())
			
 
				-        logger.setLevel(level)
			
 
				-        
			
 
				-        # 清除已有处理器
			
 
				-        logger.handlers.clear()
			
 
				-        logger.propagate = False
			
 
				-        
			
 
				-        # 添加控制台处理器
			
 
				-        if module_config.get('console', {}).get('enabled', True):
			
 
				-            console_handler = self._create_console_handler(module_config['console'])
			
 
				-            console_handler.addFilter(ContextFilter())
			
 
				-            logger.addHandler(console_handler)
			
 
				-        
			
 
				-        # 添加文件处理器（如果没有降级到控制台）
			
 
				-        if not self._fallback_to_console and module_config.get('file', {}).get('enabled', True):
			
 
				-            try:
			
 
				-                file_handler = self._create_file_handler(module_config['file'], module)
			
 
				-                file_handler.addFilter(ContextFilter())
			
 
				-                logger.addHandler(file_handler)
			
 
				-            except Exception as e:
			
 
				-                print(f"[WARNING] 无法创建文件处理器: {e}")
			
 
				-    
			
 
				-    def _get_default_config(self) -> dict:
			
 
				-        """获取默认配置"""
			
 
				-        return {
			
 
				-            'global': {'base_level': 'INFO'},
			
 
				-            'default': {
			
 
				-                'level': 'INFO',
			
 
				-                'console': {
			
 
				-                    'enabled': True,
			
 
				-                    'level': 'INFO',
			
 
				-                    'format': '%(asctime)s [%(levelname)s] %(name)s: %(message)s'
			
 
				-                },
			
 
				-                'file': {
			
 
				-                    'enabled': True,
			
 
				-                    'level': 'DEBUG',
			
 
				-                    'filename': 'app.log',
			
 
				-                    'format': '%(asctime)s [%(levelname)s] [%(name)s] [user:%(user_id)s] [session:%(session_id)s] %(filename)s:%(lineno)d - %(message)s',
			
 
				-                    'rotation': {
			
 
				-                        'enabled': True,
			
 
				-                        'max_size': '50MB',
			
 
				-                        'backup_count': 10
			
 
				-                    }
			
 
				-                }
			
 
				-            },
			
 
				-            'modules': {}
			
 
				-        }
			
 
				-    
			
 
				-    def _create_console_handler(self, console_config: dict) -> logging.StreamHandler:
			
 
				-        """创建控制台处理器"""
			
 
				-        handler = logging.StreamHandler()
			
 
				-        handler.setLevel(getattr(logging, console_config.get('level', 'INFO').upper()))
			
 
				-        
			
 
				-        formatter = logging.Formatter(
			
 
				-            console_config.get('format', '%(asctime)s [%(levelname)s] %(name)s: %(message)s'),
			
 
				-            datefmt='%Y-%m-%d %H:%M:%S'
			
 
				-        )
			
 
				-        handler.setFormatter(formatter)
			
 
				-        return handler
			
 
				-    
			
 
				-    def _create_file_handler(self, file_config: dict, module: str) -> logging.Handler:
			
 
				-        """创建文件处理器（支持自动轮转）"""
			
 
				-        log_file = self.base_log_dir / file_config.get('filename', f'{module}.log')
			
 
				-        
			
 
				-        # 使用RotatingFileHandler实现自动轮转和清理
			
 
				-        rotation_config = file_config.get('rotation', {})
			
 
				-        if rotation_config.get('enabled', False):
			
 
				-            handler = logging.handlers.RotatingFileHandler(
			
 
				-                log_file,
			
 
				-                maxBytes=self._parse_size(rotation_config.get('max_size', '50MB')),
			
 
				-                backupCount=rotation_config.get('backup_count', 10),
			
 
				-                encoding='utf-8'
			
 
				-            )
			
 
				-        else:
			
 
				-            handler = logging.FileHandler(log_file, encoding='utf-8')
			
 
				-        
			
 
				-        handler.setLevel(getattr(logging, file_config.get('level', 'DEBUG').upper()))
			
 
				-        
			
 
				-        formatter = logging.Formatter(
			
 
				-            file_config.get('format', '%(asctime)s [%(levelname)s] [%(name)s] %(filename)s:%(lineno)d - %(message)s'),
			
 
				-            datefmt='%Y-%m-%d %H:%M:%S'
			
 
				-        )
			
 
				-        handler.setFormatter(formatter)
			
 
				-        return handler
			
 
				-    
			
 
				-    def _parse_size(self, size_str: str) -> int:
			
 
				-        """解析大小字符串，如 '50MB' -> 字节数"""
			
 
				-        size_str = size_str.upper()
			
 
				-        if size_str.endswith('KB'):
			
 
				-            return int(size_str[:-2]) * 1024
			
 
				-        elif size_str.endswith('MB'):
			
 
				-            return int(size_str[:-2]) * 1024 * 1024
			
 
				-        elif size_str.endswith('GB'):
			
 
				-            return int(size_str[:-2]) * 1024 * 1024 * 1024
			
 
				-        else:
			
 
				-            return int(size_str)
			
 
				-    
			
 
				-    def __del__(self):
			
 
				-        """清理资源"""
			
 
				-        if self._executor:
			
 
				-            self._executor.shutdown(wait=False)
			
 
				-```
			
 
				-
			
 
				-### 2.3 统一日志接口（增强版）
			
 
				-
			
 
				-```python
			
 
				-# core/logging/__init__.py
			
 
				-from .log_manager import LogManager
			
 
				-import logging
			
 
				-
			
 
				-# 全局日志管理器实例
			
 
				-_log_manager = LogManager()
			
 
				-
			
 
				-def initialize_logging(config_path: str = "config/logging_config.yaml"):
			
 
				-    """初始化项目日志系统"""
			
 
				-    _log_manager.initialize(config_path)
			
 
				-
			
 
				-def get_logger(name: str, module: str = "default") -> logging.Logger:
			
 
				-    """获取logger实例 - 主要API"""
			
 
				-    return _log_manager.get_logger(name, module)
			
 
				-
			
 
				-# 便捷方法
			
 
				-def get_data_pipeline_logger(name: str) -> logging.Logger:
			
 
				-    """获取data_pipeline模块logger"""
			
 
				-    return get_logger(name, "data_pipeline")
			
 
				-
			
 
				-def get_agent_logger(name: str) -> logging.Logger:
			
 
				-    """获取agent模块logger"""
			
 
				-    return get_logger(name, "agent")
			
 
				-
			
 
				-def get_vanna_logger(name: str) -> logging.Logger:
			
 
				-    """获取vanna模块logger"""
			
 
				-    return get_logger(name, "vanna")
			
 
				-
			
 
				-# 上下文管理便捷方法
			
 
				-def set_log_context(**kwargs):
			
 
				-    """设置日志上下文（可选）
			
 
				-    示例: set_log_context(user_id='user123', session_id='sess456')
			
 
				-    """
			
 
				-    _log_manager.set_context(**kwargs)
			
 
				-
			
 
				-def clear_log_context():
			
 
				-    """清除日志上下文"""
			
 
				-    _log_manager.clear_context()
			
 
				-
			
 
				-# 异步日志便捷方法
			
 
				-async def alog_info(logger: logging.Logger, message: str, **kwargs):
			
 
				-    """异步记录INFO日志"""
			
 
				-    await _log_manager.alog(logger, 'info', message, **kwargs)
			
 
				-
			
 
				-async def alog_error(logger: logging.Logger, message: str, **kwargs):
			
 
				-    """异步记录ERROR日志"""
			
 
				-    await _log_manager.alog(logger, 'error', message, **kwargs)
			
 
				-
			
 
				-async def alog_debug(logger: logging.Logger, message: str, **kwargs):
			
 
				-    """异步记录DEBUG日志"""
			
 
				-    await _log_manager.alog(logger, 'debug', message, **kwargs)
			
 
				-
			
 
				-async def alog_warning(logger: logging.Logger, message: str, **kwargs):
			
 
				-    """异步记录WARNING日志"""
			
 
				-    await _log_manager.alog(logger, 'warning', message, **kwargs)
			
 
				-```
			
 
				-
			
 
				-### 2.4 日志配置文件（支持上下文信息）
			
 
				-
			
 
				-```yaml
			
 
				-# config/logging_config.yaml
			
 
				-version: 1
			
 
				-
			
 
				-# 全局配置
			
 
				-global:
			
 
				-  base_level: INFO
			
 
				-  
			
 
				-# 默认配置
			
 
				-default:
			
 
				-  level: INFO
			
 
				-  console:
			
 
				-    enabled: true
			
 
				-    level: INFO
			
 
				-    format: "%(asctime)s [%(levelname)s] %(name)s: %(message)s"
			
 
				-  file:
			
 
				-    enabled: true
			
 
				-    level: DEBUG
			
 
				-    filename: "app.log"
			
 
				-    # 支持上下文信息，但有默认值避免错误
			
 
				-    format: "%(asctime)s [%(levelname)s] [%(name)s] [user:%(user_id)s] [session:%(session_id)s] %(filename)s:%(lineno)d - %(message)s"
			
 
				-    rotation:
			
 
				-      enabled: true
			
 
				-      max_size: "50MB"
			
 
				-      backup_count: 10
			
 
				-
			
 
				-# 模块特定配置
			
 
				-modules:
			
 
				-  data_pipeline:
			
 
				-    level: DEBUG
			
 
				-    console:
			
 
				-      enabled: true
			
 
				-      level: INFO
			
 
				-      format: "🔄 %(asctime)s [%(levelname)s] Pipeline: %(message)s"
			
 
				-    file:
			
 
				-      enabled: true
			
 
				-      level: DEBUG
			
 
				-      filename: "data_pipeline.log"
			
 
				-      format: "%(asctime)s [%(levelname)s] [%(name)s] %(filename)s:%(lineno)d - %(message)s"
			
 
				-      rotation:
			
 
				-        enabled: true
			
 
				-        max_size: "30MB"
			
 
				-        backup_count: 8
			
 
				-  
			
 
				-  agent:
			
 
				-    level: DEBUG
			
 
				-    console:
			
 
				-      enabled: true
			
 
				-      level: INFO
			
 
				-      format: "🤖 %(asctime)s [%(levelname)s] Agent: %(message)s"
			
 
				-    file:
			
 
				-      enabled: true
			
 
				-      level: DEBUG
			
 
				-      filename: "agent.log"
			
 
				-      # Agent模块支持user_id和session_id
			
 
				-      format: "%(asctime)s [%(levelname)s] [%(name)s] [user:%(user_id)s] [session:%(session_id)s] %(filename)s:%(lineno)d - %(message)s"
			
 
				-      rotation:
			
 
				-        enabled: true
			
 
				-        max_size: "30MB"
			
 
				-        backup_count: 8
			
 
				-  
			
 
				-  vanna:
			
 
				-    level: INFO
			
 
				-    console:
			
 
				-      enabled: true
			
 
				-      level: INFO
			
 
				-      format: "🧠 %(asctime)s [%(levelname)s] Vanna: %(message)s"
			
 
				-    file:
			
 
				-      enabled: true
			
 
				-      level: DEBUG
			
 
				-      filename: "vanna.log"
			
 
				-      format: "%(asctime)s [%(levelname)s] [%(name)s] %(filename)s:%(lineno)d - %(message)s"
			
 
				-      rotation:
			
 
				-        enabled: true
			
 
				-        max_size: "20MB"
			
 
				-        backup_count: 5
			
 
				-```
			
 
				-
			
 
				-## 3. 改造实施步骤
			
 
				-
			
 
				-### 3.1 第一阶段：基础架构搭建
			
 
				-
			
 
				-1. **创建日志服务目录结构**
			
 
				-   ```bash
			
 
				-   mkdir -p core/logging
			
 
				-   mkdir -p config
			
 
				-   mkdir -p logs
			
 
				-   ```
			
 
				-
			
 
				-2. **实现核心组件**
			
 
				-   - 创建 `core/logging/log_manager.py`
			
 
				-   - 创建 `core/logging/__init__.py`
			
 
				-   - 创建 `config/logging_config.yaml`
			
 
				-
			
 
				-3. **集成到citu_app.py（主要应用）**
			
 
				-   ```python
			
 
				-   # 在citu_app.py的开头添加
			
 
				-   from core.logging import initialize_logging, get_logger, set_log_context, clear_log_context
			
 
				-   import uuid
			
 
				-   
			
 
				-   # 初始化日志系统
			
 
				-   initialize_logging("config/logging_config.yaml")
			
 
				-   app_logger = get_logger("CituApp", "default")
			
 
				-   
			
 
				-   # 在Flask应用配置后集成请求级别的日志上下文
			
 
				-   @app.flask_app.before_request
			
 
				-   def before_request():
			
 
				-       # 为每个请求设置上下文（如果有的话）
			
 
				-       request_id = str(uuid.uuid4())[:8]
			
 
				-       user_id = request.headers.get('X-User-ID', 'anonymous')
			
 
				-       set_log_context(request_id=request_id, user_id=user_id)
			
 
				-   
			
 
				-   @app.flask_app.after_request
			
 
				-   def after_request(response):
			
 
				-       # 清理上下文
			
 
				-       clear_log_context()
			
 
				-       return response
			
 
				-   ```
			
 
				-
			
 
				-### 3.2 第二阶段：模块改造
			
 
				-
			
 
				-#### 3.2.1 改造data_pipeline模块
			
 
				-
			
 
				-```python
			
 
				-# 替换 data_pipeline/utils/logger.py 中的使用方式
			
 
				-from core.logging import get_data_pipeline_logger
			
 
				-
			
 
				-def setup_logging(verbose: bool = False, log_file: str = None, log_dir: str = None):
			
 
				-    """
			
 
				-    保持原有接口，内部使用新的日志系统
			
 
				-    """
			
 
				-    # 不再需要复杂的设置，直接使用统一日志系统
			
 
				-    pass
			
 
				-
			
 
				-# 在各个文件中使用
			
 
				-# data_pipeline/qa_generation/qs_agent.py
			
 
				-class QuestionSQLGenerationAgent:
			
 
				-    def __init__(self, ...):
			
 
				-        # 替换原有的 logging.getLogger("schema_tools.QSAgent")
			
 
				-        self.logger = get_data_pipeline_logger("QSAgent")
			
 
				-        
			
 
				-    async def generate(self):
			
 
				-        self.logger.info("🚀 开始生成Question-SQL训练数据")
			
 
				-        # ... 其他代码
			
 
				-        
			
 
				-        # 手动记录关键节点的时间
			
 
				-        start_time = time.time()
			
 
				-        self.logger.info("开始初始化LLM组件")
			
 
				-        
			
 
				-        self._initialize_llm_components()
			
 
				-        
			
 
				-        init_time = time.time() - start_time
			
 
				-        self.logger.info(f"LLM组件初始化完成，耗时: {init_time:.2f}秒")
			
 
				-```
			
 
				-
			
 
				-#### 3.2.2 改造Agent模块（支持可选的用户上下文）
			
 
				-
			
 
				-```python
			
 
				-# 在ask_agent接口中使用
			
 
				-@app.flask_app.route('/api/v0/ask_agent', methods=['POST'])
			
 
				-def ask_agent():
			
 
				-    logger = get_agent_logger("AskAgent")
			
 
				-    
			
 
				-    try:
			
 
				-        data = request.json
			
 
				-        question = data.get('question', '')
			
 
				-        user_id = data.get('user_id')  # 可选
			
 
				-        session_id = data.get('session_id')  # 可选
			
 
				-        
			
 
				-        # 设置上下文（如果有的话）
			
 
				-        if user_id or session_id:
			
 
				-            set_log_context(user_id=user_id or 'anonymous', session_id=session_id or 'N/A')
			
 
				-        
			
 
				-        logger.info(f"收到问题: {question[:50]}...")
			
 
				-        
			
 
				-        # 异步记录示例（在async函数中）
			
 
				-        # await alog_info(logger, f"开始处理问题: {question}")
			
 
				-        
			
 
				-        # ... 其他处理逻辑
			
 
				-        
			
 
				-    except Exception as e:
			
 
				-        logger.error(f"处理失败: {str(e)}", exc_info=True)
			
 
				-        # ...
			
 
				-```
			
 
				-
			
 
				-#### 3.2.3 改造vanna相关代码
			
 
				-
			
 
				-由于vanna使用print方式，创建简单的适配器：
			
 
				-
			
 
				-```python
			
 
				-# core/logging/vanna_adapter.py
			
 
				-from core.logging import get_vanna_logger
			
 
				-
			
 
				-class VannaLogAdapter:
			
 
				-    """Vanna日志适配器 - 将print转换为logger调用"""
			
 
				-    
			
 
				-    def __init__(self, logger_name: str = "VannaBase"):
			
 
				-        self.logger = get_vanna_logger(logger_name)
			
 
				-    
			
 
				-    def log(self, message: str):
			
 
				-        """替换vanna的log方法"""
			
 
				-        # 根据内容判断日志级别
			
 
				-        message_lower = message.lower()
			
 
				-        if any(keyword in message_lower for keyword in ['error', 'exception', 'fail']):
			
 
				-            self.logger.error(message)
			
 
				-        elif any(keyword in message_lower for keyword in ['warning', 'warn']):
			
 
				-            self.logger.warning(message)
			
 
				-        else:
			
 
				-            self.logger.info(message)
			
 
				-
			
 
				-# 使用装饰器改造vanna实例
			
 
				-def enhance_vanna_logging(vanna_instance):
			
 
				-    """增强vanna实例的日志功能"""
			
 
				-    adapter = VannaLogAdapter(vanna_instance.__class__.__name__)
			
 
				-    
			
 
				-    # 替换log方法
			
 
				-    vanna_instance.log = adapter.log
			
 
				-    return vanna_instance
			
 
				-
			
 
				-# 在vanna实例创建时使用
			
 
				-# core/vanna_llm_factory.py
			
 
				-from core.logging.vanna_adapter import enhance_vanna_logging
			
 
				-
			
 
				-def create_vanna_instance():
			
 
				-    # 原有创建逻辑
			
 
				-    vn = VannaDefault(...)
			
 
				-    
			
 
				-    # 增强日志功能
			
 
				-    vn = enhance_vanna_logging(vn)
			
 
				-    
			
 
				-    return vn
			
 
				-```
			
 
				-
			
 
				-### 3.3 第三阶段：workflow级别的时间统计
			
 
				-
			
 
				-对于跨多个函数的执行时间统计，在关键业务节点手动记录：
			
 
				-
			
 
				-```python
			
 
				-# data_pipeline/schema_workflow.py
			
 
				-import time
			
 
				-from core.logging import get_data_pipeline_logger
			
 
				-
			
 
				-class SchemaWorkflowOrchestrator:
			
 
				-    def __init__(self, ...):
			
 
				-        self.logger = get_data_pipeline_logger("SchemaWorkflow")
			
 
				-    
			
 
				-    async def run_full_workflow(self):
			
 
				-        """执行完整工作流"""
			
 
				-        workflow_start = time.time()
			
 
				-        self.logger.info("🚀 开始执行完整的Schema工作流")
			
 
				-        
			
 
				-        try:
			
 
				-            # 步骤1：生成DDL和MD文件
			
 
				-            step1_start = time.time()
			
 
				-            self.logger.info("📝 步骤1: 开始生成DDL和MD文件")
			
 
				-            
			
 
				-            result1 = await self.generate_ddl_md()
			
 
				-            
			
 
				-            step1_time = time.time() - step1_start
			
 
				-            self.logger.info(f"✅ 步骤1完成，生成了{result1['ddl_count']}个DDL文件和{result1['md_count']}个MD文件，耗时: {step1_time:.2f}秒")
			
 
				-            
			
 
				-            # 步骤2：生成Question-SQL对
			
 
				-            step2_start = time.time()
			
 
				-            self.logger.info("❓ 步骤2: 开始生成Question-SQL对")
			
 
				-            
			
 
				-            result2 = await self.generate_qa_pairs()
			
 
				-            
			
 
				-            step2_time = time.time() - step2_start
			
 
				-            self.logger.info(f"✅ 步骤2完成，生成了{result2['qa_count']}个问答对，耗时: {step2_time:.2f}秒")
			
 
				-            
			
 
				-            # 步骤3：验证SQL
			
 
				-            step3_start = time.time()
			
 
				-            self.logger.info("🔍 步骤3: 开始验证SQL")
			
 
				-            
			
 
				-            result3 = await self.validate_sql()
			
 
				-            
			
 
				-            step3_time = time.time() - step3_start
			
 
				-            self.logger.info(f"✅ 步骤3完成，验证了{result3['validated_count']}个SQL，修复了{result3['fixed_count']}个，耗时: {step3_time:.2f}秒")
			
 
				-            
			
 
				-            # 步骤4：加载训练数据
			
 
				-            step4_start = time.time()
			
 
				-            self.logger.info("📚 步骤4: 开始加载训练数据")
			
 
				-            
			
 
				-            result4 = await self.load_training_data()
			
 
				-            
			
 
				-            step4_time = time.time() - step4_start
			
 
				-            self.logger.info(f"✅ 步骤4完成，加载了{result4['loaded_count']}个训练文件，耗时: {step4_time:.2f}秒")
			
 
				-            
			
 
				-            # 总结
			
 
				-            total_time = time.time() - workflow_start
			
 
				-            self.logger.info(f"🎉 完整工作流执行成功！总耗时: {total_time:.2f}秒")
			
 
				-            self.logger.info(f"   - DDL/MD生成: {step1_time:.2f}秒")
			
 
				-            self.logger.info(f"   - QA生成: {step2_time:.2f}秒")  
			
 
				-            self.logger.info(f"   - SQL验证: {step3_time:.2f}秒")
			
 
				-            self.logger.info(f"   - 数据加载: {step4_time:.2f}秒")
			
 
				-            
			
 
				-            return {
			
 
				-                "success": True,
			
 
				-                "total_time": total_time,
			
 
				-                "steps": {
			
 
				-                    "ddl_md": {"time": step1_time, "result": result1},
			
 
				-                    "qa_generation": {"time": step2_time, "result": result2},
			
 
				-                    "sql_validation": {"time": step3_time, "result": result3},
			
 
				-                    "data_loading": {"time": step4_time, "result": result4}
			
 
				-                }
			
 
				-            }
			
 
				-            
			
 
				-        except Exception as e:
			
 
				-            total_time = time.time() - workflow_start
			
 
				-            self.logger.error(f"❌ 工作流执行失败，耗时: {total_time:.2f}秒，错误: {str(e)}")
			
 
				-            raise
			
 
				-```
			
 
				-
			
 
				-## 4. 实际使用示例
			
 
				-
			
 
				-### 4.1 在citu_app.py中的使用（主要应用）
			
 
				-
			
 
				-```python
			
 
				-# citu_app.py
			
 
				-from core.logging import initialize_logging, get_logger, set_log_context, clear_log_context
			
 
				-import uuid
			
 
				-
			
 
				-# 应用启动时初始化
			
 
				-initialize_logging("config/logging_config.yaml")
			
 
				-app_logger = get_logger("CituApp", "default")
			
 
				-
			
 
				-# API端点示例
			
 
				-@app.flask_app.route('/api/v0/ask_agent', methods=['POST'])
			
 
				-def ask_agent():
			
 
				-    logger = get_agent_logger("AskAgent")
			
 
				-    request_id = str(uuid.uuid4())[:8]
			
 
				-    
			
 
				-    try:
			
 
				-        data = request.json
			
 
				-        user_id = data.get('user_id')
			
 
				-        
			
 
				-        # 设置上下文（安全的，即使没有user_id）
			
 
				-        set_log_context(
			
 
				-            request_id=request_id,
			
 
				-            user_id=user_id or 'anonymous'
			
 
				-        )
			
 
				-        
			
 
				-        logger.info(f"开始处理请求")
			
 
				-        # ... 业务逻辑
			
 
				-        
			
 
				-        logger.info(f"请求处理成功")
			
 
				-        return success_response(...)
			
 
				-        
			
 
				-    except Exception as e:
			
 
				-        logger.error(f"请求处理失败: {str(e)}", exc_info=True)
			
 
				-        return error_response(...)
			
 
				-    finally:
			
 
				-        clear_log_context()
			
 
				-```
			
 
				-
			
 
				-### 4.2 在data_pipeline中的使用
			
 
				-
			
 
				-```python
			
 
				-# data_pipeline/ddl_generation/training_data_agent.py
			
 
				-from core.logging import get_data_pipeline_logger
			
 
				-import time
			
 
				-
			
 
				-class SchemaTrainingDataAgent:
			
 
				-    def __init__(self, db_config, output_dir):
			
 
				-        self.logger = get_data_pipeline_logger("TrainingDataAgent")
			
 
				-        self.db_config = db_config
			
 
				-        self.output_dir = output_dir
			
 
				-        
			
 
				-    async def process_tables(self, table_list):
			
 
				-        """处理表列表"""
			
 
				-        start_time = time.time()
			
 
				-        self.logger.info(f"开始处理{len(table_list)}个表的训练数据生成")
			
 
				-        
			
 
				-        success_count = 0
			
 
				-        failed_tables = []
			
 
				-        
			
 
				-        for table in table_list:
			
 
				-            try:
			
 
				-                table_start = time.time()
			
 
				-                self.logger.debug(f"开始处理表: {table}")
			
 
				-                
			
 
				-                await self._process_single_table(table)
			
 
				-                
			
 
				-                table_time = time.time() - table_start
			
 
				-                self.logger.info(f"表 {table} 处理完成，耗时: {table_time:.2f}秒")
			
 
				-                success_count += 1
			
 
				-                
			
 
				-            except Exception as e:
			
 
				-                self.logger.error(f"表 {table} 处理失败: {str(e)}")
			
 
				-                failed_tables.append(table)
			
 
				-        
			
 
				-        total_time = time.time() - start_time
			
 
				-        self.logger.info(f"批量处理完成，成功: {success_count}个，失败: {len(failed_tables)}个，总耗时: {total_time:.2f}秒")
			
 
				-        
			
 
				-        if failed_tables:
			
 
				-            self.logger.warning(f"处理失败的表: {failed_tables}")
			
 
				-            
			
 
				-        return {
			
 
				-            "success_count": success_count,
			
 
				-            "failed_count": len(failed_tables),
			
 
				-            "failed_tables": failed_tables,
			
 
				-            "total_time": total_time
			
 
				-        }
			
 
				-```
			
 
				-
			
 
				-### 4.3 在Agent中的使用（支持异步）
			
 
				-
			
 
				-```python
			
 
				-# agent/citu_agent.py
			
 
				-from core.logging import get_agent_logger, alog_info, alog_error
			
 
				-
			
 
				-class CituLangGraphAgent:
			
 
				-    def __init__(self):
			
 
				-        self.logger = get_agent_logger("CituAgent")
			
 
				-    
			
 
				-    async def process_question(self, question: str, session_id: str = None, user_id: str = None):
			
 
				-        """异步处理问题"""
			
 
				-        # 设置上下文（如果有的话）
			
 
				-        if user_id or session_id:
			
 
				-            set_log_context(user_id=user_id or 'anonymous', session_id=session_id or 'N/A')
			
 
				-        
			
 
				-        # 同步日志
			
 
				-        self.logger.info(f"开始处理问题: {question[:50]}...")
			
 
				-        
			
 
				-        try:
			
 
				-            # 异步日志
			
 
				-            await alog_info(self.logger, f"开始分类问题")
			
 
				-            
			
 
				-            # 业务逻辑
			
 
				-            result = await self._classify_question(question)
			
 
				-            
			
 
				-            await alog_info(self.logger, f"分类完成: {result.question_type}")
			
 
				-            
			
 
				-            return result
			
 
				-            
			
 
				-        except Exception as e:
			
 
				-            await alog_error(self.logger, f"处理失败: {str(e)}")
			
 
				-            raise
			
 
				-```
			
 
				-
			
 
				-### 4.4 增强vanna日志
			
 
				-
			
 
				-```python
			
 
				-# core/vanna_llm_factory.py
			
 
				-from core.logging.vanna_adapter import enhance_vanna_logging
			
 
				-from core.logging import get_vanna_logger
			
 
				-
			
 
				-def create_vanna_instance():
			
 
				-    """创建增强了日志功能的vanna实例"""
			
 
				-    logger = get_vanna_logger("VannaFactory")
			
 
				-    logger.info("🧠 开始创建Vanna实例")
			
 
				-    
			
 
				-    try:
			
 
				-        # 原有创建逻辑
			
 
				-        vn = VannaDefault(
			
 
				-            config={
			
 
				-                'api_key': os.getenv('OPENAI_API_KEY'),
			
 
				-                'model': 'gpt-4'
			
 
				-            }
			
 
				-        )
			
 
				-        
			
 
				-        # 增强日志功能
			
 
				-        vn = enhance_vanna_logging(vn)
			
 
				-        
			
 
				-        logger.info("✅ Vanna实例创建成功")
			
 
				-        return vn
			
 
				-        
			
 
				-    except Exception as e:
			
 
				-        logger.error(f"❌ Vanna实例创建失败: {str(e)}")
			
 
				-        raise
			
 
				-```
			
 
				-
			
 
				-## 5. 配置调优建议
			
 
				-
			
 
				-### 5.1 开发环境配置
			
 
				-
			
 
				-```yaml
			
 
				-# config/logging_config_dev.yaml
			
 
				-version: 1
			
 
				-
			
 
				-global:
			
 
				-  base_level: DEBUG
			
 
				-
			
 
				-default:
			
 
				-  level: DEBUG
			
 
				-  console:
			
 
				-    enabled: true
			
 
				-    level: DEBUG
			
 
				-  file:
			
 
				-    enabled: false  # 开发环境可以只用控制台
			
 
				-
			
 
				-modules:
			
 
				-  data_pipeline:
			
 
				-    level: DEBUG
			
 
				-    console:
			
 
				-      enabled: true
			
 
				-      level: DEBUG
			
 
				-      format: "🔄 %(asctime)s [%(levelname)s] Pipeline: %(message)s"
			
 
				-    file:
			
 
				-      enabled: true
			
 
				-      level: DEBUG
			
 
				-      filename: "data_pipeline.log"
			
 
				-      
			
 
				-  agent:
			
 
				-    level: DEBUG
			
 
				-    console:
			
 
				-      enabled: true
			
 
				-      level: DEBUG
			
 
				-      format: "🤖 %(asctime)s [%(levelname)s] Agent: %(message)s"
			
 
				-```
			
 
				-
			
 
				-### 5.2 生产环境配置
			
 
				-
			
 
				-```yaml
			
 
				-# config/logging_config_prod.yaml
			
 
				-version: 1
			
 
				-
			
 
				-global:
			
 
				-  base_level: INFO
			
 
				-
			
 
				-default:
			
 
				-  level: INFO
			
 
				-  console:
			
 
				-    enabled: false  # 生产环境不输出到控制台
			
 
				-  file:
			
 
				-    enabled: true
			
 
				-    level: INFO
			
 
				-    rotation:
			
 
				-      enabled: true
			
 
				-      max_size: "100MB"
			
 
				-      backup_count: 20
			
 
				-
			
 
				-modules:
			
 
				-  data_pipeline:
			
 
				-    level: INFO
			
 
				-    console:
			
 
				-      enabled: false
			
 
				-    file:
			
 
				-      enabled: true
			
 
				-      level: INFO
			
 
				-      filename: "data_pipeline.log"
			
 
				-      rotation:
			
 
				-        enabled: true
			
 
				-        max_size: "50MB"
			
 
				-        backup_count: 15
			
 
				-        
			
 
				-  langchain:
			
 
				-    level: ERROR  # 生产环境只记录错误
			
 
				-    console:
			
 
				-      enabled: false
			
 
				-    file:
			
 
				-      enabled: true
			
 
				-      level: ERROR
			
 
				-```
			
 
				-
			
 
				-## 6. 注意事项
			
 
				-
			
 
				-基于用户反馈，特别注意以下几点：
			
 
				-
			
 
				-1. **上下文安全性**：即使没有用户信息，日志系统也能正常工作（使用默认值）
			
 
				-2. **降级策略**：当文件系统不可用时，自动降级到控制台输出
			
 
				-3. **异步支持**：在async函数中使用异步日志方法，避免阻塞
			
 
				-4. **主应用聚焦**：重点关注citu_app.py的集成，忽略flask_app.py和chainlit_app.py
			
 
				-5. **性能考虑**：保持原有的跨函数时间统计方式，不强制使用装饰器
			
 
				-
			
 
				-## 7. 总结
			
 
				-
			
 
				-这个精简实用的日志改造方案提供了：
			
 
				-
			
 
				-1. **统一的日志管理**：类似Log4j的架构，单一配置文件管理所有日志
			
 
				-2. **模块化日志文件**：每个模块独立的日志文件，便于问题定位
			
 
				-3. **自动日志轮转**：使用RotatingFileHandler自动管理日志文件大小和数量
			
 
				-4. **灵活的配置**：支持不同环境的配置，控制台和文件输出可独立配置
			
 
				-5. **简单易用**：提供便捷的API，一行代码获取对应模块的logger
			
 
				-6. **性能友好**：手动记录关键节点时间，不影响整体性能
			
 
				-7. **技术栈兼容**：专门为vanna/langchain/langgraph设计适配器
			
 
				-8. **异步支持**：适配项目大量使用async/await的特点
			
 
				-9. **安全容错**：上下文信息可选，文件系统可降级
			
 
				-
			
 
				-该方案专注核心功能，去掉了不必要的复杂性，是一个可以直接落地实施的实用设计。