wangxiaoqing_citu
/
citu_vanna


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677
							import os
from abc import ABC, abstractmethod
from typing import List, Dict, Any, Optional, Union, Tuple
import pandas as pd
import plotly.graph_objs
from vanna.base import VannaBase
from core.logging import get_vanna_logger
# 导入配置参数
from app_config import REWRITE_QUESTION_ENABLED, DISPLAY_RESULT_THINKING
# 导入提示词加载器
from .load_prompts import get_prompt_loader


class BaseLLMChat(VannaBase, ABC):
    """自定义LLM聊天基类，包含公共方法"""
    
    def __init__(self, config=None):
        VannaBase.__init__(self, config=config)

        # 初始化日志
        self.logger = get_vanna_logger("BaseLLMChat")

        # 存储LLM解释性文本
        self.last_llm_explanation = None
        
        # 初始化提示词加载器
        self.prompt_loader = get_prompt_loader()
        
        self.logger.info("传入的 config 参数如下：")
        for key, value in self.config.items():
            self.logger.info(f"  {key}: {value}")
        
        # 默认参数
        self.temperature = 0.7
        
        if "temperature" in config:
            self.logger.info(f"temperature is changed to: {config['temperature']}")
            self.temperature = config["temperature"]
        
        # 加载错误SQL提示配置
        self.enable_error_sql_prompt = self._load_error_sql_prompt_config()

    def _load_error_sql_prompt_config(self) -> bool:
        """从app_config.py加载错误SQL提示配置"""
        try:
            import app_config
            enable_error_sql = getattr(app_config, 'ENABLE_ERROR_SQL_PROMPT', False)
            self.logger.debug(f"错误SQL提示配置: ENABLE_ERROR_SQL_PROMPT = {enable_error_sql}")
            return enable_error_sql
        except (ImportError, AttributeError) as e:
            self.logger.warning(f"无法加载错误SQL提示配置: {e}，使用默认值 False")
            return False

    def log(self, message: str, title: str = "Info"):
        """
        重写父类的log方法，使用项目的日志系统替代print输出
        
        Args:
            message: 日志消息
            title: 日志标题
        """
        # 将Vanna的log输出转换为项目的日志格式
        if title == "SQL Prompt":
            # 对于SQL Prompt，使用debug级别，避免输出过长的内容
            # 将列表格式转换为字符串，只显示前200个字符
            if isinstance(message, list):
                message_str = str(message)[:200] + "..." if len(str(message)) > 200 else str(message)
            else:
                message_str = str(message)[:200] + "..." if len(str(message)) > 200 else str(message)
            self.logger.debug(f"[Vanna] {title}: {message_str}")
        elif title == "LLM Response":
            # 对于LLM响应，记录但不显示全部内容
            if isinstance(message, str):
                message_str = message[:200] + "..." if len(message) > 200 else message
            else:
                message_str = str(message)[:200] + "..." if len(str(message)) > 200 else str(message)
            self.logger.debug(f"[Vanna] {title}: {message_str}")
        elif title == "Extracted SQL":
            # 对于提取的SQL，使用info级别
            self.logger.info(f"[Vanna] {title}: {message}")
        else:
            # 其他日志使用info级别
            self.logger.info(f"[Vanna] {title}: {message}")

    def system_message(self, message: str) -> dict:
        """创建系统消息格式"""
        self.logger.debug(f"system_content: {message}")
        return {"role": "system", "content": message}

    def user_message(self, message: str) -> dict:
        """创建用户消息格式"""
        self.logger.debug(f"\nuser_content: {message}")
        return {"role": "user", "content": message}

    def assistant_message(self, message: str) -> dict:
        """创建助手消息格式"""
        self.logger.debug(f"assistant_content: {message}")
        return {"role": "assistant", "content": message}

    def get_sql_prompt(self, initial_prompt: str, question: str, question_sql_list: list, ddl_list: list, doc_list: list, **kwargs):
        """
        基于VannaBase源码实现，在第7点添加中文别名指令
        """
        self.logger.debug(f"开始生成SQL提示词，问题: {question}")
        
        if initial_prompt is None:
            initial_prompt = self.prompt_loader.get_sql_initial_prompt(self.dialect)

        # 提取DDL内容（适配新的字典格式）
        ddl_content_list = []
        if ddl_list:
            for item in ddl_list:
                if isinstance(item, dict) and "content" in item:
                    ddl_content_list.append(item["content"])
                elif isinstance(item, str):
                    ddl_content_list.append(item)
        
        initial_prompt = self.add_ddl_to_prompt(
            initial_prompt, ddl_content_list, max_tokens=self.max_tokens
        )

        # 提取文档内容（适配新的字典格式）
        doc_content_list = []
        if doc_list:
            for item in doc_list:
                if isinstance(item, dict) and "content" in item:
                    doc_content_list.append(item["content"])
                elif isinstance(item, str):
                    doc_content_list.append(item)
        
        if self.static_documentation != "":
            doc_content_list.append(self.static_documentation)

        initial_prompt = self.add_documentation_to_prompt(
            initial_prompt, doc_content_list, max_tokens=self.max_tokens
        )

        # 新增：添加错误SQL示例作为负面示例（放在Response Guidelines之前）
        if self.enable_error_sql_prompt:
            try:
                error_sql_list = self.get_related_error_sql(question, **kwargs)
                if error_sql_list:
                    self.logger.debug(f"找到 {len(error_sql_list)} 个相关的错误SQL示例")
                    
                    # 构建格式化的负面提示内容
                    negative_prompt_content = "===Negative Examples\n"
                    negative_prompt_content += "下面是错误的SQL示例，请分析这些错误SQL的问题所在，并在生成新SQL时避免类似错误：\n\n"
                    
                    for i, error_example in enumerate(error_sql_list, 1):
                        if "question" in error_example and "sql" in error_example:
                            similarity = error_example.get('similarity', 'N/A')
                            self.logger.debug(f"错误SQL示例 {i}: 相似度={similarity}")
                            negative_prompt_content += f"问题: {error_example['question']}\n"
                            negative_prompt_content += f"错误的SQL: {error_example['sql']}\n\n"
                    
                    # 将负面提示添加到初始提示中
                    initial_prompt += negative_prompt_content
                else:
                    self.logger.debug("未找到相关的错误SQL示例")
            except Exception as e:
                self.logger.warning(f"获取错误SQL示例失败: {e}")

        initial_prompt += self.prompt_loader.get_sql_response_guidelines(self.dialect)

        message_log = [self.system_message(initial_prompt)]

        for example in question_sql_list:
            if example is None:
                self.logger.warning("example is None")
            else:
                if example is not None and "question" in example and "sql" in example:
                    message_log.append(self.user_message(example["question"]))
                    message_log.append(self.assistant_message(example["sql"]))

        message_log.append(self.user_message(question))
        
        return message_log

    def generate_plotly_code(self, question: str = None, sql: str = None, df_metadata: str = None, **kwargs) -> str:
        """
        重写父类方法，添加明确的中文图表指令
        """
        # 构建系统消息
        system_msg = self.prompt_loader.get_chart_system_message(
            question=question,
            sql=sql,
            df_metadata=df_metadata
        )

        # 构建用户消息
        user_msg = self.prompt_loader.get_chart_user_message()

        message_log = [
            self.system_message(system_msg),
            self.user_message(user_msg),
        ]

        # 调用submit_prompt方法，并清理结果
        plotly_code = self.submit_prompt(message_log, **kwargs)
        
        # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
        if not DISPLAY_RESULT_THINKING:
            original_code = plotly_code
            plotly_code = self._remove_thinking_content(plotly_code)
            self.logger.debug(f"generate_plotly_code隐藏thinking内容 - 原始长度: {len(original_code)}, 处理后长度: {len(plotly_code)}")

        return self._sanitize_plotly_code(self._extract_python_code(plotly_code))

    def _extract_python_code(self, response: str) -> str:
        """从LLM响应中提取Python代码"""
        if not response:
            return ""
        
        # 查找代码块
        import re
        
        # 匹配 ```python 或 ``` 代码块
        code_pattern = r'```(?:python)?\s*(.*?)```'
        matches = re.findall(code_pattern, response, re.DOTALL)
        
        if matches:
            return matches[0].strip()
        
        # 如果没有找到代码块，返回原始响应
        return response.strip()

    def _sanitize_plotly_code(self, code: str) -> str:
        """清理和验证Plotly代码"""
        if not code:
            return ""
        
        # 基本的代码清理
        lines = code.split('\n')
        cleaned_lines = []
        
        for line in lines:
            # 移除空行和注释行
            line = line.strip()
            if line and not line.startswith('#'):
                cleaned_lines.append(line)
        
        return '\n'.join(cleaned_lines)

    def should_generate_chart(self, df) -> bool:
        """
        判断是否应该生成图表
        对于Flask应用，这个方法决定了前端是否显示图表生成按钮
        """
        if df is None or df.empty:
            self.logger.debug("should_generate_chart: df为空，返回False")
            return False
        
        # 如果数据有多行或多列，通常适合生成图表
        result = len(df) > 1 or len(df.columns) > 1
        self.logger.debug(f"should_generate_chart: df.shape={df.shape}, 返回{result}")
        
        if result:
            return True
        
        return False

    def generate_sql(self, question: str, **kwargs) -> str:
        """
        重写父类的 generate_sql 方法，增加异常处理和解释性文本保存
        """
        try:
            # 清空上次的解释性文本
            self.last_llm_explanation = None
            
            self.logger.debug(f"尝试为问题生成SQL: {question}")
            # 调用父类的 generate_sql
            sql = super().generate_sql(question, **kwargs)
            
            if not sql or sql.strip() == "":
                self.logger.warning("生成的SQL为空")
                explanation = "无法生成SQL查询，可能是问题描述不够清晰或缺少必要的数据表信息。"
                # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
                if not DISPLAY_RESULT_THINKING:
                    explanation = self._remove_thinking_content(explanation)
                self.last_llm_explanation = explanation
                return None
            
            # 替换 "\_" 为 "_"，解决特殊字符转义问题
            sql = sql.replace("\\_", "_")
            
            # 检查返回内容是否为有效SQL或错误信息
            sql_lower = sql.lower().strip()
            
            # 检查是否包含错误提示信息
            error_indicators = [
                "insufficient context", "无法生成", "sorry", "cannot generate", "cannot", "不能",
                "no relevant", "no suitable", "unable to", "无法", "抱歉",
                "i don't have", "i cannot", "没有相关", "找不到", "不存在", "上下文不足",
                "没有直接存储", "无法直接查询", "没有存储", "not enough information", "unclear"
            ]
            
            for indicator in error_indicators:
                if indicator in sql_lower:
                    self.logger.warning(f"LLM返回错误信息而非SQL: {sql}")
                    # 保存LLM的解释性文本，并根据配置处理thinking内容
                    explanation = sql
                    if not DISPLAY_RESULT_THINKING:
                        explanation = self._remove_thinking_content(explanation)
                        self.logger.debug("隐藏thinking内容 - SQL生成解释性文本")
                    self.last_llm_explanation = explanation
                    return None
            
            # 简单检查是否像SQL语句（至少包含一些SQL关键词）
            sql_keywords = ["select", "insert", "update", "delete", "with", "from", "where"]
            if not any(keyword in sql_lower for keyword in sql_keywords):
                self.logger.warning(f"返回内容不像有效SQL: {sql}")
                # 保存LLM的解释性文本，并根据配置处理thinking内容
                explanation = sql
                if not DISPLAY_RESULT_THINKING:
                    explanation = self._remove_thinking_content(explanation)
                    self.logger.debug("隐藏thinking内容 - SQL生成非有效SQL内容")
                self.last_llm_explanation = explanation
                return None
                
            self.logger.info(f"成功生成SQL:\n {sql}")
            # 清空解释性文本
            self.last_llm_explanation = None
            return sql
            
        except Exception as e:
            self.logger.error(f"SQL生成过程中出现异常: {str(e)}")
            self.logger.error(f"异常类型: {type(e).__name__}")
            # 导入traceback以获取详细错误信息
            import traceback
            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
            explanation = f"SQL生成过程中出现异常: {str(e)}"
            # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
            if not DISPLAY_RESULT_THINKING:
                explanation = self._remove_thinking_content(explanation)
            self.last_llm_explanation = explanation
            return None

    def generate_question(self, sql: str, **kwargs) -> str:
        """根据SQL生成中文问题"""
        prompt = [
            self.system_message(
                self.prompt_loader.get_question_generation_prompt()
            ),
            self.user_message(sql)
        ]
        response = self.submit_prompt(prompt, **kwargs)
        
        # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
        if not DISPLAY_RESULT_THINKING:
            original_response = response
            response = self._remove_thinking_content(response)
            self.logger.debug(f"generate_question隐藏thinking内容 - 原始长度: {len(original_response)}, 处理后长度: {len(response)}")
        
        return response

    # def chat_with_llm(self, question: str, **kwargs) -> str:
    #     """
    #     直接与LLM对话，不涉及SQL生成
    #     """
    #     try:
    #         prompt = [
    #             self.system_message(
    #                 "你是一个友好的AI助手。如果用户询问的是数据库相关问题，请建议他们重新表述问题以便进行SQL查询。对于其他问题，请尽力提供有帮助的回答。"
    #             ),
    #             self.user_message(question)
    #         ]
    #         response = self.submit_prompt(prompt, **kwargs)
    #         return response
    #     except Exception as e:
    #         self.logger.error(f"LLM对话失败: {str(e)}")
    #         return f"抱歉，我暂时无法回答您的问题。请稍后再试。"

    def chat_with_llm(self, question: str, system_prompt: str = None, **kwargs) -> str:
        """
        直接与LLM对话，不涉及SQL生成        
        Args:
            question: 用户问题
            system_prompt: 自定义系统提示词，如果为None则使用默认提示词
            **kwargs: 其他传递给submit_prompt的参数            
        Returns:
            LLM的响应文本
        """
        try:
            # 如果没有提供自定义系统提示词，使用默认的
            if system_prompt is None:
                system_prompt = self.prompt_loader.get_chat_default_prompt()
            
            prompt = [
                self.system_message(system_prompt),
                self.user_message(question)
            ]
            
            response = self.submit_prompt(prompt, **kwargs)
            
            # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
            if not DISPLAY_RESULT_THINKING:
                original_response = response
                response = self._remove_thinking_content(response)
                self.logger.debug(f"chat_with_llm隐藏thinking内容 - 原始长度: {len(original_response)}, 处理后长度: {len(response)}")
            
            return response
            
        except Exception as e:
            self.logger.error(f"LLM对话失败: {str(e)}")
            return f"抱歉，我暂时无法回答您的问题。请稍后再试。"

    def generate_rewritten_question(self, last_question: str, new_question: str, **kwargs) -> str:
        """
        重写问题合并方法，通过配置参数控制是否启用合并功能
        
        Args:
            last_question (str): 上一个问题
            new_question (str): 新问题
            **kwargs: 其他参数
            
        Returns:
            str: 如果启用合并且问题相关则返回合并后的问题，否则返回新问题
        """
        # 如果未启用合并功能或没有上一个问题，直接返回新问题
        if not REWRITE_QUESTION_ENABLED or last_question is None:
            self.logger.debug(f"问题合并功能{'未启用' if not REWRITE_QUESTION_ENABLED else '上一个问题为空'}，直接返回新问题")
            return new_question
        
        self.logger.debug("启用问题合并功能，尝试合并问题")
        self.logger.debug(f"上一个问题: {last_question}")
        self.logger.debug(f"新问题: {new_question}")
        
        try:
            prompt = [
                self.system_message(
                    self.prompt_loader.get_question_merge_prompt()
                ),
                self.user_message(f"第一个问题: {last_question}\n第二个问题: {new_question}")
            ]
            
            rewritten_question = self.submit_prompt(prompt=prompt, **kwargs)
            
            # 根据 DISPLAY_RESULT_THINKING 参数处理thinking内容
            if not DISPLAY_RESULT_THINKING:
                original_question = rewritten_question
                rewritten_question = self._remove_thinking_content(rewritten_question)
                self.logger.debug(f"generate_rewritten_question隐藏thinking内容 - 原始长度: {len(original_question)}, 处理后长度: {len(rewritten_question)}")
            
            self.logger.debug(f"合并后的问题: {rewritten_question}")
            return rewritten_question
            
        except Exception as e:
            self.logger.error(f"问题合并失败: {str(e)}")
            # 如果合并失败，返回新问题
            return new_question

    def generate_summary(self, question: str, df, **kwargs) -> str:
        """
        覆盖父类的 generate_summary 方法，添加中文思考和回答指令
        
        Args:
            question (str): 用户提出的问题
            df: 查询结果的 DataFrame
            **kwargs: 其他参数
            
        Returns:
            str: 数据摘要
        """
        try:
            # 导入 pandas 用于 DataFrame 处理
            import pandas as pd
            
            # 确保 df 是 pandas DataFrame
            if not isinstance(df, pd.DataFrame):
                self.logger.warning(f"df 不是 pandas DataFrame，类型: {type(df)}")
                return "无法生成摘要：数据格式不正确"
            
            if df.empty:
                return "查询结果为空，无数据可供摘要。"
            
            self.logger.debug(f"生成摘要 - 问题: {question}")
            self.logger.debug(f"DataFrame 形状: {df.shape}")
            
            # 构建包含中文指令的系统消息
            system_content = self.prompt_loader.get_summary_system_message(
                question=question,
                df_markdown=df.to_markdown()
            )
            
            # 构建用户消息，强调中文思考和回答
            user_content = self.prompt_loader.get_summary_user_instructions()
            
            message_log = [
                self.system_message(system_content),
                self.user_message(user_content)
            ]
            
            summary = self.submit_prompt(message_log, **kwargs)
            
            # 检查是否需要隐藏 thinking 内容
            display_thinking = kwargs.get("display_result_thinking", DISPLAY_RESULT_THINKING)
            
            if not display_thinking:
                # 移除 <think></think> 标签及其内容
                original_summary = summary
                summary = self._remove_thinking_content(summary)
                self.logger.debug(f"隐藏thinking内容 - 原始长度: {len(original_summary)}, 处理后长度: {len(summary)}")
            
            self.logger.debug(f"生成的摘要: {summary[:100]}...")
            return summary
            
        except Exception as e:
            self.logger.error(f"生成摘要失败: {str(e)}")
            import traceback
            self.logger.error(f"详细错误信息: {traceback.format_exc()}")
            return f"生成摘要时出现错误：{str(e)}"

    def _remove_thinking_content(self, text: str) -> str:
        """
        移除文本中的 <think></think> 标签及其内容
        
        Args:
            text (str): 包含可能的 thinking 标签的文本
            
        Returns:
            str: 移除 thinking 内容后的文本
        """
        if not text:
            return text
        
        import re
        
        # 移除 <think>...</think> 标签及其内容（支持多行）
        # 使用 re.DOTALL 标志使 . 匹配包括换行符在内的任何字符
        cleaned_text = re.sub(r'<think>.*?</think>\s*', '', text, flags=re.DOTALL | re.IGNORECASE)
        
        # 移除可能的多余空行
        cleaned_text = re.sub(r'\n\s*\n\s*\n', '\n\n', cleaned_text)
        
        # 去除开头和结尾的空白字符
        cleaned_text = cleaned_text.strip()
        
        return cleaned_text
    

    def ask(
        self,
        question: Union[str, None] = None,
        print_results: bool = True,
        auto_train: bool = True,
        visualize: bool = True,
        allow_llm_to_see_data: bool = False,
    ) -> Union[
        Tuple[
            Union[str, None],
            Union[pd.DataFrame, None],
            Union[plotly.graph_objs.Figure, None],
        ],
        None,
    ]:
        """
        重载父类的ask方法，处理LLM解释性文本
        当generate_sql无法生成SQL时，保存解释性文本供API层使用
        """
        if question is None:
            question = input("Enter a question: ")

        # 清空上次的解释性文本
        self.last_llm_explanation = None

        try:
            sql = self.generate_sql(question=question, allow_llm_to_see_data=allow_llm_to_see_data)
        except Exception as e:
            self.logger.error(f"SQL generation error: {e}")
            self.last_llm_explanation = str(e)
            if print_results:
                return None
            else:
                return None, None, None

        # 如果SQL为空，说明有解释性文本，按照正常流程返回None
        # API层会检查 last_llm_explanation 来获取解释
        if sql is None:
            self.logger.info(f"无法生成SQL，解释: {self.last_llm_explanation}")
            if print_results:
                return None
            else:
                return None, None, None

        # 以下是正常的SQL执行流程（保持VannaBase原有逻辑）
        if print_results:
            self.logger.info(f"Generated SQL: {sql}")

        if self.run_sql_is_set is False:
            self.logger.info("If you want to run the SQL query, connect to a database first.")
            if print_results:
                return None
            else:
                return sql, None, None

        try:
            df = self.run_sql(sql)
            
            if df is None:
                self.logger.info("The SQL query returned no results.")
                if print_results:
                    return None
                else:
                    return sql, None, None

            if print_results:
                # 显示结果表格
                if len(df) > 10:
                    self.logger.info(f"Query results (first 10 rows):\n{df.head(10).to_string()}")
                    self.logger.info(f"... ({len(df)} rows)")
                else:
                    self.logger.info(f"Query results:\n{df.to_string()}")

            # 如果启用了自动训练，添加问题-SQL对到训练集
            if auto_train:
                try:
                    self.add_question_sql(question=question, sql=sql)
                except Exception as e:
                    self.logger.warning(f"Could not add question and sql to training data: {e}")

            if visualize:
                try:
                    # 检查是否应该生成图表
                    if self.should_generate_chart(df):
                        plotly_code = self.generate_plotly_code(
                            question=question, 
                            sql=sql, 
                            df=df,
                            chart_instructions=""
                        )
                        if plotly_code is not None and plotly_code.strip() != "":
                            fig = self.get_plotly_figure(
                                plotly_code=plotly_code, 
                                df=df, 
                                dark_mode=False
                            )
                            if fig is not None:
                                if print_results:
                                    self.logger.info("Chart generated (use fig.show() to display)")
                                return sql, df, fig
                            else:
                                self.logger.warning("Could not generate chart")
                                return sql, df, None
                        else:
                            self.logger.info("No chart generated")
                            return sql, df, None
                    else:
                        self.logger.info("Not generating chart for this data")
                        return sql, df, None
                except Exception as e:
                    self.logger.error(f"Couldn't generate chart: {e}")
                    return sql, df, None
            else:
                return sql, df, None

        except Exception as e:
            self.logger.error(f"Couldn't run sql: {e}")
            if print_results:
                return None
            else:
                return sql, None, None


    @abstractmethod
    def submit_prompt(self, prompt, **kwargs) -> str:
        """
        子类必须实现的核心提交方法
        
        Args:
            prompt: 消息列表
            **kwargs: 其他参数
            
        Returns:
            str: LLM的响应
        """
        pass