Sen descrición

wangxq 5642f785ff 将数据库判断的提示词抽取为txt文件,由生成训练数据的时候,一起生成,然后动态提供给代码使用。另外,修复了无法生成SQL时,无法传递LLM response的问题。 hai 11 meses
.chainlit c74481dcb8 能正常运行,部分汉化,测试更换icon的过程中失败。 hai 1 ano
.claude 847e45252b 训练数据生成与加载模块重构完成. hai 11 meses
.vscode 56ca6e03a9 增加了对问题向量化缓存到Redis的模块,缓存问题的向量值。 hai 11 meses
agent 5642f785ff 将数据库判断的提示词抽取为txt文件,由生成训练数据的时候,一起生成,然后动态提供给代码使用。另外,修复了无法生成SQL时,无法传递LLM response的问题。 hai 11 meses
common 8a2d5e325f 修复redis api的bug. hai 11 meses
core ed8d605d94 增加提示词,在SQL中增加 NULL LAST,增加embedding尝试的次数. hai 11 meses
customembedding ed8d605d94 增加提示词,在SQL中增加 NULL LAST,增加embedding尝试的次数. hai 11 meses
customllm 5642f785ff 将数据库判断的提示词抽取为txt文件,由生成训练数据的时候,一起生成,然后动态提供给代码使用。另外,修复了无法生成SQL时,无法传递LLM response的问题。 hai 11 meses
custompgvector 56ca6e03a9 增加了对问题向量化缓存到Redis的模块,缓存问题的向量值。 hai 11 meses
data_pipeline 0a8b2fd63b 在生成trainig_data的时候,添加了db_query_decision_prompt.txt,优化了产生的结果。 hai 11 meses
docs 434784d3ec 准备修改metadata.txt的生成需求,改了表的字段,增加了这个表的md文件,增加了一个让LLM判断是否查询数据库的提示词文件。 hai 11 meses
output 3f74546e04 完成qa管理模块的开发,基本完成测试。 hai 11 meses
public c74481dcb8 能正常运行,部分汉化,测试更换icon的过程中失败。 hai 1 ano
.gitignore dd31177d44 Initial commit. hai 1 ano
CLAUDE.md 847e45252b 训练数据生成与加载模块重构完成. hai 11 meses
README.md f59483d06b 准备进行Agent改造. hai 11 meses
app_config.py 847e45252b 训练数据生成与加载模块重构完成. hai 11 meses
chainlit.md c74481dcb8 能正常运行,部分汉化,测试更换icon的过程中失败。 hai 1 ano
chainlit_app.py ecb9b74349 修复了ollama/deepseek llm对stream和thinking的支持,正在修改ollama. hai 1 ano
chainlit_zh-CN.md c74481dcb8 能正常运行,部分汉化,测试更换icon的过程中失败。 hai 1 ano
citu_app.py 0a8b2fd63b 在生成trainig_data的时候,添加了db_query_decision_prompt.txt,优化了产生的结果。 hai 11 meses
flask_app.py ecb9b74349 修复了ollama/deepseek llm对stream和thinking的支持,正在修改ollama. hai 1 ano
list.txt 776d9af128 当无法生成SQL时,拦截错误,返回解释信息。 hai 11 meses
requirements.txt c26e9ffb72 准备重构database agent,把它一分为二。 hai 11 meses

README.md

Vanna-Chainlit-Chromadb 项目

项目结构

该项目主要组织结构如下:

  • core/: 核心组件目录
    • embedding_function.py: 嵌入函数实现
    • vanna_llm_factory.py: Vanna实例工厂
  • common/: 通用工具和辅助函数
  • customembedding/: 自定义嵌入模型实现
  • customllm/: 自定义语言模型实现
  • custompgvector/: PgVector数据库集成
  • docs/: 项目文档
  • public/: 公共资源文件
  • training/: 训练工具和数据
  • app_config.py: 应用配置
  • chainlit_app.py: Chainlit应用入口
  • flask_app.py: Flask应用入口

训练数据与Function的对应关系

文件格式/扩展名 对应处理函数 用途说明
.ddl train_ddl_statements() 训练数据库定义语言文件
.md / .markdown train_documentation_blocks() 训练Markdown格式的文档
_pair.json / _pairs.json train_json_question_sql_pairs() 训练JSON格式的问答对
_pair.sql / _pairs.sql train_formatted_question_sql_pairs() 训练格式化的问答对文件
.sql (其他) train_sql_examples() 训练一般SQL示例文件

各种组合的行为总结 enable_thinking stream (输入) stream (实际) 行为描述 False False False 非流式模式,无thinking False True True 流式模式,无thinking True False True (强制) 流式模式,有thinking + 警告日志 True True True 流式模式,有thinking

当前的代码实现完全符合您的两个要求,逻辑正确且健壮!