app_config.py 2.6 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586
  1. from dotenv import load_dotenv
  2. import os
  3. # 加载.env文件中的环境变量
  4. load_dotenv()
  5. # 使用的模型类型("qwen" 或 "deepseek")
  6. LLM_MODEL_NAME = "qwen"
  7. # 向量数据库类型, chromadb 或 pgvector
  8. VECTOR_DB_NAME = "pgvector"
  9. # DeepSeek模型配置
  10. DEEPSEEK_CONFIG = {
  11. "api_key": os.getenv("DEEPSEEK_API_KEY"), # 从环境变量读取API密钥
  12. "model": "deepseek-reasoner", # deepseek-chat, deepseek-reasoner
  13. "allow_llm_to_see_data": True,
  14. "temperature": 0.7,
  15. "n_results": 6,
  16. "language": "Chinese",
  17. "enable_thinking": False # 自定义,是否支持流模式
  18. }
  19. # Qwen模型配置
  20. QWEN_CONFIG = {
  21. "api_key": os.getenv("QWEN_API_KEY"), # 从环境变量读取API密钥
  22. "model": "qwen-plus",
  23. "allow_llm_to_see_data": True,
  24. "temperature": 0.7,
  25. "n_results": 6,
  26. "language": "Chinese",
  27. "enable_thinking": False #自定义,是否支持流模式,仅qwen3模型。
  28. }
  29. #qwen3-30b-a3b
  30. #qwen3-235b-a22b
  31. #qwen-plus-latest
  32. #qwen-plus
  33. EMBEDDING_CONFIG = {
  34. "model_name": "BAAI/bge-m3",
  35. "api_key": os.getenv("EMBEDDING_API_KEY"),
  36. "base_url": os.getenv("EMBEDDING_BASE_URL"),
  37. "embedding_dimension": 1024
  38. }
  39. # 应用数据库连接配置 (业务数据库)
  40. APP_DB_CONFIG = {
  41. "host": "192.168.67.1",
  42. "port": 5432,
  43. "dbname": "bank_db",
  44. "user": os.getenv("APP_DB_USER"),
  45. "password": os.getenv("APP_DB_PASSWORD")
  46. }
  47. # ChromaDB配置
  48. # CHROMADB_PATH = "."
  49. # PgVector数据库连接配置 (向量数据库,独立于业务数据库)
  50. PGVECTOR_CONFIG = {
  51. "host": "192.168.67.1",
  52. "port": 5432,
  53. "dbname": "pgvector_db",
  54. "user": os.getenv("PGVECTOR_DB_USER"),
  55. "password": os.getenv("PGVECTOR_DB_PASSWORD")
  56. }
  57. # 训练脚本批处理配置
  58. # 这些配置仅用于 training/run_training.py 训练脚本的批处理优化
  59. TRAINING_BATCH_PROCESSING_ENABLED = True # 是否启用训练数据批处理
  60. TRAINING_BATCH_SIZE = 10 # 每批处理的训练项目数量
  61. TRAINING_MAX_WORKERS = 4 # 训练批处理的最大工作线程数
  62. # 训练数据路径配置
  63. # 支持以下格式:
  64. # 1. 相对路径(以 . 开头):
  65. # "./training/data" - 项目根目录下的training/data
  66. # "../data" - 项目根目录上级的data目录
  67. # 2. 绝对路径:
  68. # "/home/user/data" - Linux绝对路径
  69. # "C:/data" - Windows绝对路径
  70. # "D:\\training\\data" - Windows绝对路径(转义反斜杠)
  71. # 3. 相对路径(不以.开头):
  72. # "training/data" - 相对于项目根目录
  73. # "my_data" - 项目根目录下的my_data文件夹
  74. TRAINING_DATA_PATH = "./training/data"