5 tháng trước cách đây · a6b118853d
--- a/Deepseek-prompt.txt
+++ b/Deepseek-prompt.txt
@@ -0,0 +1,46 @@
 
				+你是一名数据库工程师，正在构建一个PostgreSQL数据中的汇总逻辑。请为以下需求生成一段标准的 PostgreSQL SQL 脚本：
			
 
				+1.有一个源表: personal_loan_resource，它的定义语句如下：
			
 
				+CREATE TABLE personal_loan_resource (
			
 
				+    employee_profit_sharing_ratio numeric(18,6) COMMENT '员工分润比例',
			
 
				+    customer_level_identifier smallint COMMENT '管户层级标识',
			
 
				+    superior_organization_code varchar(15) COMMENT '上级机构编码',
			
 
				+    amount_disbursed numeric(15,2) COMMENT '发放金额',
			
 
				+    unified_authentication_code_2 varchar(255) COMMENT '统一认证码2',
			
 
				+    customer_weight_coefficient numeric(18,6) COMMENT '客户权重系数',
			
 
				+    monthly_interest_received_total numeric(15,2) COMMENT '月累计实收利息',
			
 
				+    institution_code varchar(15) COMMENT '机构编码',
			
 
				+    agreement_status_code varchar(10) COMMENT '协议状态代码',
			
 
				+    secondary_subject_code varchar(50) COMMENT '二级科目编码',
			
 
				+    unified_authentication_code_1 varchar(255) COMMENT '统一认证码1',
			
 
				+    data_date date COMMENT '数据日期',
			
 
				+    customer_category_identifier smallint COMMENT '客户类别标识',
			
 
				+    customer_id varchar(50) COMMENT '客户编号',
			
 
				+    disbursement_date date COMMENT '发放日期'
			
 
				+);
			
 
				+COMMENT ON TABLE personal_loan_resource IS '个人贷款_资源';
			
 
				+
			
 
				+2.有一个目标表：customer_service_ledger，它的定义语句如下：
			
 
				+CREATE TABLE customer_service_ledger (
			
 
				+    original_profit_sharing_record char COMMENT '原始分润记录',
			
 
				+    unified_authentication_code_2 varchar(255) COMMENT '统一认证码2',
			
 
				+    data_date date COMMENT '数据日期',
			
 
				+    customer_category_identifier smallint COMMENT '客户类别标识',
			
 
				+    secondary_subject varchar(50) COMMENT '二级科目',
			
 
				+    primary_subject varchar(50) COMMENT '一级科目',
			
 
				+    unified_authentication_code_1 varchar(255) COMMENT '统一认证码1',
			
 
				+    customer_id varchar(50) COMMENT '客户编号',
			
 
				+    customer_level_identifier smallint COMMENT '管户层级标识',
			
 
				+    employee_profit_sharing_ratio numeric(18,6) COMMENT '员工分润比例',
			
 
				+    customer_weight_coefficient numeric(18,6) COMMENT '客户权重系数',
			
 
				+    amount numeric(15,2) COMMENT '金额',
			
 
				+    superior_organization_code varchar(15) COMMENT '上级机构编码',
			
 
				+    institution_code varchar(15) COMMENT '机构编码'
			
 
				+);
			
 
				+COMMENT ON TABLE customer_service_ledger IS '客户维业绩流水账';
			
 
				+
			
 
				+3.处理逻辑为：从源表里读取记录，根据贷款发放日期进行判断，如果贷款发放日期与数据日期为同一个月，则提取发放金额作为金额，在目标表里插入一条记录，“一级科目”字段设置内容为“当期个人贷款新发放金额”。；如果贷款发放日期与数据日期不是同一个月，则提取月累计实收利息作为金额，在目标表里插入一条记录，“一级科目”字段设置内容为“当期个人贷款月累计收息”。其他字段内容按照目标表的字段定义，从源表中读取对应字段进行填充。
			
 
				+4.脚本应使用标准的 PostgreSQL 语法，适合在 Airflow、Python 脚本、或调度系统中调用；
			
 
				+5.无需使用 UPSERT 或 ON CONFLICT
			
 
				+6.请直接输出SQL，无需进行解释。
			
 
				+7.请给这段sql起个英文名，不少于三个英文单词，使用"_"分隔，采用蛇形命名法。把sql的名字作为注释写在返回的sql中。
			
 
				+8.生成的sql在向目标表插入数据的时候，向create_time字段写入当前日期时间now(),不用处理update_time字段
			
--- a/app/api/data_flow/routes.py
+++ b/app/api/data_flow/routes.py
@@ -148,6 +148,10 @@ def create_script():
 
				             res = failed("请求数据不能为空", code=400)
			
 
				             return json.dumps(res, ensure_ascii=False, cls=MyEncoder)
			
 
				         
			
 
				+        # 记录接收到的数据用于调试
			
 
				+        logger.info(f"create_script接收到的数据: {json_data}")
			
 
				+        logger.info(f"json_data类型: {type(json_data)}")
			
 
				+        
			
 
				         # 直接使用前端提交的json_data作为request_data参数
			
 
				         script_content = DataFlowService.create_script(json_data)
			
 
				         
			
--- a/app/api/data_resource/routes.py
+++ b/app/api/data_resource/routes.py
@@ -485,7 +485,7 @@ def id_data_save():
 
				             
			
 
				             # 先删除现有关系
			
 
				             cypher_delete = """
			
 
				-            MATCH (n:DataResource)-[r:contain]->()
			
 
				+            MATCH (n:DataResource)-[r:INCLUDES]->()
			
 
				             WHERE id(n) = $resource_id
			
 
				             DELETE r
			
 
				             """
			
@@ -521,7 +521,7 @@ def id_data_save():
 
				                 # 使用明确的属性名匹配而不是ID
			
 
				                 rel_cypher = """
			
 
				                 MATCH (a:DataResource {name: $r_name}), (m:DataMeta {name: $m_name})
			
 
				-                MERGE (a)-[r:contain]->(m)
			
 
				+                MERGE (a)-[r:INCLUDES]->(m)
			
 
				                 RETURN r
			
 
				                 """
			
 
				                 
			
@@ -539,7 +539,7 @@ def id_data_save():
 
				 
			
 
				                 # 额外验证关系是否创建
			
 
				                 verify_cypher = """
			
 
				-                MATCH (a:DataResource {name: $r_name})-[r:contain]->(m:DataMeta {name: $m_name})
			
 
				+                MATCH (a:DataResource {name: $r_name})-[r:INCLUDES]->(m:DataMeta {name: $m_name})
			
 
				                 RETURN count(r) as rel_count
			
 
				                 """
			
 
				                 
			
--- a/app/core/data_flow/dataflows.py
+++ b/app/core/data_flow/dataflows.py
@@ -1,8 +1,8 @@
 
				 import logging
			
 
				-from typing import Dict, List, Optional, Any
			
 
				+from typing import Dict, List, Optional, Any, Union
			
 
				 from datetime import datetime
			
 
				 import json
			
 
				-from app.core.llm.llm_service import llm_client
			
 
				+from app.core.llm.llm_service import llm_client, llm_sql
			
 
				 from app.core.graph.graph_operations import connect_graph, create_or_get_node, get_node, relationship_exists
			
 
				 from app.core.meta_data import translate_and_parse, get_formatted_time
			
 
				 from py2neo import Relationship
			
@@ -611,36 +611,115 @@ class DataFlowService:
 
				             raise e
			
 
				 
			
 
				     @staticmethod
			
 
				-    def create_script(request_data: str) -> str:
			
 
				+    def create_script(request_data: Union[Dict[str, Any], str]) -> str:
			
 
				         """
			
 
				-        使用Deepseek模型生成脚本
			
 
				+        使用Deepseek模型生成SQL脚本
			
 
				         
			
 
				         Args:
			
 
				-            request_data: 请求数据，用户需求的文本描述
			
 
				+            request_data: 包含input, output, request_content的请求数据字典，或JSON字符串
			
 
				             
			
 
				         Returns:
			
 
				-            生成的脚本内容（TXT格式）
			
 
				+            生成的SQL脚本内容
			
 
				         """
			
 
				         try:
			
 
				-            # 构建prompt
			
 
				-            prompt_parts = []
			
 
				+            logger.info(f"开始处理脚本生成请求: {request_data}")
			
 
				+            logger.info(f"request_data类型: {type(request_data)}")
			
 
				+            
			
 
				+            # 类型检查和处理
			
 
				+            if isinstance(request_data, str):
			
 
				+                logger.warning(f"request_data是字符串，尝试解析为JSON: {request_data}")
			
 
				+                try:
			
 
				+                    import json
			
 
				+                    request_data = json.loads(request_data)
			
 
				+                except json.JSONDecodeError as e:
			
 
				+                    raise ValueError(f"无法解析request_data为JSON: {str(e)}")
			
 
				+            
			
 
				+            if not isinstance(request_data, dict):
			
 
				+                raise ValueError(f"request_data必须是字典类型，实际类型: {type(request_data)}")
			
 
				+            
			
 
				+            # 1. 从传入的request_data中解析input, output, request_content内容
			
 
				+            input_data = request_data.get('input', '')
			
 
				+            output_data = request_data.get('output', '')
			
 
				+           
			
 
				+            request_content = request_data.get('request_data', '')
			
 
				+            
			
 
				+            # 如果request_content是HTML格式，提取纯文本
			
 
				+            if request_content and (request_content.startswith('<p>') or '<' in request_content):
			
 
				+                # 简单的HTML标签清理
			
 
				+                import re
			
 
				+                request_content = re.sub(r'<[^>]+>', '', request_content).strip()
			
 
				+            
			
 
				+            if not input_data or not output_data or not request_content:
			
 
				+                raise ValueError(f"缺少必要参数：input='{input_data}', output='{output_data}', request_content='{request_content[:100] if request_content else ''}' 不能为空")
			
 
				+            
			
 
				+            logger.info(f"解析得到 - input: {input_data}, output: {output_data}, request_content: {request_content}")
			
 
				+            
			
 
				+            # 2. 解析input中的多个数据表并生成源表DDL
			
 
				+            source_tables_ddl = []
			
 
				+            input_tables = []
			
 
				+            if input_data:
			
 
				+                tables = [table.strip() for table in input_data.split(',') if table.strip()]
			
 
				+                for table in tables:
			
 
				+                    ddl = DataFlowService._parse_table_and_get_ddl(table, 'input')
			
 
				+                    if ddl:
			
 
				+                        input_tables.append(table)
			
 
				+                        source_tables_ddl.append(ddl)
			
 
				+                    else:
			
 
				+                        logger.warning(f"无法获取输入表 {table} 的DDL结构")
			
 
				+            
			
 
				+            # 3. 解析output中的数据表并生成目标表DDL
			
 
				+            target_table_ddl = ""
			
 
				+            if output_data:
			
 
				+                target_table_ddl = DataFlowService._parse_table_and_get_ddl(output_data.strip(), 'output')
			
 
				+                if not target_table_ddl:
			
 
				+                    logger.warning(f"无法获取输出表 {output_data} 的DDL结构")
			
 
				             
			
 
				-            # 添加系统提示
			
 
				-            prompt_parts.append("请根据以下需求生成相应的数据处理脚本：")
			
 
				+            # 4. 按照Deepseek-prompt.txt的框架构建提示语
			
 
				+            prompt_parts = []
			
 
				             
			
 
				-            # 直接将request_data作为文本描述添加到prompt中
			
 
				-            prompt_parts.append(request_data)
			
 
				+            # 开场白 - 角色定义
			
 
				+            prompt_parts.append("你是一名数据库工程师，正在构建一个PostgreSQL数据中的汇总逻辑。请为以下需求生成一段标准的 PostgreSQL SQL 脚本：")
			
 
				+            
			
 
				+            # 动态生成源表部分（第1点）
			
 
				+            for i, (table, ddl) in enumerate(zip(input_tables, source_tables_ddl), 1):
			
 
				+                table_name = table.split(':')[-1] if ':' in table else table
			
 
				+                prompt_parts.append(f"{i}.有一个源表: {table_name}，它的定义语句如下：")
			
 
				+                prompt_parts.append(ddl)
			
 
				+                prompt_parts.append("")  # 添加空行分隔
			
 
				+            
			
 
				+            # 动态生成目标表部分（第2点）
			
 
				+            if target_table_ddl:
			
 
				+                target_table_name = output_data.split(':')[-1] if ':' in output_data else output_data
			
 
				+                next_index = len(input_tables) + 1
			
 
				+                prompt_parts.append(f"{next_index}.有一个目标表：{target_table_name}，它的定义语句如下：")
			
 
				+                prompt_parts.append(target_table_ddl)
			
 
				+                prompt_parts.append("")  # 添加空行分隔
			
 
				+            
			
 
				+            # 动态生成处理逻辑部分（第3点）
			
 
				+            next_index = len(input_tables) + 2 if target_table_ddl else len(input_tables) + 1
			
 
				+            prompt_parts.append(f"{next_index}.处理逻辑为：{request_content}")
			
 
				+            prompt_parts.append("")  # 添加空行分隔
			
 
				+            
			
 
				+            # 固定的技术要求部分（第4-8点）
			
 
				+            tech_requirements = [
			
 
				+                f"{next_index + 1}.脚本应使用标准的 PostgreSQL 语法，适合在 Airflow、Python 脚本、或调度系统中调用；",
			
 
				+                f"{next_index + 2}.无需使用 UPSERT 或 ON CONFLICT",
			
 
				+                f"{next_index + 3}.请直接输出SQL，无需进行解释。",
			
 
				+                f"{next_index + 4}.请给这段sql起个英文名，不少于三个英文单词，使用\"_\"分隔，采用蛇形命名法。把sql的名字作为注释写在返回的sql中。",
			
 
				+                f"{next_index + 5}.生成的sql在向目标表插入数据的时候，向create_time字段写入当前日期时间now(),不用处理update_time字段"
			
 
				+            ]
			
 
				             
			
 
				-            # 添加格式要求
			
 
				-            prompt_parts.append("\n请生成完整可执行的脚本代码，包含必要的注释和错误处理。")
			
 
				+            prompt_parts.extend(tech_requirements)
			
 
				             
			
 
				-            # 组合prompt
			
 
				-            full_prompt = "\n\n".join(prompt_parts)
			
 
				+            # 组合完整的提示语
			
 
				+            full_prompt = "\n".join(prompt_parts)
			
 
				             
			
 
				-            logger.info(f"开始调用Deepseek模型生成脚本，prompt长度: {len(full_prompt)}")
			
 
				+            logger.info(f"构建的完整提示语长度: {len(full_prompt)}")
			
 
				+            logger.info(f"完整提示语内容: {full_prompt}")
			
 
				             
			
 
				-            # 调用LLM服务
			
 
				-            script_content = llm_client(full_prompt)
			
 
				+            # 5. 调用LLM生成SQL脚本
			
 
				+            logger.info("开始调用Deepseek模型生成SQL脚本")
			
 
				+            script_content = llm_sql(full_prompt)
			
 
				             
			
 
				             if not script_content:
			
 
				                 raise ValueError("Deepseek模型返回空内容")
			
@@ -649,14 +728,113 @@ class DataFlowService:
 
				             if not isinstance(script_content, str):
			
 
				                 script_content = str(script_content)
			
 
				             
			
 
				-            logger.info(f"脚本生成成功，内容长度: {len(script_content)}")
			
 
				+            logger.info(f"SQL脚本生成成功，内容长度: {len(script_content)}")
			
 
				             
			
 
				             return script_content
			
 
				             
			
 
				         except Exception as e:
			
 
				-            logger.error(f"生成脚本失败: {str(e)}")
			
 
				+            logger.error(f"生成SQL脚本失败: {str(e)}")
			
 
				             raise e
			
 
				 
			
 
				+    @staticmethod
			
 
				+    def _parse_table_and_get_ddl(table_str: str, table_type: str) -> str:
			
 
				+        """
			
 
				+        解析表格式（A:B）并从Neo4j查询元数据生成DDL
			
 
				+        
			
 
				+        Args:
			
 
				+            table_str: 表格式字符串，格式为"label:en_name"
			
 
				+            table_type: 表类型，用于日志记录（input/output）
			
 
				+            
			
 
				+        Returns:
			
 
				+            DDL格式的表结构字符串
			
 
				+        """
			
 
				+        try:
			
 
				+            # 解析A:B格式
			
 
				+            if ':' not in table_str:
			
 
				+                logger.error(f"表格式错误，应为'label:en_name'格式: {table_str}")
			
 
				+                return ""
			
 
				+            
			
 
				+            parts = table_str.split(':', 1)
			
 
				+            if len(parts) != 2:
			
 
				+                logger.error(f"表格式解析失败: {table_str}")
			
 
				+                return ""
			
 
				+            
			
 
				+            label = parts[0].strip()
			
 
				+            en_name = parts[1].strip()
			
 
				+            
			
 
				+            if not label or not en_name:
			
 
				+                logger.error(f"标签或英文名为空: label={label}, en_name={en_name}")
			
 
				+                return ""
			
 
				+            
			
 
				+            logger.info(f"开始查询{table_type}表: label={label}, en_name={en_name}")
			
 
				+            
			
 
				+            # 从Neo4j查询节点及其关联的元数据
			
 
				+            with connect_graph().session() as session:
			
 
				+                # 查询节点及其关联的元数据
			
 
				+                cypher = f"""
			
 
				+                MATCH (n:{label} {{en_name: $en_name}})
			
 
				+                OPTIONAL MATCH (n)-[:INCLUDES]->(m:DataMeta)
			
 
				+                RETURN n, collect(m) as metadata
			
 
				+                """
			
 
				+                
			
 
				+                result = session.run(cypher, en_name=en_name)
			
 
				+                record = result.single()
			
 
				+                
			
 
				+                if not record:
			
 
				+                    logger.error(f"未找到节点: label={label}, en_name={en_name}")
			
 
				+                    return ""
			
 
				+                
			
 
				+                node = record['n']
			
 
				+                metadata = record['metadata']
			
 
				+                
			
 
				+                logger.info(f"找到节点，关联元数据数量: {len(metadata)}")
			
 
				+                
			
 
				+                # 生成DDL格式的表结构
			
 
				+                ddl_lines = []
			
 
				+                ddl_lines.append(f"CREATE TABLE {en_name} (")
			
 
				+                
			
 
				+                if metadata:
			
 
				+                    column_definitions = []
			
 
				+                    for meta in metadata:
			
 
				+                        if meta:  # 确保meta不为空
			
 
				+                            meta_props = dict(meta)
			
 
				+                            column_name = meta_props.get('en_name', meta_props.get('name', 'unknown_column'))
			
 
				+                            data_type = meta_props.get('data_type', 'VARCHAR(255)')
			
 
				+                            comment = meta_props.get('name', '')
			
 
				+                            
			
 
				+                            # 构建列定义
			
 
				+                            column_def = f"    {column_name} {data_type}"
			
 
				+                            if comment:
			
 
				+                                column_def += f" COMMENT '{comment}'"
			
 
				+                            
			
 
				+                            column_definitions.append(column_def)
			
 
				+                    
			
 
				+                    if column_definitions:
			
 
				+                        ddl_lines.append(",\n".join(column_definitions))
			
 
				+                    else:
			
 
				+                        ddl_lines.append("    id BIGINT PRIMARY KEY COMMENT '主键ID'")
			
 
				+                else:
			
 
				+                    # 如果没有元数据，添加默认列
			
 
				+                    ddl_lines.append("    id BIGINT PRIMARY KEY COMMENT '主键ID'")
			
 
				+                
			
 
				+                ddl_lines.append(");")
			
 
				+                
			
 
				+                # 添加表注释
			
 
				+                node_props = dict(node)
			
 
				+                table_comment = node_props.get('name', node_props.get('describe', en_name))
			
 
				+                if table_comment and table_comment != en_name:
			
 
				+                    ddl_lines.append(f"COMMENT ON TABLE {en_name} IS '{table_comment}';")
			
 
				+                
			
 
				+                ddl_content = "\n".join(ddl_lines)
			
 
				+                logger.info(f"{table_type}表DDL生成成功: {en_name}")
			
 
				+                logger.debug(f"生成的DDL: {ddl_content}")
			
 
				+                
			
 
				+                return ddl_content
			
 
				+                
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"解析表格式和生成DDL失败: {str(e)}")
			
 
				+            return ""
			
 
				+
			
 
				     @staticmethod
			
 
				     def _handle_script_relationships(data: Dict[str, Any],dataflow_name:str,name_en:str):
			
 
				         """
			
--- a/app/core/data_model/model.py
+++ b/app/core/data_model/model.py
@@ -244,18 +244,22 @@ def resource_handle_meta_data_model(id_lists, data_model_node_id):
 
				                 logger.info(f"成功创建 {count} 个数据模型与元数据的关系")
			
 
				 
			
 
				         # 创建与DataResource的关系 资源关系
			
 
				-        if resouce_ids:
			
 
				-            logger.info("开始创建数据模型与数据资源的关系")
			
 
				-            query = """
			
 
				-            MATCH (source:DataModel), (target:DataResource)
			
 
				-            WHERE id(source)=$source_id AND id(target) IN $target_ids
			
 
				-            MERGE (source)-[:DERIVES_FROM]->(target)
			
 
				-            RETURN count(*) as count
			
 
				-            """
			
 
				-            with connect_graph().session() as session:
			
 
				-                result = session.run(query, source_id=data_model_node_id, target_ids=resouce_ids)
			
 
				-                count = result.single()["count"]
			
 
				-                logger.info(f"成功创建 {count} 个数据模型与数据资源的关系")
			
 
				+        # 不在创建Modle时创建资源关系，将资源关系创建放在数据流程创建时处理
			
 
				+        # 关系名称为DERIVED_FROM
			
 
				+        # commented by mxl 2025-06-27
			
 
				+        # 
			
 
				+        # if resouce_ids:
			
 
				+        #     logger.info("开始创建数据模型与数据资源的关系")
			
 
				+        #     query = """
			
 
				+        #     MATCH (source:DataModel), (target:DataResource)
			
 
				+        #     WHERE id(source)=$source_id AND id(target) IN $target_ids
			
 
				+        #     MERGE (source)-[:DERIVES_FROM]->(target)
			
 
				+        #     RETURN count(*) as count
			
 
				+        #     """
			
 
				+        #     with connect_graph().session() as session:
			
 
				+        #         result = session.run(query, source_id=data_model_node_id, target_ids=resouce_ids)
			
 
				+        #         count = result.single()["count"]
			
 
				+        #         logger.info(f"成功创建 {count} 个数据模型与数据资源的关系")
			
 
				                 
			
 
				     except Exception as e:
			
 
				         logger.error(f"处理数据模型与元数据的关系时发生错误: {str(e)}")
			
@@ -441,7 +445,7 @@ def handle_id_model(id):
 
				     cql = """
			
 
				         MATCH (n:DataModel) WHERE id(n) = $nodeId
			
 
				         OPTIONAL MATCH (n)-[:INCLUDES]->(meta:DataMeta)  
			
 
				-        OPTIONAL MATCH (n)-[:DERIVES_FROM]->(resource:DataResource)
			
 
				+        OPTIONAL MATCH (n)-[:DERIVED_FROM]->(resource:DataResource)
			
 
				         OPTIONAL MATCH (n)-[:label]->(tag:DataLabel)
			
 
				         OPTIONAL MATCH (uses:model_use)-[:use]->(n)
			
 
				         OPTIONAL MATCH (n)-[:has_component]->(component)
			
--- a/app/core/data_parse/parse_card.py
+++ b/app/core/data_parse/parse_card.py
@@ -293,16 +293,15 @@ def add_business_card(card_data, image_file=None):
 
				                 # 创建新记录
			
 
				                 # 准备初始职业轨迹，包含当前名片信息和图片路径
			
 
				                 # initial_career_path = card_data.get('career_path', [])
			
 
				-                if card_data.get('hotel_zh') or card_data.get('hotel_en') or card_data.get('title_zh') or card_data.get('title_en'):
			
 
				-                    initial_entry = {
			
 
				-                        'date': datetime.now().strftime('%Y-%m-%d'),
			
 
				-                        'hotel_zh': card_data.get('hotel_zh', ''),
			
 
				-                        'hotel_en': card_data.get('hotel_en', ''),
			
 
				-                        'title_zh': card_data.get('title_zh', ''),
			
 
				-                        'title_en': card_data.get('title_en', ''),
			
 
				-                        'image_path': minio_path or '',  # 当前名片的图片路径
			
 
				-                        'source': 'business_card_creation'
			
 
				-                    }
			
 
				+                initial_entry = {
			
 
				+                    'date': datetime.now().strftime('%Y-%m-%d'),
			
 
				+                    'hotel_zh': card_data.get('hotel_zh', ''),
			
 
				+                    'hotel_en': card_data.get('hotel_en', ''),
			
 
				+                    'title_zh': card_data.get('title_zh', ''),
			
 
				+                    'title_en': card_data.get('title_en', ''),
			
 
				+                    'image_path': minio_path or '',  # 当前名片的图片路径
			
 
				+                    'source': 'business_card_creation'
			
 
				+                }
			
 
				                 initial_career_path = [initial_entry]
			
 
				                 
			
 
				                 # 导入手机号码处理函数
			
--- a/app/core/data_resource/resource.py
+++ b/app/core/data_resource/resource.py
@@ -250,7 +250,7 @@ def handle_node(receiver, head_data, data_source=None, resource_type=None):
 
				                         rel_cypher = """
			
 
				                         MATCH (a:DataResource), (m:DataMeta)
			
 
				                         WHERE id(a) = $resource_id AND id(m) = $meta_id
			
 
				-                        MERGE (a)-[r:contain]->(m)
			
 
				+                        MERGE (a)-[r:INCLUDES]->(m)
			
 
				                         RETURN r
			
 
				                         """
			
 
				                         
			
@@ -386,7 +386,7 @@ def handle_id_resource(resource_id):
 
				             
			
 
				             # 查询关联的元数据 - 支持meta_data和Metadata两种标签
			
 
				             meta_cypher = """
			
 
				-            MATCH (n:DataResource)-[:contain]->(m)
			
 
				+            MATCH (n:DataResource)-[:INCLUDES]->(m)
			
 
				             WHERE id(n) = $resource_id
			
 
				             AND (m:DataMeta OR m:Metadata)
			
 
				             RETURN m
			
@@ -567,7 +567,7 @@ def id_data_search_list(resource_id, page, page_size, en_name_filter=None,
 
				             
			
 
				             # 基本匹配语句 - 支持meta_data和Metadata标签
			
 
				             match_clause = """
			
 
				-            MATCH (n:DataResource)-[:contain]->(m)
			
 
				+            MATCH (n:DataResource)-[:INCLUDES]->(m)
			
 
				             WHERE id(n) = $resource_id
			
 
				             AND (m:DataMeta OR m:Metadata)
			
 
				             """
			
@@ -647,7 +647,7 @@ def resource_kinship_graph(resource_id, include_meta=True):
 
				             
			
 
				             # 是否包含元数据 - 支持meta_data和Metadata两种标签
			
 
				             if include_meta:
			
 
				-                cypher_parts.append("OPTIONAL MATCH (n)-[:contain]->(m) WHERE (m:DataMeta OR m:Metadata)")
			
 
				+                cypher_parts.append("OPTIONAL MATCH (n)-[:INCLUDES]->(m) WHERE (m:DataMeta OR m:Metadata)")
			
 
				                 
			
 
				             cypher_parts.append("RETURN n, l, collect(m) as metadata")
			
 
				             
			
@@ -696,10 +696,10 @@ def resource_kinship_graph(resource_id, include_meta=True):
 
				                         
			
 
				                         # 添加资源-元数据关系
			
 
				                         relationships.append({
			
 
				-                            "id": f"rel-{resource_node['id']}-contain-{meta_node['id']}",
			
 
				+                            "id": f"rel-{resource_node['id']}-INCLUDES-{meta_node['id']}",
			
 
				                             "source": resource_node["id"],
			
 
				                             "target": meta_node["id"],
			
 
				-                            "type": "contain"
			
 
				+                            "type": "INCLUDES"
			
 
				                         })
			
 
				             
			
 
				             logger.info(f"成功获取资源图谱，ID: {resource_id_int}, 节点数: {len(nodes)}")
			
@@ -1306,7 +1306,7 @@ def data_resource_edit(data):
 
				             
			
 
				             # 首先删除旧的元数据关系和清洗资源关系（无论parsed_data是否为空都要执行）
			
 
				             delete_meta_cypher = """
			
 
				-            MATCH (n:DataResource)-[r:contain]->()
			
 
				+            MATCH (n:DataResource)-[r:INCLUDES]->()
			
 
				             WHERE id(n) = $resource_id
			
 
				             DELETE r
			
 
				             """
			
@@ -1381,7 +1381,7 @@ def data_resource_edit(data):
 
				                         create_meta_cypher = """
			
 
				                         MATCH (n:DataResource), (m:DataMeta)
			
 
				                         WHERE id(n) = $resource_id AND id(m) = $meta_id
			
 
				-                        CREATE (n)-[r:contain]->(m)
			
 
				+                        CREATE (n)-[r:INCLUDES]->(m)
			
 
				                         RETURN r
			
 
				                         """
			
 
				                         session.run(create_meta_cypher, resource_id=int(resource_id), meta_id=int(meta_id))
			
--- a/app/core/llm/llm_service.py
+++ b/app/core/llm/llm_service.py
@@ -135,4 +135,57 @@ def llm_client(content):
 
				                 return "translated_text"
			
 
				             return content
			
 
				         except:
			
 
				-            return content 
			
 
				+            return content
			
 
				+
			
 
				+def llm_sql(request_data):
			
 
				+    """
			
 
				+    调用Deepseek大模型生成SQL脚本
			
 
				+    
			
 
				+    Args:
			
 
				+        request_data: 提交给LLM的提示语内容
			
 
				+        
			
 
				+    Returns:
			
 
				+        str: Deepseek模型返回的SQL脚本内容
			
 
				+    """
			
 
				+    try:
			
 
				+        # 使用配置文件中的参数连接Deepseek
			
 
				+        client = OpenAI(
			
 
				+            api_key=current_app.config.get('LLM_API_KEY'),
			
 
				+            base_url=current_app.config.get('LLM_BASE_URL')
			
 
				+        )
			
 
				+        
			
 
				+        model = current_app.config.get('LLM_MODEL_NAME')
			
 
				+        
			
 
				+        logger.info(f"开始调用Deepseek模型生成SQL脚本: model={model}")
			
 
				+        logger.debug(f"输入提示语: {request_data}")
			
 
				+        
			
 
				+        # 调用Deepseek API生成SQL脚本
			
 
				+        completion = client.chat.completions.create(
			
 
				+            model=model,
			
 
				+            messages=[
			
 
				+                {
			
 
				+                    "role": "system", 
			
 
				+                    "content": "你是一名专业的数据库工程师，专门负责编写高质量的PostgreSQL SQL脚本。"
			
 
				+                              "请严格按照用户提供的需求和表结构信息生成SQL脚本。"
			
 
				+                              "确保生成的SQL语法正确、性能优化，并且能够直接执行。"
			
 
				+                },
			
 
				+                {
			
 
				+                    "role": "user", 
			
 
				+                    "content": request_data
			
 
				+                }
			
 
				+            ],
			
 
				+            temperature=0.1,  # 使用较低的温度确保结果的一致性和准确性
			
 
				+            max_tokens=4096,  # 为SQL脚本提供足够的token空间
			
 
				+            top_p=0.9
			
 
				+        )
			
 
				+        
			
 
				+        response_text = completion.choices[0].message.content.strip()
			
 
				+        
			
 
				+        logger.info(f"Deepseek模型成功返回SQL脚本，长度: {len(response_text)} 字符")
			
 
				+        logger.debug(f"生成的SQL脚本: {response_text}")
			
 
				+        
			
 
				+        return response_text
			
 
				+        
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"Deepseek SQL生成调用失败: {str(e)}")
			
 
				+        raise Exception(f"调用Deepseek模型生成SQL脚本失败: {str(e)}") 
			
--- a/app/core/production_line/production_line.py
+++ b/app/core/production_line/production_line.py
@@ -219,7 +219,7 @@ def get_resource_storage_info(resource_id):
 
				                 
			
 
				             # 查询元数据节点
			
 
				             metadata_query = """
			
 
				-            MATCH (n:DataResource)-[:contain]->(m:DataMeta)
			
 
				+            MATCH (n:DataResource)-[:INCLUDES]->(m:DataMeta)
			
 
				             WHERE id(n) = $resource_id
			
 
				             RETURN m.name as name, m.en_name as en_name, m.data_type as data_type
			
 
				             """