há 4 meses atrás · 7f0e6be121
--- a/dags/dag_dependency_analysis.py
+++ b/dags/dag_dependency_analysis.py
@@ -1,408 +0,0 @@
 
				-# dag_dependency_analysis.py
			
 
				-from airflow import DAG
			
 
				-from airflow.operators.python import PythonOperator
			
 
				-from airflow.models.param import Param
			
 
				-from datetime import datetime, timedelta
			
 
				-import logging
			
 
				-import os
			
 
				-from pathlib import Path
			
 
				-import networkx as nx
			
 
				-from neo4j import GraphDatabase
			
 
				-from config import NEO4J_CONFIG, SCRIPTS_BASE_PATH
			
 
				-
			
 
				-# 导入工具函数
			
 
				-from utils import (
			
 
				-    get_pg_conn, is_data_model_table, is_data_resource_table, 
			
 
				-    get_script_name_from_neo4j, execute_script,
			
 
				-    check_script_exists, run_model_script
			
 
				-)
			
 
				-
			
 
				-# 设置logger
			
 
				-logger = logging.getLogger(__name__)
			
 
				-
			
 
				-# DAG参数
			
 
				-default_args = {
			
 
				-    'owner': 'airflow',
			
 
				-    'depends_on_past': False,
			
 
				-    'start_date': datetime(2024, 1, 1),
			
 
				-    'email_on_failure': False,
			
 
				-    'email_on_retry': False,
			
 
				-    'retries': 1,
			
 
				-    'retry_delay': timedelta(minutes=5),
			
 
				-}
			
 
				-
			
 
				-def get_execution_mode(table_name):
			
 
				-    """
			
 
				-    从PostgreSQL获取表的执行模式
			
 
				-    
			
 
				-    参数:
			
 
				-        table_name (str): 表名
			
 
				-    
			
 
				-    返回:
			
 
				-        str: 执行模式，如果未找到则返回"append"作为默认值
			
 
				-    """
			
 
				-    try:
			
 
				-        conn = get_pg_conn()
			
 
				-        cursor = conn.cursor()
			
 
				-        cursor.execute("""
			
 
				-            SELECT execution_mode 
			
 
				-            FROM table_schedule 
			
 
				-            WHERE table_name = %s
			
 
				-        """, (table_name,))
			
 
				-        result = cursor.fetchone()
			
 
				-        cursor.close()
			
 
				-        conn.close()
			
 
				-        
			
 
				-        if result:
			
 
				-            return result[0]
			
 
				-        else:
			
 
				-            logger.warning(f"未找到表 {table_name} 的执行模式，使用默认值 'append'")
			
 
				-            return "append"
			
 
				-    except Exception as e:
			
 
				-        logger.error(f"获取表 {table_name} 的执行模式时出错: {str(e)}")
			
 
				-        return "append"
			
 
				-
			
 
				-def get_table_metadata(table_name):
			
 
				-    """
			
 
				-    获取表的元数据信息
			
 
				-    
			
 
				-    参数:
			
 
				-        table_name (str): 表名
			
 
				-    
			
 
				-    返回:
			
 
				-        dict: 表的元数据
			
 
				-    """
			
 
				-    driver = GraphDatabase.driver(
			
 
				-        NEO4J_CONFIG['uri'], 
			
 
				-        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				-    )
			
 
				-    
			
 
				-    metadata = {
			
 
				-        'table_name': table_name,
			
 
				-        'type': None,
			
 
				-        'script_name': None,
			
 
				-        'execution_mode': get_execution_mode(table_name)
			
 
				-    }
			
 
				-    
			
 
				-    try:
			
 
				-        # 判断表类型
			
 
				-        if is_data_model_table(table_name):
			
 
				-            metadata['type'] = 'DataModel'
			
 
				-        elif is_data_resource_table(table_name):
			
 
				-            metadata['type'] = 'DataResource'
			
 
				-        else:
			
 
				-            # 尝试查询是否为DataSource类型
			
 
				-            with driver.session() as session:
			
 
				-                query = """
			
 
				-                    MATCH (ds:DataSource {en_name: $table_name})
			
 
				-                    RETURN count(ds) > 0 AS exists
			
 
				-                """
			
 
				-                result = session.run(query, table_name=table_name)
			
 
				-                record = result.single()
			
 
				-                if record and record['exists']:
			
 
				-                    metadata['type'] = 'DataSource'
			
 
				-        
			
 
				-        # 查询脚本名称
			
 
				-        if metadata['type'] in ['DataModel', 'DataResource']:
			
 
				-            metadata['script_name'] = get_script_name_from_neo4j(table_name)
			
 
				-            
			
 
				-        return metadata
			
 
				-    finally:
			
 
				-        driver.close()
			
 
				-
			
 
				-def get_upstream_tables(table_name, dependency_level):
			
 
				-    """
			
 
				-    获取表的上游依赖
			
 
				-    
			
 
				-    参数:
			
 
				-        table_name (str): 表名
			
 
				-        dependency_level (str): 依赖级别 (self/resource/source)
			
 
				-    
			
 
				-    返回:
			
 
				-        list: 上游表名列表
			
 
				-    """
			
 
				-    # 如果只需要自身，返回空列表
			
 
				-    if dependency_level == 'self':
			
 
				-        return []
			
 
				-    
			
 
				-    driver = GraphDatabase.driver(
			
 
				-        NEO4J_CONFIG['uri'], 
			
 
				-        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				-    )
			
 
				-    
			
 
				-    upstream_tables = []
			
 
				-    
			
 
				-    try:
			
 
				-        with driver.session() as session:
			
 
				-            # 根据依赖级别构建不同的查询
			
 
				-            if dependency_level == 'resource':
			
 
				-                # 查询上游DataModel和DataResource表
			
 
				-                query = """
			
 
				-                    MATCH (target {en_name: $table_name})-[:DERIVED_FROM]->(up)
			
 
				-                    WHERE up:DataModel OR up:DataResource
			
 
				-                    RETURN up.en_name AS upstream, labels(up) AS types
			
 
				-                """
			
 
				-            else:  # source级别
			
 
				-                # 查询所有上游表，包括DataSource
			
 
				-                query = """
			
 
				-                    MATCH (target {en_name: $table_name})-[:DERIVED_FROM]->(up)
			
 
				-                    RETURN up.en_name AS upstream, labels(up) AS types
			
 
				-                """
			
 
				-                
			
 
				-            result = session.run(query, table_name=table_name)
			
 
				-            for record in result:
			
 
				-                upstream_tables.append({
			
 
				-                    'table_name': record['upstream'],
			
 
				-                    'type': record['types'][0] if record['types'] else 'Unknown'
			
 
				-                })
			
 
				-                
			
 
				-        return upstream_tables
			
 
				-    finally:
			
 
				-        driver.close()
			
 
				-
			
 
				-def build_dependency_graph(start_table, dependency_level):
			
 
				-    """
			
 
				-    构建依赖图
			
 
				-    
			
 
				-    参数:
			
 
				-        start_table (str): 起始表名
			
 
				-        dependency_level (str): 依赖级别 (self/resource/source)
			
 
				-    
			
 
				-    返回:
			
 
				-        tuple: (表信息字典, 依赖图)
			
 
				-    """
			
 
				-    logger.info(f"开始构建 {start_table} 的依赖图，依赖级别: {dependency_level}")
			
 
				-    
			
 
				-    # 创建有向图
			
 
				-    G = nx.DiGraph()
			
 
				-    
			
 
				-    # 添加起始节点
			
 
				-    G.add_node(start_table)
			
 
				-    
			
 
				-    # 记录表信息的字典
			
 
				-    table_info = {}
			
 
				-    
			
 
				-    # 获取起始表的元数据
			
 
				-    table_metadata = get_table_metadata(start_table)
			
 
				-    table_info[start_table] = table_metadata
			
 
				-    
			
 
				-    # 如果依赖级别为self，只返回起始表的信息
			
 
				-    if dependency_level == 'self':
			
 
				-        logger.info(f"依赖级别为'self'，只包含起始表: {start_table}")
			
 
				-        return table_info, G
			
 
				-    
			
 
				-    # 记录已访问的表，避免循环
			
 
				-    visited = set()
			
 
				-    
			
 
				-    def add_dependencies(table_name):
			
 
				-        """递归添加依赖到图中"""
			
 
				-        if table_name in visited:
			
 
				-            return
			
 
				-        
			
 
				-        visited.add(table_name)
			
 
				-        
			
 
				-        # 获取上游依赖
			
 
				-        upstream_tables = get_upstream_tables(table_name, dependency_level)
			
 
				-        
			
 
				-        for upstream in upstream_tables:
			
 
				-            up_table_name = upstream['table_name']
			
 
				-            
			
 
				-            # 添加节点和边
			
 
				-            G.add_node(up_table_name)
			
 
				-            G.add_edge(up_table_name, table_name)  # 上游指向下游，执行时上游先执行
			
 
				-            
			
 
				-            # 递归处理上游依赖
			
 
				-            if up_table_name not in table_info:
			
 
				-                up_metadata = get_table_metadata(up_table_name)
			
 
				-                table_info[up_table_name] = up_metadata
			
 
				-                
			
 
				-                # 如果是resource级别，不继续处理DataSource节点
			
 
				-                if dependency_level == 'resource' and up_metadata['type'] == 'DataSource':
			
 
				-                    continue
			
 
				-                    
			
 
				-                add_dependencies(up_table_name)
			
 
				-    
			
 
				-    # 开始递归构建依赖图
			
 
				-    add_dependencies(start_table)
			
 
				-    
			
 
				-    # 检测和处理循环依赖
			
 
				-    cycles = list(nx.simple_cycles(G))
			
 
				-    if cycles:
			
 
				-        logger.warning(f"检测到循环依赖: {cycles}")
			
 
				-        for cycle in cycles:
			
 
				-            # 移除循环中的最后一条边来打破循环
			
 
				-            G.remove_edge(cycle[-1], cycle[0])
			
 
				-            logger.info(f"打破循环依赖: 移除 {cycle[-1]} -> {cycle[0]} 的依赖")
			
 
				-    
			
 
				-    return table_info, G
			
 
				-
			
 
				-def optimize_execution_order(dependency_graph):
			
 
				-    """
			
 
				-    优化执行顺序
			
 
				-    
			
 
				-    参数:
			
 
				-        dependency_graph: NetworkX依赖图
			
 
				-        
			
 
				-    返回:
			
 
				-        list: 优化后的执行顺序
			
 
				-    """
			
 
				-    # 使用拓扑排序生成执行顺序
			
 
				-    try:
			
 
				-        execution_order = list(nx.topological_sort(dependency_graph))
			
 
				-        logger.info(f"生成拓扑排序: {execution_order}")
			
 
				-        return execution_order
			
 
				-    except nx.NetworkXUnfeasible:
			
 
				-        logger.error("无法生成拓扑排序，图可能仍然包含循环")
			
 
				-        # 返回图中的所有节点作为备选
			
 
				-        return list(dependency_graph.nodes())
			
 
				-
			
 
				-def analyze_and_prepare_dag(**context):
			
 
				-    """
			
 
				-    分析依赖关系并准备DAG结构，但不执行任何脚本
			
 
				-    """
			
 
				-    # 获取参数
			
 
				-    params = context['params']
			
 
				-    target_table = params.get('TABLE_NAME')
			
 
				-    dependency_level = params.get('DEPENDENCY_LEVEL', 'resource')
			
 
				-    
			
 
				-    if not target_table:
			
 
				-        raise ValueError("必须提供TABLE_NAME参数")
			
 
				-    
			
 
				-    logger.info(f"开始分析表 {target_table} 的依赖，依赖级别: {dependency_level}")
			
 
				-    
			
 
				-    # 构建依赖图
			
 
				-    table_info, dependency_graph = build_dependency_graph(target_table, dependency_level)
			
 
				-    
			
 
				-    if not table_info:
			
 
				-        logger.warning(f"没有找到表 {target_table} 的依赖信息")
			
 
				-        return {}
			
 
				-    
			
 
				-    # 优化执行顺序
			
 
				-    execution_order = optimize_execution_order(dependency_graph)
			
 
				-    
			
 
				-    # 过滤掉没有脚本的表
			
 
				-    executable_tables = [
			
 
				-        table_name for table_name in execution_order 
			
 
				-        if table_name in table_info and table_info[table_name]['script_name']
			
 
				-    ]
			
 
				-    
			
 
				-    logger.info(f"需要执行的表: {executable_tables}")
			
 
				-    
			
 
				-    # 返回执行计划，包含每个表的信息和执行顺序
			
 
				-    execution_plan = {
			
 
				-        'executable_tables': executable_tables,
			
 
				-        'table_info': {k: v for k, v in table_info.items() if k in executable_tables},
			
 
				-        'dependencies': {
			
 
				-            k: list(dependency_graph.predecessors(k)) 
			
 
				-            for k in executable_tables
			
 
				-        }
			
 
				-    }
			
 
				-    
			
 
				-    return execution_plan
			
 
				-
			
 
				-# 创建DAG
			
 
				-with DAG(
			
 
				-    'dag_dependency_analysis',
			
 
				-    default_args=default_args,
			
 
				-    description='分析表依赖路径并执行相关脚本',
			
 
				-    schedule_interval=None,  # 设置为None表示只能手动触发
			
 
				-    catchup=False,
			
 
				-    is_paused_upon_creation=False,
			
 
				-    params={
			
 
				-        'TABLE_NAME': Param('', type='string', description='目标表名称'),
			
 
				-        'DEPENDENCY_LEVEL': Param('resource', type='string', enum=['self', 'resource', 'source'], description='依赖级别: self-仅本表, resource-到Resource层, source-到Source层')
			
 
				-    },
			
 
				-) as dag:
			
 
				-    # 创建分析依赖的任务
			
 
				-    analyze_task = PythonOperator(
			
 
				-        task_id='analyze_dependencies',
			
 
				-        python_callable=analyze_and_prepare_dag,
			
 
				-        provide_context=True,
			
 
				-        dag=dag,
			
 
				-    )
			
 
				-    
			
 
				-    # 动态确定要执行的任务列表
			
 
				-    def determine_and_create_tasks(**context):
			
 
				-        """
			
 
				-        根据分析结果确定要执行的任务，并动态创建任务
			
 
				-        """
			
 
				-        # 获取analyze_dependencies任务的输出
			
 
				-        ti = context['ti']
			
 
				-        execution_plan = ti.xcom_pull(task_ids='analyze_dependencies')
			
 
				-        
			
 
				-        if not execution_plan or 'executable_tables' not in execution_plan:
			
 
				-            logger.warning("未获取到执行计划，无法创建任务")
			
 
				-            return None
			
 
				-        
			
 
				-        executable_tables = execution_plan.get('executable_tables', [])
			
 
				-        table_info = execution_plan.get('table_info', {})
			
 
				-        dependencies = execution_plan.get('dependencies', {})
			
 
				-        
			
 
				-        if not executable_tables:
			
 
				-            logger.warning("没有表需要执行")
			
 
				-            return None
			
 
				-        
			
 
				-        # 记录执行计划
			
 
				-        logger.info(f"要执行的表: {executable_tables}")
			
 
				-        for table_name in executable_tables:
			
 
				-            logger.info(f"表 {table_name} 的信息: {table_info.get(table_name, {})}")
			
 
				-            logger.info(f"表 {table_name} 的依赖: {dependencies.get(table_name, [])}")
			
 
				-        
			
 
				-        # 为每个需要执行的表创建任务
			
 
				-        for table_name in executable_tables:
			
 
				-            table_data = table_info.get(table_name, {})
			
 
				-            execution_mode = table_data.get('execution_mode', 'append')
			
 
				-            
			
 
				-            # 创建处理任务
			
 
				-            task = PythonOperator(
			
 
				-                task_id=f'process_{table_name}',
			
 
				-                python_callable=run_model_script,
			
 
				-                op_kwargs={
			
 
				-                    'table_name': table_name,
			
 
				-                    'execution_mode': execution_mode
			
 
				-                },
			
 
				-                dag=dag,
			
 
				-            )
			
 
				-            
			
 
				-            # 设置依赖关系
			
 
				-            # 当前表依赖的上游表
			
 
				-            upstream_tables = dependencies.get(table_name, [])
			
 
				-            # 过滤出在executable_tables中的上游表
			
 
				-            upstream_tables = [t for t in upstream_tables if t in executable_tables]
			
 
				-            
			
 
				-            for upstream in upstream_tables:
			
 
				-                # 获取上游任务（假设已经创建）
			
 
				-                upstream_task = dag.get_task(f'process_{upstream}')
			
 
				-                if upstream_task:
			
 
				-                    # 设置依赖: 上游任务 >> 当前任务
			
 
				-                    upstream_task >> task
			
 
				-                    logger.info(f"设置任务依赖: process_{upstream} >> process_{table_name}")
			
 
				-            
			
 
				-            # 如果没有上游任务，直接依赖于分析任务
			
 
				-            if not upstream_tables:
			
 
				-                analyze_task >> task
			
 
				-                logger.info(f"设置任务依赖: analyze_dependencies >> process_{table_name}")
			
 
				-        
			
 
				-        # 找到没有依赖的第一个表（入口任务）
			
 
				-        entry_tables = [
			
 
				-            table for table in executable_tables
			
 
				-            if not dependencies.get(table, [])
			
 
				-        ]
			
 
				-        
			
 
				-        # 返回入口任务的ID，如果有的话
			
 
				-        if entry_tables:
			
 
				-            return f'process_{entry_tables[0]}'
			
 
				-        else:
			
 
				-            # 如果没有明确的入口任务，使用第一个表
			
 
				-            return f'process_{executable_tables[0]}'
			
 
				-    
			
 
				-    # 使用BranchPythonOperator
			
 
				-    branch_task = PythonOperator(
			
 
				-        task_id='branch_and_create_tasks',
			
 
				-        python_callable=determine_and_create_tasks,
			
 
				-        provide_context=True,
			
 
				-        dag=dag,
			
 
				-    )
			
 
				-    
			
 
				-    # 设置基本任务流
			
 
				-    analyze_task >> branch_task 
			
--- a/dags/dag_manual_dependency_trigger.py
+++ b/dags/dag_manual_dependency_trigger.py
@@ -0,0 +1,500 @@
 
				+# dag_manual_dependency_trigger.py
			
 
				+from airflow import DAG
			
 
				+from airflow.operators.python import PythonOperator
			
 
				+from datetime import datetime, timedelta
			
 
				+import logging
			
 
				+import importlib.util
			
 
				+import os
			
 
				+from pathlib import Path
			
 
				+from neo4j import GraphDatabase
			
 
				+import psycopg2
			
 
				+import networkx as nx
			
 
				+from config import NEO4J_CONFIG, SCRIPTS_BASE_PATH, PG_CONFIG
			
 
				+
			
 
				+# 设置logger
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+# DAG参数
			
 
				+default_args = {
			
 
				+    'owner': 'airflow',
			
 
				+    'depends_on_past': False,
			
 
				+    'start_date': datetime(2024, 1, 1),
			
 
				+    'email_on_failure': False,
			
 
				+    'email_on_retry': False,
			
 
				+    'retries': 1,
			
 
				+    'retry_delay': timedelta(minutes=5),
			
 
				+}
			
 
				+
			
 
				+def get_pg_conn():
			
 
				+    """获取PostgreSQL连接"""
			
 
				+    return psycopg2.connect(**PG_CONFIG)
			
 
				+
			
 
				+def get_execution_mode(table_name):
			
 
				+    """
			
 
				+    从PostgreSQL获取表的执行模式    
			
 
				+    参数:
			
 
				+        table_name (str): 表名
			
 
				+    注意：
			
 
				+        "AND is_enabled = TRUE" 这个条件在这里不适用，因为这是强制执行的。
			
 
				+        即使订阅表中没有这个表名，也会强制执行。
			
 
				+    返回:
			
 
				+        str: 执行模式，如果未找到则返回"append"作为默认值
			
 
				+    """
			
 
				+    try:
			
 
				+        conn = get_pg_conn()
			
 
				+        cursor = conn.cursor()
			
 
				+        cursor.execute("""
			
 
				+            SELECT execution_mode 
			
 
				+            FROM table_schedule 
			
 
				+            WHERE table_name = %s
			
 
				+        """, (table_name,))
			
 
				+        result = cursor.fetchone()
			
 
				+        cursor.close()
			
 
				+        conn.close()
			
 
				+        
			
 
				+        if result:
			
 
				+            return result[0]
			
 
				+        else:
			
 
				+            logger.warning(f"未找到表 {table_name} 的执行模式，使用默认值 'append'")
			
 
				+            return "append"
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"获取表 {table_name} 的执行模式时出错: {str(e)}")
			
 
				+        return "append"
			
 
				+
			
 
				+def get_dag_params(**context):
			
 
				+    """获取DAG运行参数"""
			
 
				+    params = context.get('params', {})
			
 
				+    table_name = params.get('TABLE_NAME')
			
 
				+    dependency_level = params.get('DEPENDENCY_LEVEL', 'resource')  # 默认值为resource
			
 
				+    
			
 
				+    if not table_name:
			
 
				+        raise ValueError("必须提供TABLE_NAME参数")
			
 
				+    
			
 
				+    # 验证dependency_level参数
			
 
				+    if dependency_level not in ['self', 'resource', 'source']:
			
 
				+        logger.warning(f"无效的DEPENDENCY_LEVEL参数: {dependency_level}，使用默认值'resource'")
			
 
				+        dependency_level = 'resource'
			
 
				+    
			
 
				+    logger.info(f"开始处理表: {table_name}, 依赖级别: {dependency_level}")
			
 
				+    return table_name, dependency_level
			
 
				+
			
 
				+def is_data_model_table(table_name):
			
 
				+    """判断表是否为DataModel类型"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (n:DataModel {en_name: $table_name}) RETURN count(n) > 0 AS exists
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            return record and record["exists"]
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def is_data_resource_table(table_name):
			
 
				+    """判断表是否为DataResource类型"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (n:DataResource {en_name: $table_name}) RETURN count(n) > 0 AS exists
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            return record and record["exists"]
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_upstream_models(table_name):
			
 
				+    """获取表的上游DataModel依赖"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (target:DataModel {en_name: $table_name})-[:DERIVED_FROM]->(up:DataModel)
			
 
				+        RETURN up.en_name AS upstream
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            upstream_list = [record["upstream"] for record in result]
			
 
				+            logger.info(f"表 {table_name} 的上游DataModel依赖: {upstream_list}")
			
 
				+            return upstream_list
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_upstream_resources(table_name):
			
 
				+    """获取表的上游DataResource依赖"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (target:DataModel {en_name: $table_name})-[:DERIVED_FROM]->(up:DataResource)
			
 
				+        RETURN up.en_name AS upstream
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            upstream_list = [record["upstream"] for record in result]
			
 
				+            logger.info(f"表 {table_name} 的上游DataResource依赖: {upstream_list}")
			
 
				+            return upstream_list
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_data_sources(resource_table_name):
			
 
				+    """获取DataResource表的上游DataSource"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (dr:DataResource {en_name: $table_name})-[:ORIGINATES_FROM]->(ds:DataSource)
			
 
				+        RETURN ds.en_name AS source_name
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=resource_table_name)
			
 
				+            return [record["source_name"] for record in result]
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_script_name_for_model(table_name):
			
 
				+    """获取DataModel表对应的脚本名称"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (target:DataModel {en_name: $table_name})-[r:DERIVED_FROM]->(n)
			
 
				+        WHERE n:DataModel OR n:DataResource
			
 
				+        RETURN r.script_name AS script_name
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            if record:
			
 
				+                return record["script_name"]
			
 
				+            else:
			
 
				+                logger.warning(f"未找到DataModel表 {table_name} 的脚本名称")
			
 
				+                return None
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"查询表 {table_name} 的脚本名称时出错: {str(e)}")
			
 
				+        return None
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_script_name_for_resource(table_name):
			
 
				+    """获取DataResource表对应的脚本名称"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (dr:DataResource {en_name: $table_name})-[rel:ORIGINATES_FROM]->(ds:DataSource)
			
 
				+        RETURN rel.script_name AS script_name
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            if record:
			
 
				+                return record["script_name"]
			
 
				+            else:
			
 
				+                logger.warning(f"未找到DataResource表 {table_name} 的脚本名称")
			
 
				+                return None
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"查询表 {table_name} 的脚本名称时出错: {str(e)}")
			
 
				+        return None
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def build_dependency_chain_nx(start_table, dependency_level='resource'):
			
 
				+    """
			
 
				+    使用networkx构建依赖链
			
 
				+    
			
 
				+    参数:
			
 
				+        start_table (str): 起始表名
			
 
				+        dependency_level (str): 依赖级别
			
 
				+            - 'self': 只执行自己
			
 
				+            - 'resource': 到Resource层 (默认)
			
 
				+            - 'source': 到Source层
			
 
				+        
			
 
				+    返回:
			
 
				+        list: 依赖链列表，按执行顺序排序（从上游到下游）
			
 
				+    """
			
 
				+    # 创建有向图
			
 
				+    G = nx.DiGraph()
			
 
				+    
			
 
				+    # 设置起始节点属性
			
 
				+    if is_data_model_table(start_table):
			
 
				+        G.add_node(start_table, type='DataModel')
			
 
				+        table_type = 'DataModel'
			
 
				+    elif is_data_resource_table(start_table):
			
 
				+        G.add_node(start_table, type='DataResource')
			
 
				+        table_type = 'DataResource'
			
 
				+    else:
			
 
				+        logger.warning(f"表 {start_table} 不是DataModel或DataResource类型")
			
 
				+        return []
			
 
				+    
			
 
				+    # 如果只执行自己，直接返回
			
 
				+    if dependency_level == 'self':
			
 
				+        script_name = get_script_name_for_model(start_table) if table_type == 'DataModel' else get_script_name_for_resource(start_table)
			
 
				+        execution_mode = get_execution_mode(start_table)
			
 
				+        return [{
			
 
				+            'table_name': start_table,
			
 
				+            'script_name': script_name,
			
 
				+            'table_type': table_type,
			
 
				+            'execution_mode': execution_mode
			
 
				+        }]
			
 
				+    
			
 
				+    # BFS构建依赖图
			
 
				+    visited = set([start_table])
			
 
				+    queue = [start_table]
			
 
				+    
			
 
				+    while queue:
			
 
				+        current = queue.pop(0)
			
 
				+        
			
 
				+        # 处理当前节点的上游依赖
			
 
				+        if G.nodes[current].get('type') == 'DataModel':
			
 
				+            # 获取DataModel的上游依赖
			
 
				+            upstream_models = get_upstream_models(current)
			
 
				+            for upstream in upstream_models:
			
 
				+                if upstream not in visited:
			
 
				+                    G.add_node(upstream, type='DataModel')
			
 
				+                    visited.add(upstream)
			
 
				+                    queue.append(upstream)
			
 
				+                G.add_edge(current, upstream, type='model_to_model')
			
 
				+            
			
 
				+            # 获取上游DataResource
			
 
				+            upstream_resources = get_upstream_resources(current)
			
 
				+            for upstream in upstream_resources:
			
 
				+                if upstream not in visited:
			
 
				+                    G.add_node(upstream, type='DataResource')
			
 
				+                    visited.add(upstream)
			
 
				+                    # 如果依赖级别为source并且上游是DataResource，则继续向上查找DataSource
			
 
				+                    if dependency_level == 'source':
			
 
				+                        queue.append(upstream)
			
 
				+                G.add_edge(current, upstream, type='model_to_resource')
			
 
				+        
			
 
				+        # 如果当前节点是DataResource且依赖级别为source，则查找上游DataSource
			
 
				+        elif G.nodes[current].get('type') == 'DataResource' and dependency_level == 'source':
			
 
				+            data_sources = get_data_sources(current)
			
 
				+            for source in data_sources:
			
 
				+                if source not in visited:
			
 
				+                    G.add_node(source, type='DataSource')
			
 
				+                    visited.add(source)
			
 
				+                G.add_edge(current, source, type='resource_to_source')
			
 
				+    
			
 
				+    # 检测循环依赖
			
 
				+    cycles = list(nx.simple_cycles(G))
			
 
				+    if cycles:
			
 
				+        logger.warning(f"检测到循环依赖，将尝试打破循环: {cycles}")
			
 
				+        # 打破循环依赖（简单策略：移除每个循环中的一条边）
			
 
				+        for cycle in cycles:
			
 
				+            G.remove_edge(cycle[-1], cycle[0])
			
 
				+            logger.info(f"打破循环依赖: 移除 {cycle[-1]} -> {cycle[0]} 的依赖")
			
 
				+    
			
 
				+    # 生成拓扑排序（从上游到下游的顺序）
			
 
				+    try:
			
 
				+        # 注意：拓扑排序给出的是从上游到下游的顺序
			
 
				+        # 我们需要的是执行顺序，所以要反转图然后进行拓扑排序
			
 
				+        reverse_G = G.reverse()
			
 
				+        execution_order = list(nx.topological_sort(reverse_G))
			
 
				+        
			
 
				+        # 构建最终依赖链
			
 
				+        dependency_chain = []
			
 
				+        for table_name in execution_order:
			
 
				+            node_type = G.nodes[table_name].get('type')
			
 
				+            
			
 
				+            # 跳过DataSource节点，它们没有脚本需要执行
			
 
				+            if node_type == 'DataSource':
			
 
				+                continue
			
 
				+            
			
 
				+            # 获取脚本和执行模式
			
 
				+            if node_type == 'DataModel':
			
 
				+                script_name = get_script_name_for_model(table_name)
			
 
				+            else:  # DataResource
			
 
				+                script_name = get_script_name_for_resource(table_name)
			
 
				+            
			
 
				+            execution_mode = get_execution_mode(table_name)
			
 
				+            
			
 
				+            dependency_chain.append({
			
 
				+                'table_name': table_name,
			
 
				+                'script_name': script_name,
			
 
				+                'table_type': node_type,
			
 
				+                'execution_mode': execution_mode
			
 
				+            })
			
 
				+        
			
 
				+        return dependency_chain
			
 
				+    
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"生成拓扑排序时出错: {str(e)}")
			
 
				+        return []
			
 
				+
			
 
				+def execute_scripts(scripts_list):
			
 
				+    """
			
 
				+    执行指定的脚本列表
			
 
				+    
			
 
				+    参数:
			
 
				+        scripts_list (list): 要执行的脚本信息列表，每项包含table_name, script_name, execution_mode
			
 
				+        
			
 
				+    返回:
			
 
				+        bool: 全部执行成功返回True，任一失败返回False
			
 
				+    """
			
 
				+    if not scripts_list:
			
 
				+        logger.info("没有脚本需要执行")
			
 
				+        return True
			
 
				+    
			
 
				+    success = True
			
 
				+    for item in scripts_list:
			
 
				+        script_name = item['script_name']
			
 
				+        table_name = item['table_name']
			
 
				+        execution_mode = item['execution_mode']
			
 
				+        
			
 
				+        if not script_name:
			
 
				+            logger.warning(f"表 {table_name} 没有对应的脚本，跳过执行")
			
 
				+            continue
			
 
				+        
			
 
				+        logger.info(f"执行脚本: {script_name}, 表: {table_name}, 模式: {execution_mode}")
			
 
				+        
			
 
				+        try:
			
 
				+            script_path = Path(SCRIPTS_BASE_PATH) / script_name
			
 
				+            
			
 
				+            if not os.path.exists(script_path):
			
 
				+                logger.error(f"脚本文件不存在: {script_path}")
			
 
				+                success = False
			
 
				+                break
			
 
				+            
			
 
				+            # 动态导入模块
			
 
				+            spec = importlib.util.spec_from_file_location("dynamic_module", script_path)
			
 
				+            module = importlib.util.module_from_spec(spec)
			
 
				+            spec.loader.exec_module(module)
			
 
				+            
			
 
				+            # 使用标准入口函数run
			
 
				+            if hasattr(module, "run"):
			
 
				+                logger.info(f"执行脚本 {script_name} 的标准入口函数 run()")
			
 
				+                result = module.run(table_name=table_name, execution_mode=execution_mode)
			
 
				+                if result:
			
 
				+                    logger.info(f"脚本 {script_name} 执行成功")
			
 
				+                else:
			
 
				+                    logger.error(f"脚本 {script_name} 执行失败")
			
 
				+                    success = False
			
 
				+                    break
			
 
				+            else:
			
 
				+                logger.warning(f"脚本 {script_name} 未定义标准入口函数 run()，无法执行")
			
 
				+                success = False
			
 
				+                break
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"执行脚本 {script_name} 时出错: {str(e)}")
			
 
				+            success = False
			
 
				+            break
			
 
				+    
			
 
				+    return success
			
 
				+
			
 
				+def prepare_dependency_chain(**context):
			
 
				+    """准备依赖链并保存到XCom"""
			
 
				+    # 获取参数
			
 
				+    table_name, dependency_level = get_dag_params(**context)
			
 
				+    
			
 
				+    # 获取依赖链
			
 
				+    dependency_chain = build_dependency_chain_nx(table_name, dependency_level)
			
 
				+    
			
 
				+    if not dependency_chain:
			
 
				+        logger.warning(f"没有找到表 {table_name} 的依赖链")
			
 
				+        return False
			
 
				+    
			
 
				+    # 记录完整依赖链
			
 
				+    logger.info(f"依赖链完整列表: {[item['table_name'] for item in dependency_chain]}")
			
 
				+    
			
 
				+    # 保存依赖链到XCom以便后续任务使用
			
 
				+    ti = context['ti']
			
 
				+    ti.xcom_push(key='dependency_chain', value=dependency_chain)
			
 
				+    
			
 
				+    # 检查是否有各类型的脚本需要执行
			
 
				+    has_resource = any(item['table_type'] == 'DataResource' for item in dependency_chain)
			
 
				+    has_model = any(item['table_type'] == 'DataModel' for item in dependency_chain)
			
 
				+    
			
 
				+    logger.info(f"是否有DataResource脚本: {has_resource}, 是否有DataModel脚本: {has_model}")
			
 
				+    
			
 
				+    return True
			
 
				+
			
 
				+def process_resources(**context):
			
 
				+    """处理所有DataResource层的脚本"""
			
 
				+    # 获取任务间共享变量
			
 
				+    ti = context['ti']
			
 
				+    dependency_chain = ti.xcom_pull(task_ids='prepare_dependency_chain', key='dependency_chain')
			
 
				+    
			
 
				+    # 过滤出DataResource类型的表
			
 
				+    resource_scripts = [item for item in dependency_chain if item['table_type'] == 'DataResource']
			
 
				+    
			
 
				+    logger.info(f"要执行的DataResource脚本: {[item['table_name'] for item in resource_scripts]}")
			
 
				+    
			
 
				+    # 执行所有DataResource脚本
			
 
				+    return execute_scripts(resource_scripts)
			
 
				+
			
 
				+def process_models(**context):
			
 
				+    """处理所有DataModel层的脚本"""
			
 
				+    # 获取任务间共享变量
			
 
				+    ti = context['ti']
			
 
				+    dependency_chain = ti.xcom_pull(task_ids='prepare_dependency_chain', key='dependency_chain')
			
 
				+    
			
 
				+    # 过滤出DataModel类型的表
			
 
				+    model_scripts = [item for item in dependency_chain if item['table_type'] == 'DataModel']
			
 
				+    
			
 
				+    logger.info(f"要执行的DataModel脚本: {[item['table_name'] for item in model_scripts]}")
			
 
				+    
			
 
				+    # 执行所有DataModel脚本
			
 
				+    return execute_scripts(model_scripts)
			
 
				+
			
 
				+# 创建DAG
			
 
				+with DAG(
			
 
				+    'dag_manual_dependency_trigger',
			
 
				+    default_args=default_args,
			
 
				+    description='手动触发指定表的依赖链执行（使用networkx优化依赖路径）',
			
 
				+    schedule_interval=None,  # 设置为None表示只能手动触发
			
 
				+    catchup=False,
			
 
				+    is_paused_upon_creation=False,  # 添加这一行，使DAG创建时不处于暂停状态
			
 
				+    params={
			
 
				+        'TABLE_NAME': '',
			
 
				+        'DEPENDENCY_LEVEL': {
			
 
				+            'type': 'string',
			
 
				+            'enum': ['self', 'resource', 'source'],
			
 
				+            'default': 'resource',
			
 
				+            'description': '依赖级别: self-仅本表, resource-到Resource层, source-到Source层'
			
 
				+        }
			
 
				+    },
			
 
				+) as dag:
			
 
				+    
			
 
				+    # 第一个任务：准备依赖链
			
 
				+    prepare_task = PythonOperator(
			
 
				+        task_id='prepare_dependency_chain',
			
 
				+        python_callable=prepare_dependency_chain,
			
 
				+        provide_context=True,
			
 
				+    )
			
 
				+    
			
 
				+    # 第二个任务：执行DataResource脚本
			
 
				+    resource_task = PythonOperator(
			
 
				+        task_id='process_resources',
			
 
				+        python_callable=process_resources,
			
 
				+        provide_context=True,
			
 
				+    )
			
 
				+    
			
 
				+    # 第三个任务：执行DataModel脚本
			
 
				+    model_task = PythonOperator(
			
 
				+        task_id='process_models',
			
 
				+        python_callable=process_models,
			
 
				+        provide_context=True,
			
 
				+    )
			
 
				+    
			
 
				+    # 设置任务依赖关系
			
 
				+    prepare_task >> resource_task >> model_task 
			
--- a/dags/dag_manual_trigger_chain_nx.py
+++ b/dags/dag_manual_trigger_chain_nx.py
@@ -0,0 +1,500 @@
 
				+# dag_manual_dependency_trigger.py
			
 
				+from airflow import DAG
			
 
				+from airflow.operators.python import PythonOperator
			
 
				+from datetime import datetime, timedelta
			
 
				+import logging
			
 
				+import importlib.util
			
 
				+import os
			
 
				+from pathlib import Path
			
 
				+from neo4j import GraphDatabase
			
 
				+import psycopg2
			
 
				+import networkx as nx
			
 
				+from config import NEO4J_CONFIG, SCRIPTS_BASE_PATH, PG_CONFIG
			
 
				+
			
 
				+# 设置logger
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+# DAG参数
			
 
				+default_args = {
			
 
				+    'owner': 'airflow',
			
 
				+    'depends_on_past': False,
			
 
				+    'start_date': datetime(2024, 1, 1),
			
 
				+    'email_on_failure': False,
			
 
				+    'email_on_retry': False,
			
 
				+    'retries': 1,
			
 
				+    'retry_delay': timedelta(minutes=5),
			
 
				+}
			
 
				+
			
 
				+def get_pg_conn():
			
 
				+    """获取PostgreSQL连接"""
			
 
				+    return psycopg2.connect(**PG_CONFIG)
			
 
				+
			
 
				+def get_execution_mode(table_name):
			
 
				+    """
			
 
				+    从PostgreSQL获取表的执行模式    
			
 
				+    参数:
			
 
				+        table_name (str): 表名
			
 
				+    注意：
			
 
				+        "AND is_enabled = TRUE" 这个条件在这里不适用，因为这是强制执行的。
			
 
				+        即使订阅表中没有这个表名，也会强制执行。
			
 
				+    返回:
			
 
				+        str: 执行模式，如果未找到则返回"append"作为默认值
			
 
				+    """
			
 
				+    try:
			
 
				+        conn = get_pg_conn()
			
 
				+        cursor = conn.cursor()
			
 
				+        cursor.execute("""
			
 
				+            SELECT execution_mode 
			
 
				+            FROM table_schedule 
			
 
				+            WHERE table_name = %s
			
 
				+        """, (table_name,))
			
 
				+        result = cursor.fetchone()
			
 
				+        cursor.close()
			
 
				+        conn.close()
			
 
				+        
			
 
				+        if result:
			
 
				+            return result[0]
			
 
				+        else:
			
 
				+            logger.warning(f"未找到表 {table_name} 的执行模式，使用默认值 'append'")
			
 
				+            return "append"
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"获取表 {table_name} 的执行模式时出错: {str(e)}")
			
 
				+        return "append"
			
 
				+
			
 
				+def get_dag_params(**context):
			
 
				+    """获取DAG运行参数"""
			
 
				+    params = context.get('params', {})
			
 
				+    table_name = params.get('TABLE_NAME')
			
 
				+    dependency_level = params.get('DEPENDENCY_LEVEL', 'resource')  # 默认值为resource
			
 
				+    
			
 
				+    if not table_name:
			
 
				+        raise ValueError("必须提供TABLE_NAME参数")
			
 
				+    
			
 
				+    # 验证dependency_level参数
			
 
				+    if dependency_level not in ['self', 'resource', 'source']:
			
 
				+        logger.warning(f"无效的DEPENDENCY_LEVEL参数: {dependency_level}，使用默认值'resource'")
			
 
				+        dependency_level = 'resource'
			
 
				+    
			
 
				+    logger.info(f"开始处理表: {table_name}, 依赖级别: {dependency_level}")
			
 
				+    return table_name, dependency_level
			
 
				+
			
 
				+def is_data_model_table(table_name):
			
 
				+    """判断表是否为DataModel类型"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (n:DataModel {en_name: $table_name}) RETURN count(n) > 0 AS exists
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            return record and record["exists"]
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def is_data_resource_table(table_name):
			
 
				+    """判断表是否为DataResource类型"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (n:DataResource {en_name: $table_name}) RETURN count(n) > 0 AS exists
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            return record and record["exists"]
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_upstream_models(table_name):
			
 
				+    """获取表的上游DataModel依赖"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (target:DataModel {en_name: $table_name})-[:DERIVED_FROM]->(up:DataModel)
			
 
				+        RETURN up.en_name AS upstream
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            upstream_list = [record["upstream"] for record in result]
			
 
				+            logger.info(f"表 {table_name} 的上游DataModel依赖: {upstream_list}")
			
 
				+            return upstream_list
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_upstream_resources(table_name):
			
 
				+    """获取表的上游DataResource依赖"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (target:DataModel {en_name: $table_name})-[:DERIVED_FROM]->(up:DataResource)
			
 
				+        RETURN up.en_name AS upstream
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            upstream_list = [record["upstream"] for record in result]
			
 
				+            logger.info(f"表 {table_name} 的上游DataResource依赖: {upstream_list}")
			
 
				+            return upstream_list
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_data_sources(resource_table_name):
			
 
				+    """获取DataResource表的上游DataSource"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (dr:DataResource {en_name: $table_name})-[:ORIGINATES_FROM]->(ds:DataSource)
			
 
				+        RETURN ds.en_name AS source_name
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=resource_table_name)
			
 
				+            return [record["source_name"] for record in result]
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_script_name_for_model(table_name):
			
 
				+    """获取DataModel表对应的脚本名称"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (target:DataModel {en_name: $table_name})-[r:DERIVED_FROM]->(n)
			
 
				+        WHERE n:DataModel OR n:DataResource
			
 
				+        RETURN r.script_name AS script_name
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            if record:
			
 
				+                return record["script_name"]
			
 
				+            else:
			
 
				+                logger.warning(f"未找到DataModel表 {table_name} 的脚本名称")
			
 
				+                return None
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"查询表 {table_name} 的脚本名称时出错: {str(e)}")
			
 
				+        return None
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def get_script_name_for_resource(table_name):
			
 
				+    """获取DataResource表对应的脚本名称"""
			
 
				+    driver = GraphDatabase.driver(
			
 
				+        NEO4J_CONFIG['uri'], 
			
 
				+        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				+    )
			
 
				+    query = """
			
 
				+        MATCH (dr:DataResource {en_name: $table_name})-[rel:ORIGINATES_FROM]->(ds:DataSource)
			
 
				+        RETURN rel.script_name AS script_name
			
 
				+    """
			
 
				+    try:
			
 
				+        with driver.session() as session:
			
 
				+            result = session.run(query, table_name=table_name)
			
 
				+            record = result.single()
			
 
				+            if record:
			
 
				+                return record["script_name"]
			
 
				+            else:
			
 
				+                logger.warning(f"未找到DataResource表 {table_name} 的脚本名称")
			
 
				+                return None
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"查询表 {table_name} 的脚本名称时出错: {str(e)}")
			
 
				+        return None
			
 
				+    finally:
			
 
				+        driver.close()
			
 
				+
			
 
				+def build_dependency_chain_nx(start_table, dependency_level='resource'):
			
 
				+    """
			
 
				+    使用networkx构建依赖链
			
 
				+    
			
 
				+    参数:
			
 
				+        start_table (str): 起始表名
			
 
				+        dependency_level (str): 依赖级别
			
 
				+            - 'self': 只执行自己
			
 
				+            - 'resource': 到Resource层 (默认)
			
 
				+            - 'source': 到Source层
			
 
				+        
			
 
				+    返回:
			
 
				+        list: 依赖链列表，按执行顺序排序（从上游到下游）
			
 
				+    """
			
 
				+    # 创建有向图
			
 
				+    G = nx.DiGraph()
			
 
				+    
			
 
				+    # 设置起始节点属性
			
 
				+    if is_data_model_table(start_table):
			
 
				+        G.add_node(start_table, type='DataModel')
			
 
				+        table_type = 'DataModel'
			
 
				+    elif is_data_resource_table(start_table):
			
 
				+        G.add_node(start_table, type='DataResource')
			
 
				+        table_type = 'DataResource'
			
 
				+    else:
			
 
				+        logger.warning(f"表 {start_table} 不是DataModel或DataResource类型")
			
 
				+        return []
			
 
				+    
			
 
				+    # 如果只执行自己，直接返回
			
 
				+    if dependency_level == 'self':
			
 
				+        script_name = get_script_name_for_model(start_table) if table_type == 'DataModel' else get_script_name_for_resource(start_table)
			
 
				+        execution_mode = get_execution_mode(start_table)
			
 
				+        return [{
			
 
				+            'table_name': start_table,
			
 
				+            'script_name': script_name,
			
 
				+            'table_type': table_type,
			
 
				+            'execution_mode': execution_mode
			
 
				+        }]
			
 
				+    
			
 
				+    # BFS构建依赖图
			
 
				+    visited = set([start_table])
			
 
				+    queue = [start_table]
			
 
				+    
			
 
				+    while queue:
			
 
				+        current = queue.pop(0)
			
 
				+        
			
 
				+        # 处理当前节点的上游依赖
			
 
				+        if G.nodes[current].get('type') == 'DataModel':
			
 
				+            # 获取DataModel的上游依赖
			
 
				+            upstream_models = get_upstream_models(current)
			
 
				+            for upstream in upstream_models:
			
 
				+                if upstream not in visited:
			
 
				+                    G.add_node(upstream, type='DataModel')
			
 
				+                    visited.add(upstream)
			
 
				+                    queue.append(upstream)
			
 
				+                G.add_edge(current, upstream, type='model_to_model')
			
 
				+            
			
 
				+            # 获取上游DataResource
			
 
				+            upstream_resources = get_upstream_resources(current)
			
 
				+            for upstream in upstream_resources:
			
 
				+                if upstream not in visited:
			
 
				+                    G.add_node(upstream, type='DataResource')
			
 
				+                    visited.add(upstream)
			
 
				+                    # 如果依赖级别为source并且上游是DataResource，则继续向上查找DataSource
			
 
				+                    if dependency_level == 'source':
			
 
				+                        queue.append(upstream)
			
 
				+                G.add_edge(current, upstream, type='model_to_resource')
			
 
				+        
			
 
				+        # 如果当前节点是DataResource且依赖级别为source，则查找上游DataSource
			
 
				+        elif G.nodes[current].get('type') == 'DataResource' and dependency_level == 'source':
			
 
				+            data_sources = get_data_sources(current)
			
 
				+            for source in data_sources:
			
 
				+                if source not in visited:
			
 
				+                    G.add_node(source, type='DataSource')
			
 
				+                    visited.add(source)
			
 
				+                G.add_edge(current, source, type='resource_to_source')
			
 
				+    
			
 
				+    # 检测循环依赖
			
 
				+    cycles = list(nx.simple_cycles(G))
			
 
				+    if cycles:
			
 
				+        logger.warning(f"检测到循环依赖，将尝试打破循环: {cycles}")
			
 
				+        # 打破循环依赖（简单策略：移除每个循环中的一条边）
			
 
				+        for cycle in cycles:
			
 
				+            G.remove_edge(cycle[-1], cycle[0])
			
 
				+            logger.info(f"打破循环依赖: 移除 {cycle[-1]} -> {cycle[0]} 的依赖")
			
 
				+    
			
 
				+    # 生成拓扑排序（从上游到下游的顺序）
			
 
				+    try:
			
 
				+        # 注意：拓扑排序给出的是从上游到下游的顺序
			
 
				+        # 我们需要的是执行顺序，所以要反转图然后进行拓扑排序
			
 
				+        reverse_G = G.reverse()
			
 
				+        execution_order = list(nx.topological_sort(reverse_G))
			
 
				+        
			
 
				+        # 构建最终依赖链
			
 
				+        dependency_chain = []
			
 
				+        for table_name in execution_order:
			
 
				+            node_type = G.nodes[table_name].get('type')
			
 
				+            
			
 
				+            # 跳过DataSource节点，它们没有脚本需要执行
			
 
				+            if node_type == 'DataSource':
			
 
				+                continue
			
 
				+            
			
 
				+            # 获取脚本和执行模式
			
 
				+            if node_type == 'DataModel':
			
 
				+                script_name = get_script_name_for_model(table_name)
			
 
				+            else:  # DataResource
			
 
				+                script_name = get_script_name_for_resource(table_name)
			
 
				+            
			
 
				+            execution_mode = get_execution_mode(table_name)
			
 
				+            
			
 
				+            dependency_chain.append({
			
 
				+                'table_name': table_name,
			
 
				+                'script_name': script_name,
			
 
				+                'table_type': node_type,
			
 
				+                'execution_mode': execution_mode
			
 
				+            })
			
 
				+        
			
 
				+        return dependency_chain
			
 
				+    
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"生成拓扑排序时出错: {str(e)}")
			
 
				+        return []
			
 
				+
			
 
				+def execute_scripts(scripts_list):
			
 
				+    """
			
 
				+    执行指定的脚本列表
			
 
				+    
			
 
				+    参数:
			
 
				+        scripts_list (list): 要执行的脚本信息列表，每项包含table_name, script_name, execution_mode
			
 
				+        
			
 
				+    返回:
			
 
				+        bool: 全部执行成功返回True，任一失败返回False
			
 
				+    """
			
 
				+    if not scripts_list:
			
 
				+        logger.info("没有脚本需要执行")
			
 
				+        return True
			
 
				+    
			
 
				+    success = True
			
 
				+    for item in scripts_list:
			
 
				+        script_name = item['script_name']
			
 
				+        table_name = item['table_name']
			
 
				+        execution_mode = item['execution_mode']
			
 
				+        
			
 
				+        if not script_name:
			
 
				+            logger.warning(f"表 {table_name} 没有对应的脚本，跳过执行")
			
 
				+            continue
			
 
				+        
			
 
				+        logger.info(f"执行脚本: {script_name}, 表: {table_name}, 模式: {execution_mode}")
			
 
				+        
			
 
				+        try:
			
 
				+            script_path = Path(SCRIPTS_BASE_PATH) / script_name
			
 
				+            
			
 
				+            if not os.path.exists(script_path):
			
 
				+                logger.error(f"脚本文件不存在: {script_path}")
			
 
				+                success = False
			
 
				+                break
			
 
				+            
			
 
				+            # 动态导入模块
			
 
				+            spec = importlib.util.spec_from_file_location("dynamic_module", script_path)
			
 
				+            module = importlib.util.module_from_spec(spec)
			
 
				+            spec.loader.exec_module(module)
			
 
				+            
			
 
				+            # 使用标准入口函数run
			
 
				+            if hasattr(module, "run"):
			
 
				+                logger.info(f"执行脚本 {script_name} 的标准入口函数 run()")
			
 
				+                result = module.run(table_name=table_name, execution_mode=execution_mode)
			
 
				+                if result:
			
 
				+                    logger.info(f"脚本 {script_name} 执行成功")
			
 
				+                else:
			
 
				+                    logger.error(f"脚本 {script_name} 执行失败")
			
 
				+                    success = False
			
 
				+                    break
			
 
				+            else:
			
 
				+                logger.warning(f"脚本 {script_name} 未定义标准入口函数 run()，无法执行")
			
 
				+                success = False
			
 
				+                break
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"执行脚本 {script_name} 时出错: {str(e)}")
			
 
				+            success = False
			
 
				+            break
			
 
				+    
			
 
				+    return success
			
 
				+
			
 
				+def prepare_dependency_chain(**context):
			
 
				+    """准备依赖链并保存到XCom"""
			
 
				+    # 获取参数
			
 
				+    table_name, dependency_level = get_dag_params(**context)
			
 
				+    
			
 
				+    # 获取依赖链
			
 
				+    dependency_chain = build_dependency_chain_nx(table_name, dependency_level)
			
 
				+    
			
 
				+    if not dependency_chain:
			
 
				+        logger.warning(f"没有找到表 {table_name} 的依赖链")
			
 
				+        return False
			
 
				+    
			
 
				+    # 记录完整依赖链
			
 
				+    logger.info(f"依赖链完整列表: {[item['table_name'] for item in dependency_chain]}")
			
 
				+    
			
 
				+    # 保存依赖链到XCom以便后续任务使用
			
 
				+    ti = context['ti']
			
 
				+    ti.xcom_push(key='dependency_chain', value=dependency_chain)
			
 
				+    
			
 
				+    # 检查是否有各类型的脚本需要执行
			
 
				+    has_resource = any(item['table_type'] == 'DataResource' for item in dependency_chain)
			
 
				+    has_model = any(item['table_type'] == 'DataModel' for item in dependency_chain)
			
 
				+    
			
 
				+    logger.info(f"是否有DataResource脚本: {has_resource}, 是否有DataModel脚本: {has_model}")
			
 
				+    
			
 
				+    return True
			
 
				+
			
 
				+def process_resources(**context):
			
 
				+    """处理所有DataResource层的脚本"""
			
 
				+    # 获取任务间共享变量
			
 
				+    ti = context['ti']
			
 
				+    dependency_chain = ti.xcom_pull(task_ids='prepare_dependency_chain', key='dependency_chain')
			
 
				+    
			
 
				+    # 过滤出DataResource类型的表
			
 
				+    resource_scripts = [item for item in dependency_chain if item['table_type'] == 'DataResource']
			
 
				+    
			
 
				+    logger.info(f"要执行的DataResource脚本: {[item['table_name'] for item in resource_scripts]}")
			
 
				+    
			
 
				+    # 执行所有DataResource脚本
			
 
				+    return execute_scripts(resource_scripts)
			
 
				+
			
 
				+def process_models(**context):
			
 
				+    """处理所有DataModel层的脚本"""
			
 
				+    # 获取任务间共享变量
			
 
				+    ti = context['ti']
			
 
				+    dependency_chain = ti.xcom_pull(task_ids='prepare_dependency_chain', key='dependency_chain')
			
 
				+    
			
 
				+    # 过滤出DataModel类型的表
			
 
				+    model_scripts = [item for item in dependency_chain if item['table_type'] == 'DataModel']
			
 
				+    
			
 
				+    logger.info(f"要执行的DataModel脚本: {[item['table_name'] for item in model_scripts]}")
			
 
				+    
			
 
				+    # 执行所有DataModel脚本
			
 
				+    return execute_scripts(model_scripts)
			
 
				+
			
 
				+# 创建DAG
			
 
				+with DAG(
			
 
				+    'dag_manual_dependency_trigger',
			
 
				+    default_args=default_args,
			
 
				+    description='手动触发指定表的依赖链执行（使用networkx优化依赖路径）',
			
 
				+    schedule_interval=None,  # 设置为None表示只能手动触发
			
 
				+    catchup=False,
			
 
				+    is_paused_upon_creation=False,  # 添加这一行，使DAG创建时不处于暂停状态
			
 
				+    params={
			
 
				+        'TABLE_NAME': '',
			
 
				+        'DEPENDENCY_LEVEL': {
			
 
				+            'type': 'string',
			
 
				+            'enum': ['self', 'resource', 'source'],
			
 
				+            'default': 'resource',
			
 
				+            'description': '依赖级别: self-仅本表, resource-到Resource层, source-到Source层'
			
 
				+        }
			
 
				+    },
			
 
				+) as dag:
			
 
				+    
			
 
				+    # 第一个任务：准备依赖链
			
 
				+    prepare_task = PythonOperator(
			
 
				+        task_id='prepare_dependency_chain',
			
 
				+        python_callable=prepare_dependency_chain,
			
 
				+        provide_context=True,
			
 
				+    )
			
 
				+    
			
 
				+    # 第二个任务：执行DataResource脚本
			
 
				+    resource_task = PythonOperator(
			
 
				+        task_id='process_resources',
			
 
				+        python_callable=process_resources,
			
 
				+        provide_context=True,
			
 
				+    )
			
 
				+    
			
 
				+    # 第三个任务：执行DataModel脚本
			
 
				+    model_task = PythonOperator(
			
 
				+        task_id='process_models',
			
 
				+        python_callable=process_models,
			
 
				+        provide_context=True,
			
 
				+    )
			
 
				+    
			
 
				+    # 设置任务依赖关系
			
 
				+    prepare_task >> resource_task >> model_task 
			
--- a/dags/dag_manual_trigger_chain_optimized.py
+++ b/dags/dag_manual_trigger_chain_optimized.py
@@ -1,480 +0,0 @@
 
				-# dag_manual_trigger_chain_optimized.py
			
 
				-from airflow import DAG
			
 
				-from airflow.operators.python import PythonOperator
			
 
				-from airflow.operators.empty import EmptyOperator
			
 
				-from airflow.models.param import Param
			
 
				-from datetime import datetime, timedelta
			
 
				-import logging
			
 
				-import os
			
 
				-from pathlib import Path
			
 
				-import networkx as nx
			
 
				-from neo4j import GraphDatabase
			
 
				-from config import NEO4J_CONFIG, SCRIPTS_BASE_PATH
			
 
				-
			
 
				-# 导入工具函数
			
 
				-from utils import (
			
 
				-    get_pg_conn, is_data_model_table, is_data_resource_table, 
			
 
				-    get_script_name_from_neo4j, execute_script,
			
 
				-    get_model_dependency_graph, generate_optimized_execution_order,
			
 
				-    build_model_dependency_dag, create_task_dict, build_task_dependencies,
			
 
				-    connect_start_and_end_tasks
			
 
				-)
			
 
				-
			
 
				-# 设置logger
			
 
				-logger = logging.getLogger(__name__)
			
 
				-
			
 
				-# DAG参数
			
 
				-default_args = {
			
 
				-    'owner': 'airflow',
			
 
				-    'depends_on_past': False,
			
 
				-    'start_date': datetime(2024, 1, 1),
			
 
				-    'email_on_failure': False,
			
 
				-    'email_on_retry': False,
			
 
				-    'retries': 1,
			
 
				-    'retry_delay': timedelta(minutes=5),
			
 
				-}
			
 
				-
			
 
				-def get_execution_mode(table_name):
			
 
				-    """
			
 
				-    从PostgreSQL获取表的执行模式
			
 
				-    
			
 
				-    参数:
			
 
				-        table_name (str): 表名
			
 
				-    注意：
			
 
				-        "AND is_enabled = TRUE" 这个条件在这里不适用，因为这是强制执行的。
			
 
				-        即使订阅表中没有这个表名，也会强制执行。
			
 
				-    返回:
			
 
				-        str: 执行模式，如果未找到则返回"append"作为默认值
			
 
				-    """
			
 
				-    try:
			
 
				-        conn = get_pg_conn()
			
 
				-        cursor = conn.cursor()
			
 
				-        cursor.execute("""
			
 
				-            SELECT execution_mode 
			
 
				-            FROM table_schedule 
			
 
				-            WHERE table_name = %s
			
 
				-        """, (table_name,))
			
 
				-        result = cursor.fetchone()
			
 
				-        cursor.close()
			
 
				-        conn.close()
			
 
				-        
			
 
				-        if result:
			
 
				-            return result[0]
			
 
				-        else:
			
 
				-            logger.warning(f"未找到表 {table_name} 的执行模式，使用默认值 'append'")
			
 
				-            return "append"
			
 
				-    except Exception as e:
			
 
				-        logger.error(f"获取表 {table_name} 的执行模式时出错: {str(e)}")
			
 
				-        return "append"
			
 
				-
			
 
				-def get_upstream_models(table_name):
			
 
				-    """获取表的上游DataModel依赖"""
			
 
				-    driver = GraphDatabase.driver(
			
 
				-        NEO4J_CONFIG['uri'], 
			
 
				-        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				-    )
			
 
				-    query = """
			
 
				-        MATCH (target:DataModel {en_name: $table_name})-[:DERIVED_FROM]->(up:DataModel)
			
 
				-        RETURN up.en_name AS upstream
			
 
				-    """
			
 
				-    try:
			
 
				-        with driver.session() as session:
			
 
				-            result = session.run(query, table_name=table_name)
			
 
				-            upstream_list = [record["upstream"] for record in result]
			
 
				-            logger.info(f"表 {table_name} 的上游DataModel依赖: {upstream_list}")
			
 
				-            return upstream_list
			
 
				-    finally:
			
 
				-        driver.close()
			
 
				-
			
 
				-def get_upstream_resources(table_name):
			
 
				-    """获取表的上游DataResource依赖"""
			
 
				-    driver = GraphDatabase.driver(
			
 
				-        NEO4J_CONFIG['uri'], 
			
 
				-        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				-    )
			
 
				-    query = """
			
 
				-        MATCH (target:DataModel {en_name: $table_name})-[:DERIVED_FROM]->(up:DataResource)
			
 
				-        RETURN up.en_name AS upstream
			
 
				-    """
			
 
				-    try:
			
 
				-        with driver.session() as session:
			
 
				-            result = session.run(query, table_name=table_name)
			
 
				-            upstream_list = [record["upstream"] for record in result]
			
 
				-            logger.info(f"表 {table_name} 的上游DataResource依赖: {upstream_list}")
			
 
				-            return upstream_list
			
 
				-    finally:
			
 
				-        driver.close()
			
 
				-
			
 
				-def get_data_sources(resource_table_name):
			
 
				-    """获取DataResource表的上游DataSource"""
			
 
				-    driver = GraphDatabase.driver(
			
 
				-        NEO4J_CONFIG['uri'], 
			
 
				-        auth=(NEO4J_CONFIG['user'], NEO4J_CONFIG['password'])
			
 
				-    )
			
 
				-    query = """
			
 
				-        MATCH (dr:DataResource {en_name: $table_name})-[:ORIGINATES_FROM]->(ds:DataSource)
			
 
				-        RETURN ds.en_name AS source_name
			
 
				-    """
			
 
				-    try:
			
 
				-        with driver.session() as session:
			
 
				-            result = session.run(query, table_name=resource_table_name)
			
 
				-            return [record["source_name"] for record in result]
			
 
				-    finally:
			
 
				-        driver.close()
			
 
				-
			
 
				-def build_dependency_chain_with_networkx(start_table, dependency_level='resource'):
			
 
				-    """
			
 
				-    使用networkx构建依赖链
			
 
				-    
			
 
				-    参数:
			
 
				-        start_table (str): 起始表名
			
 
				-        dependency_level (str): 依赖级别，可选值：
			
 
				-            'self' - 只包含起始表自身
			
 
				-            'resource' - 包含到DataResource层级（默认）
			
 
				-            'source' - 包含到DataSource层级
			
 
				-        
			
 
				-    返回:
			
 
				-        dict: 依赖图 {表名: 表信息字典}
			
 
				-        networkx.DiGraph: 表示依赖关系的有向图
			
 
				-    """
			
 
				-    logger.info(f"使用networkx构建依赖链, 起始表: {start_table}, 依赖级别: {dependency_level}")
			
 
				-    
			
 
				-    # 创建有向图
			
 
				-    G = nx.DiGraph()
			
 
				-    
			
 
				-    # 添加起始节点
			
 
				-    G.add_node(start_table)
			
 
				-    
			
 
				-    # 记录表类型和脚本信息的字典
			
 
				-    table_info = {}
			
 
				-    
			
 
				-    # 只执行起始表自身
			
 
				-    if dependency_level == 'self':
			
 
				-        # 确定表类型并记录信息
			
 
				-        if is_data_model_table(start_table):
			
 
				-            script_name = get_script_name_from_neo4j(start_table)
			
 
				-            execution_mode = get_execution_mode(start_table)
			
 
				-            table_info[start_table] = {
			
 
				-                'table_name': start_table,
			
 
				-                'script_name': script_name,
			
 
				-                'table_type': 'DataModel',
			
 
				-                'execution_mode': execution_mode
			
 
				-            }
			
 
				-        elif is_data_resource_table(start_table):
			
 
				-            script_name = get_script_name_from_neo4j(start_table)
			
 
				-            execution_mode = get_execution_mode(start_table)
			
 
				-            table_info[start_table] = {
			
 
				-                'table_name': start_table,
			
 
				-                'script_name': script_name,
			
 
				-                'table_type': 'DataResource',
			
 
				-                'execution_mode': execution_mode
			
 
				-            }
			
 
				-        
			
 
				-        logger.info(f"依赖级别为'self'，只处理起始表: {start_table}")
			
 
				-        return table_info, G
			
 
				-    
			
 
				-    # 处理完整依赖链
			
 
				-    # 用于检测循环的已访问集合
			
 
				-    visited = set()
			
 
				-    
			
 
				-    def add_dependencies(table, level):
			
 
				-        """递归添加依赖到图中"""
			
 
				-        if table in visited:
			
 
				-            return
			
 
				-        
			
 
				-        visited.add(table)
			
 
				-        
			
 
				-        # 确定表类型并记录信息
			
 
				-        if is_data_model_table(table):
			
 
				-            script_name = get_script_name_from_neo4j(table)
			
 
				-            execution_mode = get_execution_mode(start_table)
			
 
				-            table_info[table] = {
			
 
				-                'table_name': table,
			
 
				-                'script_name': script_name,
			
 
				-                'table_type': 'DataModel',
			
 
				-                'execution_mode': execution_mode
			
 
				-            }
			
 
				-            
			
 
				-            # 添加DataModel上游依赖
			
 
				-            upstream_models = get_upstream_models(table)
			
 
				-            for upstream in upstream_models:
			
 
				-                G.add_node(upstream)
			
 
				-                G.add_edge(upstream, table)  # 上游指向下游，执行时上游先执行
			
 
				-                add_dependencies(upstream, level)
			
 
				-            
			
 
				-            # 添加DataResource上游依赖
			
 
				-            upstream_resources = get_upstream_resources(table)
			
 
				-            for upstream in upstream_resources:
			
 
				-                G.add_node(upstream)
			
 
				-                G.add_edge(upstream, table)
			
 
				-                add_dependencies(upstream, level)
			
 
				-                
			
 
				-        elif is_data_resource_table(table):
			
 
				-            script_name = get_script_name_from_neo4j(table)
			
 
				-            execution_mode = get_execution_mode(start_table)
			
 
				-            table_info[table] = {
			
 
				-                'table_name': table,
			
 
				-                'script_name': script_name,
			
 
				-                'table_type': 'DataResource',
			
 
				-                'execution_mode': execution_mode
			
 
				-            }
			
 
				-            
			
 
				-            # 如果依赖级别为source，则继续查找DataSource
			
 
				-            if level == 'source':
			
 
				-                data_sources = get_data_sources(table)
			
 
				-                for source in data_sources:
			
 
				-                    G.add_node(source)
			
 
				-                    G.add_edge(source, table)
			
 
				-                    table_info[source] = {
			
 
				-                        'table_name': source,
			
 
				-                        'script_name': None,
			
 
				-                        'table_type': 'DataSource',
			
 
				-                        'execution_mode': None
			
 
				-                    }
			
 
				-    
			
 
				-    # 开始递归构建依赖图
			
 
				-    add_dependencies(start_table, dependency_level)
			
 
				-    
			
 
				-    # 检测和处理循环依赖
			
 
				-    cycles = list(nx.simple_cycles(G))
			
 
				-    if cycles:
			
 
				-        logger.warning(f"检测到循环依赖: {cycles}")
			
 
				-        for cycle in cycles:
			
 
				-            # 移除循环中的最后一条边来打破循环
			
 
				-            G.remove_edge(cycle[-1], cycle[0])
			
 
				-            logger.info(f"打破循环依赖: 移除 {cycle[-1]} -> {cycle[0]} 的依赖")
			
 
				-    
			
 
				-    return table_info, G
			
 
				-
			
 
				-def process_table_chain_manual(target_table, dependency_level, **context):
			
 
				-    """
			
 
				-    处理指定表及其依赖链
			
 
				-    
			
 
				-    参数:
			
 
				-        target_table: 目标表名
			
 
				-        dependency_level: 依赖级别
			
 
				-    """
			
 
				-    logger.info(f"开始处理表 {target_table} 的依赖链，依赖级别: {dependency_level}")
			
 
				-    
			
 
				-    # 构建依赖链
			
 
				-    table_info, dependency_graph = build_dependency_chain_with_networkx(target_table, dependency_level)
			
 
				-    
			
 
				-    if not table_info:
			
 
				-        logger.warning(f"没有找到表 {target_table} 的依赖信息")
			
 
				-        return
			
 
				-    
			
 
				-    # 使用networkx生成拓扑排序
			
 
				-    try:
			
 
				-        execution_order = list(nx.topological_sort(dependency_graph))
			
 
				-        logger.info(f"生成拓扑排序结果: {execution_order}")
			
 
				-    except nx.NetworkXUnfeasible:
			
 
				-        logger.error("无法生成拓扑排序，图可能仍然包含循环")
			
 
				-        execution_order = [target_table]  # 至少包含目标表
			
 
				-    
			
 
				-    # 过滤掉DataSource类型的表
			
 
				-    model_tables = []
			
 
				-    for table_name in execution_order:
			
 
				-        if table_name in table_info and table_info[table_name]['table_type'] != 'DataSource':
			
 
				-            model_tables.append({
			
 
				-                'table_name': table_name,
			
 
				-                'script_name': table_info[table_name]['script_name'],
			
 
				-                'execution_mode': table_info[table_name]['execution_mode'],
			
 
				-                'table_type': table_info[table_name]['table_type']
			
 
				-            })
			
 
				-    
			
 
				-    # 按顺序处理表
			
 
				-    processed_count = 0
			
 
				-    failed_tables = []
			
 
				-    
			
 
				-    for table_info in model_tables:
			
 
				-        table_name = table_info['table_name']
			
 
				-        script_name = table_info['script_name']
			
 
				-        execution_mode = table_info['execution_mode']
			
 
				-        
			
 
				-        logger.info(f"处理表: {table_name} ({processed_count + 1}/{len(model_tables)})")
			
 
				-        
			
 
				-        result = execute_script(script_name, table_name, execution_mode)
			
 
				-        
			
 
				-        if result:
			
 
				-            processed_count += 1
			
 
				-            logger.info(f"表 {table_name} 处理成功")
			
 
				-        else:
			
 
				-            failed_tables.append(table_name)
			
 
				-            logger.error(f"表 {table_name} 处理失败")
			
 
				-            # 是否要中断处理？取决于您的要求
			
 
				-            # break
			
 
				-    
			
 
				-    # 处理结果
			
 
				-    logger.info(f"依赖链处理完成: 成功 {processed_count} 个表, 失败 {len(failed_tables)} 个表")
			
 
				-    
			
 
				-    if failed_tables:
			
 
				-        logger.warning(f"失败的表: {', '.join(failed_tables)}")
			
 
				-        return False
			
 
				-        
			
 
				-    return True
			
 
				-
			
 
				-def run_model_script(table_name, execution_mode):
			
 
				-    """
			
 
				-    运行模型脚本的封装函数，用于Airflow任务
			
 
				-    
			
 
				-    参数:
			
 
				-        table_name: 表名
			
 
				-        execution_mode: 执行模式
			
 
				-    """
			
 
				-    script_name = get_script_name_from_neo4j(table_name)
			
 
				-    return execute_script(script_name, table_name, execution_mode)
			
 
				-
			
 
				-# 创建DAG
			
 
				-with DAG(
			
 
				-    'dag_manual_trigger_chain_optimized',
			
 
				-    default_args=default_args,
			
 
				-    description='手动触发指定表的依赖链执行（串行任务链）',
			
 
				-    schedule_interval=None,  # 设置为None表示只能手动触发
			
 
				-    catchup=False,
			
 
				-    is_paused_upon_creation=False,  # DAG创建时不处于暂停状态
			
 
				-    params={
			
 
				-        'TABLE_NAME': Param('', type='string', description='目标表名称'),
			
 
				-        'DEPENDENCY_LEVEL': Param('resource', type='string', enum=['self', 'resource', 'source'], description='依赖级别: self-仅本表, resource-到Resource层, source-到Source层')
			
 
				-    },
			
 
				-) as dag:
			
 
				-    
			
 
				-    # 起始任务
			
 
				-    start_task = EmptyOperator(
			
 
				-        task_id='start',
			
 
				-        dag=dag,
			
 
				-    )
			
 
				-    
			
 
				-    # 结束任务
			
 
				-    end_task = EmptyOperator(
			
 
				-        task_id='end',
			
 
				-        dag=dag,
			
 
				-    )
			
 
				-    
			
 
				-    # 分析依赖的任务
			
 
				-    def analyze_dependencies(**context):
			
 
				-        """分析依赖链，准备表信息和执行顺序"""
			
 
				-        # 获取参数
			
 
				-        params = context['params']
			
 
				-        target_table = params.get('TABLE_NAME')
			
 
				-        dependency_level = params.get('DEPENDENCY_LEVEL', 'resource')
			
 
				-        
			
 
				-        if not target_table:
			
 
				-            raise ValueError("必须提供TABLE_NAME参数")
			
 
				-            
			
 
				-        # 验证依赖级别参数
			
 
				-        valid_levels = ['self', 'resource', 'source']
			
 
				-        if dependency_level not in valid_levels:
			
 
				-            logger.warning(f"无效的依赖级别: {dependency_level}，使用默认值 'resource'")
			
 
				-            dependency_level = 'resource'
			
 
				-        
			
 
				-        logger.info(f"开始分析表 {target_table} 的依赖链, 依赖级别: {dependency_level}")
			
 
				-        
			
 
				-        # 构建依赖链
			
 
				-        table_info, dependency_graph = build_dependency_chain_with_networkx(target_table, dependency_level)
			
 
				-        
			
 
				-        if not table_info:
			
 
				-            logger.warning(f"没有找到表 {target_table} 的依赖信息")
			
 
				-            return []
			
 
				-        
			
 
				-        # 使用networkx生成拓扑排序
			
 
				-        try:
			
 
				-            execution_order = list(nx.topological_sort(dependency_graph))
			
 
				-            logger.info(f"生成拓扑排序结果: {execution_order}")
			
 
				-        except nx.NetworkXUnfeasible:
			
 
				-            logger.error("无法生成拓扑排序，图可能仍然包含循环")
			
 
				-            execution_order = [target_table]  # 至少包含目标表
			
 
				-        
			
 
				-        # 准备表信息
			
 
				-        model_tables = []
			
 
				-        for table_name in execution_order:
			
 
				-            if table_name in table_info and table_info[table_name]['table_type'] != 'DataSource':
			
 
				-                model_tables.append({
			
 
				-                    'table_name': table_name,
			
 
				-                    'script_name': table_info[table_name]['script_name'],
			
 
				-                    'execution_mode': table_info[table_name]['execution_mode']
			
 
				-                })
			
 
				-        
			
 
				-        # 将结果保存到XCom
			
 
				-        ti = context['ti']
			
 
				-        ti.xcom_push(key='model_tables', value=model_tables)
			
 
				-        ti.xcom_push(key='dependency_graph', value={k: list(v) for k, v in dependency_graph.items()})
			
 
				-        
			
 
				-        return model_tables
			
 
				-    
			
 
				-    # 创建分析任务  
			
 
				-    analyze_task = PythonOperator(
			
 
				-        task_id='analyze_dependencies',
			
 
				-        python_callable=analyze_dependencies,
			
 
				-        provide_context=True,
			
 
				-        dag=dag,
			
 
				-    )
			
 
				-    
			
 
				-    # 创建构建任务链的任务
			
 
				-    def create_dynamic_task_chain(**context):
			
 
				-        """创建动态任务链"""
			
 
				-        ti = context['ti']
			
 
				-        model_tables = ti.xcom_pull(task_ids='analyze_dependencies', key='model_tables')
			
 
				-        dependency_data = ti.xcom_pull(task_ids='analyze_dependencies', key='dependency_graph')
			
 
				-        
			
 
				-        if not model_tables:
			
 
				-            logger.warning("没有找到需要处理的表")
			
 
				-            return 'end'
			
 
				-            
			
 
				-        # 重建依赖图为networkx格式
			
 
				-        dependency_graph = nx.DiGraph()
			
 
				-        for target, upstreams in dependency_data.items():
			
 
				-            for upstream in upstreams:
			
 
				-                dependency_graph.add_edge(upstream, target)
			
 
				-        
			
 
				-        # 提取表名列表
			
 
				-        table_names = [t['table_name'] for t in model_tables]
			
 
				-        
			
 
				-        # 创建任务字典
			
 
				-        task_dict = {}
			
 
				-        for table_info in model_tables:
			
 
				-            table_name = table_info['table_name']
			
 
				-            task_id = f"process_{table_name}"
			
 
				-            
			
 
				-            # 创建处理任务
			
 
				-            task = PythonOperator(
			
 
				-                task_id=task_id,
			
 
				-                python_callable=run_model_script,
			
 
				-                op_kwargs={
			
 
				-                    'table_name': table_name,
			
 
				-                    'execution_mode': table_info['execution_mode']
			
 
				-                },
			
 
				-                dag=dag,
			
 
				-            )
			
 
				-            
			
 
				-            task_dict[table_name] = task
			
 
				-        
			
 
				-        # 设置任务间依赖关系
			
 
				-        for i, table_name in enumerate(table_names):
			
 
				-            if i > 0:
			
 
				-                prev_table = table_names[i-1]
			
 
				-                task_dict[prev_table] >> task_dict[table_name]
			
 
				-                logger.info(f"设置任务依赖: {prev_table} >> {table_name}")
			
 
				-        
			
 
				-        # 连接第一个和最后一个任务
			
 
				-        if table_names:
			
 
				-            first_task = task_dict[table_names[0]]
			
 
				-            last_task = task_dict[table_names[-1]]
			
 
				-            
			
 
				-            analyze_task >> first_task
			
 
				-            last_task >> end_task
			
 
				-        else:
			
 
				-            # 如果没有表需要处理，直接连接到结束任务
			
 
				-            analyze_task >> end_task
			
 
				-        
			
 
				-        return 'end'
			
 
				-    
			
 
				-    # 创建构建任务链的任务
			
 
				-    build_task = PythonOperator(
			
 
				-        task_id='build_task_chain',
			
 
				-        python_callable=create_dynamic_task_chain,
			
 
				-        provide_context=True,
			
 
				-        dag=dag,
			
 
				-    )
			
 
				-    
			
 
				-    # 设置任务链
			
 
				-    start_task >> analyze_task >> build_task