mxl_citu
/
DataOps-platform


			
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696697698699700701702703704705706707708709710711712713714715716717718719720721722723724725726727728729730731732733734735736737738739740741742743744745746747748749750751752753754755756757758759760761762763764765766767768769770771772773774775776777778779780781782783784785786787788789790791792793794795796797798799800801802803804805806807808809810811812813814815816817818819820821822823824825826827828829830831832833834835836837838839840841842843844845846847848849850851852853854855856857858859860861862863864865866867868869870871872873874875876877878879880881882883884885886887888889890891892893894895896897898899900901902903904905906907908909910911912913
							from io import BytesIO
import pandas as pd
from flask import request, jsonify, current_app
from app.api.data_resource import bp
from app.models.result import success, failed
import logging
import json
import re
from minio import Minio
from app.services.neo4j_driver import neo4j_driver
from app.core.data_resource.resource import (
    resource_list,
    handle_node,
    resource_kinship_graph,
    resource_impact_all_graph,
    model_resource_list,
    select_create_ddl,
    data_resource_edit,
    handle_id_resource,
    id_data_search_list,
    table_sql,
    select_sql
)
from app.core.meta_data import (
    translate_and_parse,
    infer_column_type,
    get_formatted_time
)
import traceback
from app.core.system.auth import require_auth
from app.core.llm.ddl_parser import DDLParser

logger = logging.getLogger("app")


def get_minio_client():
    """获取 MinIO 客户端实例"""
    return Minio(
        current_app.config['MINIO_HOST'],
        access_key=current_app.config['MINIO_USER'],
        secret_key=current_app.config['MINIO_PASSWORD'],
        secure=current_app.config['MINIO_SECURE']
    )


def get_minio_config():
    """获取 MinIO 配置"""
    return {
        'bucket_name': current_app.config['BUCKET_NAME'],
        'prefix': current_app.config['PREFIX'],
        'allowed_extensions': current_app.config['ALLOWED_EXTENSIONS']
    }


def is_english(text):
    """检查文本是否为英文"""
    pattern = r'^[a-zA-Z0-9_\s.,;:!?()\'"-]+$'
    return text.isascii() and bool(re.match(pattern, text))


@bp.route('/translate', methods=['POST'])
def data_resource_translate():
    # 获取表单数据
    data_resource = request.form.get('data_resource')
    meta_data = request.form.get('meta_data')
    file = request.files.get('file')

    if not data_resource or not file:
        return jsonify(failed("缺少必要参数：data_resource 或文件"))

    # 处理meta_data可能为None的情况
    if meta_data:
        try:
            # 修复JSON解析问题，处理可能包含特殊引号的情况
            # 替换可能存在的特殊引号字符
            meta_data = meta_data.replace('â', '"')
            meta_data = meta_data.replace('"', '"').replace('"', '"')
            meta_data_list = json.loads(meta_data)
        except json.JSONDecodeError as e:
            logger.error(
                f"解析meta_data失败: {meta_data}, 错误: {str(e)}"
            )
            # 尝试进行基本的字符串解析，以处理简单的数组格式
            if meta_data.startswith('[') and meta_data.endswith(']'):
                try:
                    # 使用ast.literal_eval作为备用解析方法
                    import ast
                    meta_data_list = ast.literal_eval(meta_data)
                except Exception:
                    # 如果仍然失败，使用简单的字符串分割
                    meta_data = meta_data.strip('[]')
                    meta_data_list = [
                        item.strip('"\'') for item in meta_data.split(',')
                    ]
            else:
                meta_data_list = []
    else:
        logger.warning("meta_data为空，将使用空列表")
        meta_data_list = []

    # 构建翻译后的内容组合
    translated_meta_data_list = []
    for meta_item in meta_data_list:
        if is_english(meta_item):  # 检查是否为英文
            translated_meta_data_list.append(meta_item)  # 如果是英文，则直接添加
        else:
            # 否则翻译后添加
            translated_meta_data_list.append(translate_and_parse(meta_item)[0])

    # 对 data_resource 进行翻译
    translated_data_resource = translate_and_parse(data_resource)
    if translated_data_resource and len(translated_data_resource) > 0:
        translated_data_resource = translated_data_resource[0]
    else:
        translated_data_resource = data_resource  # 翻译失败时使用原值

    try:
        # 构建最终的翻译结果
        resource = {
            "name_zh": data_resource,
            "name_en": translated_data_resource
        }
        parsed_data = []

        # 读取文件内容
        file_content = file.read()
        # 重置文件指针
        file.seek(0)

        try:
            df = pd.read_excel(BytesIO(file_content))
        except Exception as e:
            return jsonify(failed(f"文件格式错误: {str(e)}"))
            
        # 获取列名和对应的数据类型
        # 如果meta_data为空，使用DataFrame的列名
        if not meta_data_list and not df.empty:
            meta_data_list = df.columns.tolist()
            translated_meta_data_list = []
            for col in meta_data_list:
                if is_english(col):
                    translated_meta_data_list.append(col)
                else:
                    translated = translate_and_parse(col)[0]
                    translated_meta_data_list.append(translated)
                    
        columns_and_types = infer_column_type(df)
        for i in range(len(meta_data_list)):
            zh = meta_data_list[i]
            en = translated_meta_data_list[i]
            if i < len(columns_and_types):
                data_type = columns_and_types[i]
            else:
                data_type = "varchar(255)"
            parsed_item = {
                "name_zh": zh, "name_en": en, "data_type": data_type
            }
            parsed_data.append(parsed_item)

        response_data = {
            "head_data": parsed_data,
            "data_resource": resource
        }
        return jsonify(success(response_data, "success"))

    except Exception as e:
        logger.error(f"翻译处理失败: {str(e)}", exc_info=True)
        return jsonify(failed(str(e)))

  
@bp.route('/save', methods=['POST'])
def data_resource_save():
    """保存数据资源"""   
    try:
        # 获取表单数据
        receiver = request.get_json()
        if not receiver:
            return jsonify(failed("参数不完整：缺少receiver"))
        
        # 检查url（允许为空）
        if 'url' not in receiver or not receiver['url']:
            logger.debug("url 为空")

        additional_info = receiver.get('additional_info')
        if not additional_info:
            return jsonify(failed("参数不完整: 缺少additional_info"))
                      
        head_data = additional_info.get('head_data')
        
        # 获取 storage_location 和 data_source
        storage_location = receiver.get('storage_location', '').strip()
        
        # 向后兼容：data_source 可能在 receiver 顶层（新客户端）或 additional_info 内（旧客户端）
        # 使用显式 None 检查以支持 0 作为有效的节点ID
        data_source = receiver.get('data_source')
        if data_source is None:
            data_source = additional_info.get('data_source', '')
        
        # 验证：至少需要 storage_location 或 data_source 之一
        # 使用显式检查以支持 data_source=0（有效的节点ID）
        if not storage_location and data_source in (None, ''):
            return jsonify(failed(
                "参数不完整：至少需要提供 storage_location 或 data_source"
            ))
        
        # 获取资源类型（直接从前端上传的type字段获取）
        resource_type = receiver.get('type')
        if not resource_type:
            return jsonify(failed("参数不完整：缺少type字段"))
        
        # 调用业务逻辑创建数据资源
        # 只在 data_source 为 None 或空字符串时传 None，保留 0 作为有效值
        ds_value = data_source if data_source not in (None, '') else None
        resource_id = handle_node(
            receiver, head_data,
            data_source=ds_value,
            resource_type=resource_type
        )
    
        return jsonify(success({"id": resource_id}))
    except Exception as e:
        logger.error(f"保存数据资源失败: {str(e)}")
        error_traceback = traceback.format_exc()
        logger.error(f"错误详情: {error_traceback}")
        return jsonify(failed(str(e)))


@bp.route('/delete', methods=['POST'])
def data_resource_delete():
    """删除数据资源"""
    try:
        # 获取资源ID
        if not request.json:
            return jsonify(failed("请求数据不能为空"))
        
        resource_id = request.json.get('id')
        if resource_id is None:
            return jsonify(failed("资源ID不能为空"))
        
        with neo4j_driver.get_session() as session:
            # 删除数据资源节点及其关系
            cypher = """
            MATCH (n:DataResource)
            WHERE id(n) = $resource_id
            DETACH DELETE n
            """
            
            session.run(cypher, resource_id=int(resource_id))
            
            return jsonify(success({"message": "数据资源删除成功"}))
    except Exception as e:
        logger.error(f"删除数据资源失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/update', methods=['POST'])
def data_resource_update():
    """更新数据资源"""
    try:
        # 获取更新数据
        data = request.json
        
        if not data or "id" not in data:
            return jsonify(failed("参数不完整"))
        
        # 调用业务逻辑更新数据资源
        updated_data = data_resource_edit(data)
        
        return jsonify(success(updated_data))
    except Exception as e:
        logger.error(f"更新数据资源失败: {str(e)}")
        return jsonify(failed(str(e)))


# 解析ddl，使用正则表达式匹配，但没有进行翻译，也没有对注释进行识别
# 使用ddl创建数据资源时，调用该API
@bp.route('/ddl', methods=['POST'])
def id_data_ddl():
    """解析数据资源的DDL"""
    try:
        # 获取SQL内容
        if not request.json:
            return jsonify(failed("请求数据不能为空"))
        
        sql_content = request.json.get('sql', '')
        if not sql_content:
            return jsonify(failed("SQL内容不能为空"))
        
        # 记录原始SQL用于调试
        logger.debug(f"原始SQL: {sql_content}")
        
        # 提取创建表的DDL语句
        create_ddl_list = select_create_ddl(sql_content)
        
        if not create_ddl_list:
            return jsonify(failed("未找到有效的CREATE TABLE语句"))
        
        # 解析每个表定义
        tables_dict = {}  # 最终返回的表字典
        
        for ddl in create_ddl_list:
            table_info = table_sql(ddl)
            if table_info:
                # table_info格式:
                # {"table_name": {"exist": bool, "meta": [...], ...}}
                # 合并到结果字典中
                tables_dict.update(table_info)
        
        if not tables_dict:
            return jsonify(failed("解析表结构失败"))
        
        # 记录结果
        logger.debug(f"解析结果: {json.dumps(tables_dict, ensure_ascii=False)}")
        
        # 直接返回解析结果
        return jsonify(success(tables_dict))
        
    except Exception as e:
        logger.error(f"解析DDL失败: {str(e)}")
        logger.error(traceback.format_exc())  # 添加详细错误堆栈
        return jsonify(failed(str(e)))


@bp.route('/list', methods=['POST'])
def data_resource_list():
    """获取数据资源列表"""
    try:
        # 获取分页和筛选参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        page = int(request.json.get('current', 1))
        page_size = int(request.json.get('size', 10))
        name_en_filter = request.json.get('name_en')
        name_zh_filter = request.json.get('name_zh')
        type_filter = request.json.get('type', 'all')
        category_filter = request.json.get('category')
        tag_filter = request.json.get('tag')
        
        # 调用业务逻辑查询数据资源列表
        resources, total_count = resource_list(
            page, 
            page_size, 
            name_en_filter, 
            name_zh_filter, 
            type_filter, 
            category_filter, 
            tag_filter
        )
        
        # 返回结果
        return jsonify(success({
            "records": resources,
            "total": total_count,
            "size": page_size,
            "current": page
        }))
    except Exception as e:
        logger.error(f"获取数据资源列表失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/search', methods=['POST'])
def id_data_search():
    """数据资源关联元数据搜索"""
    try:
        # 获取分页和筛选参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        page = int(request.json.get('current', 1))
        page_size = int(request.json.get('size', 10))
        resource_id = request.json.get('id')
        
        name_en_filter = request.json.get('name_en')
        name_zh_filter = request.json.get('name_zh')
        category_filter = request.json.get('category')
        tag_filter = request.json.get('tag')
        
        if resource_id is None:
            return jsonify(failed("资源ID不能为空"))
            
        # 确保传入的ID为整数
        try:
            resource_id = int(resource_id)
        except (ValueError, TypeError):
            return jsonify(failed(f"资源ID必须为整数, 收到的是: {resource_id}"))
            
        # 记录请求信息
        logger.info(f"获取资源关联元数据请求，ID: {resource_id}")
            
        # 调用业务逻辑查询关联元数据
        metadata_list, total_count = id_data_search_list(
            resource_id, 
            page, 
            page_size, 
            name_en_filter, 
            name_zh_filter, 
            category_filter, 
            tag_filter
        )
        
        # 返回结果
        return jsonify(success({
            "records": metadata_list,
            "total": total_count,
            "size": page_size,
            "current": page
        }))
    except Exception as e:
        logger.error(f"数据资源关联元数据搜索失败: {str(e)}")
        return jsonify(failed(str(e)))


def dynamic_type_conversion(value, target_type):
    """动态类型转换"""
    if value is None:
        return None
        
    if target_type in ("int", "INT"):
        return int(value)
    elif target_type in ("float", "FLOAT", "double", "DOUBLE"):
        return float(value)
    elif target_type in ("bool", "BOOL", "boolean", "BOOLEAN"):
        if isinstance(value, str):
            return value.lower() in ('true', 'yes', '1', 't', 'y')
        return bool(value)
    else:
        return str(value)


@bp.route('/graph/all', methods=['POST'])
def data_resource_graph_all():
    """获取数据资源完整图谱"""
    try:
        # 获取参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        resource_id = request.json.get('id')
        meta = request.json.get('meta', True)
        
        if resource_id is None:
            return jsonify(failed("资源ID不能为空"))
            
        # 确保传入的ID为整数
        try:
            resource_id = int(resource_id)
        except (ValueError, TypeError):
            return jsonify(failed(f"资源ID必须为整数, 收到的是: {resource_id}"))
            
        # 调用业务逻辑获取完整图谱
        graph_data = resource_impact_all_graph(resource_id, meta)
        
        return jsonify(success(graph_data))
    except Exception as e:
        logger.error(f"获取数据资源完整图谱失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/graph', methods=['POST'])
def data_resource_list_graph():
    """获取数据资源亲缘关系图谱"""
    try:
        # 获取参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        resource_id = request.json.get('id')
        meta = request.json.get('meta', True)
        
        if resource_id is None:
            return jsonify(failed("资源ID不能为空"))
            
        # 确保传入的ID为整数
        try:
            resource_id = int(resource_id)
        except (ValueError, TypeError):
            return jsonify(failed(f"资源ID必须为整数, 收到的是: {resource_id}"))
            
        # 记录请求信息
        logger.info(f"获取图谱请求，ID: {resource_id}")
            
        # 调用业务逻辑获取图谱
        graph_data = resource_kinship_graph(resource_id, meta)
        
        return jsonify(success(graph_data))
    except Exception as e:
        logger.error(f"获取数据资源亲缘关系图谱失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/save/metadata', methods=['POST'])
def id_data_save():
    """保存数据资源关联的元数据"""
    try:
        # 获取参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        resource_id = request.json.get('id')
        metadata_list = request.json.get('data', [])
        
        if resource_id is None:
            return jsonify(failed("资源ID不能为空"))
            
        if not metadata_list:
            return jsonify(failed("元数据列表不能为空"))
            
        # 处理元数据保存
        with neo4j_driver.get_session() as session:
            # 获取数据资源名称
            resource_query = """
            MATCH (n:DataResource) 
            WHERE id(n) = $resource_id
            RETURN n.name as resource_name
            """
            resource_result = session.run(
                resource_query, resource_id=int(resource_id)
            )
            resource_record = resource_result.single()
            
            if not resource_record:
                return jsonify(failed(f"未找到ID为{resource_id}的数据资源"))
                
            resource_name = resource_record["resource_name"]
            
            # 先删除现有关系
            cypher_delete = """
            MATCH (n:DataResource)-[r:INCLUDES]->()
            WHERE id(n) = $resource_id
            DELETE r
            """
            session.run(cypher_delete, resource_id=int(resource_id))
            
            # 添加新关系
            for meta in metadata_list:
                # 创建元数据节点
                meta_cypher = """
                MERGE (m:DataMeta {name_zh: $name_zh})
                ON CREATE SET m.name_en = $name_en, 
                            m.create_time = $create_time,
                            m.data_type = $type
                ON MATCH SET m.data_type = $type
                RETURN m
                """
                
                create_time = get_formatted_time()
                meta_result = session.run(
                    meta_cypher,
                    name_zh=meta["name_zh"],
                    name_en=meta["name_en"],
                    create_time=create_time,
                    type=meta["data_type"]
                )
                meta_record = meta_result.single()
                if not meta_record:
                    logger.error(f"创建元数据节点失败: {meta['name_zh']}")
                    continue
                meta_node = meta_record["m"]
                meta_id = meta_node.id
                
                # 打印节点ID信息，便于调试
                logger.info(f"元数据节点ID: {meta_id}, 类型: {type(meta_id)}")
                logger.info(
                    f"数据资源节点ID: {resource_id}, 类型: {type(resource_id)}"
                )
                
                # 使用明确的属性名匹配而不是ID
                rel_cypher = """
                MATCH (a:DataResource {name: $r_name}),
                      (m:DataMeta {name: $m_name})
                MERGE (a)-[r:INCLUDES]->(m)
                RETURN r
                """
                
                rel_result = session.run(
                    rel_cypher,
                    r_name=resource_name,
                    m_name=meta["name"]
                )
                
                # 检查关系是否创建成功
                if rel_result.single():
                    logger.info(f"成功创建关系: {resource_name} -> {meta['name']}")
                else:
                    logger.warning("关系创建结果为空")

                # 额外验证关系是否创建
                verify_cypher = """
                MATCH (a:DataResource {name: $r_name})
                      -[r:INCLUDES]->(m:DataMeta {name: $m_name})
                RETURN count(r) as rel_count
                """
                
                verify_result = session.run(
                    verify_cypher,
                    r_name=resource_name,
                    m_name=meta["name"]
                )
                
                verify_record = verify_result.single()
                count = verify_record["rel_count"] if verify_record else 0
                logger.info(f"验证关系数量: {count}")
                
        return jsonify(success({"message": "元数据保存成功"}))
    except Exception as e:
        logger.error(f"保存数据资源关联的元数据失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/sql/test', methods=['POST'])
def sql_test():
    """测试SQL查询"""
    try:
        # 获取参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        sql_query = request.json.get('sql', '')
        
        if not sql_query:
            return jsonify(failed("SQL查询不能为空"))
            
        # 解析SQL
        parsed_sql = select_sql(sql_query)
        
        if not parsed_sql:
            return jsonify(failed("解析SQL失败"))
            
        # 返回解析结果
        return jsonify(success(parsed_sql))
    except Exception as e:
        logger.error(f"测试SQL查询失败: {str(e)}")
        return jsonify(failed(str(e)))


# 使用LLM识别DDL语句，用来代替原来的正则的方式
# 用于在数据资源创建时，识别DDL语句 /api/resource/ddl/parse
@bp.route('/ddl/parse', methods=['POST'])
def ddl_identify():
    """识别DDL语句"""
    try:
        # 获取参数 - 支持两种方式：上传文件或JSON
        sql_content = ''
        
        # 检查是否有文件上传
        if 'file' in request.files:
            file = request.files['file']
            # 检查文件是否存在且文件名不为空
            if file and file.filename:
                # 检查是否是SQL文件
                if not file.filename.lower().endswith('.sql'):
                    return jsonify(failed("只接受SQL文件"))
                
                # 读取文件内容
                sql_content = file.read().decode('utf-8')
                logger.info(f"从上传的文件中读取SQL内容，文件名: {file.filename}")
        # 如果没有文件上传，检查是否有JSON输入
        elif request.is_json and request.json:
            sql_content = request.json.get('sql', '')
            
        # 如果两种方式都没有提供SQL内容，则返回错误
        if not sql_content:
            return jsonify(failed("SQL内容不能为空，请上传SQL文件或提供SQL内容"))
        
        parser = DDLParser()        
        # 提取创建表的DDL语句
        ddl_list = parser.parse_ddl(sql_content)
            
        if not ddl_list:
            return jsonify(failed("未找到有效的CREATE TABLE语句"))
        
        # 处理表的存在状态
        if isinstance(ddl_list, list):
            # 新格式：数组格式
            # 获取所有表名
            table_names = []
            for table_item in ddl_list:
                if isinstance(table_item, dict) and 'table_info' in table_item:
                    table_name = table_item['table_info'].get('name_en')
                    if table_name:
                        table_names.append(table_name)
            
            # 首先为所有表设置默认的exist状态
            for table_item in ddl_list:
                if isinstance(table_item, dict):
                    table_item["exist"] = False
            
            if table_names:
                try:
                    # 查询表是否存在
                    with neo4j_driver.get_session() as session:
                        table_query = """
                        UNWIND $names AS name
                        OPTIONAL MATCH (n:DataResource {name_en: name})
                        RETURN name, n IS NOT NULL AS ex
                        """
                        table_results = session.run(
                            table_query, names=table_names
                        )

                        # 创建存在状态映射
                        exist_map = {}
                        for record in table_results:
                            table_name = record["name"]
                            exists = record["ex"]
                            exist_map[table_name] = exists
                        
                        # 更新存在的表的状态
                        for table_item in ddl_list:
                            is_valid = (
                                isinstance(table_item, dict)
                                and 'table_info' in table_item
                            )
                            if is_valid:
                                tbl_info = table_item['table_info']
                                t_name = tbl_info.get('name_en')
                                if t_name and t_name in exist_map:
                                    table_item["exist"] = exist_map[t_name]
                except Exception as e:
                    logger.error(f"检查表存在状态失败: {str(e)}")
                    # 如果查询失败，所有表保持默认的False状态
        elif isinstance(ddl_list, dict):
            # 兼容旧格式：字典格式（以表名为key）
            # 获取所有表名
            table_names = list(ddl_list.keys())
            
            # 首先为所有表设置默认的exist状态
            for table_name in table_names:
                # 确保 ddl_list[table_name] 是字典类型
                if isinstance(ddl_list[table_name], dict):
                    ddl_list[table_name]["exist"] = False
                else:
                    logger.warning(
                        f"表 {table_name} 的值不是字典类型: "
                        f"{type(ddl_list[table_name])}"
                    )
            
            if table_names:
                try:
                    # 查询表是否存在
                    with neo4j_driver.get_session() as session:
                        table_query = """
                        UNWIND $names AS name
                        OPTIONAL MATCH (n:DataResource {name_en: name})
                        RETURN name, n IS NOT NULL AS ex
                        """
                        table_results = session.run(
                            table_query, names=table_names
                        )

                        # 更新存在的表的状态
                        for record in table_results:
                            table_name = record["name"]
                            exists = record["ex"]
                            # 确保表名存在且对应的值是字典类型
                            is_valid = (
                                table_name in ddl_list
                                and isinstance(ddl_list[table_name], dict)
                            )
                            if is_valid:
                                ddl_list[table_name]["exist"] = exists
                except Exception as e:
                    logger.error(f"检查表存在状态失败: {str(e)}")
                    # 如果查询失败，所有表保持默认的False状态
        
        logger.debug(f"识别到的DDL语句: {json.dumps(ddl_list, ensure_ascii=False)}")
            
        return jsonify(success(ddl_list))
    except Exception as e:
        logger.error(f"识别DDL语句失败: {str(e)}")
        logger.error(traceback.format_exc())  # 添加详细错误堆栈
        return jsonify(failed(str(e)))
        

# 废弃的识别DDL语句方法，该API 与 ddl API 功能类似，但功能简化了
@bp.route('/ddl/identify', methods=['POST'])
def sql_ddl_identify():
    """识别DDL语句"""
    try:
        # 获取参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        sql_content = request.json.get('sql', '')
        
        if not sql_content:
            return jsonify(failed("SQL内容不能为空"))
            
        # 提取创建表的DDL语句
        create_ddl_list = select_create_ddl(sql_content)
        
        if not create_ddl_list:
            return jsonify(failed("未找到有效的CREATE TABLE语句"))
            
        return jsonify(success({"count": len(create_ddl_list)}))
    except Exception as e:
        logger.error(f"识别DDL语句失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/model/list', methods=['POST'])
def resource_model_list():
    """获取模型资源列表"""
    try:
        # 获取分页和筛选参数
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        page = int(request.json.get('current', 1))
        page_size = int(request.json.get('size', 10))
        name_filter = request.json.get('name')
        
        # 调用业务逻辑查询模型资源列表
        resources, total_count = model_resource_list(
            page, page_size, name_filter
        )
        
        # 返回结果
        return jsonify(success({
            "records": resources,
            "total": total_count,
            "size": page_size,
            "current": page
        }))
    except Exception as e:
        logger.error(f"获取模型资源列表失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/detail', methods=['POST'])
def data_resource_detail():
    """获取数据资源详情"""
    try:
        # 获取资源ID
        if not request.json:
            return jsonify(failed('请求数据不能为空'))
        
        resource_id = request.json.get('id')
        
        if resource_id is None:
            return jsonify(failed("资源ID不能为空"))
        
        # 确保传入的ID为整数
        try:
            resource_id = int(resource_id)
        except (ValueError, TypeError):
            return jsonify(failed(f"资源ID必须为整数, 收到的是: {resource_id}"))
            
        # 记录请求信息
        logger.info(f"获取资源详情请求，ID: {resource_id}")
        
        # 调用业务逻辑查询数据资源详情
        resource_data = handle_id_resource(resource_id)
        
        if not resource_data:
            logger.error(f"资源不存在，ID: {resource_id}")
            return jsonify(failed("资源不存在"))
        
        # 记录从handle_id_resource返回的数据
        logger.info(
            f"handle_id_resource返回数据，describe字段: "
            f"{resource_data.get('describe')}"
        )
            
        # 确保返回的数据格式符合要求
        response_data = {
            "parsed_data": resource_data.get("parsed_data", []),
            "tag": resource_data.get(
                "tag", {"name_zh": None, "name_en": None, "id": None}
            ),
            "leader": resource_data.get("leader", ""),
            "organization": resource_data.get("organization", ""),
            "name_zh": resource_data.get("name_zh", ""),
            "name_en": resource_data.get("name_en", ""),
            "data_sensitivity": resource_data.get("data_sensitivity", ""),
            "storage_location": resource_data.get("storage_location", "/"),
            "create_time": resource_data.get("create_time", ""),
            "update_time": resource_data.get("update_time", ""),
            "type": resource_data.get("type", ""),
            "category": resource_data.get("category", ""),
            "url": resource_data.get("url", ""),
            "frequency": resource_data.get("frequency", ""),
            "status": resource_data.get("status", True),
            "id": resource_data.get("id"),
            "keywords": resource_data.get("keywords", []),
            "describe": resource_data.get("describe", ""),
            "data_source": resource_data.get("data_source")  # 新增：数据源节点ID
        }
        
        # 记录最终返回的数据
        logger.info(
            f"最终返回的response_data，describe字段: "
            f"{response_data.get('describe')}"
        )
            
        return jsonify(success(response_data))
    except Exception as e:
        logger.error(f"获取数据资源详情失败: {str(e)}")
        return jsonify(failed(str(e)))


@bp.route('/config', methods=['GET'])
@require_auth
def get_resource_config():
    """获取数据资源配置信息"""
    config = get_minio_config()
    return jsonify({
        'allowed_extensions': list(config['allowed_extensions']),
        'bucket_name': config['bucket_name'],
        'prefix': config['prefix']
    })