vor 3 Monaten · 82fdfefd15
--- a/app/api/data_parse/routes.py
+++ b/app/api/data_parse/routes.py
@@ -1463,6 +1463,8 @@ def add_parse_task_route():
 
				                     可选值：'名片', '简历', '新任命', '招聘', '杂项'
			
 
				         - files: 文件数组 (multipart/form-data，对于招聘类型可选)
			
 
				         - created_by: 创建者 (可选，form-data字段)
			
 
				+        - data: 数据内容 (form-data字段，招聘类型必填)
			
 
				+        - publish_time: 发布时间 (form-data字段，新任命类型必填)
			
 
				         
			
 
				     返回:
			
 
				         - JSON: 包含任务创建结果和上传摘要
			
@@ -1505,6 +1507,10 @@ def add_parse_task_route():
 
				         # 获取创建者信息（可选参数）
			
 
				         created_by = request.form.get('created_by', 'api_user')
			
 
				         
			
 
				+        # 获取数据内容和发布时间参数
			
 
				+        data = request.form.get('data')
			
 
				+        publish_time = request.form.get('publish_time')
			
 
				+        
			
 
				         # 对于招聘类型，不需要文件上传
			
 
				         if task_type == '招聘':
			
 
				             # 检查是否误传了文件
			
@@ -1515,11 +1521,19 @@ def add_parse_task_route():
 
				                     'data': None
			
 
				                 }), 400
			
 
				             
			
 
				+            # 检查data参数是否有内容
			
 
				+            if not data:
			
 
				+                return jsonify({
			
 
				+                    'success': False,
			
 
				+                    'message': '招聘类型任务需要提供data参数',
			
 
				+                    'data': None
			
 
				+                }), 400
			
 
				+            
			
 
				             # 记录请求日志
			
 
				-            logger.info(f"新增招聘任务请求: 创建者={created_by}")
			
 
				+            logger.info(f"新增招聘任务请求: 创建者={created_by}, data长度={len(data) if data else 0}")
			
 
				             
			
 
				             # 调用核心业务逻辑
			
 
				-            result = add_parse_task(None, task_type, created_by)
			
 
				+            result = add_parse_task(None, task_type, created_by, data, publish_time)
			
 
				         else:
			
 
				             # 其他类型需要文件上传
			
 
				             if 'files' not in request.files:
			
@@ -1553,11 +1567,20 @@ def add_parse_task_route():
 
				                 
			
 
				                 valid_files.append(file)
			
 
				             
			
 
				+            # 对于新任命类型，检查publish_time参数
			
 
				+            if task_type == '新任命':
			
 
				+                if not publish_time:
			
 
				+                    return jsonify({
			
 
				+                        'success': False,
			
 
				+                        'message': '新任命类型任务需要提供publish_time参数',
			
 
				+                        'data': None
			
 
				+                    }), 400
			
 
				+            
			
 
				             # 记录请求日志
			
 
				             logger.info(f"新增{task_type}任务请求: 文件数量={len(valid_files)}, 创建者={created_by}")
			
 
				             
			
 
				             # 调用核心业务逻辑
			
 
				-            result = add_parse_task(valid_files, task_type, created_by)
			
 
				+            result = add_parse_task(valid_files, task_type, created_by, data, publish_time)
			
 
				         
			
 
				         # 根据处理结果设置HTTP状态码
			
 
				         if result['success']:
			
@@ -1746,20 +1769,15 @@ def add_parsed_talents_route():
 
				     处理解析任务响应数据并写入人才信息接口
			
 
				     
			
 
				     请求参数:
			
 
				-        - api_response_data: execute-parse-task API的完整返回数据 (JSON格式)
			
 
				+        - 请求体: 包含任务ID和人才数据的JSON对象 (JSON格式)
			
 
				+          - task_id: 任务ID，用于更新任务状态（可选）
			
 
				+          - data: 包含人才解析结果的数据对象
			
 
				         
			
 
				     请求体示例:
			
 
				         {
			
 
				-            "success": true,
			
 
				-            "message": "处理完成",
			
 
				-            "data": {
			
 
				-                "summary": {
			
 
				-                    "total_files": 5,
			
 
				-                    "success_count": 4,
			
 
				-                    "failed_count": 1,
			
 
				-                    "success_rate": 80.0
			
 
				-                },
			
 
				-                "results": [
			
 
				+           "task_id": 123,
			
 
				+           "data": {
			
 
				+               "results": [
			
 
				                     {
			
 
				                         "index": 0,
			
 
				                         "success": true,
			
@@ -1769,8 +1787,7 @@ def add_parsed_talents_route():
 
				                             "hotel_zh": "某酒店"
			
 
				                         }
			
 
				                     }
			
 
				-                ],
			
 
				-                "processed_time": "2025-01-18T10:30:00"
			
 
				+                ]
			
 
				             }
			
 
				         }
			
 
				         
			
@@ -1778,12 +1795,11 @@ def add_parsed_talents_route():
 
				         - JSON: 包含批量处理结果和状态信息
			
 
				         
			
 
				     功能说明:
			
 
				-        - 接收 execute-parse-task API 的完整返回数据
			
 
				-        - 自动识别和处理不同格式的人才数据（单人/批量）
			
 
				+        - 接收包含人才数据的请求体
			
 
				+        - 处理 results 数组中的人才数据
			
 
				         - 调用 add_single_talent 函数将人才信息写入 business_cards 表
			
 
				-        - 支持新任命等包含多个人员信息的批量数据
			
 
				+        - 成功处理后，更新对应任务记录状态为"已入库"
			
 
				         - 提供详细的处理统计和结果追踪
			
 
				-        - 保留原始API响应数据用于调试
			
 
				         
			
 
				     状态码:
			
 
				         - 200: 全部处理成功
			
@@ -1824,7 +1840,7 @@ def add_parsed_talents_route():
 
				         if api_response_data.get('data') and api_response_data['data'].get('results'):
			
 
				             total_results = len(api_response_data['data']['results'])
			
 
				         
			
 
				-        logger.info(f"收到处理解析任务响应数据请求，包含 {total_results} 条结果记录")
			
 
				+        logger.info(f"收到处理人才数据请求，包含 {total_results} 条结果记录")
			
 
				         
			
 
				         # 调用核心业务逻辑
			
 
				         result = add_parsed_talents(api_response_data)
			
@@ -1848,9 +1864,26 @@ def add_parsed_talents_route():
 
				             data_summary = result.get('data', {}).get('summary', {})
			
 
				             success_count = data_summary.get('success_count', 0)
			
 
				             failed_count = data_summary.get('failed_count', 0)
			
 
				-            logger.info(f"处理解析任务响应数据完成: 成功 {success_count} 条，失败 {failed_count} 条")
			
 
				+            logger.info(f"处理人才数据完成: 成功 {success_count} 条，失败 {failed_count} 条")
			
 
				+            
			
 
				+            # 更新任务状态为"已入库"
			
 
				+            task_id = api_response_data.get('task_id')
			
 
				+            if task_id:
			
 
				+                try:
			
 
				+                    from app.core.data_parse.parse_system import db, ParseTaskRepository
			
 
				+                    task_obj = ParseTaskRepository.query.filter_by(id=task_id).first()
			
 
				+                    if task_obj:
			
 
				+                        task_obj.task_status = '已入库'
			
 
				+                        db.session.commit()
			
 
				+                        logger.info(f"已更新解析任务记录: id={task_id}, 状态=已入库")
			
 
				+                    else:
			
 
				+                        logger.warning(f"未找到 ID 为 {task_id} 的任务记录")
			
 
				+                except Exception as update_error:
			
 
				+                    logger.error(f"更新任务状态失败: {str(update_error)}", exc_info=True)
			
 
				+            else:
			
 
				+                logger.info("请求中未包含 task_id，跳过任务状态更新")
			
 
				         else:
			
 
				-            logger.error(f"处理解析任务响应数据失败: {result.get('message', '未知错误')}")
			
 
				+            logger.error(f"处理人才数据失败: {result.get('message', '未知错误')}")
			
 
				         
			
 
				         # 返回结果
			
 
				         return jsonify({
			
@@ -1861,7 +1894,7 @@ def add_parsed_talents_route():
 
				         
			
 
				     except Exception as e:
			
 
				         # 记录错误日志
			
 
				-        error_msg = f"处理解析任务响应数据接口失败: {str(e)}"
			
 
				+        error_msg = f"处理人才数据接口失败: {str(e)}"
			
 
				         logger.error(error_msg, exc_info=True)
			
 
				         
			
 
				         # 返回错误响应
			
--- a/app/core/data_parse/parse_menduner.py
+++ b/app/core/data_parse/parse_menduner.py
@@ -150,6 +150,72 @@ def _normalize_talent_profile(raw_profile: Dict[str, Any]) -> Dict[str, Any]:
 
				     return normalized
			
 
				 
			
 
				 
			
 
				+def _normalize_talent_to_card_format(raw_profile: Dict[str, Any]) -> Dict[str, Any]:
			
 
				+    """
			
 
				+    将门墩儿人才数据标准化为名片格式，与任务解析结果.txt中的data字段格式一致
			
 
				+    
			
 
				+    Args:
			
 
				+        raw_profile (Dict[str, Any]): 原始门墩儿档案数据
			
 
				+        
			
 
				+    Returns:
			
 
				+        Dict[str, Any]: 标准化后的名片格式数据
			
 
				+    """
			
 
				+    # 提取基本信息
			
 
				+    name_zh = raw_profile.get('name', raw_profile.get('name_zh', ''))
			
 
				+    company = raw_profile.get('company', raw_profile.get('hotel_zh', ''))
			
 
				+    position = raw_profile.get('position', raw_profile.get('title_zh', ''))
			
 
				+    mobile = raw_profile.get('phone', raw_profile.get('mobile', ''))
			
 
				+    email = raw_profile.get('email', '')
			
 
				+    location = raw_profile.get('location', raw_profile.get('address_zh', ''))
			
 
				+    
			
 
				+    # 构建隶属关系
			
 
				+    affiliation = []
			
 
				+    if company:
			
 
				+        affiliation.append({
			
 
				+            "company": company,
			
 
				+            "group": raw_profile.get('group', '')
			
 
				+        })
			
 
				+    
			
 
				+    # 构建职业轨迹
			
 
				+    career_path = []
			
 
				+    if position and company:
			
 
				+        career_path.append({
			
 
				+            "date": datetime.now().strftime('%Y-%m-%d'),
			
 
				+            "hotel_en": raw_profile.get('hotel_en', ''),
			
 
				+            "hotel_zh": company,
			
 
				+            "image_path": raw_profile.get('image_path', ''),
			
 
				+            "source": "menduner_data_creation",
			
 
				+            "title_en": raw_profile.get('title_en', ''),
			
 
				+            "title_zh": position
			
 
				+        })
			
 
				+    
			
 
				+    # 按照任务解析结果.txt的data字段格式组装数据
			
 
				+    normalized = {
			
 
				+        "address_en": raw_profile.get('address_en', ''),
			
 
				+        "address_zh": location,
			
 
				+        "affiliation": affiliation,
			
 
				+        "age": raw_profile.get('age', 0),
			
 
				+        "birthday": raw_profile.get('birthday', ''),
			
 
				+        "brand_group": raw_profile.get('brand_group', ''),
			
 
				+        "career_path": career_path,
			
 
				+        "email": _normalize_email(email),
			
 
				+        "hotel_en": raw_profile.get('hotel_en', ''),
			
 
				+        "hotel_zh": company,
			
 
				+        "mobile": _normalize_phone(mobile),
			
 
				+        "name_en": raw_profile.get('name_en', ''),
			
 
				+        "name_zh": name_zh,
			
 
				+        "native_place": raw_profile.get('native_place', ''),
			
 
				+        "phone": raw_profile.get('phone', ''),
			
 
				+        "postal_code_en": raw_profile.get('postal_code_en', ''),
			
 
				+        "postal_code_zh": raw_profile.get('postal_code_zh', ''),
			
 
				+        "residence": raw_profile.get('residence', ''),
			
 
				+        "title_en": raw_profile.get('title_en', ''),
			
 
				+        "title_zh": position
			
 
				+    }
			
 
				+    
			
 
				+    return normalized
			
 
				+
			
 
				+
			
 
				 def _parse_talent_line(line: str) -> Optional[Dict[str, Any]]:
			
 
				     """
			
 
				     解析单行人才信息
			
@@ -233,10 +299,10 @@ def _normalize_email(email: str) -> str:
 
				 
			
 
				 def validate_menduner_data(data: Dict[str, Any]) -> Dict[str, Any]:
			
 
				     """
			
 
				-    验证门墩儿人才数据的完整性和有效性
			
 
				+    验证门墩儿人才数据的完整性和有效性（名片格式）
			
 
				     
			
 
				     Args:
			
 
				-        data (Dict[str, Any]): 待验证的人才数据
			
 
				+        data (Dict[str, Any]): 待验证的名片格式人才数据
			
 
				         
			
 
				     Returns:
			
 
				         Dict[str, Any]: 验证结果
			
@@ -245,29 +311,44 @@ def validate_menduner_data(data: Dict[str, Any]) -> Dict[str, Any]:
 
				         errors = []
			
 
				         warnings = []
			
 
				         
			
 
				-        # 必填字段检查
			
 
				-        required_fields = ['name']
			
 
				+        # 必填字段检查（按名片格式）
			
 
				+        required_fields = ['name_zh']
			
 
				         for field in required_fields:
			
 
				             if not data.get(field):
			
 
				                 errors.append(f"缺少必填字段: {field}")
			
 
				         
			
 
				         # 可选但建议填写的字段
			
 
				-        recommended_fields = ['phone', 'position', 'company']
			
 
				+        recommended_fields = ['mobile', 'title_zh', 'hotel_zh']
			
 
				         for field in recommended_fields:
			
 
				             if not data.get(field):
			
 
				                 warnings.append(f"建议填写字段: {field}")
			
 
				         
			
 
				         # 格式验证
			
 
				-        if data.get('phone'):
			
 
				-            phone = data['phone']
			
 
				-            if not re.match(r'^1[3-9]\d{9}$', re.sub(r'\D', '', phone)):
			
 
				-                warnings.append("电话号码格式可能不正确")
			
 
				+        if data.get('mobile'):
			
 
				+            mobile = data['mobile']
			
 
				+            # 移除所有非数字字符进行验证
			
 
				+            digits_only = re.sub(r'\D', '', mobile)
			
 
				+            if digits_only and not re.match(r'^1[3-9]\d{9}$', digits_only):
			
 
				+                warnings.append("手机号码格式可能不正确")
			
 
				         
			
 
				         if data.get('email'):
			
 
				             email = data['email']
			
 
				             if not re.match(r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$', email):
			
 
				                 errors.append("邮箱格式不正确")
			
 
				         
			
 
				+        # 验证数组字段
			
 
				+        if data.get('affiliation') is not None and not isinstance(data['affiliation'], list):
			
 
				+            errors.append("affiliation字段必须是数组格式")
			
 
				+        
			
 
				+        if data.get('career_path') is not None and not isinstance(data['career_path'], list):
			
 
				+            errors.append("career_path字段必须是数组格式")
			
 
				+        
			
 
				+        # 验证年龄字段
			
 
				+        if data.get('age') is not None:
			
 
				+            age = data['age']
			
 
				+            if not isinstance(age, int) or age < 0 or age > 150:
			
 
				+                warnings.append("年龄值可能不合理")
			
 
				+        
			
 
				         return {
			
 
				             'is_valid': len(errors) == 0,
			
 
				             'errors': errors,
			
@@ -293,24 +374,32 @@ def batch_process_menduner_data(data_list: List[Dict[str, Any]]) -> Dict[str, An
 
				         data_list (List[Dict[str, Any]]): 待处理的人才数据列表
			
 
				         
			
 
				     Returns:
			
 
				-        Dict[str, Any]: 批量处理结果，格式与batch_process_business_card_images保持一致
			
 
				+        Dict[str, Any]: 批量处理结果，格式与parse_result保持一致
			
 
				     """
			
 
				     try:
			
 
				         # 验证参数
			
 
				         if not data_list or not isinstance(data_list, list):
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': 'data_list参数必须是非空数组',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": len(data_list) if data_list else 0,
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": len(data_list) if data_list else 0
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         if len(data_list) == 0:
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': '门墩儿数据数组不能为空',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": 0,
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": 0
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         results = []
			
@@ -324,8 +413,8 @@ def batch_process_menduner_data(data_list: List[Dict[str, Any]]) -> Dict[str, An
 
				             try:
			
 
				                 logging.debug(f"处理第 {i+1}/{len(data_list)} 条数据")
			
 
				                 
			
 
				-                # 标准化数据
			
 
				-                normalized = _normalize_talent_profile(data)
			
 
				+                # 标准化数据为名片格式
			
 
				+                normalized = _normalize_talent_to_card_format(data)
			
 
				                 
			
 
				                 # 验证数据
			
 
				                 validation = validate_menduner_data(normalized)
			
@@ -333,29 +422,28 @@ def batch_process_menduner_data(data_list: List[Dict[str, Any]]) -> Dict[str, An
 
				                 if validation.get('is_valid', False):
			
 
				                     success_count += 1
			
 
				                     results.append({
			
 
				-                        'index': i,
			
 
				-                        'data_id': data.get('id', f'record_{i}'),
			
 
				-                        'success': True,
			
 
				-                        'error': None,
			
 
				-                        'data': {
			
 
				-                            'normalized_data': normalized,
			
 
				-                            'validation': validation
			
 
				-                        },
			
 
				-                        'message': f'处理成功，验证得分: {validation.get("score", 0)}'
			
 
				+                        "data": normalized,
			
 
				+                        "error": None,
			
 
				+                        "filename": data.get('filename', f'menduner_record_{i}.json'),
			
 
				+                        "index": i,
			
 
				+                        "message": "门墩儿数据解析成功",
			
 
				+                        "minio_path": data.get('minio_path', ''),
			
 
				+                        "object_key": data.get('object_key', f'menduner_data/record_{i}.json'),
			
 
				+                        "success": True
			
 
				                     })
			
 
				                     logging.debug(f"成功处理第 {i+1} 条数据")
			
 
				                 else:
			
 
				                     failed_count += 1
			
 
				                     error_messages = validation.get('errors', ['验证失败'])
			
 
				                     results.append({
			
 
				-                        'index': i,
			
 
				-                        'data_id': data.get('id', f'record_{i}'),
			
 
				-                        'success': False,
			
 
				-                        'error': '; '.join(error_messages),
			
 
				-                        'data': {
			
 
				-                            'normalized_data': normalized,
			
 
				-                            'validation': validation
			
 
				-                        }
			
 
				+                        "data": None,
			
 
				+                        "error": '; '.join(error_messages),
			
 
				+                        "filename": data.get('filename', f'menduner_record_{i}.json'),
			
 
				+                        "index": i,
			
 
				+                        "message": "门墩儿数据解析失败",
			
 
				+                        "minio_path": data.get('minio_path', ''),
			
 
				+                        "object_key": data.get('object_key', f'menduner_data/record_{i}.json'),
			
 
				+                        "success": False
			
 
				                     })
			
 
				                     logging.warning(f"处理第 {i+1} 条数据失败: {'; '.join(error_messages)}")
			
 
				                     
			
@@ -364,11 +452,14 @@ def batch_process_menduner_data(data_list: List[Dict[str, Any]]) -> Dict[str, An
 
				                 error_msg = f"处理门墩儿数据失败: {str(item_error)}"
			
 
				                 logging.error(error_msg, exc_info=True)
			
 
				                 results.append({
			
 
				-                    'index': i,
			
 
				-                    'data_id': data.get('id', f'record_{i}') if isinstance(data, dict) else f'record_{i}',
			
 
				-                    'success': False,
			
 
				-                    'error': error_msg,
			
 
				-                    'data': None
			
 
				+                    "data": None,
			
 
				+                    "error": error_msg,
			
 
				+                    "filename": data.get('filename', f'menduner_record_{i}.json') if isinstance(data, dict) else f'menduner_record_{i}.json',
			
 
				+                    "index": i,
			
 
				+                    "message": "门墩儿数据解析失败",
			
 
				+                    "minio_path": data.get('minio_path', '') if isinstance(data, dict) else '',
			
 
				+                    "object_key": data.get('object_key', f'menduner_data/record_{i}.json') if isinstance(data, dict) else f'menduner_data/record_{i}.json',
			
 
				+                    "success": False
			
 
				                 })
			
 
				         
			
 
				         # 组装最终结果
			
@@ -387,21 +478,21 @@ def batch_process_menduner_data(data_list: List[Dict[str, Any]]) -> Dict[str, An
 
				             return {
			
 
				                 'code': 200,
			
 
				                 'success': True,
			
 
				-                'message': f'批量处理完成，全部 {success_count} 条数据处理成功',
			
 
				+                'message': f'批量处理完成，全部 {success_count} 个文件处理成功',
			
 
				                 'data': batch_result
			
 
				             }
			
 
				         elif success_count == 0:
			
 
				             return {
			
 
				                 'code': 500,
			
 
				                 'success': False,
			
 
				-                'message': f'批量处理失败，全部 {failed_count} 条数据处理失败',
			
 
				+                'message': f'批量处理失败，全部 {failed_count} 个文件处理失败',
			
 
				                 'data': batch_result
			
 
				             }
			
 
				         else:
			
 
				             return {
			
 
				                 'code': 206,  # Partial Content
			
 
				                 'success': True,
			
 
				-                'message': f'批量处理部分成功，成功 {success_count} 条，失败 {failed_count} 条',
			
 
				+                'message': f'批量处理部分成功，成功 {success_count} 个，失败 {failed_count} 个',
			
 
				                 'data': batch_result
			
 
				             }
			
 
				             
			
@@ -409,9 +500,20 @@ def batch_process_menduner_data(data_list: List[Dict[str, Any]]) -> Dict[str, An
 
				         error_msg = f"批量处理门墩儿数据失败: {str(e)}"
			
 
				         logging.error(error_msg, exc_info=True)
			
 
				         
			
 
				+        batch_result = {
			
 
				+            'summary': {
			
 
				+                'total_files': len(data_list) if data_list else 1,
			
 
				+                'success_count': 0,
			
 
				+                'failed_count': len(data_list) if data_list else 1,
			
 
				+                'success_rate': 0
			
 
				+            },
			
 
				+            'results': [],
			
 
				+            'processed_time': datetime.now().isoformat()
			
 
				+        }
			
 
				+        
			
 
				         return {
			
 
				             'code': 500,
			
 
				             'success': False,
			
 
				             'message': error_msg,
			
 
				-            'data': None
			
 
				+            'data': batch_result
			
 
				         } 
			
--- a/app/core/data_parse/parse_pic.py
+++ b/app/core/data_parse/parse_pic.py
@@ -617,37 +617,46 @@ def parse_table_with_qwen(base64_image: str) -> List[Dict[str, Any]]:
 
				             
			
 
				             # 创建职业轨迹记录
			
 
				             career_entry = {
			
 
				-                'date': datetime.now().strftime('%Y-%m-%d'),
			
 
				-                'hotel_en': '',
			
 
				-                'hotel_zh': person_data.get('work_unit', ''),
			
 
				-                'image_path': '',
			
 
				-                'source': 'table_extraction',
			
 
				-                'title_en': '',
			
 
				-                'title_zh': person_data.get('position', '')
			
 
				+                "date": datetime.now().strftime('%Y-%m-%d'),
			
 
				+                "hotel_en": '',
			
 
				+                "hotel_zh": person_data.get('work_unit', ''),
			
 
				+                "image_path": '',
			
 
				+                "source": 'table_extraction',
			
 
				+                "title_en": '',
			
 
				+                "title_zh": person_data.get('position', '')
			
 
				             }
			
 
				             
			
 
				-            # 将字段映射到标准格式
			
 
				+            # 创建隶属关系记录
			
 
				+            affiliation = []
			
 
				+            work_unit = person_data.get('work_unit', '')
			
 
				+            if work_unit:
			
 
				+                affiliation.append({
			
 
				+                    "company": work_unit,
			
 
				+                    "group": ""
			
 
				+                })
			
 
				+            
			
 
				+            # 将字段映射到标准格式，与任务解析结果.txt完全一致
			
 
				             standardized_person = {
			
 
				-                'name_zh': person_data.get('name', ''),
			
 
				-                'name_en': '',
			
 
				-                'title_zh': person_data.get('position', ''),
			
 
				-                'title_en': '',
			
 
				-                'hotel_zh': person_data.get('work_unit', ''),
			
 
				-                'hotel_en': '',
			
 
				-                'mobile': person_data.get('mobile', ''),
			
 
				-                'phone': '',
			
 
				-                'email': person_data.get('email', ''),
			
 
				-                'address_zh': '',
			
 
				-                'address_en': '',
			
 
				-                'postal_code_zh': '',
			
 
				-                'postal_code_en': '',
			
 
				-                'birthday': '',
			
 
				-                'age': 0,
			
 
				-                'native_place': '',
			
 
				-                'residence': '',
			
 
				-                'brand_group': '',
			
 
				-                'career_path': [career_entry],
			
 
				-                'affiliation': []
			
 
				+                "address_en": '',
			
 
				+                "address_zh": '',
			
 
				+                "affiliation": affiliation,
			
 
				+                "age": 0,
			
 
				+                "birthday": '',
			
 
				+                "brand_group": '',
			
 
				+                "career_path": [career_entry],
			
 
				+                "email": person_data.get('email', ''),
			
 
				+                "hotel_en": '',
			
 
				+                "hotel_zh": person_data.get('work_unit', ''),
			
 
				+                "mobile": person_data.get('mobile', ''),
			
 
				+                "name_en": '',
			
 
				+                "name_zh": person_data.get('name', ''),
			
 
				+                "native_place": '',
			
 
				+                "phone": '',
			
 
				+                "postal_code_en": '',
			
 
				+                "postal_code_zh": '',
			
 
				+                "residence": '',
			
 
				+                "title_en": '',
			
 
				+                "title_zh": person_data.get('position', '')
			
 
				             }
			
 
				             
			
 
				             processed_data.append(standardized_person)
			
@@ -670,43 +679,45 @@ def batch_process_images(image_paths: List[str], process_type: str = 'table') ->
 
				         process_type (str): 处理类型，只支持 'table'
			
 
				         
			
 
				     Returns:
			
 
				-        Dict[str, Any]: 批量处理结果，格式与batch_process_business_card_images保持一致
			
 
				+        Dict[str, Any]: 批量处理结果，格式与parse_result保持一致
			
 
				     """
			
 
				     try:
			
 
				         # 验证处理类型
			
 
				         if process_type != 'table':
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': f'不支持的处理类型: {process_type}，只支持 "table" 类型',
			
 
				-                'data': {
			
 
				-                    'summary': {
			
 
				-                        'total_files': len(image_paths),
			
 
				-                        'success_count': 0,
			
 
				-                        'failed_count': len(image_paths),
			
 
				-                        'success_rate': 0.0,
			
 
				-                        'process_type': process_type
			
 
				-                    },
			
 
				-                    'results': [],
			
 
				-                    'processed_time': datetime.now().isoformat()
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": len(image_paths),
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": len(image_paths)
			
 
				                 }
			
 
				             }
			
 
				         
			
 
				         # 验证参数
			
 
				         if not image_paths or not isinstance(image_paths, list):
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': 'image_paths参数必须是非空数组',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": len(image_paths) if image_paths else 0,
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": len(image_paths) if image_paths else 0
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         if len(image_paths) == 0:
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': '图片路径数组不能为空',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": 0,
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": 0
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         results = []
			
@@ -720,30 +731,53 @@ def batch_process_images(image_paths: List[str], process_type: str = 'table') ->
 
				             try:
			
 
				                 logging.info(f"处理第 {i+1}/{len(image_paths)} 个文件: {image_path}")
			
 
				                 
			
 
				-                # 只支持表格处理
			
 
				+                # 调用表格处理函数
			
 
				                 result = parse_table_image(image_path)
			
 
				                 
			
 
				                 if result.get('success', False):
			
 
				-                    success_count += 1
			
 
				-                    results.append({
			
 
				-                        'index': i,
			
 
				-                        'image_path': image_path,
			
 
				-                        'filename': os.path.basename(image_path) if image_path else f'file_{i}',
			
 
				-                        'success': True,
			
 
				-                        'error': None,
			
 
				-                        'data': result.get('data'),
			
 
				-                        'message': result.get('message', '处理成功')
			
 
				-                    })
			
 
				-                    logging.info(f"成功处理第 {i+1} 个文件: {os.path.basename(image_path)}")
			
 
				+                    # 提取表格数据并转换为多个人员记录
			
 
				+                    extracted_data = result.get('data', {}).get('extracted_data', [])
			
 
				+                    
			
 
				+                    if extracted_data and isinstance(extracted_data, list):
			
 
				+                        # 为每个人员创建一个结果记录
			
 
				+                        for person_idx, person_data in enumerate(extracted_data):
			
 
				+                            success_count += 1
			
 
				+                            results.append({
			
 
				+                                "data": person_data,
			
 
				+                                "error": None,
			
 
				+                                "filename": os.path.basename(image_path) if image_path else f'table_file_{i}.jpg',
			
 
				+                                "index": len(results),  # 使用连续的索引
			
 
				+                                "message": "表格图片解析成功",
			
 
				+                                "minio_path": f"table_images/{os.path.basename(image_path)}" if image_path else '',
			
 
				+                                "object_key": f"table_images/{os.path.basename(image_path)}" if image_path else f'table_images/file_{i}.jpg',
			
 
				+                                "success": True
			
 
				+                            })
			
 
				+                            logging.info(f"成功提取人员 {person_idx+1}: {person_data.get('name_zh', 'Unknown')}")
			
 
				+                    else:
			
 
				+                        # 没有提取到有效数据
			
 
				+                        failed_count += 1
			
 
				+                        results.append({
			
 
				+                            "data": None,
			
 
				+                            "error": "未从表格图片中提取到人员信息",
			
 
				+                            "filename": os.path.basename(image_path) if image_path else f'table_file_{i}.jpg',
			
 
				+                            "index": i,
			
 
				+                            "message": "表格图片解析失败",
			
 
				+                            "minio_path": f"table_images/{os.path.basename(image_path)}" if image_path else '',
			
 
				+                            "object_key": f"table_images/{os.path.basename(image_path)}" if image_path else f'table_images/file_{i}.jpg',
			
 
				+                            "success": False
			
 
				+                        })
			
 
				+                        logging.warning(f"第 {i+1} 个文件未提取到人员信息")
			
 
				                 else:
			
 
				                     failed_count += 1
			
 
				                     results.append({
			
 
				-                        'index': i,
			
 
				-                        'image_path': image_path,
			
 
				-                        'filename': os.path.basename(image_path) if image_path else f'file_{i}',
			
 
				-                        'success': False,
			
 
				-                        'error': result.get('error', '处理失败'),
			
 
				-                        'data': None
			
 
				+                        "data": None,
			
 
				+                        "error": result.get('error', '处理失败'),
			
 
				+                        "filename": os.path.basename(image_path) if image_path else f'table_file_{i}.jpg',
			
 
				+                        "index": i,
			
 
				+                        "message": "表格图片解析失败",
			
 
				+                        "minio_path": f"table_images/{os.path.basename(image_path)}" if image_path else '',
			
 
				+                        "object_key": f"table_images/{os.path.basename(image_path)}" if image_path else f'table_images/file_{i}.jpg',
			
 
				+                        "success": False
			
 
				                     })
			
 
				                     logging.error(f"处理第 {i+1} 个文件失败: {result.get('error', '未知错误')}")
			
 
				                     
			
@@ -752,12 +786,14 @@ def batch_process_images(image_paths: List[str], process_type: str = 'table') ->
 
				                 error_msg = f"处理图片失败: {str(item_error)}"
			
 
				                 logging.error(error_msg, exc_info=True)
			
 
				                 results.append({
			
 
				-                    'index': i,
			
 
				-                    'image_path': image_path,
			
 
				-                    'filename': os.path.basename(image_path) if image_path else f'file_{i}',
			
 
				-                    'success': False,
			
 
				-                    'error': error_msg,
			
 
				-                    'data': None
			
 
				+                    "data": None,
			
 
				+                    "error": error_msg,
			
 
				+                    "filename": os.path.basename(image_path) if image_path else f'table_file_{i}.jpg',
			
 
				+                    "index": i,
			
 
				+                    "message": "表格图片解析失败",
			
 
				+                    "minio_path": f"table_images/{os.path.basename(image_path)}" if image_path else '',
			
 
				+                    "object_key": f"table_images/{os.path.basename(image_path)}" if image_path else f'table_images/file_{i}.jpg',
			
 
				+                    "success": False
			
 
				                 })
			
 
				         
			
 
				         # 组装最终结果
			
@@ -766,8 +802,7 @@ def batch_process_images(image_paths: List[str], process_type: str = 'table') ->
 
				                 'total_files': len(image_paths),
			
 
				                 'success_count': success_count,
			
 
				                 'failed_count': failed_count,
			
 
				-                'success_rate': round((success_count / len(image_paths)) * 100, 2) if len(image_paths) > 0 else 0,
			
 
				-                'process_type': process_type
			
 
				+                'success_rate': round((success_count / len(image_paths)) * 100, 2) if len(image_paths) > 0 else 0
			
 
				             },
			
 
				             'results': results,
			
 
				             'processed_time': datetime.now().isoformat()
			
@@ -799,9 +834,20 @@ def batch_process_images(image_paths: List[str], process_type: str = 'table') ->
 
				         error_msg = f"批量处理图片失败: {str(e)}"
			
 
				         logging.error(error_msg, exc_info=True)
			
 
				         
			
 
				+        batch_result = {
			
 
				+            'summary': {
			
 
				+                'total_files': len(image_paths) if image_paths else 1,
			
 
				+                'success_count': 0,
			
 
				+                'failed_count': len(image_paths) if image_paths else 1,
			
 
				+                'success_rate': 0
			
 
				+            },
			
 
				+            'results': [],
			
 
				+            'processed_time': datetime.now().isoformat()
			
 
				+        }
			
 
				+        
			
 
				         return {
			
 
				             'code': 500,
			
 
				             'success': False,
			
 
				             'message': error_msg,
			
 
				-            'data': None
			
 
				+            'data': batch_result
			
 
				         } 
			
--- a/app/core/data_parse/parse_resume.py
+++ b/app/core/data_parse/parse_resume.py
@@ -151,13 +151,13 @@ def parse_resume_with_qwen(resume_text: str) -> Dict[str, Any]:
 
				         # 为career_path增加一条记录（如果提取到相关信息）
			
 
				         if parsed_resume.get('hotel_zh') or parsed_resume.get('hotel_en') or parsed_resume.get('title_zh') or parsed_resume.get('title_en'):
			
 
				             career_entry = {
			
 
				-                'date': datetime.now().strftime('%Y-%m-%d'),
			
 
				-                'hotel_en': parsed_resume.get('hotel_en', ''),
			
 
				-                'hotel_zh': parsed_resume.get('hotel_zh', ''),
			
 
				-                'image_path': '',
			
 
				-                'source': 'resume_extraction',
			
 
				-                'title_en': parsed_resume.get('title_en', ''),
			
 
				-                'title_zh': parsed_resume.get('title_zh', '')
			
 
				+                "date": datetime.now().strftime('%Y-%m-%d'),
			
 
				+                "hotel_en": parsed_resume.get('hotel_en', ''),
			
 
				+                "hotel_zh": parsed_resume.get('hotel_zh', ''),
			
 
				+                "image_path": '',
			
 
				+                "source": 'resume_extraction',
			
 
				+                "title_en": parsed_resume.get('title_en', ''),
			
 
				+                "title_zh": parsed_resume.get('title_zh', '')
			
 
				             }
			
 
				             
			
 
				             # 如果原有career_path为空或不是数组，则重新设置
			
@@ -169,6 +169,29 @@ def parse_resume_with_qwen(resume_text: str) -> Dict[str, Any]:
 
				                 parsed_resume['career_path'].insert(0, career_entry)
			
 
				                 logging.info(f"为简历解析结果添加了career_path记录: {career_entry}")
			
 
				         
			
 
				+        # 为affiliation增加记录（如果提取到公司信息）
			
 
				+        if parsed_resume.get('hotel_zh') or parsed_resume.get('hotel_en'):
			
 
				+            company_name = parsed_resume.get('hotel_zh') or parsed_resume.get('hotel_en')
			
 
				+            affiliation_entry = {
			
 
				+                "company": company_name,
			
 
				+                "group": ""
			
 
				+            }
			
 
				+            
			
 
				+            # 如果原有affiliation为空或不是数组，则重新设置
			
 
				+            if not isinstance(parsed_resume.get('affiliation'), list) or not parsed_resume['affiliation']:
			
 
				+                parsed_resume['affiliation'] = [affiliation_entry]
			
 
				+                logging.info(f"为简历解析结果设置了affiliation记录: {affiliation_entry}")
			
 
				+            else:
			
 
				+                # 检查是否已存在相同公司的记录
			
 
				+                company_exists = any(
			
 
				+                    aff.get('company') == company_name 
			
 
				+                    for aff in parsed_resume['affiliation'] 
			
 
				+                    if isinstance(aff, dict)
			
 
				+                )
			
 
				+                if not company_exists:
			
 
				+                    parsed_resume['affiliation'].append(affiliation_entry)
			
 
				+                    logging.info(f"为简历解析结果添加了affiliation记录: {affiliation_entry}")
			
 
				+        
			
 
				         return parsed_resume
			
 
				         
			
 
				     except Exception as e:
			
@@ -374,24 +397,32 @@ def batch_parse_resumes(file_paths: List[str]) -> Dict[str, Any]:
 
				         file_paths (List[str]): 简历文件路径列表
			
 
				         
			
 
				     Returns:
			
 
				-        Dict[str, Any]: 批量解析结果，格式与batch_process_business_card_images保持一致
			
 
				+        Dict[str, Any]: 批量解析结果，格式与parse_result保持一致
			
 
				     """
			
 
				     try:
			
 
				         # 验证参数
			
 
				         if not file_paths or not isinstance(file_paths, list):
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': 'file_paths参数必须是非空数组',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": len(file_paths) if file_paths else 0,
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": len(file_paths) if file_paths else 0
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         if len(file_paths) == 0:
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': '简历文件路径数组不能为空',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": 0,
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": 0
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         results = []
			
@@ -408,26 +439,56 @@ def batch_parse_resumes(file_paths: List[str]) -> Dict[str, Any]:
 
				                 result = parse_resume_file(file_path)
			
 
				                 
			
 
				                 if result.get('success', False):
			
 
				+                    # 提取并转换为标准名片格式
			
 
				+                    resume_data = result.get('data', {})
			
 
				+                    
			
 
				+                    # 构建符合规范的名片格式数据
			
 
				+                    standardized_data = {
			
 
				+                        "address_en": resume_data.get('address_en', ''),
			
 
				+                        "address_zh": resume_data.get('address_zh', ''),
			
 
				+                        "affiliation": resume_data.get('affiliation', []),
			
 
				+                        "age": resume_data.get('age', 0),
			
 
				+                        "birthday": resume_data.get('birthday', ''),
			
 
				+                        "brand_group": resume_data.get('brand_group', ''),
			
 
				+                        "career_path": resume_data.get('career_path', []),
			
 
				+                        "email": resume_data.get('email', ''),
			
 
				+                        "hotel_en": resume_data.get('hotel_en', ''),
			
 
				+                        "hotel_zh": resume_data.get('hotel_zh', ''),
			
 
				+                        "mobile": resume_data.get('mobile', ''),
			
 
				+                        "name_en": resume_data.get('name_en', ''),
			
 
				+                        "name_zh": resume_data.get('name_zh', ''),
			
 
				+                        "native_place": resume_data.get('native_place', ''),
			
 
				+                        "phone": resume_data.get('phone', ''),
			
 
				+                        "postal_code_en": resume_data.get('postal_code_en', ''),
			
 
				+                        "postal_code_zh": resume_data.get('postal_code_zh', ''),
			
 
				+                        "residence": resume_data.get('residence', ''),
			
 
				+                        "title_en": resume_data.get('title_en', ''),
			
 
				+                        "title_zh": resume_data.get('title_zh', '')
			
 
				+                    }
			
 
				+                    
			
 
				                     success_count += 1
			
 
				                     results.append({
			
 
				-                        'index': i,
			
 
				-                        'file_path': file_path,
			
 
				-                        'filename': os.path.basename(file_path) if file_path else f'file_{i}',
			
 
				-                        'success': True,
			
 
				-                        'error': None,
			
 
				-                        'data': result.get('data'),
			
 
				-                        'message': result.get('message', '处理成功')
			
 
				+                        "data": standardized_data,
			
 
				+                        "error": None,
			
 
				+                        "filename": os.path.basename(file_path) if file_path else f'resume_{i}.pdf',
			
 
				+                        "index": i,
			
 
				+                        "message": "简历文件解析成功",
			
 
				+                        "minio_path": f"resume_files/{os.path.basename(file_path)}" if file_path else '',
			
 
				+                        "object_key": f"resume_files/{os.path.basename(file_path)}" if file_path else f'resume_files/file_{i}.pdf',
			
 
				+                        "success": True
			
 
				                     })
			
 
				                     logging.info(f"成功处理第 {i+1} 个文件: {os.path.basename(file_path)}")
			
 
				                 else:
			
 
				                     failed_count += 1
			
 
				                     results.append({
			
 
				-                        'index': i,
			
 
				-                        'file_path': file_path,
			
 
				-                        'filename': os.path.basename(file_path) if file_path else f'file_{i}',
			
 
				-                        'success': False,
			
 
				-                        'error': result.get('error', '处理失败'),
			
 
				-                        'data': None
			
 
				+                        "data": None,
			
 
				+                        "error": result.get('error', '处理失败'),
			
 
				+                        "filename": os.path.basename(file_path) if file_path else f'resume_{i}.pdf',
			
 
				+                        "index": i,
			
 
				+                        "message": "简历文件解析失败",
			
 
				+                        "minio_path": f"resume_files/{os.path.basename(file_path)}" if file_path else '',
			
 
				+                        "object_key": f"resume_files/{os.path.basename(file_path)}" if file_path else f'resume_files/file_{i}.pdf',
			
 
				+                        "success": False
			
 
				                     })
			
 
				                     logging.error(f"处理第 {i+1} 个文件失败: {result.get('error', '未知错误')}")
			
 
				                     
			
@@ -436,12 +497,14 @@ def batch_parse_resumes(file_paths: List[str]) -> Dict[str, Any]:
 
				                 error_msg = f"处理简历文件失败: {str(item_error)}"
			
 
				                 logging.error(error_msg, exc_info=True)
			
 
				                 results.append({
			
 
				-                    'index': i,
			
 
				-                    'file_path': file_path,
			
 
				-                    'filename': os.path.basename(file_path) if file_path else f'file_{i}',
			
 
				-                    'success': False,
			
 
				-                    'error': error_msg,
			
 
				-                    'data': None
			
 
				+                    "data": None,
			
 
				+                    "error": error_msg,
			
 
				+                    "filename": os.path.basename(file_path) if file_path else f'resume_{i}.pdf',
			
 
				+                    "index": i,
			
 
				+                    "message": "简历文件解析失败",
			
 
				+                    "minio_path": f"resume_files/{os.path.basename(file_path)}" if file_path else '',
			
 
				+                    "object_key": f"resume_files/{os.path.basename(file_path)}" if file_path else f'resume_files/file_{i}.pdf',
			
 
				+                    "success": False
			
 
				                 })
			
 
				         
			
 
				         # 组装最终结果
			
@@ -482,9 +545,20 @@ def batch_parse_resumes(file_paths: List[str]) -> Dict[str, Any]:
 
				         error_msg = f"批量解析简历失败: {str(e)}"
			
 
				         logging.error(error_msg, exc_info=True)
			
 
				         
			
 
				+        batch_result = {
			
 
				+            'summary': {
			
 
				+                'total_files': len(file_paths) if file_paths else 1,
			
 
				+                'success_count': 0,
			
 
				+                'failed_count': len(file_paths) if file_paths else 1,
			
 
				+                'success_rate': 0
			
 
				+            },
			
 
				+            'results': [],
			
 
				+            'processed_time': datetime.now().isoformat()
			
 
				+        }
			
 
				+        
			
 
				         return {
			
 
				             'code': 500,
			
 
				             'success': False,
			
 
				             'message': error_msg,
			
 
				-            'data': None
			
 
				+            'data': batch_result
			
 
				         } 
			
--- a/app/core/data_parse/parse_task.py
+++ b/app/core/data_parse/parse_task.py
@@ -214,12 +214,13 @@ def _validate_files_by_task_type(files, task_type):
 
				     return {'success': True}
			
 
				 
			
 
				 
			
 
				-def _handle_recruitment_task(created_by):
			
 
				+def _handle_recruitment_task(created_by, data=None):
			
 
				     """
			
 
				     处理招聘类型任务（数据库记录，不需要文件上传）
			
 
				     
			
 
				     Args:
			
 
				         created_by (str): 创建者
			
 
				+        data (str): 招聘数据内容
			
 
				         
			
 
				     Returns:
			
 
				         dict: 处理结果
			
@@ -236,10 +237,14 @@ def _handle_recruitment_task(created_by):
 
				             'upload_time': datetime.now().isoformat()
			
 
				         }
			
 
				         
			
 
				+        # 将传入的data参数写入task_source字段
			
 
				+        if data:
			
 
				+            task_source['data'] = data
			
 
				+        
			
 
				         # 创建解析任务记录
			
 
				         parse_task = ParseTaskRepository(
			
 
				             task_name=task_name,
			
 
				-            task_status='待解析',
			
 
				+            task_status='成功',  # 招聘任务不需要实际解析操作，直接设置为成功
			
 
				             task_type='招聘',
			
 
				             task_source=task_source,
			
 
				             collection_count=0,  # 招聘任务不涉及文件收集
			
@@ -252,7 +257,7 @@ def _handle_recruitment_task(created_by):
 
				         db.session.add(parse_task)
			
 
				         db.session.commit()
			
 
				         
			
 
				-        logging.info(f"成功创建招聘任务记录: {task_name}")
			
 
				+        logging.info(f"成功创建招聘任务记录: {task_name}, 包含data参数: {'是' if data else '否'}")
			
 
				         
			
 
				         return {
			
 
				             'code': 200,
			
@@ -350,7 +355,7 @@ def _get_content_type_by_extension(filename):
 
				     return content_type_mapping.get(file_ext, 'application/octet-stream')
			
 
				 
			
 
				 
			
 
				-def add_parse_task(files, task_type, created_by='system'):
			
 
				+def add_parse_task(files, task_type, created_by='system', data=None, publish_time=None):
			
 
				     """
			
 
				     新增解析任务，根据任务类型处理不同类型的文件
			
 
				     
			
@@ -358,6 +363,8 @@ def add_parse_task(files, task_type, created_by='system'):
 
				         files (list): 前端上传的文件数组，每个元素是FileStorage对象
			
 
				         task_type (str): 任务类型，可选值：'名片', '简历', '新任命', '招聘', '杂项'
			
 
				         created_by (str): 创建者，默认为'system'
			
 
				+        data (str): 数据内容，招聘类型必需
			
 
				+        publish_time (str): 发布时间，新任命类型必需
			
 
				         
			
 
				     Returns:
			
 
				         dict: 包含操作结果的字典
			
@@ -382,7 +389,7 @@ def add_parse_task(files, task_type, created_by='system'):
 
				                     'data': None
			
 
				                 }
			
 
				             # 招聘任务处理逻辑
			
 
				-            return _handle_recruitment_task(created_by)
			
 
				+            return _handle_recruitment_task(created_by, data)
			
 
				         
			
 
				         # 其他类型需要验证文件
			
 
				         if not files or not isinstance(files, list):
			
@@ -507,6 +514,10 @@ def add_parse_task(files, task_type, created_by='system'):
 
				             'upload_time': datetime.now().isoformat()
			
 
				         }
			
 
				         
			
 
				+        # 对于新任命类型，在task_source中添加publish_time
			
 
				+        if task_type == '新任命' and publish_time:
			
 
				+            task_source['publish_time'] = publish_time
			
 
				+        
			
 
				         # 创建解析任务记录
			
 
				         try:
			
 
				             parse_task = ParseTaskRepository(
			
@@ -821,10 +832,10 @@ def add_single_talent(talent_data):
 
				 
			
 
				 def add_parsed_talents(api_response_data):
			
 
				     """
			
 
				-    处理execute-parse-task API响应数据，提取人才信息并写入business_cards表
			
 
				+    处理解析任务响应数据，提取人才信息并写入business_cards表
			
 
				     
			
 
				     Args:
			
 
				-        api_response_data (dict): execute-parse-task API的返回数据
			
 
				+        api_response_data (dict): 请求数据，格式为 {"data": {"results": [...]}}
			
 
				         
			
 
				     Returns:
			
 
				         dict: 批量处理结果，格式与其他batch函数保持一致
			
@@ -839,22 +850,13 @@ def add_parsed_talents(api_response_data):
 
				                 'data': None
			
 
				             }
			
 
				         
			
 
				-        # 检查API响应是否成功
			
 
				-        if not api_response_data.get('success', False):
			
 
				-            return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': f"API响应表示处理失败: {api_response_data.get('message', '未知错误')}",
			
 
				-                'data': None
			
 
				-            }
			
 
				-        
			
 
				         # 获取data字段
			
 
				         response_data = api_response_data.get('data')
			
 
				         if not response_data or not isinstance(response_data, dict):
			
 
				             return {
			
 
				                 'code': 400,
			
 
				                 'success': False,
			
 
				-                'message': 'API响应中缺少有效的data字段',
			
 
				+                'message': '请求中缺少有效的data字段',
			
 
				                 'data': None
			
 
				             }
			
 
				         
			
@@ -864,7 +866,7 @@ def add_parsed_talents(api_response_data):
 
				             return {
			
 
				                 'code': 400,
			
 
				                 'success': False,
			
 
				-                'message': 'API响应中的results字段必须是数组',
			
 
				+                'message': '请求中的results字段必须是数组',
			
 
				                 'data': None
			
 
				             }
			
 
				         
			
@@ -872,11 +874,11 @@ def add_parsed_talents(api_response_data):
 
				             return {
			
 
				                 'code': 400,
			
 
				                 'success': False,
			
 
				-                'message': 'API响应中的results数组为空，没有人才数据需要处理',
			
 
				+                'message': '请求中的results数组为空，没有人才数据需要处理',
			
 
				                 'data': None
			
 
				             }
			
 
				         
			
 
				-        logging.info(f"开始处理API响应中的人才数据，共 {len(results)} 条记录")
			
 
				+        logging.info(f"开始处理人才数据，共 {len(results)} 条记录")
			
 
				         
			
 
				         processed_results = []
			
 
				         success_count = 0
			
@@ -914,76 +916,11 @@ def add_parsed_talents(api_response_data):
 
				                     logging.warning(f"第 {i+1} 条记录缺少data字段")
			
 
				                     continue
			
 
				                 
			
 
				-                # 处理不同的数据格式
			
 
				-                talent_data = None
			
 
				-                
			
 
				-                # 检查是否是批量解析结果（如新任命等，包含多个人员）
			
 
				-                if isinstance(item_data, dict):
			
 
				-                    if 'all_results' in item_data and isinstance(item_data['all_results'], list):
			
 
				-                        # 新任命等批量数据格式，包含多个人员
			
 
				-                        all_talents = item_data['all_results']
			
 
				-                        logging.info(f"第 {i+1} 条记录包含 {len(all_talents)} 个人员信息")
			
 
				-                        
			
 
				-                        # 处理每个人员
			
 
				-                        for j, single_talent in enumerate(all_talents):
			
 
				-                            try:
			
 
				-                                talent_result = add_single_talent(single_talent)
			
 
				-                                if talent_result.get('success', False):
			
 
				-                                    success_count += 1
			
 
				-                                    processed_results.append({
			
 
				-                                        'index': i,
			
 
				-                                        'original_index': result_item.get('index', i),
			
 
				-                                        'sub_index': j,
			
 
				-                                        'success': True,
			
 
				-                                        'error': None,
			
 
				-                                        'data': talent_result.get('data'),
			
 
				-                                        'message': f'成功处理人员: {single_talent.get("name_zh", "未知")}'
			
 
				-                                    })
			
 
				-                                    logging.debug(f"成功处理第 {i+1} 条记录中的第 {j+1} 个人员")
			
 
				-                                else:
			
 
				-                                    failed_count += 1
			
 
				-                                    processed_results.append({
			
 
				-                                        'index': i,
			
 
				-                                        'original_index': result_item.get('index', i),
			
 
				-                                        'sub_index': j,
			
 
				-                                        'success': False,
			
 
				-                                        'error': talent_result.get('message', '处理失败'),
			
 
				-                                        'data': None
			
 
				-                                    })
			
 
				-                                    logging.error(f"处理第 {i+1} 条记录中的第 {j+1} 个人员失败")
			
 
				-                            except Exception as talent_error:
			
 
				-                                failed_count += 1
			
 
				-                                error_msg = f"处理人员数据异常: {str(talent_error)}"
			
 
				-                                processed_results.append({
			
 
				-                                    'index': i,
			
 
				-                                    'original_index': result_item.get('index', i),
			
 
				-                                    'sub_index': j,
			
 
				-                                    'success': False,
			
 
				-                                    'error': error_msg,
			
 
				-                                    'data': None
			
 
				-                                })
			
 
				-                                logging.error(error_msg, exc_info=True)
			
 
				-                        continue
			
 
				-                    else:
			
 
				-                        # 单个人员数据格式
			
 
				-                        talent_data = item_data
			
 
				-                elif isinstance(item_data, list) and len(item_data) > 0:
			
 
				-                    # 如果是数组，取第一个元素
			
 
				-                    talent_data = item_data[0]
			
 
				-                else:
			
 
				-                    failed_count += 1
			
 
				-                    processed_results.append({
			
 
				-                        'index': i,
			
 
				-                        'original_index': result_item.get('index', i),
			
 
				-                        'success': False,
			
 
				-                        'error': 'data字段格式不正确，无法识别人才数据',
			
 
				-                        'data': None
			
 
				-                    })
			
 
				-                    logging.warning(f"第 {i+1} 条记录data字段格式不正确")
			
 
				-                    continue
			
 
				+                # 处理人才数据 - 新格式直接使用 item_data
			
 
				+                talent_data = item_data
			
 
				                 
			
 
				                 # 处理单个人才数据
			
 
				-                if talent_data:
			
 
				+                if talent_data and isinstance(talent_data, dict):
			
 
				                     try:
			
 
				                         talent_result = add_single_talent(talent_data)
			
 
				                         if talent_result.get('success', False):
			
@@ -1037,12 +974,10 @@ def add_parsed_talents(api_response_data):
 
				                 'total_files': len(results),
			
 
				                 'success_count': success_count,
			
 
				                 'failed_count': failed_count,
			
 
				-                'success_rate': round((success_count / len(results)) * 100, 2) if len(results) > 0 else 0,
			
 
				-                'original_summary': response_data.get('summary', {})
			
 
				+                'success_rate': round((success_count / len(results)) * 100, 2) if len(results) > 0 else 0
			
 
				             },
			
 
				             'results': processed_results,
			
 
				-            'processed_time': datetime.now().isoformat(),
			
 
				-            'original_api_response': api_response_data  # 保留原始API响应用于调试
			
 
				+            'processed_time': datetime.now().isoformat()
			
 
				         }
			
 
				         
			
 
				         if failed_count == 0:
			
@@ -1068,7 +1003,7 @@ def add_parsed_talents(api_response_data):
 
				             }
			
 
				             
			
 
				     except Exception as e:
			
 
				-        error_msg = f"处理API响应数据失败: {str(e)}"
			
 
				+        error_msg = f"处理人才数据失败: {str(e)}"
			
 
				         logging.error(error_msg, exc_info=True)
			
 
				         
			
 
				         return {
			
--- a/app/core/data_parse/parse_web.py
+++ b/app/core/data_parse/parse_web.py
@@ -9,6 +9,7 @@ from botocore.config import Config
 
				 from io import BytesIO
			
 
				 from datetime import datetime
			
 
				 from openai import OpenAI
			
 
				+from typing import Dict, Any
			
 
				 
			
 
				 # 导入配置和业务逻辑模块
			
 
				 from app.config.config import DevelopmentConfig, ProductionConfig
			
@@ -748,6 +749,67 @@ def process_webpage_with_QWen(markdown_text, publish_time):
 
				         raise Exception(error_msg) 
			
 
				 
			
 
				 
			
 
				+def _convert_webpage_to_card_format(webpage_data: Dict[str, Any], publish_time: str) -> Dict[str, Any]:
			
 
				+    """
			
 
				+    将网页解析的数据转换为标准名片格式，与任务解析结果.txt中的data字段格式一致
			
 
				+    
			
 
				+    Args:
			
 
				+        webpage_data (Dict[str, Any]): 网页解析的原始数据
			
 
				+        publish_time (str): 发布时间
			
 
				+        
			
 
				+    Returns:
			
 
				+        Dict[str, Any]: 标准化后的名片格式数据
			
 
				+    """
			
 
				+    # 构建隶属关系
			
 
				+    affiliation = []
			
 
				+    company = webpage_data.get('hotel_zh', '')
			
 
				+    if company:
			
 
				+        affiliation.append({
			
 
				+            "company": company,
			
 
				+            "group": webpage_data.get('brand_group', '')
			
 
				+        })
			
 
				+    
			
 
				+    # 构建职业轨迹
			
 
				+    career_path = []
			
 
				+    position = webpage_data.get('title_zh', '')
			
 
				+    if position and company:
			
 
				+        career_path.append({
			
 
				+            "date": publish_time if publish_time else datetime.now().strftime('%Y-%m-%d'),
			
 
				+            "hotel_en": webpage_data.get('hotel_en', ''),
			
 
				+            "hotel_zh": company,
			
 
				+            "image_path": webpage_data.get('pic_url', ''),
			
 
				+            "source": "webpage_talent_extraction",
			
 
				+            "title_en": webpage_data.get('title_en', ''),
			
 
				+            "title_zh": position
			
 
				+        })
			
 
				+    
			
 
				+    # 按照任务解析结果.txt的data字段格式组装数据
			
 
				+    standardized = {
			
 
				+        "address_en": webpage_data.get('address_en', ''),
			
 
				+        "address_zh": webpage_data.get('address_zh', ''),
			
 
				+        "affiliation": affiliation,
			
 
				+        "age": webpage_data.get('age', 0),
			
 
				+        "birthday": webpage_data.get('birthday', ''),
			
 
				+        "brand_group": webpage_data.get('brand_group', ''),
			
 
				+        "career_path": career_path,
			
 
				+        "email": webpage_data.get('email', ''),
			
 
				+        "hotel_en": webpage_data.get('hotel_en', ''),
			
 
				+        "hotel_zh": company,
			
 
				+        "mobile": webpage_data.get('mobile', ''),
			
 
				+        "name_en": webpage_data.get('name_en', ''),
			
 
				+        "name_zh": webpage_data.get('name_zh', ''),
			
 
				+        "native_place": webpage_data.get('native_place', ''),
			
 
				+        "phone": webpage_data.get('phone', ''),
			
 
				+        "postal_code_en": webpage_data.get('postal_code_en', ''),
			
 
				+        "postal_code_zh": webpage_data.get('postal_code_zh', ''),
			
 
				+        "residence": webpage_data.get('residence', ''),
			
 
				+        "title_en": webpage_data.get('title_en', ''),
			
 
				+        "title_zh": position
			
 
				+    }
			
 
				+    
			
 
				+    return standardized
			
 
				+
			
 
				+
			
 
				 def batch_process_md(markdown_file_list, publish_time):
			
 
				     """
			
 
				     批量处理包含多个人员信息的markdown文件
			
@@ -757,24 +819,32 @@ def batch_process_md(markdown_file_list, publish_time):
 
				         publish_time (str): 发布时间，用于career_path中的date字段
			
 
				         
			
 
				     Returns:
			
 
				-        dict: 批量处理结果，格式与batch_process_business_card_images保持一致
			
 
				+        dict: 批量处理结果，格式与parse_result保持一致
			
 
				     """
			
 
				     try:
			
 
				         # 参数验证
			
 
				         if not markdown_file_list or not isinstance(markdown_file_list, list):
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': 'markdown_file_list参数必须是非空数组',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": len(markdown_file_list) if markdown_file_list else 0,
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": len(markdown_file_list) if markdown_file_list else 0
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         if not publish_time or not isinstance(publish_time, str):
			
 
				             return {
			
 
				-                'code': 400,
			
 
				-                'success': False,
			
 
				-                'message': 'publish_time参数必须是非空字符串',
			
 
				-                'data': None
			
 
				+                "processed_time": datetime.now().isoformat(),
			
 
				+                "results": [],
			
 
				+                "summary": {
			
 
				+                    "failed_count": len(markdown_file_list),
			
 
				+                    "success_count": 0,
			
 
				+                    "success_rate": 0,
			
 
				+                    "total_files": len(markdown_file_list)
			
 
				+                }
			
 
				             }
			
 
				         
			
 
				         logging.info(f"开始批量处理 {len(markdown_file_list)} 个markdown文件")
			
@@ -782,7 +852,7 @@ def batch_process_md(markdown_file_list, publish_time):
 
				         results = []
			
 
				         success_count = 0
			
 
				         failed_count = 0
			
 
				-        total_persons = 0
			
 
				+        total_records = 0  # 总记录数（人员数）
			
 
				         
			
 
				         # 逐个处理每个markdown文件
			
 
				         for i, minio_path in enumerate(markdown_file_list):
			
@@ -793,44 +863,74 @@ def batch_process_md(markdown_file_list, publish_time):
 
				                 file_result = process_single_markdown_file(minio_path, publish_time)
			
 
				                 
			
 
				                 if file_result.get('success', False):
			
 
				-                    success_count += 1
			
 
				-                    persons_count = file_result.get('data', {}).get('total_persons', 0)
			
 
				-                    total_persons += persons_count
			
 
				+                    # 提取处理结果中的人员信息
			
 
				+                    persons_data = file_result.get('data', {}).get('all_results', [])
			
 
				                     
			
 
				-                    results.append({
			
 
				-                        'index': i,
			
 
				-                        'minio_path': minio_path,
			
 
				-                        'filename': minio_path.split('/')[-1] if '/' in minio_path else minio_path,
			
 
				-                        'success': True,
			
 
				-                        'error': None,
			
 
				-                        'data': file_result.get('data'),
			
 
				-                        'message': f'处理成功，提取 {persons_count} 个人员信息'
			
 
				-                    })
			
 
				-                    logging.info(f"成功处理第 {i+1} 个文件: {minio_path}，提取 {persons_count} 个人员信息")
			
 
				+                    if persons_data and isinstance(persons_data, list):
			
 
				+                        # 为每个人员创建一个结果记录
			
 
				+                        for person_idx, person_data in enumerate(persons_data):
			
 
				+                            total_records += 1
			
 
				+                            # 转换为标准名片格式
			
 
				+                            standardized_data = _convert_webpage_to_card_format(person_data, publish_time)
			
 
				+                            
			
 
				+                            success_count += 1
			
 
				+                            results.append({
			
 
				+                                "data": standardized_data,
			
 
				+                                "error": None,
			
 
				+                                "filename": minio_path.split('/')[-1] if '/' in minio_path else minio_path,
			
 
				+                                "index": len(results),  # 使用连续的索引
			
 
				+                                "message": "网页人才信息解析成功",
			
 
				+                                "minio_path": minio_path,
			
 
				+                                "object_key": minio_path,
			
 
				+                                "success": True
			
 
				+                            })
			
 
				+                            logging.info(f"成功提取人员 {person_idx+1}: {person_data.get('name_zh', 'Unknown')}")
			
 
				+                    else:
			
 
				+                        # 没有提取到有效数据，这算作一个失败记录
			
 
				+                        total_records += 1
			
 
				+                        failed_count += 1
			
 
				+                        results.append({
			
 
				+                            "data": None,
			
 
				+                            "error": "未从markdown文件中提取到人员信息",
			
 
				+                            "filename": minio_path.split('/')[-1] if '/' in minio_path else minio_path,
			
 
				+                            "index": len(results),
			
 
				+                            "message": "网页人才信息解析失败",
			
 
				+                            "minio_path": minio_path,
			
 
				+                            "object_key": minio_path,
			
 
				+                            "success": False
			
 
				+                        })
			
 
				+                        logging.warning(f"第 {i+1} 个文件未提取到人员信息")
			
 
				                 else:
			
 
				+                    # 文件处理失败，算作一个失败记录
			
 
				+                    total_records += 1
			
 
				                     failed_count += 1
			
 
				                     error_msg = file_result.get('message', '处理失败')
			
 
				                     results.append({
			
 
				-                        'index': i,
			
 
				-                        'minio_path': minio_path,
			
 
				-                        'filename': minio_path.split('/')[-1] if '/' in minio_path else minio_path,
			
 
				-                        'success': False,
			
 
				-                        'error': error_msg,
			
 
				-                        'data': None
			
 
				+                        "data": None,
			
 
				+                        "error": error_msg,
			
 
				+                        "filename": minio_path.split('/')[-1] if '/' in minio_path else minio_path,
			
 
				+                        "index": len(results),
			
 
				+                        "message": "网页人才信息解析失败",
			
 
				+                        "minio_path": minio_path,
			
 
				+                        "object_key": minio_path,
			
 
				+                        "success": False
			
 
				                     })
			
 
				                     logging.error(f"处理第 {i+1} 个文件失败: {error_msg}")
			
 
				                     
			
 
				             except Exception as item_error:
			
 
				+                total_records += 1
			
 
				                 failed_count += 1
			
 
				                 error_msg = f"处理markdown文件失败: {str(item_error)}"
			
 
				                 logging.error(error_msg, exc_info=True)
			
 
				                 results.append({
			
 
				-                    'index': i,
			
 
				-                    'minio_path': minio_path,
			
 
				-                    'filename': minio_path.split('/')[-1] if '/' in minio_path else minio_path,
			
 
				-                    'success': False,
			
 
				-                    'error': error_msg,
			
 
				-                    'data': None
			
 
				+                    "data": None,
			
 
				+                    "error": error_msg,
			
 
				+                    "filename": minio_path.split('/')[-1] if '/' in minio_path else minio_path,
			
 
				+                    "index": len(results),
			
 
				+                    "message": "网页人才信息解析失败",
			
 
				+                    "minio_path": minio_path,
			
 
				+                    "object_key": minio_path,
			
 
				+                    "success": False
			
 
				                 })
			
 
				         
			
 
				         # 组装最终结果
			
@@ -839,8 +939,7 @@ def batch_process_md(markdown_file_list, publish_time):
 
				                 'total_files': len(markdown_file_list),
			
 
				                 'success_count': success_count,
			
 
				                 'failed_count': failed_count,
			
 
				-                'success_rate': round((success_count / len(markdown_file_list)) * 100, 2) if len(markdown_file_list) > 0 else 0,
			
 
				-                'total_persons': total_persons
			
 
				+                'success_rate': round((success_count / len(markdown_file_list)) * 100, 2) if len(markdown_file_list) > 0 else 0
			
 
				             },
			
 
				             'results': results,
			
 
				             'processed_time': datetime.now().isoformat()
			
@@ -850,7 +949,7 @@ def batch_process_md(markdown_file_list, publish_time):
 
				             return {
			
 
				                 'code': 200,
			
 
				                 'success': True,
			
 
				-                'message': f'批量处理完成，全部 {success_count} 个文件处理成功，共提取 {total_persons} 个人员信息',
			
 
				+                'message': f'批量处理完成，全部 {success_count} 个文件处理成功',
			
 
				                 'data': batch_result
			
 
				             }
			
 
				         elif success_count == 0:
			
@@ -864,18 +963,30 @@ def batch_process_md(markdown_file_list, publish_time):
 
				             return {
			
 
				                 'code': 206,  # Partial Content
			
 
				                 'success': True,
			
 
				-                'message': f'批量处理部分成功，成功 {success_count} 个，失败 {failed_count} 个，共提取 {total_persons} 个人员信息',
			
 
				+                'message': f'批量处理部分成功，成功 {success_count} 个，失败 {failed_count} 个',
			
 
				                 'data': batch_result
			
 
				             }
			
 
				             
			
 
				     except Exception as e:
			
 
				         error_msg = f"batch_process_md函数执行失败: {str(e)}"
			
 
				         logging.error(error_msg, exc_info=True)
			
 
				+        
			
 
				+        batch_result = {
			
 
				+            'summary': {
			
 
				+                'total_files': len(markdown_file_list) if markdown_file_list else 1,
			
 
				+                'success_count': 0,
			
 
				+                'failed_count': len(markdown_file_list) if markdown_file_list else 1,
			
 
				+                'success_rate': 0
			
 
				+            },
			
 
				+            'results': [],
			
 
				+            'processed_time': datetime.now().isoformat()
			
 
				+        }
			
 
				+        
			
 
				         return {
			
 
				             'code': 500,
			
 
				             'success': False,
			
 
				             'message': error_msg,
			
 
				-            'data': None
			
 
				+            'data': batch_result
			
 
				         }
			
 
				 
			
 
				 
			
@@ -885,7 +996,7 @@ def get_markdown_from_minio(minio_client, minio_path):
 
				     
			
 
				     Args:
			
 
				         minio_client: MinIO客户端
			
 
				-        minio_path (str): MinIO中的文件路径
			
 
				+        minio_path (str): MinIO中的文件路径或完整URL
			
 
				         
			
 
				     Returns:
			
 
				         str: 文件内容，如果失败返回None
			
@@ -893,8 +1004,16 @@ def get_markdown_from_minio(minio_client, minio_path):
 
				     try:
			
 
				         logging.info(f"从MinIO获取文件: {minio_path}")
			
 
				         
			
 
				+        # 如果是完整的URL，提取对象键
			
 
				+        object_key = _extract_object_key_from_url(minio_path)
			
 
				+        if object_key is None:
			
 
				+            logging.error(f"无法从URL中提取有效的对象键: {minio_path}")
			
 
				+            return None
			
 
				+        if object_key != minio_path:
			
 
				+            logging.info(f"从URL提取的对象键: {object_key}")
			
 
				+        
			
 
				         # 从MinIO下载文件
			
 
				-        response = minio_client.get_object(Bucket=minio_bucket, Key=minio_path)
			
 
				+        response = minio_client.get_object(Bucket=minio_bucket, Key=object_key)
			
 
				         
			
 
				         # 读取文件内容
			
 
				         content = response['Body'].read()
			
@@ -921,6 +1040,46 @@ def get_markdown_from_minio(minio_client, minio_path):
 
				         return None
			
 
				 
			
 
				 
			
 
				+def _extract_object_key_from_url(minio_url):
			
 
				+    """
			
 
				+    从MinIO完整URL中提取对象键名
			
 
				+    
			
 
				+    Args:
			
 
				+        minio_url (str): 完整的MinIO URL，如 "http://host:port/bucket/path/to/file.md"
			
 
				+        
			
 
				+    Returns:
			
 
				+        str: 对象键名，如 "path/to/file.md"，失败时返回原始字符串或None
			
 
				+    """
			
 
				+    try:
			
 
				+        if not minio_url or not isinstance(minio_url, str):
			
 
				+            return None
			
 
				+            
			
 
				+        # 移除协议部分 (http:// 或 https://)
			
 
				+        if minio_url.startswith('https://'):
			
 
				+            url_without_protocol = minio_url[8:]
			
 
				+        elif minio_url.startswith('http://'):
			
 
				+            url_without_protocol = minio_url[7:]
			
 
				+        else:
			
 
				+            # 如果没有协议前缀，假设是相对路径，直接返回
			
 
				+            return minio_url
			
 
				+        
			
 
				+        # 分割路径部分
			
 
				+        parts = url_without_protocol.split('/')
			
 
				+        
			
 
				+        # 至少需要包含 host:port/bucket/object
			
 
				+        if len(parts) < 3:
			
 
				+            return None
			
 
				+        
			
 
				+        # 跳过host:port和bucket，获取对象路径
			
 
				+        object_key = '/'.join(parts[2:])
			
 
				+        
			
 
				+        return object_key if object_key else None
			
 
				+        
			
 
				+    except Exception as e:
			
 
				+        logging.error(f"解析MinIO URL失败: {str(e)}")
			
 
				+        return None
			
 
				+
			
 
				+
			
 
				 def save_section_to_minio(minio_client, section_content, original_minio_path, section_number):
			
 
				     """
			
 
				     将分割后的markdown内容保存到MinIO
			
--- a/任务解析结果.txt
+++ b/任务解析结果.txt
@@ -0,0 +1,57 @@
 
				+parse_result:{
			
 
				+  "processed_time": "2025-07-21T14:59:08.416455",
			
 
				+  "results": [
			
 
				+    {
			
 
				+      "data": {
			
 
				+        "address_en": "",
			
 
				+        "address_zh": "苏州市吴中区木渎镇花苑东路726号3幢",
			
 
				+        "affiliation": [
			
 
				+          {
			
 
				+            "company": "苏州木渎古镇ROSSO酒店",
			
 
				+            "group": ""
			
 
				+          }
			
 
				+        ],
			
 
				+        "age": 0,
			
 
				+        "birthday": "",
			
 
				+        "brand_group": "",
			
 
				+        "career_path": [
			
 
				+          {
			
 
				+            "date": "2025-07-21",
			
 
				+            "hotel_en": "",
			
 
				+            "hotel_zh": "苏州木渎古镇ROSSO酒店",
			
 
				+            "image_path": "",
			
 
				+            "source": "business_card_creation",
			
 
				+            "title_en": "Sales Director",
			
 
				+            "title_zh": "销售总监"
			
 
				+          }
			
 
				+        ],
			
 
				+        "email": "cw928383712@163.com",
			
 
				+        "hotel_en": "",
			
 
				+        "hotel_zh": "苏州木渎古镇ROSSO酒店",
			
 
				+        "mobile": "13073381364",
			
 
				+        "name_en": "",
			
 
				+        "name_zh": "陈玮",
			
 
				+        "native_place": "",
			
 
				+        "phone": "0512-66563999",
			
 
				+        "postal_code_en": "",
			
 
				+        "postal_code_zh": "",
			
 
				+        "residence": "",
			
 
				+        "title_en": "Sales Director",
			
 
				+        "title_zh": "销售总监"
			
 
				+      },
			
 
				+      "error": null,
			
 
				+      "filename": "talent_photo_20250721_145849_b47a70cc.jpg",
			
 
				+      "index": 0,
			
 
				+      "message": "名片图片解析成功",
			
 
				+      "minio_path": "http://192.168.3.143:9000/dataops-bucket/talent_photos/talent_photo_20250721_145849_b47a70cc.jpg",
			
 
				+      "object_key": "talent_photos/talent_photo_20250721_145849_b47a70cc.jpg",
			
 
				+      "success": true
			
 
				+    }
			
 
				+  ],
			
 
				+  "summary": {
			
 
				+    "failed_count": 0,
			
 
				+    "success_count": 1,
			
 
				+    "success_rate": 100,
			
 
				+    "total_files": 1
			
 
				+  }
			
 
				+}