routes.py 65 KB


  1. from flask import jsonify, request, make_response, Blueprint, current_app, send_file
  2. from app.api.data_parse import bp
  3. from app.core.data_parse.parse_system import (
  4. update_business_card,
  5. get_business_cards,
  6. update_business_card_status,
  7. create_talent_tag,
  8. get_talent_tag_list,
  9. update_talent_tag,
  10. delete_talent_tag,
  11. query_neo4j_graph,
  12. talent_get_tags,
  13. talent_update_tags,
  14. get_business_card,
  15. search_business_cards_by_mobile,
  16. get_duplicate_records,
  17. process_duplicate_record,
  18. get_duplicate_record_detail,
  19. fix_broken_duplicate_records
  20. )
  21. # 导入解析任务相关函数
  22. from app.core.data_parse.parse_task import (
  23. get_parse_tasks,
  24. get_parse_task_detail,
  25. add_parse_task
  26. )
  27. # 导入酒店管理相关函数
  28. from app.core.data_parse.hotel_management import (
  29. get_hotel_positions_list,
  30. add_hotel_positions,
  31. update_hotel_positions,
  32. query_hotel_positions,
  33. delete_hotel_positions,
  34. get_hotel_group_brands_list,
  35. add_hotel_group_brands,
  36. update_hotel_group_brands,
  37. query_hotel_group_brands,
  38. delete_hotel_group_brands
  39. )
  40. # 导入新的名片图片解析函数和添加名片函数
  41. from app.core.data_parse.parse_card import process_business_card_image, add_business_card, delete_business_card
  42. # 导入网页文本解析函数
  43. from app.core.data_parse.parse_web import process_webpage_with_QWen, add_webpage_talent
  44. from app.config.config import DevelopmentConfig, ProductionConfig
  45. import logging
  46. import boto3
  47. from botocore.config import Config
  48. from botocore.exceptions import ClientError
  49. from io import BytesIO
  50. import base64
  51. import os
  52. import urllib.parse
  53. from minio import Minio
  54. # Define logger
  55. logger = logging.getLogger(__name__)
  56. # For failure responses
  57. def failed(message, code=500):
  58. return {
  59. 'success': False,
  60. 'message': message,
  61. 'data': None
  62. }, code
  63. # 根据环境选择配置
  64. if os.environ.get('FLASK_ENV') == 'production':
  65. config = ProductionConfig()
  66. else:
  67. config = DevelopmentConfig()
  68. # 使用配置变量
  69. minio_url = f"{'https' if config.MINIO_SECURE else 'http'}://{config.MINIO_HOST}"
  70. minio_access_key = config.MINIO_USER
  71. minio_secret_key = config.MINIO_PASSWORD
  72. minio_bucket = config.MINIO_BUCKET
  73. use_ssl = config.MINIO_SECURE
  74. def get_minio_client():
  75. """获取 MinIO 客户端实例"""
  76. return Minio(
  77. '192.168.3.143:9000',
  78. access_key=config.MINIO_USER,
  79. secret_key=config.MINIO_PASSWORD,
  80. secure=config.MINIO_SECURE
  81. )
  82. # 名片解析接口
  83. @bp.route('/business-card-parse', methods=['POST'])
  84. def parse_business_card_route():
  85. """
  86. 解析名片图片并提取信息的API接口(仅解析,不保存到数据库)
  87. 请求参数:
  88. - image: 名片图片文件 (multipart/form-data)
  89. 返回:
  90. - JSON: 包含提取的名片信息和处理状态
  91. 注意:此接口仅负责图片解析和信息提取,不会将数据保存到数据库
  92. """
  93. # 检查是否上传了文件
  94. if 'image' not in request.files:
  95. return jsonify({
  96. 'success': False,
  97. 'message': '未上传图片',
  98. 'data': None
  99. }), 400
  100. image_file = request.files['image']
  101. # 检查文件是否为空
  102. if image_file.filename == '':
  103. return jsonify({
  104. 'success': False,
  105. 'message': '未选择文件',
  106. 'data': None
  107. }), 400
  108. # 检查文件类型是否为图片
  109. if not image_file.content_type.startswith('image/'):
  110. return jsonify({
  111. 'success': False,
  112. 'message': '上传的文件不是图片',
  113. 'data': None
  114. }), 400
  115. # 处理名片图片
  116. result = process_business_card_image(image_file)
  117. if result['success']:
  118. return jsonify(result), 200
  119. else:
  120. return jsonify(result), 500
  121. # 添加名片记录接口
  122. @bp.route('/add-business-card', methods=['POST'])
  123. def add_business_card_route():
  124. """
  125. 添加名片记录的API接口(解析图片并保存到数据库)
  126. 请求参数:
  127. - card_data: 名片信息数据 (JSON格式,可以通过form-data或JSON body传递)
  128. - image: 名片图片文件 (multipart/form-data,可选)
  129. 返回:
  130. - JSON: 包含保存结果和处理状态
  131. 注意:此接口负责业务逻辑处理,包括重复检查、MinIO上传和数据库保存
  132. """
  133. try:
  134. # 获取名片数据 - 支持两种方式
  135. card_data = None
  136. # 方式1:通过JSON body传递
  137. if request.is_json:
  138. card_data = request.get_json()
  139. # 方式2:通过form-data传递card_data字段
  140. elif 'card_data' in request.form:
  141. import json
  142. try:
  143. card_data = json.loads(request.form['card_data'])
  144. except json.JSONDecodeError:
  145. return jsonify({
  146. 'success': False,
  147. 'message': 'card_data格式错误,必须是有效的JSON字符串',
  148. 'data': None
  149. }), 400
  150. # 检查是否提供了名片数据
  151. if not card_data:
  152. return jsonify({
  153. 'success': False,
  154. 'message': '未提供名片数据,请通过JSON body或form-data的card_data字段传递',
  155. 'data': None
  156. }), 400
  157. # 获取可选的图片文件
  158. image_file = None
  159. if 'image' in request.files:
  160. image_file = request.files['image']
  161. # 检查文件是否为空
  162. if image_file.filename == '':
  163. image_file = None
  164. # 检查文件类型是否为图片
  165. elif not image_file.content_type.startswith('image/'):
  166. return jsonify({
  167. 'success': False,
  168. 'message': '上传的文件不是图片',
  169. 'data': None
  170. }), 400
  171. # 调用业务逻辑函数处理名片数据
  172. result = add_business_card(card_data, image_file)
  173. # 根据处理结果设置HTTP状态码
  174. if result['success']:
  175. if result['code'] == 200:
  176. status_code = 200
  177. elif result['code'] == 202:
  178. status_code = 202 # Accepted - 创建成功但有疑似重复记录
  179. else:
  180. status_code = 200
  181. else:
  182. if result['code'] == 400:
  183. status_code = 400
  184. else:
  185. status_code = 500
  186. return jsonify(result), status_code
  187. except Exception as e:
  188. logger.error(f"添加名片记录失败: {str(e)}")
  189. return jsonify({
  190. 'success': False,
  191. 'message': f'添加名片记录失败: {str(e)}',
  192. 'data': None
  193. }), 500
  194. # 更新名片信息接口
  195. @bp.route('/business-cards/<int:card_id>', methods=['PUT'])
  196. def update_business_card_route(card_id):
  197. """
  198. 更新名片信息的API接口
  199. 路径参数:
  200. - card_id: 名片记录ID
  201. 请求参数:
  202. - JSON格式的名片信息
  203. 返回:
  204. - JSON: 包含更新后的名片信息和处理状态
  205. """
  206. # 获取请求数据
  207. data = request.json
  208. if not data:
  209. return jsonify({
  210. 'success': False,
  211. 'message': '请求数据为空',
  212. 'data': None
  213. }), 400
  214. # 调用业务逻辑函数处理更新
  215. result = update_business_card(card_id, data)
  216. # 根据处理结果设置HTTP状态码
  217. status_code = 200 if result['success'] else 500
  218. if 'not found' in result.get('message', '').lower() or '未找到' in result.get('message', ''):
  219. status_code = 404
  220. return jsonify(result), status_code
  221. # 获取所有名片记录的API接口
  222. @bp.route('/get-business-cards', methods=['GET'])
  223. def get_business_cards_route():
  224. """
  225. 获取所有名片记录的API接口
  226. 返回:
  227. - JSON: 包含名片记录列表和处理状态
  228. """
  229. # 调用业务逻辑函数获取名片列表
  230. result = get_business_cards()
  231. # 根据处理结果设置HTTP状态码
  232. status_code = 200 if result['success'] else 500
  233. return jsonify(result), status_code
  234. @bp.route('/update-business-cards/<int:card_id>/status', methods=['PUT'])
  235. def update_business_card_status_route(card_id):
  236. """
  237. 更新名片状态的API接口
  238. 路径参数:
  239. - card_id: 名片记录ID
  240. 请求参数:
  241. - JSON格式,包含status字段
  242. 返回:
  243. - JSON: 包含更新后的名片信息和处理状态
  244. """
  245. # 获取请求数据
  246. data = request.json
  247. if not data or 'status' not in data:
  248. return jsonify({
  249. 'success': False,
  250. 'message': '请求数据为空或缺少status字段',
  251. 'data': None
  252. }), 400
  253. status = data['status']
  254. # 调用业务逻辑函数处理状态更新
  255. result = update_business_card_status(card_id, status)
  256. # 根据处理结果设置HTTP状态码
  257. status_code = 200 if result['success'] else 500
  258. if 'not found' in result.get('message', '').lower() or '未找到' in result.get('message', ''):
  259. status_code = 404
  260. return jsonify(result), status_code
  261. # 从MinIO获取名片图片的API接口
  262. @bp.route('/business-cards/image/<path:image_path>', methods=['GET'])
  263. def get_business_card_image(image_path):
  264. """
  265. 从MinIO获取名片图片的API接口
  266. 路径参数:
  267. - image_path: MinIO中的图片路径
  268. 返回:
  269. - 图片数据流
  270. """
  271. try:
  272. # 记录下载请求信息,便于调试
  273. logger.info(f"获取名片图片请求: {image_path}")
  274. # 获取 MinIO 客户端
  275. minio_client = get_minio_client()
  276. if not minio_client:
  277. return jsonify(failed("MinIO客户端初始化失败")), 500
  278. try:
  279. # 使用正确的MinIO客户端方法
  280. data = minio_client.get_object(minio_bucket, image_path)
  281. # 创建内存文件流
  282. file_stream = BytesIO(data.read())
  283. # 获取文件名
  284. file_name = image_path.split('/')[-1]
  285. # 返回文件
  286. return send_file(
  287. file_stream,
  288. as_attachment=False, # 设置为False,让浏览器直接显示图片
  289. download_name=file_name,
  290. mimetype='image/jpeg' # 根据实际图片类型设置
  291. )
  292. except Exception as e:
  293. logger.error(f"MinIO获取文件失败: {str(e)}")
  294. return jsonify(failed(f"文件获取失败: {str(e)}")), 404
  295. except Exception as e:
  296. logger.error(f"文件下载失败: {str(e)}")
  297. return jsonify(failed(str(e))), 500
  298. finally:
  299. # 确保关闭数据流
  300. if 'data' in locals():
  301. data.close()
  302. # 创建人才标签接口
  303. @bp.route('/create-talent-tag', methods=['POST'])
  304. def create_talent_tag_route():
  305. """
  306. 创建人才标签的API接口
  307. 请求参数:
  308. - JSON格式,包含以下字段:
  309. - name: 标签名称
  310. - category: 标签分类
  311. - description: 标签描述
  312. - status: 启用状态,默认为'active'
  313. 返回:
  314. - JSON: 包含创建结果和标签信息
  315. """
  316. try:
  317. # 获取请求数据
  318. data = request.get_json()
  319. if not data:
  320. return jsonify({
  321. 'success': False,
  322. 'message': '请求数据为空',
  323. 'data': None
  324. }), 400
  325. # 验证必要字段
  326. if 'name' not in data or not data['name']:
  327. return jsonify({
  328. 'success': False,
  329. 'message': '标签名称不能为空',
  330. 'data': None
  331. }), 400
  332. # 处理分类字段,如果未提供则设置默认值
  333. if 'category' not in data or not data['category']:
  334. data['category'] = '未分类'
  335. # 调用业务逻辑函数处理创建
  336. result = create_talent_tag(data)
  337. # 根据处理结果设置HTTP状态码
  338. status_code = 200 if result['success'] else 500
  339. return jsonify(result), status_code
  340. except Exception as e:
  341. logger.error(f"创建人才标签失败: {str(e)}")
  342. return jsonify({
  343. 'success': False,
  344. 'message': f'创建人才标签失败: {str(e)}',
  345. 'data': None
  346. }), 500
  347. # 获取人才标签列表接口
  348. @bp.route('/get-talent-tag-list', methods=['GET'])
  349. def get_talent_tag_list_route():
  350. """
  351. 获取人才标签列表的API接口
  352. 返回:
  353. - JSON: 包含人才标签列表和处理状态
  354. """
  355. try:
  356. # 调用业务逻辑函数获取人才标签列表
  357. result = get_talent_tag_list()
  358. # 根据处理结果设置HTTP状态码
  359. status_code = 200 if result['success'] else 500
  360. return jsonify(result), status_code
  361. except Exception as e:
  362. logger.error(f"获取人才标签列表失败: {str(e)}")
  363. return jsonify({
  364. 'success': False,
  365. 'message': f'获取人才标签列表失败: {str(e)}',
  366. 'data': []
  367. }), 500
  368. # 更新人才标签接口
  369. @bp.route('/update-talent-tag/<int:tag_id>', methods=['PUT'])
  370. def update_talent_tag_route(tag_id):
  371. """
  372. 更新人才标签的API接口
  373. 路径参数:
  374. - tag_id: 标签节点ID
  375. 请求参数:
  376. - JSON格式,可能包含以下字段:
  377. - name: 标签名称
  378. - category: 标签分类
  379. - description: 标签描述
  380. - status: 启用状态
  381. 返回:
  382. - JSON: 包含更新结果和标签信息
  383. """
  384. try:
  385. # 获取请求数据
  386. data = request.get_json()
  387. if not data:
  388. return jsonify({
  389. 'success': False,
  390. 'message': '请求数据为空',
  391. 'data': None
  392. }), 400
  393. # 调用业务逻辑函数处理更新
  394. result = update_talent_tag(tag_id, data)
  395. # 根据处理结果设置HTTP状态码
  396. if not result['success']:
  397. if result['code'] == 404:
  398. status_code = 404
  399. elif result['code'] == 400:
  400. status_code = 400
  401. else:
  402. status_code = 500
  403. else:
  404. status_code = 200
  405. return jsonify(result), status_code
  406. except Exception as e:
  407. logger.error(f"更新人才标签失败: {str(e)}")
  408. return jsonify({
  409. 'success': False,
  410. 'message': f'更新人才标签失败: {str(e)}',
  411. 'data': None
  412. }), 500
  413. # 删除人才标签接口
  414. @bp.route('/delete-talent-tag/<int:tag_id>', methods=['DELETE'])
  415. def delete_talent_tag_route(tag_id):
  416. """
  417. 删除人才标签的API接口
  418. 路径参数:
  419. - tag_id: 标签节点ID
  420. 返回:
  421. - JSON: 包含删除结果和被删除的标签信息
  422. """
  423. try:
  424. # 调用业务逻辑函数执行删除
  425. result = delete_talent_tag(tag_id)
  426. # 根据处理结果设置HTTP状态码
  427. if not result['success']:
  428. if result['code'] == 404:
  429. status_code = 404
  430. else:
  431. status_code = 500
  432. else:
  433. status_code = 200
  434. return jsonify(result), status_code
  435. except Exception as e:
  436. logger.error(f"删除人才标签失败: {str(e)}")
  437. return jsonify({
  438. 'success': False,
  439. 'message': f'删除人才标签失败: {str(e)}',
  440. 'data': None
  441. }), 500
  442. @bp.route('/query-kg', methods=['POST'])
  443. def query_kg():
  444. """
  445. 查询知识图谱API接口
  446. 请求参数:
  447. - query_requirement: 查询需求描述(JSON格式)
  448. 返回:
  449. - JSON: 包含查询结果和处理状态
  450. """
  451. try:
  452. # 获取请求数据
  453. data = request.json
  454. if not data or 'query_requirement' not in data:
  455. return jsonify({
  456. 'code': 400,
  457. 'success': False,
  458. 'message': '请求数据为空或缺少query_requirement字段',
  459. 'data': []
  460. }), 400
  461. query_requirement = data['query_requirement']
  462. # 调用业务逻辑函数执行查询
  463. result = query_neo4j_graph(query_requirement)
  464. # 根据处理结果设置HTTP状态码
  465. status_code = 200 if result['success'] else 500
  466. return jsonify(result), status_code
  467. except Exception as e:
  468. logger.error(f"查询知识图谱失败: {str(e)}")
  469. return jsonify({
  470. 'code': 500,
  471. 'success': False,
  472. 'message': f"查询知识图谱失败: {str(e)}",
  473. 'data': []
  474. }), 500
  475. @bp.route('/talent-get-tags/<int:talent_id>', methods=['GET'])
  476. def talent_get_tags_route(talent_id):
  477. """
  478. 获取人才标签的API接口
  479. 路径参数:
  480. - talent_id: 人才节点ID
  481. 返回:
  482. - JSON: 包含人才关联的标签列表和处理状态
  483. """
  484. try:
  485. # 调用业务逻辑函数获取人才标签
  486. result = talent_get_tags(talent_id)
  487. # 根据处理结果设置HTTP状态码
  488. status_code = 200 if result['success'] else 500
  489. return jsonify(result), status_code
  490. except Exception as e:
  491. logger.error(f"获取人才标签失败: {str(e)}")
  492. return jsonify({
  493. 'code': 500,
  494. 'success': False,
  495. 'message': f"获取人才标签失败: {str(e)}",
  496. 'data': []
  497. }), 500
  498. @bp.route('/talent-update-tags', methods=['POST'])
  499. def talent_update_tags_route():
  500. """
  501. 更新人才标签关系的API接口
  502. 请求参数:
  503. - JSON数组,包含talent和tag字段的对象列表
  504. 例如: [
  505. {"talent": 12345, "tag": "市场营销"},
  506. {"talent": 12345, "tag": "酒店管理"}
  507. ]
  508. 返回:
  509. - JSON: 包含更新结果的状态信息
  510. """
  511. try:
  512. # 获取请求数据
  513. data = request.json
  514. if not data:
  515. return jsonify({
  516. 'code': 400,
  517. 'success': False,
  518. 'message': '请求数据为空',
  519. 'data': None
  520. }), 400
  521. # 调用业务逻辑函数处理标签关系更新
  522. result = talent_update_tags(data)
  523. # 根据处理结果设置HTTP状态码
  524. if result['code'] == 200:
  525. status_code = 200
  526. elif result['code'] == 206:
  527. status_code = 206 # Partial Content
  528. elif result['code'] == 400:
  529. status_code = 400 # Bad Request
  530. elif result['code'] == 404:
  531. status_code = 404 # Not Found
  532. else:
  533. status_code = 500 # Internal Server Error
  534. return jsonify(result), status_code
  535. except Exception as e:
  536. logger.error(f"更新人才标签关系失败: {str(e)}")
  537. return jsonify({
  538. 'code': 500,
  539. 'success': False,
  540. 'message': f"更新人才标签关系失败: {str(e)}",
  541. 'data': None
  542. }), 500
  543. # 测试MinIO连接
  544. def test_minio_connection():
  545. """测试MinIO连接是否正常"""
  546. try:
  547. client = get_minio_client()
  548. if client.bucket_exists(minio_bucket):
  549. return {
  550. 'success': True,
  551. 'message': f'连接MinIO服务器成功,存储桶 {minio_bucket} 存在',
  552. 'config': {
  553. 'host': config.MINIO_HOST,
  554. 'bucket': minio_bucket,
  555. 'secure': use_ssl
  556. }
  557. }
  558. else:
  559. return {
  560. 'success': False,
  561. 'message': f'连接MinIO服务器成功,但存储桶 {minio_bucket} 不存在',
  562. 'config': {
  563. 'host': config.MINIO_HOST,
  564. 'bucket': minio_bucket,
  565. 'secure': use_ssl
  566. }
  567. }
  568. except Exception as e:
  569. return {
  570. 'success': False,
  571. 'message': f'连接MinIO服务器失败: {str(e)}',
  572. 'config': {
  573. 'host': config.MINIO_HOST,
  574. 'bucket': minio_bucket,
  575. 'secure': use_ssl
  576. }
  577. }
  578. # MinIO测试接口
  579. @bp.route('/test-minio-connection', methods=['GET'])
  580. def test_minio_connection_route():
  581. """
  582. 测试MinIO连接的API接口
  583. 返回:
  584. - JSON: 包含连接测试结果
  585. """
  586. try:
  587. result = test_minio_connection()
  588. status_code = 200 if result['success'] else 500
  589. return jsonify(result), status_code
  590. except Exception as e:
  591. logger.error(f"测试MinIO连接失败: {str(e)}")
  592. return jsonify({
  593. 'success': False,
  594. 'message': f'测试MinIO连接失败: {str(e)}',
  595. 'config': {
  596. 'host': config.MINIO_HOST,
  597. 'bucket': minio_bucket,
  598. 'secure': use_ssl
  599. }
  600. }), 500
  601. # 获取单个名片记录的API接口
  602. @bp.route('/get-business-card/<int:card_id>', methods=['GET'])
  603. def get_business_card_route(card_id):
  604. """
  605. 获取单个名片记录的API接口
  606. 路径参数:
  607. - card_id: 名片记录ID
  608. 返回:
  609. - JSON: 包含名片记录信息和处理状态
  610. """
  611. # 调用业务逻辑函数获取名片记录
  612. result = get_business_card(card_id)
  613. # 根据处理结果设置HTTP状态码
  614. if not result['success']:
  615. if result['code'] == 404:
  616. status_code = 404
  617. else:
  618. status_code = 500
  619. else:
  620. status_code = 200
  621. return jsonify(result), status_code
  622. @bp.route('/search-business-cards-by-mobile', methods=['GET'])
  623. def search_business_cards_by_mobile_route():
  624. """
  625. 根据手机号码搜索名片记录的API接口
  626. 查询参数:
  627. - mobile: 要搜索的手机号码
  628. 返回:
  629. - JSON: 包含搜索到的名片记录列表和处理状态
  630. 示例:
  631. GET /search-business-cards-by-mobile?mobile=13800138000
  632. """
  633. try:
  634. # 获取查询参数
  635. mobile_number = request.args.get('mobile', '').strip()
  636. if not mobile_number:
  637. return jsonify({
  638. 'success': False,
  639. 'message': '请提供要搜索的手机号码',
  640. 'data': []
  641. }), 400
  642. # 调用业务逻辑函数搜索名片记录
  643. result = search_business_cards_by_mobile(mobile_number)
  644. # 根据处理结果设置HTTP状态码
  645. if result['code'] == 200:
  646. status_code = 200
  647. elif result['code'] == 400:
  648. status_code = 400
  649. else:
  650. status_code = 500
  651. return jsonify(result), status_code
  652. except Exception as e:
  653. # 处理未预期的异常
  654. error_msg = f"根据手机号码搜索名片时发生错误: {str(e)}"
  655. logger.error(error_msg, exc_info=True)
  656. return jsonify({
  657. 'success': False,
  658. 'message': error_msg,
  659. 'data': []
  660. }), 500
  661. @bp.route('/get-hotel-positions-list', methods=['GET'])
  662. def get_hotel_positions_list_route():
  663. """
  664. 获取酒店职位数据表全部记录的API接口
  665. 返回:
  666. - JSON: 包含酒店职位记录列表和处理状态
  667. """
  668. try:
  669. # 调用业务逻辑函数获取酒店职位列表
  670. result = get_hotel_positions_list()
  671. # 根据处理结果设置HTTP状态码
  672. status_code = 200 if result['success'] else 500
  673. return jsonify(result), status_code
  674. except Exception as e:
  675. # 处理未预期的异常
  676. error_msg = f"获取酒店职位列表时发生错误: {str(e)}"
  677. logger.error(error_msg, exc_info=True)
  678. return jsonify({
  679. 'success': False,
  680. 'message': error_msg,
  681. 'data': [],
  682. 'count': 0
  683. }), 500
  684. @bp.route('/add-hotel-positions', methods=['POST'])
  685. def add_hotel_positions_route():
  686. """
  687. 新增酒店职位数据表记录的API接口
  688. 请求参数:
  689. - JSON格式,包含以下字段:
  690. - department_zh: 部门中文名称 (必填)
  691. - department_en: 部门英文名称 (必填)
  692. - position_zh: 职位中文名称 (必填)
  693. - position_en: 职位英文名称 (必填)
  694. - position_abbr: 职位英文缩写 (可选)
  695. - level_zh: 职级中文名称 (必填)
  696. - level_en: 职级英文名称 (必填)
  697. - created_by: 创建者 (可选)
  698. - updated_by: 更新者 (可选)
  699. - status: 状态 (可选)
  700. 返回:
  701. - JSON: 包含创建结果和职位信息
  702. """
  703. try:
  704. # 获取请求数据
  705. data = request.get_json()
  706. if not data:
  707. return jsonify({
  708. 'success': False,
  709. 'message': '请求数据为空',
  710. 'data': None
  711. }), 400
  712. # 调用业务逻辑函数处理创建
  713. result = add_hotel_positions(data)
  714. # 根据处理结果设置HTTP状态码
  715. if result['code'] == 200:
  716. status_code = 201 # Created
  717. elif result['code'] == 400:
  718. status_code = 400 # Bad Request
  719. elif result['code'] == 409:
  720. status_code = 409 # Conflict
  721. else:
  722. status_code = 500 # Internal Server Error
  723. return jsonify(result), status_code
  724. except Exception as e:
  725. # 处理未预期的异常
  726. error_msg = f"创建酒店职位记录时发生错误: {str(e)}"
  727. logger.error(error_msg, exc_info=True)
  728. return jsonify({
  729. 'success': False,
  730. 'message': error_msg,
  731. 'data': None
  732. }), 500
  733. @bp.route('/update-hotel-positions/<int:position_id>', methods=['PUT'])
  734. def update_hotel_positions_route(position_id):
  735. """
  736. 修改酒店职位数据表记录的API接口
  737. 路径参数:
  738. - position_id: 职位记录ID
  739. 请求参数:
  740. - JSON格式,可能包含以下字段:
  741. - department_zh: 部门中文名称
  742. - department_en: 部门英文名称
  743. - position_zh: 职位中文名称
  744. - position_en: 职位英文名称
  745. - position_abbr: 职位英文缩写
  746. - level_zh: 职级中文名称
  747. - level_en: 职级英文名称
  748. - updated_by: 更新者
  749. - status: 状态
  750. 返回:
  751. - JSON: 包含更新结果和职位信息
  752. """
  753. try:
  754. # 获取请求数据
  755. data = request.get_json()
  756. if not data:
  757. return jsonify({
  758. 'success': False,
  759. 'message': '请求数据为空',
  760. 'data': None
  761. }), 400
  762. # 调用业务逻辑函数处理更新
  763. result = update_hotel_positions(position_id, data)
  764. # 根据处理结果设置HTTP状态码
  765. if result['code'] == 200:
  766. status_code = 200 # OK
  767. elif result['code'] == 400:
  768. status_code = 400 # Bad Request
  769. elif result['code'] == 404:
  770. status_code = 404 # Not Found
  771. elif result['code'] == 409:
  772. status_code = 409 # Conflict
  773. else:
  774. status_code = 500 # Internal Server Error
  775. return jsonify(result), status_code
  776. except Exception as e:
  777. # 处理未预期的异常
  778. error_msg = f"更新酒店职位记录时发生错误: {str(e)}"
  779. logger.error(error_msg, exc_info=True)
  780. return jsonify({
  781. 'success': False,
  782. 'message': error_msg,
  783. 'data': None
  784. }), 500
  785. @bp.route('/query-hotel-positions/<int:position_id>', methods=['GET'])
  786. def query_hotel_positions_route(position_id):
  787. """
  788. 查找指定ID的酒店职位数据表记录的API接口
  789. 路径参数:
  790. - position_id: 职位记录ID
  791. 返回:
  792. - JSON: 包含查找结果和职位信息
  793. """
  794. try:
  795. # 调用业务逻辑函数查找职位记录
  796. result = query_hotel_positions(position_id)
  797. # 根据处理结果设置HTTP状态码
  798. if result['code'] == 200:
  799. status_code = 200 # OK
  800. elif result['code'] == 404:
  801. status_code = 404 # Not Found
  802. else:
  803. status_code = 500 # Internal Server Error
  804. return jsonify(result), status_code
  805. except Exception as e:
  806. # 处理未预期的异常
  807. error_msg = f"查找酒店职位记录时发生错误: {str(e)}"
  808. logger.error(error_msg, exc_info=True)
  809. return jsonify({
  810. 'success': False,
  811. 'message': error_msg,
  812. 'data': None
  813. }), 500
  814. @bp.route('/delete-hotel-positions/<int:position_id>', methods=['DELETE'])
  815. def delete_hotel_positions_route(position_id):
  816. """
  817. 删除指定ID的酒店职位数据表记录的API接口
  818. 路径参数:
  819. - position_id: 职位记录ID
  820. 返回:
  821. - JSON: 包含删除结果和被删除的职位信息
  822. """
  823. try:
  824. # 调用业务逻辑函数删除职位记录
  825. result = delete_hotel_positions(position_id)
  826. # 根据处理结果设置HTTP状态码
  827. if result['code'] == 200:
  828. status_code = 200 # OK
  829. elif result['code'] == 404:
  830. status_code = 404 # Not Found
  831. else:
  832. status_code = 500 # Internal Server Error
  833. return jsonify(result), status_code
  834. except Exception as e:
  835. # 处理未预期的异常
  836. error_msg = f"删除酒店职位记录时发生错误: {str(e)}"
  837. logger.error(error_msg, exc_info=True)
  838. return jsonify({
  839. 'success': False,
  840. 'message': error_msg,
  841. 'data': None
  842. }), 500
  843. @bp.route('/get-hotel-group-brands-list', methods=['GET'])
  844. def get_hotel_group_brands_list_route():
  845. """
  846. 获取酒店集团子品牌数据表全部记录的API接口
  847. 返回:
  848. - JSON: 包含酒店集团品牌记录列表和处理状态
  849. """
  850. try:
  851. # 调用业务逻辑函数获取酒店集团品牌列表
  852. result = get_hotel_group_brands_list()
  853. # 根据处理结果设置HTTP状态码
  854. status_code = 200 if result['success'] else 500
  855. return jsonify(result), status_code
  856. except Exception as e:
  857. # 处理未预期的异常
  858. error_msg = f"获取酒店集团品牌列表时发生错误: {str(e)}"
  859. logger.error(error_msg, exc_info=True)
  860. return jsonify({
  861. 'success': False,
  862. 'message': error_msg,
  863. 'data': [],
  864. 'count': 0
  865. }), 500
  866. @bp.route('/add-hotel-group-brands', methods=['POST'])
  867. def add_hotel_group_brands_route():
  868. """
  869. 新增酒店集团子品牌数据表记录的API接口
  870. 请求参数:
  871. - JSON格式,包含以下字段:
  872. - group_name_en: 集团英文名称 (必填)
  873. - group_name_zh: 集团中文名称 (必填)
  874. - brand_name_en: 品牌英文名称 (必填)
  875. - brand_name_zh: 品牌中文名称 (必填)
  876. - positioning_level_en: 定位级别英文名称 (必填)
  877. - positioning_level_zh: 定位级别中文名称 (必填)
  878. - created_by: 创建者 (可选)
  879. - updated_by: 更新者 (可选)
  880. - status: 状态 (可选)
  881. 返回:
  882. - JSON: 包含创建结果和品牌信息
  883. """
  884. try:
  885. # 获取请求数据
  886. data = request.get_json()
  887. if not data:
  888. return jsonify({
  889. 'success': False,
  890. 'message': '请求数据为空',
  891. 'data': None
  892. }), 400
  893. # 调用业务逻辑函数处理创建
  894. result = add_hotel_group_brands(data)
  895. # 根据处理结果设置HTTP状态码
  896. if result['code'] == 200:
  897. status_code = 201 # Created
  898. elif result['code'] == 400:
  899. status_code = 400 # Bad Request
  900. elif result['code'] == 409:
  901. status_code = 409 # Conflict
  902. else:
  903. status_code = 500 # Internal Server Error
  904. return jsonify(result), status_code
  905. except Exception as e:
  906. # 处理未预期的异常
  907. error_msg = f"创建酒店集团品牌记录时发生错误: {str(e)}"
  908. logger.error(error_msg, exc_info=True)
  909. return jsonify({
  910. 'success': False,
  911. 'message': error_msg,
  912. 'data': None
  913. }), 500
  914. @bp.route('/update-hotel-group-brands/<int:brand_id>', methods=['PUT'])
  915. def update_hotel_group_brands_route(brand_id):
  916. """
  917. 修改酒店集团子品牌数据表记录的API接口
  918. 路径参数:
  919. - brand_id: 品牌记录ID
  920. 请求参数:
  921. - JSON格式,可能包含以下字段:
  922. - group_name_en: 集团英文名称
  923. - group_name_zh: 集团中文名称
  924. - brand_name_en: 品牌英文名称
  925. - brand_name_zh: 品牌中文名称
  926. - positioning_level_en: 定位级别英文名称
  927. - positioning_level_zh: 定位级别中文名称
  928. - updated_by: 更新者
  929. - status: 状态
  930. 返回:
  931. - JSON: 包含更新结果和品牌信息
  932. """
  933. try:
  934. # 获取请求数据
  935. data = request.get_json()
  936. if not data:
  937. return jsonify({
  938. 'success': False,
  939. 'message': '请求数据为空',
  940. 'data': None
  941. }), 400
  942. # 调用业务逻辑函数处理更新
  943. result = update_hotel_group_brands(brand_id, data)
  944. # 根据处理结果设置HTTP状态码
  945. if result['code'] == 200:
  946. status_code = 200 # OK
  947. elif result['code'] == 400:
  948. status_code = 400 # Bad Request
  949. elif result['code'] == 404:
  950. status_code = 404 # Not Found
  951. elif result['code'] == 409:
  952. status_code = 409 # Conflict
  953. else:
  954. status_code = 500 # Internal Server Error
  955. return jsonify(result), status_code
  956. except Exception as e:
  957. # 处理未预期的异常
  958. error_msg = f"更新酒店集团品牌记录时发生错误: {str(e)}"
  959. logger.error(error_msg, exc_info=True)
  960. return jsonify({
  961. 'success': False,
  962. 'message': error_msg,
  963. 'data': None
  964. }), 500
  965. @bp.route('/query-hotel-group-brands/<int:brand_id>', methods=['GET'])
  966. def query_hotel_group_brands_route(brand_id):
  967. """
  968. 查找指定ID的酒店集团子品牌数据表记录的API接口
  969. 路径参数:
  970. - brand_id: 品牌记录ID
  971. 返回:
  972. - JSON: 包含查找结果和品牌信息
  973. """
  974. try:
  975. # 调用业务逻辑函数查找品牌记录
  976. result = query_hotel_group_brands(brand_id)
  977. # 根据处理结果设置HTTP状态码
  978. if result['code'] == 200:
  979. status_code = 200 # OK
  980. elif result['code'] == 404:
  981. status_code = 404 # Not Found
  982. else:
  983. status_code = 500 # Internal Server Error
  984. return jsonify(result), status_code
  985. except Exception as e:
  986. # 处理未预期的异常
  987. error_msg = f"查找酒店集团品牌记录时发生错误: {str(e)}"
  988. logger.error(error_msg, exc_info=True)
  989. return jsonify({
  990. 'success': False,
  991. 'message': error_msg,
  992. 'data': None
  993. }), 500
  994. @bp.route('/delete-hotel-group-brands/<int:brand_id>', methods=['DELETE'])
  995. def delete_hotel_group_brands_route(brand_id):
  996. """
  997. 删除指定ID的酒店集团子品牌数据表记录的API接口
  998. 路径参数:
  999. - brand_id: 品牌记录ID
  1000. 返回:
  1001. - JSON: 包含删除结果和被删除的品牌信息
  1002. """
  1003. try:
  1004. # 调用业务逻辑函数删除品牌记录
  1005. result = delete_hotel_group_brands(brand_id)
  1006. # 根据处理结果设置HTTP状态码
  1007. if result['code'] == 200:
  1008. status_code = 200 # OK
  1009. elif result['code'] == 404:
  1010. status_code = 404 # Not Found
  1011. else:
  1012. status_code = 500 # Internal Server Error
  1013. return jsonify(result), status_code
  1014. except Exception as e:
  1015. # 处理未预期的异常
  1016. error_msg = f"删除酒店集团品牌记录时发生错误: {str(e)}"
  1017. logger.error(error_msg, exc_info=True)
  1018. return jsonify({
  1019. 'success': False,
  1020. 'message': error_msg,
  1021. 'data': None
  1022. }), 500
  1023. # ==================================
  1024. # 重复记录处理API接口
  1025. # ==================================
  1026. @bp.route('/get-duplicate-records', methods=['GET'])
  1027. def get_duplicate_records_route():
  1028. """
  1029. 获取重复记录列表的API接口
  1030. 查询参数:
  1031. - status: 可选,筛选特定状态的记录 ('pending', 'processed', 'ignored')
  1032. 返回:
  1033. - JSON: 包含重复记录列表和处理状态
  1034. """
  1035. try:
  1036. # 获取查询参数
  1037. status = request.args.get('status', None)
  1038. # 验证status参数的有效性
  1039. if status and status not in ['pending', 'processed', 'ignored']:
  1040. return jsonify({
  1041. 'success': False,
  1042. 'message': 'status参数无效,必须为 pending、processed 或 ignored',
  1043. 'data': None
  1044. }), 400
  1045. # 调用业务逻辑函数获取重复记录列表
  1046. result = get_duplicate_records(status)
  1047. # 根据处理结果设置HTTP状态码
  1048. status_code = 200 if result['success'] else 500
  1049. return jsonify(result), status_code
  1050. except Exception as e:
  1051. # 处理未预期的异常
  1052. error_msg = f"获取重复记录列表时发生错误: {str(e)}"
  1053. logger.error(error_msg, exc_info=True)
  1054. return jsonify({
  1055. 'success': False,
  1056. 'message': error_msg,
  1057. 'data': [],
  1058. 'count': 0
  1059. }), 500
  1060. @bp.route('/process-duplicate-record/<int:duplicate_id>', methods=['POST'])
  1061. def process_duplicate_record_route(duplicate_id):
  1062. """
  1063. 处理重复记录的API接口
  1064. 路径参数:
  1065. - duplicate_id: 重复记录ID
  1066. 请求参数:
  1067. - JSON格式,包含以下字段:
  1068. - action: 处理动作 (必填) ('merge_to_suspected', 'keep_main', 'ignore')
  1069. - selected_duplicate_id: 当action为'merge_to_suspected'时,选择的疑似重复记录ID (可选)
  1070. - processed_by: 处理人 (可选)
  1071. - notes: 处理备注 (可选)
  1072. 返回:
  1073. - JSON: 包含处理结果和状态信息
  1074. """
  1075. try:
  1076. # 获取请求数据
  1077. data = request.get_json()
  1078. if not data:
  1079. return jsonify({
  1080. 'success': False,
  1081. 'message': '请求数据为空',
  1082. 'data': None
  1083. }), 400
  1084. # 验证必填字段
  1085. action = data.get('action')
  1086. if not action:
  1087. return jsonify({
  1088. 'success': False,
  1089. 'message': '缺少必填字段: action',
  1090. 'data': None
  1091. }), 400
  1092. # 验证action参数的有效性
  1093. if action not in ['merge_to_suspected', 'keep_main', 'ignore']:
  1094. return jsonify({
  1095. 'success': False,
  1096. 'message': 'action参数无效,必须为 merge_to_suspected、keep_main 或 ignore',
  1097. 'data': None
  1098. }), 400
  1099. # 提取其他参数
  1100. selected_duplicate_id = data.get('selected_duplicate_id')
  1101. processed_by = data.get('processed_by')
  1102. notes = data.get('notes')
  1103. # 特殊验证:如果action为merge_to_suspected,必须提供selected_duplicate_id
  1104. if action == 'merge_to_suspected' and not selected_duplicate_id:
  1105. return jsonify({
  1106. 'success': False,
  1107. 'message': '执行merge_to_suspected操作时必须提供selected_duplicate_id',
  1108. 'data': None
  1109. }), 400
  1110. # 调用业务逻辑函数处理重复记录
  1111. result = process_duplicate_record(
  1112. duplicate_id=duplicate_id,
  1113. action=action,
  1114. selected_duplicate_id=selected_duplicate_id,
  1115. processed_by=processed_by,
  1116. notes=notes
  1117. )
  1118. # 根据处理结果设置HTTP状态码
  1119. if result['code'] == 200:
  1120. status_code = 200 # OK
  1121. elif result['code'] == 400:
  1122. status_code = 400 # Bad Request
  1123. elif result['code'] == 404:
  1124. status_code = 404 # Not Found
  1125. else:
  1126. status_code = 500 # Internal Server Error
  1127. return jsonify(result), status_code
  1128. except Exception as e:
  1129. # 处理未预期的异常
  1130. error_msg = f"处理重复记录时发生错误: {str(e)}"
  1131. logger.error(error_msg, exc_info=True)
  1132. return jsonify({
  1133. 'success': False,
  1134. 'message': error_msg,
  1135. 'data': None
  1136. }), 500
  1137. @bp.route('/get-duplicate-record-detail/<int:duplicate_id>', methods=['GET'])
  1138. def get_duplicate_record_detail_route(duplicate_id):
  1139. """
  1140. 获取指定重复记录详细信息的API接口
  1141. 路径参数:
  1142. - duplicate_id: 重复记录ID
  1143. 返回:
  1144. - JSON: 包含重复记录详细信息
  1145. """
  1146. try:
  1147. # 调用业务逻辑函数获取重复记录详情
  1148. result = get_duplicate_record_detail(duplicate_id)
  1149. # 根据处理结果设置HTTP状态码
  1150. if result['code'] == 200:
  1151. status_code = 200 # OK
  1152. elif result['code'] == 404:
  1153. status_code = 404 # Not Found
  1154. else:
  1155. status_code = 500 # Internal Server Error
  1156. return jsonify(result), status_code
  1157. except Exception as e:
  1158. # 处理未预期的异常
  1159. error_msg = f"获取重复记录详情时发生错误: {str(e)}"
  1160. logger.error(error_msg, exc_info=True)
  1161. return jsonify({
  1162. 'success': False,
  1163. 'message': error_msg,
  1164. 'data': None
  1165. }), 500
  1166. # 删除名片记录接口
  1167. @bp.route('/delete-business-card/<int:card_id>', methods=['DELETE'])
  1168. def delete_business_card_route(card_id):
  1169. """
  1170. 删除名片记录的API接口
  1171. 路径参数:
  1172. - card_id: 名片记录ID (必填)
  1173. 功能说明:
  1174. - 删除PostgreSQL数据库中business_cards表的指定记录
  1175. - 删除PostgreSQL数据库中duplicate_business_cards表的相关记录
  1176. - 删除MinIO存储中的名片图片文件
  1177. - 删除Neo4j图数据库中talent节点及其关联关系
  1178. 返回:
  1179. - JSON: 包含删除操作的结果状态和被删除的记录信息
  1180. 状态码:
  1181. - 200: 完全成功删除所有相关数据
  1182. - 206: 部分成功 (PostgreSQL删除成功,但Neo4j删除失败)
  1183. - 404: 未找到指定ID的名片记录
  1184. - 500: 删除操作失败
  1185. """
  1186. try:
  1187. # 验证card_id参数
  1188. if not card_id or card_id <= 0:
  1189. return jsonify({
  1190. 'success': False,
  1191. 'message': '无效的名片记录ID',
  1192. 'data': None
  1193. }), 400
  1194. # 调用删除函数
  1195. result = delete_business_card(card_id)
  1196. # 根据处理结果设置HTTP状态码和返回响应
  1197. if result['success']:
  1198. if result['code'] == 200:
  1199. status_code = 200 # 完全成功
  1200. elif result['code'] == 206:
  1201. status_code = 206 # 部分成功
  1202. else:
  1203. status_code = 200 # 默认成功
  1204. else:
  1205. if result['code'] == 404:
  1206. status_code = 404 # 未找到记录
  1207. elif result['code'] == 400:
  1208. status_code = 400 # 参数错误
  1209. else:
  1210. status_code = 500 # 服务器错误
  1211. return jsonify(result), status_code
  1212. except Exception as e:
  1213. logger.error(f"删除名片记录失败: {str(e)}")
  1214. return jsonify({
  1215. 'success': False,
  1216. 'message': f'删除名片记录失败: {str(e)}',
  1217. 'data': None
  1218. }), 500
  1219. # 修复损坏的重复记录接口
  1220. @bp.route('/fix-broken-duplicate-records', methods=['POST'])
  1221. def fix_broken_duplicate_records_route():
  1222. """
  1223. 修复duplicate_business_cards表中main_card_id为null的损坏记录
  1224. 功能说明:
  1225. - 查找所有main_card_id为null的损坏记录
  1226. - 删除这些损坏的记录以维护数据完整性
  1227. - 返回修复操作的详细结果
  1228. 返回:
  1229. - JSON: 包含修复操作的结果和被删除记录的信息
  1230. 状态码:
  1231. - 200: 修复成功
  1232. - 500: 修复失败
  1233. 注意:
  1234. - 此操作会永久删除损坏的记录
  1235. - 建议在系统维护时执行此操作
  1236. """
  1237. try:
  1238. # 调用修复函数
  1239. result = fix_broken_duplicate_records()
  1240. # 根据结果设置状态码
  1241. if result['success']:
  1242. status_code = 200
  1243. else:
  1244. status_code = 500
  1245. return jsonify(result), status_code
  1246. except Exception as e:
  1247. logger.error(f"修复损坏记录接口调用失败: {str(e)}")
  1248. return jsonify({
  1249. 'success': False,
  1250. 'message': f'修复损坏记录接口调用失败: {str(e)}',
  1251. 'data': None
  1252. }), 500
  1253. # 网页文本解析接口
  1254. @bp.route('/webpage-parse', methods=['POST'])
  1255. def webpage_parse_route():
  1256. """
  1257. 解析网页 Markdown 文本并提取人员信息的API接口
  1258. 请求参数:
  1259. - markdown_text: 网页的 Markdown 格式文本内容 (JSON格式)
  1260. - publish_time: 发布时间,用于career_path中的date字段 (JSON格式)
  1261. 请求体示例:
  1262. {
  1263. "markdown_text": "# 张三\n\n职位:高级经理\n\n公司:XX酒店\n\n![照片](http://example.com/photo.jpg)",
  1264. "publish_time": "2025-01-15"
  1265. }
  1266. 返回:
  1267. - JSON: 包含提取的人员信息和处理状态
  1268. 功能说明:
  1269. - 接收 Markdown 格式的网页文本
  1270. - 进行必要的格式和内容验证
  1271. - 使用 Qwen VL Max 模型提取人员信息
  1272. - 支持提取照片链接 (pic_url)
  1273. - 返回标准化的人员信息数据
  1274. 状态码:
  1275. - 200: 解析成功
  1276. - 400: 请求参数错误
  1277. - 500: 解析失败
  1278. """
  1279. try:
  1280. # 检查请求是否为 JSON 格式
  1281. if not request.is_json:
  1282. return jsonify({
  1283. 'success': False,
  1284. 'message': '请求必须是 JSON 格式',
  1285. 'data': None
  1286. }), 400
  1287. # 获取请求数据
  1288. data = request.get_json()
  1289. # 检查是否提供了 markdown_text 参数
  1290. if 'markdown_text' not in data:
  1291. return jsonify({
  1292. 'success': False,
  1293. 'message': '缺少必填参数: markdown_text',
  1294. 'data': None
  1295. }), 400
  1296. # 检查是否提供了 publish_time 参数
  1297. if 'publish_time' not in data:
  1298. return jsonify({
  1299. 'success': False,
  1300. 'message': '缺少必填参数: publish_time',
  1301. 'data': None
  1302. }), 400
  1303. markdown_text = data['markdown_text']
  1304. publish_time = data['publish_time']
  1305. # 验证 markdown_text 是否为字符串
  1306. if not isinstance(markdown_text, str):
  1307. return jsonify({
  1308. 'success': False,
  1309. 'message': 'markdown_text 必须是字符串类型',
  1310. 'data': None
  1311. }), 400
  1312. # 验证 publish_time 是否为字符串
  1313. if not isinstance(publish_time, str):
  1314. return jsonify({
  1315. 'success': False,
  1316. 'message': 'publish_time 必须是字符串类型',
  1317. 'data': None
  1318. }), 400
  1319. # 验证文本内容不能为空
  1320. if not markdown_text.strip():
  1321. return jsonify({
  1322. 'success': False,
  1323. 'message': 'markdown_text 内容不能为空',
  1324. 'data': None
  1325. }), 400
  1326. # 验证文本长度(防止过长的文本)
  1327. if len(markdown_text) > 50000: # 限制最大50KB
  1328. return jsonify({
  1329. 'success': False,
  1330. 'message': 'markdown_text 内容过长,最大支持50KB',
  1331. 'data': None
  1332. }), 400
  1333. # 基本的 Markdown 格式验证(可选)
  1334. # 检查是否包含一些基本的文本内容
  1335. if len(markdown_text.strip()) < 10:
  1336. return jsonify({
  1337. 'success': False,
  1338. 'message': 'markdown_text 内容过短,无法进行有效解析',
  1339. 'data': None
  1340. }), 400
  1341. # 记录解析请求
  1342. logger.info(f"开始解析网页文本,内容长度: {len(markdown_text)} 字符")
  1343. # 调用网页文本解析函数
  1344. extracted_data = process_webpage_with_QWen(markdown_text, publish_time)
  1345. # 返回成功结果
  1346. return jsonify({
  1347. 'success': True,
  1348. 'message': '网页文本解析成功',
  1349. 'data': extracted_data
  1350. }), 200
  1351. except Exception as e:
  1352. # 记录错误日志
  1353. error_msg = f"网页文本解析失败: {str(e)}"
  1354. logger.error(error_msg, exc_info=True)
  1355. # 返回错误响应
  1356. return jsonify({
  1357. 'success': False,
  1358. 'message': error_msg,
  1359. 'data': None
  1360. }), 500
  1361. # 添加网页人才信息接口
  1362. @bp.route('/add-webpage-talent', methods=['POST'])
  1363. def add_webpage_talent_route():
  1364. """
  1365. 添加网页人才信息的API接口,包括保存网页内容和创建名片记录
  1366. 请求参数:
  1367. - talent_list: 人才信息列表,每个item包含业务卡片格式的数据 (JSON数组)
  1368. - web_md: 网页markdown文本内容 (JSON字符串)
  1369. 请求体示例:
  1370. {
  1371. "talent_list": [
  1372. {
  1373. "name_zh": "张三",
  1374. "name_en": "Zhang San",
  1375. "title_zh": "总经理",
  1376. "title_en": "General Manager",
  1377. "hotel_zh": "北京万豪酒店",
  1378. "hotel_en": "Beijing Marriott Hotel",
  1379. "brand_group": "万豪",
  1380. "mobile": "13800138000",
  1381. "email": "zhangsan@example.com"
  1382. },
  1383. {
  1384. "name_zh": "李四",
  1385. "name_en": "Li Si",
  1386. "title_zh": "市场总监",
  1387. "title_en": "Marketing Director",
  1388. "hotel_zh": "上海希尔顿酒店",
  1389. "hotel_en": "Shanghai Hilton Hotel",
  1390. "brand_group": "希尔顿",
  1391. "mobile": "13900139000",
  1392. "email": "lisi@example.com"
  1393. }
  1394. ],
  1395. "web_md": "# 人事任命公告\n\n**1** 张三被任命为北京万豪酒店总经理...\n\n**2** 李四被任命为上海希尔顿酒店市场总监..."
  1396. }
  1397. 返回:
  1398. - JSON: 包含处理结果,包括成功和失败的记录统计
  1399. 功能说明:
  1400. - 将网页markdown内容保存到MinIO
  1401. - 循环处理talent_list中的每个人才记录
  1402. - 为每个人才创建business_card记录
  1403. - 使用与名片上传相同的重复检查逻辑
  1404. - 在business_card记录的updated_by字段中记录MinIO路径
  1405. 状态码:
  1406. - 200: 所有记录处理成功
  1407. - 206: 部分记录处理成功
  1408. - 400: 请求参数错误
  1409. - 500: 处理失败
  1410. """
  1411. try:
  1412. # 检查请求是否为 JSON 格式
  1413. if not request.is_json:
  1414. return jsonify({
  1415. 'success': False,
  1416. 'message': '请求必须是 JSON 格式',
  1417. 'data': None
  1418. }), 400
  1419. # 获取请求数据
  1420. data = request.get_json()
  1421. # 检查是否提供了 talent_list 参数
  1422. if 'talent_list' not in data:
  1423. return jsonify({
  1424. 'success': False,
  1425. 'message': '缺少必填参数: talent_list',
  1426. 'data': None
  1427. }), 400
  1428. # 检查是否提供了 web_md 参数
  1429. if 'web_md' not in data:
  1430. return jsonify({
  1431. 'success': False,
  1432. 'message': '缺少必填参数: web_md',
  1433. 'data': None
  1434. }), 400
  1435. talent_list = data['talent_list']
  1436. web_md = data['web_md']
  1437. # 验证 talent_list 是否为数组
  1438. if not isinstance(talent_list, list):
  1439. return jsonify({
  1440. 'success': False,
  1441. 'message': 'talent_list 必须是数组类型',
  1442. 'data': None
  1443. }), 400
  1444. # 验证 web_md 是否为字符串
  1445. if not isinstance(web_md, str):
  1446. return jsonify({
  1447. 'success': False,
  1448. 'message': 'web_md 必须是字符串类型',
  1449. 'data': None
  1450. }), 400
  1451. # 验证数组不能为空
  1452. if len(talent_list) == 0:
  1453. return jsonify({
  1454. 'success': False,
  1455. 'message': 'talent_list 不能为空数组',
  1456. 'data': None
  1457. }), 400
  1458. # 验证文本内容不能为空
  1459. if not web_md.strip():
  1460. return jsonify({
  1461. 'success': False,
  1462. 'message': 'web_md 内容不能为空',
  1463. 'data': None
  1464. }), 400
  1465. # 验证文本长度(防止过长的文本)
  1466. if len(web_md) > 100000: # 限制最大100KB
  1467. return jsonify({
  1468. 'success': False,
  1469. 'message': 'web_md 内容过长,最大支持100KB',
  1470. 'data': None
  1471. }), 400
  1472. # 验证数组长度(防止过多记录)
  1473. if len(talent_list) > 50: # 限制最大50条记录
  1474. return jsonify({
  1475. 'success': False,
  1476. 'message': 'talent_list 记录过多,最大支持50条记录',
  1477. 'data': None
  1478. }), 400
  1479. # 基本的数据格式验证
  1480. for index, talent_data in enumerate(talent_list):
  1481. if not isinstance(talent_data, dict):
  1482. return jsonify({
  1483. 'success': False,
  1484. 'message': f'talent_list 第{index + 1}项必须是对象类型',
  1485. 'data': None
  1486. }), 400
  1487. # 检查必要的字段
  1488. if not talent_data.get('name_zh'):
  1489. return jsonify({
  1490. 'success': False,
  1491. 'message': f'talent_list 第{index + 1}项缺少必填字段: name_zh',
  1492. 'data': None
  1493. }), 400
  1494. # 记录处理请求
  1495. logger.info(f"开始处理网页人才信息,人才数量: {len(talent_list)}, 网页内容长度: {len(web_md)} 字符")
  1496. # 调用网页人才处理函数
  1497. result = add_webpage_talent(talent_list, web_md)
  1498. # 根据处理结果设置HTTP状态码
  1499. if result['success']:
  1500. if result['code'] == 200:
  1501. status_code = 200 # 全部成功
  1502. elif result['code'] == 206:
  1503. status_code = 206 # 部分成功
  1504. else:
  1505. status_code = 200 # 默认成功
  1506. else:
  1507. if result['code'] == 400:
  1508. status_code = 400 # 参数错误
  1509. else:
  1510. status_code = 500 # 服务器错误
  1511. return jsonify(result), status_code
  1512. except Exception as e:
  1513. # 记录错误日志
  1514. error_msg = f"添加网页人才信息失败: {str(e)}"
  1515. logger.error(error_msg, exc_info=True)
  1516. # 返回错误响应
  1517. return jsonify({
  1518. 'success': False,
  1519. 'message': error_msg,
  1520. 'data': None
  1521. }), 500
  1522. # 获取解析任务列表接口
  1523. @bp.route('/get-parse-tasks', methods=['GET'])
  1524. def get_parse_tasks_route():
  1525. """
  1526. 获取解析任务列表的API接口,支持分页
  1527. 查询参数:
  1528. - page: 页码,从1开始,默认为1
  1529. - per_page: 每页记录数,默认为10,最大100
  1530. - task_type: 任务类型过滤,可选
  1531. - task_status: 任务状态过滤,可选
  1532. 返回:
  1533. - JSON: 包含解析任务列表和分页信息
  1534. 功能说明:
  1535. - 支持分页查询,每页默认10条记录
  1536. - 支持按任务类型和状态过滤
  1537. - 按创建时间倒序排列
  1538. - 返回总记录数和分页信息
  1539. 状态码:
  1540. - 200: 查询成功
  1541. - 400: 请求参数错误
  1542. - 500: 查询失败
  1543. """
  1544. try:
  1545. # 获取查询参数
  1546. page = request.args.get('page', 1, type=int)
  1547. per_page = request.args.get('per_page', 10, type=int)
  1548. task_type = request.args.get('task_type', type=str)
  1549. task_status = request.args.get('task_status', type=str)
  1550. # 记录请求日志
  1551. logger.info(f"获取解析任务列表请求: page={page}, per_page={per_page}, task_type={task_type}, task_status={task_status}")
  1552. # 调用核心业务逻辑
  1553. result = get_parse_tasks(page, per_page, task_type, task_status)
  1554. # 返回结果
  1555. return jsonify({
  1556. 'success': result['success'],
  1557. 'message': result['message'],
  1558. 'data': result['data']
  1559. }), result['code']
  1560. except Exception as e:
  1561. # 记录错误日志
  1562. error_msg = f"获取解析任务列表接口失败: {str(e)}"
  1563. logger.error(error_msg, exc_info=True)
  1564. # 返回错误响应
  1565. return jsonify({
  1566. 'success': False,
  1567. 'message': error_msg,
  1568. 'data': None
  1569. }), 500
  1570. # 获取解析任务详情接口
  1571. @bp.route('/get-parse-task-detail', methods=['GET'])
  1572. def get_parse_task_detail_route():
  1573. """
  1574. 获取解析任务详情的API接口
  1575. 查询参数:
  1576. - task_name: 任务名称,必填
  1577. 返回:
  1578. - JSON: 包含任务详细信息
  1579. 功能说明:
  1580. - 根据任务名称查询指定任务的详细信息
  1581. - 返回任务的所有字段信息
  1582. - 包含解析结果的完整数据
  1583. 状态码:
  1584. - 200: 查询成功
  1585. - 400: 请求参数错误
  1586. - 404: 任务不存在
  1587. - 500: 查询失败
  1588. """
  1589. try:
  1590. # 获取查询参数
  1591. task_name = request.args.get('task_name', type=str)
  1592. # 参数验证
  1593. if not task_name:
  1594. return jsonify({
  1595. 'success': False,
  1596. 'message': '任务名称参数不能为空',
  1597. 'data': None
  1598. }), 400
  1599. # 记录请求日志
  1600. logger.info(f"获取解析任务详情请求: task_name={task_name}")
  1601. # 调用核心业务逻辑
  1602. result = get_parse_task_detail(task_name)
  1603. # 返回结果
  1604. return jsonify({
  1605. 'success': result['success'],
  1606. 'message': result['message'],
  1607. 'data': result['data']
  1608. }), result['code']
  1609. except Exception as e:
  1610. # 记录错误日志
  1611. error_msg = f"获取解析任务详情接口失败: {str(e)}"
  1612. logger.error(error_msg, exc_info=True)
  1613. # 返回错误响应
  1614. return jsonify({
  1615. 'success': False,
  1616. 'message': error_msg,
  1617. 'data': None
  1618. }), 500
  1619. # 新增解析任务接口
  1620. @bp.route('/add-parse-task', methods=['POST'])
  1621. def add_parse_task_route():
  1622. """
  1623. 新增解析任务的API接口
  1624. 请求参数:
  1625. - task_type: 任务类型 (form-data字段,必填)
  1626. 可选值:'名片', '简历', '新任命', '招聘', '杂项'
  1627. - files: 文件数组 (multipart/form-data,对于招聘类型可选)
  1628. - created_by: 创建者 (可选,form-data字段)
  1629. 返回:
  1630. - JSON: 包含任务创建结果和上传摘要
  1631. 功能说明:
  1632. - 根据任务类型处理不同格式的文件
  1633. - 名片任务:JPG/PNG格式图片 → talent_photos目录
  1634. - 简历任务:PDF格式文件 → resume_files目录
  1635. - 新任命任务:MD格式文件 → appointment_files目录
  1636. - 招聘任务:数据库记录处理,无需文件上传
  1637. - 杂项任务:任意格式文件 → misc_files目录
  1638. - 使用timestamp+uuid自动生成文件名
  1639. - 在parse_task_repository表中创建待解析任务记录
  1640. 状态码:
  1641. - 200: 所有文件上传成功,任务创建成功
  1642. - 206: 部分文件上传成功,任务创建成功
  1643. - 400: 请求参数错误
  1644. - 500: 服务器内部错误
  1645. """
  1646. try:
  1647. # 获取任务类型参数
  1648. task_type = request.form.get('task_type')
  1649. # 验证任务类型
  1650. if not task_type:
  1651. return jsonify({
  1652. 'success': False,
  1653. 'message': '缺少task_type参数',
  1654. 'data': None
  1655. }), 400
  1656. if task_type not in ['名片', '简历', '新任命', '招聘', '杂项']:
  1657. return jsonify({
  1658. 'success': False,
  1659. 'message': 'task_type参数必须是以下值之一:名片、简历、新任命、招聘、杂项',
  1660. 'data': None
  1661. }), 400
  1662. # 获取创建者信息(可选参数)
  1663. created_by = request.form.get('created_by', 'api_user')
  1664. # 对于招聘类型,不需要文件上传
  1665. if task_type == '招聘':
  1666. # 检查是否误传了文件
  1667. if 'files' in request.files and request.files.getlist('files'):
  1668. return jsonify({
  1669. 'success': False,
  1670. 'message': '招聘类型任务不需要上传文件',
  1671. 'data': None
  1672. }), 400
  1673. # 记录请求日志
  1674. logger.info(f"新增招聘任务请求: 创建者={created_by}")
  1675. # 调用核心业务逻辑
  1676. result = add_parse_task(None, task_type, created_by)
  1677. else:
  1678. # 其他类型需要文件上传
  1679. if 'files' not in request.files:
  1680. return jsonify({
  1681. 'success': False,
  1682. 'message': f'{task_type}任务需要上传文件,请使用files字段上传文件',
  1683. 'data': None
  1684. }), 400
  1685. # 获取上传的文件列表
  1686. uploaded_files = request.files.getlist('files')
  1687. # 检查文件列表是否为空
  1688. if not uploaded_files or len(uploaded_files) == 0:
  1689. return jsonify({
  1690. 'success': False,
  1691. 'message': '文件数组不能为空',
  1692. 'data': None
  1693. }), 400
  1694. # 验证所有文件
  1695. valid_files = []
  1696. for i, file in enumerate(uploaded_files):
  1697. # 检查文件是否为空
  1698. if not file or file.filename == '':
  1699. return jsonify({
  1700. 'success': False,
  1701. 'message': f'第{i+1}个文件为空或未选择',
  1702. 'data': None
  1703. }), 400
  1704. valid_files.append(file)
  1705. # 记录请求日志
  1706. logger.info(f"新增{task_type}任务请求: 文件数量={len(valid_files)}, 创建者={created_by}")
  1707. # 调用核心业务逻辑
  1708. result = add_parse_task(valid_files, task_type, created_by)
  1709. # 根据处理结果设置HTTP状态码
  1710. if result['success']:
  1711. if result['code'] == 200:
  1712. status_code = 200
  1713. elif result['code'] == 206:
  1714. status_code = 206
  1715. else:
  1716. status_code = 200
  1717. else:
  1718. if result['code'] == 400:
  1719. status_code = 400
  1720. else:
  1721. status_code = 500
  1722. # 返回结果
  1723. return jsonify({
  1724. 'success': result['success'],
  1725. 'message': result['message'],
  1726. 'data': result['data']
  1727. }), status_code
  1728. except Exception as e:
  1729. # 记录错误日志
  1730. error_msg = f"新增解析任务接口失败: {str(e)}"
  1731. logger.error(error_msg, exc_info=True)
  1732. # 返回错误响应
  1733. return jsonify({
  1734. 'success': False,
  1735. 'message': error_msg,
  1736. 'data': None
  1737. }), 500