本次测试验证了 process_webpage_with_QWen
函数提取酒店人员任命信息的功能,使用了两个样例文件:
新任命单人-markdown格式.md
(单人任命测试)新任命多人-markdown格式.md
(多人任命测试)原始代码中使用 extract_json_from_text
函数处理QWen返回的JSON响应,该函数可能会截断多人JSON数据,导致信息丢失。
修改了 app/core/data_parse/parse_web.py
中的JSON解析逻辑:
extract_json_from_text
函数作为备用方案序号 | 姓名 | 中文职位 | 英文职位 | 酒店 | 品牌组合 | 非空字段 |
---|---|---|---|---|---|---|
1 | 曲晶 女士 | 市场营销副总裁 | - | 北京诺金国际酒店管理有限责任公司 | 诺金国际 | 6/9 |
2 | 扎西央宗 女士 | 总经理 | General Manager | 北海涠洲岛悦苑酒店 | 悦榕集团 | 8/9 |
3 | 孔祥俊 先生 | 总经理 | General Manager | 上海嘉定凯悦酒店 | 凯悦 | 9/9 |
4 | 戴庆丰 先生 | 总经理 | General Manager | 合肥皇冠假日酒店 | 洲际酒店集团 | 9/9 |
5 | 金涛 先生 | 总经理 | General Manager | 厦门泛太平洋大酒店 | 新加坡泛太平洋酒店集团(PPHG) | 9/9 |
6 | 聂磊 先生 | 总经理 | General Manager | 大连硬石酒店 | 硬石酒店集团 | 8/9 |
7 | 张雪婷 女士 | 总经理 | General Manager | 洛阳浩德诺富特酒店 | - | 8/9 |
8 | 刘志强 先生 | 总经理 | General Manager | 嘉辉会丽呈华廷酒店、嘉辉会度假酒店 | - | 7/9 |
9 | 卜伟 先生 | 市场销售总监 | Director of Sales & Marketing | 西安浐灞华邑酒店与西安浐灞假日酒店 | 洲际酒店集团 | 8/9 |
10 | 缪慧 女士 | 市场销售总监 | - | 北海涠洲岛悦苑酒店 | - | 5/9 |
11 | 温国游 先生 | 财务总监 | - | 北海涠洲岛悦苑酒店 | - | 5/9 |
12 | 文远超 先生 | 餐饮总监 | - | 北海涠洲岛悦苑酒店 | - | 5/9 |
13 | 王亚铭 先生 | 餐饮总监 | Director of Food & Beverage | 武汉世茂希尔顿酒店 | - | 8/9 |
14 | 赵先托 先生 | 餐饮总监 | Director of Food and Beverage | 三亚湾海居铂尔曼度假酒店 | 雅高集团 | 8/9 |
15 | 盘海文 先生 | 工程总监 | - | 北海涠洲岛悦苑酒店 | - | 5/9 |
16 | 陆尤喜 先生 | 工程总监 | Director of Engineering | 深圳中洲万豪酒店 | - | 8/9 |
extract_json_from_text
函数截断了JSON数据测试结果: ✅ 通过
process_webpage_with_QWen
函数在修改后能够:
该功能已满足酒店人员任命信息提取的基本需求,可以投入使用。建议在实际应用中继续监控和优化英文信息提取的准确性。