成功修改了 process_webpage_with_QWen
函数,添加了新的 publish_time
参数,并更新了所有相关的调用位置。
文件: app/core/data_parse/parse_web.py
process_webpage_with_QWen(markdown_text)
process_webpage_with_QWen(markdown_text, publish_time)
publish_time
参数用于设置 career_path 中的 date 字段值文件: app/api/data_parse/routes.py
/webpage-parse
接口publish_time
必填参数验证新的请求体格式:
{
"markdown_text": "网页内容...",
"publish_time": "2025-01-15"
}
更新了以下测试文件中的函数调用:
test_qwen_extraction.py
test_single_person_extraction()
函数test_multiple_person_extraction()
函数"2025-01-15"
作为 publish_time 参数test_webpage_parse.py
test_single_person()
函数test_multiple_persons()
函数test_field_validation()
函数"2025-01-15"
作为 publish_time 参数quick_test.py
"2025-01-15"
作为 publish_time 参数文件类型 | 修改文件数 | 主要变更 |
---|---|---|
核心函数 | 1 | 添加新参数,修改内部逻辑 |
API接口 | 1 | 更新请求参数验证和调用 |
测试文件 | 3 | 更新所有函数调用 |
# 新的调用方式
result = process_webpage_with_QWen(markdown_content, "2025-01-15")
curl -X POST http://localhost:5000/api/data-parse/webpage-parse \
-H "Content-Type: application/json" \
-d '{
"markdown_text": "网页内容...",
"publish_time": "2025-01-15"
}'
publish_time
应为字符串格式,建议使用 "YYYY-MM-DD" 格式publish_time
是必填参数,不提供会返回400错误✅ 所有修改已完成并验证通过
✅ 函数参数传递正确
✅ career_path 日期字段使用指定的 publish_time
✅ 测试文件全部更新完毕