千问Qwen发布PLaw Bench:为法律AI模型提供专业测评标准

PChome | 编辑: 冯可心 2026-02-07 11:43:18

2026年2月7日消息,千问Qwen团队联合阿里巴巴AIData团队、晓天衡宇评测社区,正式发布PLaw bench。

2026年2月7日消息,千问Qwen团队联合阿里巴巴AIData团队、晓天衡宇评测社区,正式发布PLaw bench。

据了解,PLaw Bench基于大模型面对的法律实务咨询场景的现实,模拟真实的咨询场景,并通过三大任务模块和特定的判分标准,来测评大模型的实际法律能力。同时,Plaw Bench的文书生成板块并未止步于格式规范,而是将重点放在案情归纳、策略选择、程序意识等核心诉讼实务能力的考察上。在数据集构建上,为了确保评测的公正与高效,我们邀请了39位法律专家对850道题目完成三轮交叉质检,并通过API调用了多款主流大模型进行作答。

此外,对法律从业者而言,在使用AI辅助办案时,不应盲目追求“最强”的通用模型,而应根据具体工作场景来选择在该项任务上表现最佳的“专家”模型。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑