2026年2月7日消息,千问Qwen团队联合阿里巴巴AIData团队、晓天衡宇评测社区,正式发布PLaw bench。
2026年2月7日消息,千问Qwen团队联合阿里巴巴AIData团队、晓天衡宇评测社区,正式发布PLaw bench。

据了解,PLaw Bench基于大模型面对的法律实务咨询场景的现实,模拟真实的咨询场景,并通过三大任务模块和特定的判分标准,来测评大模型的实际法律能力。同时,Plaw Bench的文书生成板块并未止步于格式规范,而是将重点放在案情归纳、策略选择、程序意识等核心诉讼实务能力的考察上。在数据集构建上,为了确保评测的公正与高效,我们邀请了39位法律专家对850道题目完成三轮交叉质检,并通过API调用了多款主流大模型进行作答。

此外,对法律从业者而言,在使用AI辅助办案时,不应盲目追求“最强”的通用模型,而应根据具体工作场景来选择在该项任务上表现最佳的“专家”模型。