1,问题陈述:法律AI推理的幻觉风险在法律的工作当中,推理模型能辅助法律研究,合同审核和评估风险,但面临以下的局限:
幻觉问题:AI缺乏足够上下文时,可能生成虚构案例或错误法律解释(如误引法规),导致法律意见不可靠。 私域信息缺失:AI无法自动访问客户私有数据(如案件历史、保密协议),除非构建专用记忆结构,否则“AI永远不知道案件xx还存在的其他身份信息”。 解决方案核心:RAG(检索增强生成)和上下文工程,通过嵌入“信息燃料”增强推理。链接指出:“好的推理能力更需要充足的信息燃料,没有好的燃料,计算方向就会跑偏”。在法律领域,这意味着一套专用知识库,存储结构化法律记忆。 2.基于trae的的多轮对话首先将所有的资料处理为markdown的格式文件: md属于程序语言,更容易被程序解析,并转化为结构化的数据,这对于大模型来说是非常有利阅读和分析 将文件存储在文件夹中:通过自然语言的形式,模型可以遍历文件中的每一份文件突破了对话模型对于长文本和多余重复的案件限制:
广义上的RAG,和上下文工程,相当于是同义词 如果AI的工作记忆空间(最大输入+输出tokens)每次都能包含恰当的输入,那么只要AI的推理性能良好,计算结果就会和预期方向一致 好的推理能力不止和AI内部权重有关。AI自己的权重是被压缩的智能,会随着新的强大模型出现不断升级其能力。kimi -deepseek r1 -gpt 4o-genimi 简而言之,推理能力更需要充足的信息燃料,没有好的燃料,计算的方向就会跑偏,以至于出现被识破的幻觉。
充足的信息燃料,也就是RAG嵌入在AI工作记忆的信息,是智能的关键。这点和人一样,无论是系统1,系统2
你可以询问模型一些通用的知识法规法条一些公开的信息,但是他无法基于当时你的案件进行回答私人的或者正在发生的案件信息 3.专用记忆结构:法律关系和事件时间轴通用AI模型容易固化认知,难以修改;专用记忆结构更高效,是智能行为表现的关键。在案件分析中需设计: 案件三元组提取: 案件时间轴: 基于法院认定核实的法律关系图,帮助大模型梳理案件的逻辑 4.推理逻辑根据个人的分析思路可以控制模型的分析角度
|