Preprocessing
基于法律文本智能信息抽取技术, 对本案相关法律文书进行实体识别、关系抽取与事件结构化处理。
法律文本智能信息抽取与结构化是指利用自然语言处理(NLP)、机器学习和人工智能技术, 从非结构化或半结构化的法律文档(如裁判文书、合同、法规等)中自动识别、提取预定义的关键信息, 并将其转化为机器可读、可检索、可分析的结构化数据的过程。
整个过程的核心任务包含 两个模块:
(1) 法律文书结构化:从非结构化的文本中提取预定义的字段,形成类似数据库的记录。
(2) 法律知识与关系抽取:识别文本中的 实体、事件 及其之间的复杂 关系,构建知识图谱。