卷宗自動歸目
結合基于深度學習的OCR、圖像分析和實體識別等技術,實現電子卷宗材料的自動分類;支持常見圖片類型、pdf、word、excel等格式;支持3600多類材料;民事、刑事、行政、執行、賠償、減刑假釋類卷宗,自動歸目準確率達到95%以上。
文檔標題識別
基于自研的OCR技術,結合識別后的文本以及文本的位置坐標信息,采用卷積神經網絡的文本分類方法,通過大量的樣本標注和訓練,實現對圖片材料和文本文檔的標題識別;行業內文檔標題識別準確率可達92%。
司法實體識別
基于深度學習,將自然語言理解技術和法律邏輯體系相結合,可對公、檢、法、司、仲裁等多個行業100多類文書進行信息項提取,可提取信息項數量超過1萬項。 
關系提取
將基于深度學習的自然語言理解技術和模式識別技術相結合,利用生成模型,結合關系圖譜,自動識別文本中的實體并抽取實體之間的關系;支持100+種法律關系和社會關系。 
事件提取
利用觸發詞對事件進行分類,基于人工標注數據,采用實體識別技術和文本分類技術提起事件中的主體、客體和其他參數等信息,實現事件提取;支持消費類、娛樂活動類、行賄受賄類等8大類事件;事件提取準確率可達85%。 
司法智能問答
基于人工梳理問答對,結合自然語言理解和機器學習的技術,實現具有語義理解的問答系統;并支持根據預定槽位和狀態,靈活配置符合業務邏輯的對話管理策略,實現了任務式對話。
法律文書生成
通過機器學習技術,基于“法律認知”技術,從海量文書中學習出不同類型文書中針對法律事實的常用表述規則,經由法律專家校準,固化形成專業的文書表述邏輯和規則庫,實現為用戶智能地根據案情的不同生成不同的文書表述。 
裁判文書校對
基于百萬法律文書和50G網頁素材,采用自然語言理解技術,并結合獨創的裁判文書詞法分析技術,實現了貼合文書特點、尊重用戶習慣、符合格式規范安的文書智能校對功能;自動結合辦案系統數據與文書信息,支持字詞、語法、標點、文書結構、業務邏輯、法律法規的全方位校對,支持語音讀校,支持word插件。 
裁判文書排版
實現對文書格式的自動排版和規范。排版格式依據的模板可以由用戶根據實際業務需要統一對模板做修改和更新,非常方便靈活。 
裁判文書屏蔽
基于自然語言理解技術和實體識別技術實現對法律裁判文書敏感信息屏蔽的功能。在文書屏蔽的過程中嚴格按照《最高人民法院關于人民法院在互聯網公布裁判文書的規定》的要求對敏感詞匯進行屏蔽。 
庭審筆錄歸納
深入分析語音識別處理的筆錄特征,首先基于序列標注模型對語音識別出來的筆錄進行精簡,去除口語描述和重復表達等,再采用Seq-to-Seq模型實現筆錄歸納,以提升自動生成筆錄的規范性和可讀性。 
證據預測
分析各類文書數據中的案情,并對其中事實和證據的關系進行標注,基于數十萬人工標注的高質量數據,訓練Seq-to-Seq模型,實現在給定事實的前提下生成其可能依賴的證據,證據預測準確率可達90%。 
案由預測
基于案件文書全文、文書段落、案件情節、案件事實描述,通過自然語言理解技術,提取案情特征,將LSTM模型和CNN模型等進行融合,并采用多任務聯合訓練的方式,實現了案由預測。 
法條預測
基于案件情節,通過自然語言理解技術,提取案情特征,將LSTM模型和CNN模型等進行融合,并采用多任務聯合訓練的方式,實現了相關法條預測。 
裁判規律分析
基于法律知識圖譜和自然語言理解技術,對400多萬公開刑事裁判文書全面挖掘分析,通過法學專家和實務專家從業務實踐出發,結合法律法規、司法解釋等規范性文件的要求,構建出適用于不同場景下的動態知識模型,利用模型對多元數據進行抽取,進而分析類案的歷史裁判規律,提供法律知識服務。 
卷宗材料OCR
基于AI深度學習算法,利用圖像分析、字符識別等技術,對卷宗材料文件實現智能感知分析,提供卷宗材料文字識別能力;支持文本、表格、卡證識別,準確率分別為96%以上、85%以上、70%以上;支持中文簡體、繁體、英文印刷文本識別;支持圖像的糾偏和翻轉;單張圖片的識別速度為毫秒級。 
司法視頻分析
基于庭審、訊問、談話、監舍等法律行業場景進行深度學習及大規模圖像訓練,準確識別物體標簽、位置、行為意圖、置信度、圖像質量等綜合信息。支持人、國徽、法袍、 桌牌、帽子、墨鏡等目標標識;支持打電話、抽煙等行為識別;支持過亮、過暗、模糊、遮擋等畫面質量識別。 
卡證識別
基于深度學習的ocr和目標檢測技術,對二代居民身份證、律師證、機動車駕駛證、機動車行駛證等進行識別;支持證件的正反面檢測和分頁檢測;支持自定義卡證識別模板;利用大量圖片樣本訓練模型,具有高準確率,如身份證識別準確率超過90%。 
表格識別
基于圖像分析技術和ocr技術,對表格信息進行精度定位和識別,實現復雜表格的智能字段提取。支持存在合并單元格的復雜表格;支持自定義表格識別模板;識別識別率達到90%以上。 
指紋、印章等識別
基于深度學習的目標檢測技術,實現對文檔中的指紋和簽章等檢測識別;并通過顏色模型和OpenCV相結合,實現對紅章和指紋進行抹除。支持人像、指紋、紅章、方章、長方章、合縫章、二維碼、條形碼,紅頭文件等識別,且識別準確率能夠達到96%以上。 
卷宗中手寫標簽識別
針對卷宗中存在手寫材料的特點,基于深度學習技術,實現了手寫標簽的識別,擴大了卷宗文件類型識別的范圍。支持訴狀、欠條、收條、證明、情況說明等78類標簽。 
卷宗圖像優化
針對卷宗文件多為掃描件的特點,對卷宗文件進行圖像清除黑邊、空白頁檢查、圖像糾偏、圖像DPI檢測、圖像虛化檢測等功能。 
法律知識圖譜
法律知識圖譜屬于垂直行業領域的知識圖譜,從圖示的直觀形式看,是眾多法律要素組成的知識庫。法律知識圖譜是機器進行法律知識推理的基礎,它將法律規定、法律文書、證據材料及其他法律資料中的法律知識點以一定的法律邏輯連接在一起形成概念框架,它的概念框架上的每一個知識實體或概念又分別與法律法規、司法經驗、案例、證據材料等相應掛接,建立法律概念、法律法規、事實、證據之間的動態關聯關系。 
法律數據融合
建立行業數據融合規則,依據法律知識解析并提煉數據,基于語義實現結構化、半結構化與非結構化的多源異構數據融合,構建關系模型,基于法律語義識別并建立數據實體間的關聯關系,解決數據的完整性、一致性和相關性等問題,形成高度融合的數據資源地圖。 
當事人畫像
通過數據挖掘方式將分散至各應用系統中核心業務群體的零散信息進行提煉,以基本信息、行為信息、涉案信息、資產信息、信用信息等為維度,刻畫出與案件相關的當事人的畫像,滿足不同場景下各主體對于人員或者人群全關鍵信息的不同層次需求。 
案件畫像
基于大數據分析、自然語言理解、圖像分析等多項技術相結合,實現案件結構化數據、案件文書、相關卷宗等多元異構數據的內容層面的深度關聯融合;以基本信息、主體信息、材料信息、流程信息、關聯案件信息、庭審信息等維度,刻畫完整、準確的案件畫像。 
法官畫像
以裁判文書為基準,對具體法官的辦案數據、特征指標、關聯圖譜、證據、爭議焦點、裁判觀點等進行各角度分析,展示法官對某種主張采納或不采納、法官認定某種法律后果/抗辯理由構成或不構成的裁判傾向,為院庭領導全面了解和評估法官工作提供參考輔助。 
涉案人員同路會面分析
基于大數據技術和數據挖掘技術,深入分析被調查人話單的數據特征,結合通訊基站信息和GIS系統,將被調查人與相關涉案人員之間通話記錄進行碰撞,智能分析雙方或多方在相近時間且相鄰位置的情況,進而實現同路會面分析。 
涉案人員共同聯系人分析
運用數據挖掘技術,深入分析被調查人話單的數據特征,從通話次數、時長,關注人員人數等多個維度進行分析,進而發現相關涉案人員的共同聯系人;支持多名人員之間通過若干層級中間人進行聯系的情況。 
法律聲明 網站地圖 聯系我們

©Thunisoft 北京華宇信息技術有限公司 版權所有    京ICP備13006480-3

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?44d5929b98ed1fd093ffc3d47ec712b9"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); document.writeln("");