财务数æ®ï¼Œå°¤å…¶æ˜¯æ¥è‡ªæ€»è´¦çš„æ•°æ®ï¼Œè®°å½•ç€ä¼ä¸šçš„财务交易,包括收入ã€æ”¯å‡ºã€èµ„产和负债,对于确ä¿è´¢åŠ¡è®°å½•çš„真实性和é€æ˜Žåº¦è‡³å…³é‡è¦ [21, 24]。它ä¸ä»…帮助ä¼ä¸šæ»¡è¶³ç›‘管机构ã€æŠ•èµ„者和金èžæœºæž„ç‰åˆ©ç›Šç›¸å…³è€…çš„è¦æ±‚,还通过分æžæ”¯æŒå†³ç–,而异常检测则是维护数æ®å®Œæ•´æ€§å’Œå¯é 性的关键 [37]。
然而,财务数æ®ä¸çš„异常,å¯èƒ½æ˜¯ç”±äºŽé”™è¯¯ã€æ¬ºè¯ˆæˆ–æ“çºµé€ æˆçš„,会带æ¥å·¨å¤§çš„财务æŸå¤±ï¼ŒæŸå®³æŠ•èµ„者信心,并需è¦è¿›è¡Œæ¬ºè¯ˆè°ƒæŸ¥ [24]ã€‚å› æ¤ï¼ŒåŠæ—¶æœ‰æ•ˆåœ°æ£€æµ‹å¼‚常对于éµå®ˆæ³•è§„å’Œä¿æŠ¤è´¢åŠ¡å®‰å…¨è‡³å…³é‡è¦ [8, 22]ã€‚ä¼ ç»Ÿçš„è´¢åŠ¡å¼‚å¸¸æ£€æµ‹æ–¹æ³•åœ¨å¤„ç†å¤æ‚ã€åºžå¤§çš„æ•°æ®å’Œä¸æ–å‡çº§çš„欺诈手法方é¢å˜åœ¨å›°éš¾ã€‚早期的åšæ³•ä¾èµ–于人工检查和基于规则的系统,效率低下,æ¼æŽ‰äº†å¾ˆå¤šå¼‚常,并产生了大é‡è¯¯æŠ¥ï¼Œå¯¼è‡´è´¢åŠ¡æ¬ºè¯ˆéš¾ä»¥å¯Ÿè§‰ [5]。
机器å¦ä¹ (ML) 在现代财务审计ä¸å˜å¾—越æ¥è¶Šé‡è¦ï¼Œå®ƒèƒ½å¤Ÿé«˜æ•ˆåœ°å¤„ç†å¤§åž‹æ•°æ®é›†å¹¶è¯†åˆ«å…¶ä¸çš„模å¼ã€‚然而,éšç€è´¢åŠ¡æ¬ºè¯ˆæ‰‹æ³•å˜å¾—越æ¥è¶Šå¤æ‚,需è¦æ–°çš„方法æ¥å…‹æœæ•°æ®é¢„处ç†å’Œæ¨¡åž‹å±€é™æ€§å¸¦æ¥çš„挑战 [2, 22]ã€‚æœ€è¿‘çš„ç ”ç©¶è¡¨æ˜Žï¼Œè‡ªåŠ¨ç¼–ç 器在异常检测方é¢æœ‰æ½œåŠ›ï¼Œè€Œå¤§åž‹è¯è¨€æ¨¡åž‹ (LLM) 在å„ç§ä»»åŠ¡ä¸éƒ½è¡¨çŽ°å‡ºè‰²ï¼Œä½†çŽ°å®žä¸–界数æ®çš„稀ç–性和å¤æ‚性é™åˆ¶äº†å®ƒä»¬çš„有效性 [26, 36]。
挑战与机é‡ï¼šåˆ©ç”¨å¤§åž‹è¯è¨€æ¨¡åž‹ç¼–ç éžè¯ä¹‰è´¢åŠ¡æ•°æ®
本文ç€çœ¼äºŽé«˜æ•ˆæ£€æµ‹æ€»è´¦æ•°æ®ä¸çš„异常,é‡ç‚¹å…³æ³¨ç‰¹å¾ç»´åº¦å¼‚质性和特å¾ç¨€ç–性这两个问题,它们阻ç¢äº†è´¢åŠ¡å®¡è®¡ä¸çš„异常检测。我们的方法是利用 Sentence-BERT LLM 的预è®ç»ƒè¡¨ç¤ºæ¥ç¼–ç 日记账分录ä¸çš„éžè¯ä¹‰åˆ†ç±»æ•°æ®ï¼Œä»Žè€Œæ高对数æ®å¼‚常的识别能力。
现有的解决方案使用å„ç§çŸ¢é‡åŒ–方法,éšåŽå¯¹ç¨€ç–特å¾è¿›è¡Œé™ç»´ï¼Œä½†è¿™å¯èƒ½ä¸è¶³ä»¥åº”对现实世界ä¸çš„æ—¥è®°è´¦åˆ†å½•ï¼Œå› ä¸ºè¿™äº›åˆ†å½•åœ¨é•¿åº¦å’Œå¤æ‚性上往往差异很大。æ¤å¤–,交易异常的éžæ—¶é—´æ€§ç‰¹å¾é™åˆ¶äº†å¯åº”用的特å¾ç¼–ç æ–¹æ³•èŒƒå›´ã€‚å› æ¤ï¼Œç”¨äºŽæ£€æµ‹è´¢åŠ¡æ•°æ®å¼‚常的机器å¦ä¹ 算法在处ç†å¼‚质性和稀ç–æ•°æ®æ—¶ä¼šé‡åˆ°å›°éš¾ï¼Œå¯¼è‡´ç¼–ç 和分类问题,最终导致结果ä¸ç†æƒ³ã€‚这会影å“财务记录审计的å¯é 性。
我们æ出了一ç§æ–°æ–¹æ³•ï¼Œå¦‚图 1 所示,利用预è®ç»ƒçš„ Sentence-Transformer 模型æ¥ç¼–ç éžè¯ä¹‰è´¢åŠ¡æ•°æ®ï¼Œè§£å†³ç‰¹å¾å¼‚质性和稀ç–性问题。这ç§æ–¹æ³•ä¸åŒäºŽä¼ 统的财务异常检测机器å¦ä¹ 技术,它æ出了一ç§æ··åˆæ¨¡åž‹ï¼Œå°† Sentence-Transformer 嵌入与机器å¦ä¹ 分类器相结åˆï¼Œä»¥æ高异常检测性能。准确的异常检测是å¯é 财务审计的基石。改进处ç†è´¢åŠ¡æ•°æ®ä¸çš„异质性和稀ç–性的方法å¯ä»¥æ˜¾è‘—æ高异常检测æµç¨‹ï¼Œæœ‰åŠ©äºŽæ›´å¥½åœ°è¿›è¡Œé£Žé™©ç®¡ç†å’Œéµå®ˆæ³•è§„。该方法在财务异常检测之外具有更广泛的æ„义,为跨领域应用高级编ç 技术处ç†å¤æ‚æ•°æ®é›†æ供了模æ¿ã€‚
ç ”ç©¶ç›®æ ‡ä¸Žè´¡çŒ®
在这项工作ä¸ï¼Œæˆ‘们æ出了以下两个å‡è®¾ï¼š
- å‡è®¾ 1: 利用 Sentence-Transformer LLM 对财务记录ä¸çš„éžè¯ä¹‰åˆ†ç±»æ•°æ®è¿›è¡Œç¼–ç ,å¯ä»¥æœ‰æ•ˆåœ°æ ‡å‡†åŒ–特å¾å˜å¼‚性,增强特å¾é›†çš„紧凑性和信æ¯ä¿ç•™èƒ½åŠ›ï¼Œä¸Žä¼ 统方法相比,这一点å¯ä»¥é€šè¿‡ PCA ç‰é™ç»´æŠ€æœ¯æ¥è¡¡é‡ã€‚
- å‡è®¾ 2: 将基于 Sentence-Transformer çš„ LLM 嵌入与优化的机器å¦ä¹ 模型相结åˆï¼Œå¯ä»¥æ高财务日记账分录ä¸çš„异常检测性能,这一点å¯ä»¥é€šè¿‡ä¸Žä¼ 统机器å¦ä¹ æ–¹æ³•ç›¸æ¯”ï¼Œæ”¹è¿›è¯„ä¼°æŒ‡æ ‡æ¥è¯æ˜Žã€‚
在制定我们的å‡è®¾æ—¶ï¼Œæˆ‘ä»¬å€Ÿé‰´äº†æœ€è¿‘çš„ç ”ç©¶å‘现,这些å‘现表明 LLM 除了文本任务之外,还å¯ä»¥é€‚应其他任务 [28]ã€‚ç ”ç©¶è¡¨æ˜Žï¼Œæœ€åˆåœ¨æ–‡æœ¬ä¸Šè®ç»ƒçš„ LLM å¯ä»¥æœ‰æ•ˆåœ°å¤„ç†å’Œç¼–ç éžæ–‡æœ¬ã€è¯è¨€éžè¯ä¹‰æ•°æ® [30]。这ç§èƒ½åŠ›æºäºŽå…¶ Transformer å—çš„ç¼–ç 功能,促使我们æ出了å‡è®¾ 1,建议使用 SBERT LLM å°†éžè¯ä¹‰è´¢åŠ¡æ•°æ®é›†è½¬æ¢ä¸ºæ ‡å‡†åŒ–çš„å•ä¸€å°ºå¯¸å‘é‡ç‰¹å¾ã€‚éšåŽï¼Œæˆ‘们的å‡è®¾ 2 建立在 LLM 高效的编ç 能力基础上,这æ„味ç€é›†æˆ LLM 嵌入å¯ä»¥å¢žå¼ºæœºå™¨å¦ä¹ 模型,特别是在检测财务数æ®ä¸çš„异常方é¢ã€‚验è¯å‡è®¾ 1 å°†è¯æ˜Žä¸€ç§ç®¡ç†è´¢åŠ¡è®°å½•ä¸ç‰¹å¾å˜å¼‚性的新方法,增强异常检测。确认å‡è®¾ 2 将说明将 LLM 嵌入与优化模型相结åˆåœ¨æ£€æµ‹è´¢åŠ¡å¼‚常方é¢çš„有效性,有å¯èƒ½è¶…è¶Šä¼ ç»Ÿæ–¹æ³•ã€‚
这些å‘现å¯ä»¥å…±åŒæ”¹å˜å½“å‰è´¢åŠ¡å¼‚常检测的åšæ³•ã€‚LLM 的创新应用å¯ä»¥æžå¤§åœ°æŽ¨åŠ¨è¯¥é¢†åŸŸçš„å‘展,展示其在跨å¦ç§‘应用ä¸çš„潜力,并改进财务审计和监控系统。
背景与相关工作
机器å¦ä¹ 方法åŠå…¶åœ¨æ£€æµ‹è´¢åŠ¡å¼‚常方é¢çš„å±€é™æ€§
财务异常检测至关é‡è¦ï¼Œæ¬ºè¯ˆæ´»åŠ¨å¯¹è¯¥è¡Œä¸šé€ æˆäº†å·¨å¤§å½±å“。数å—金èžæœåŠ¡çš„兴起,尤其是在 COVID-19 大æµè¡Œä¹‹åŽï¼Œéœ€è¦å…ˆè¿›çš„欺诈检测方法 [43]。深度å¦ä¹ ,包括å˜åˆ†è‡ªåŠ¨ç¼–ç 器和 LSTM 架构,在检测日记账分录 [44] 和电å商务 [27] ä¸çš„异常方é¢å–得了æˆåŠŸï¼ŒLSTM 也éžå¸¸æœ‰æ•ˆ [1]。图神ç»ç½‘络 (GNN) 以其处ç†æ¬ºè¯ˆæ£€æµ‹ä¸å¤æ‚æ•°æ®å…³ç³»çš„能力而著称 [43]。å„ç§æœºå™¨å¦ä¹ æŠ€æœ¯ï¼Œå¦‚æœ´ç´ è´å¶æ–¯ã€é€»è¾‘回归ã€KNNã€éšæœºæ£®æž—å’Œé¡ºåº CNN,已被应用于信用å¡æ¬ºè¯ˆæ£€æµ‹ [29],其ä¸åŸºäºŽ CatBoost 的方法çªå‡ºäº†ç‰¹å¾å·¥ç¨‹å’Œå†…å˜åŽ‹ç¼©åœ¨æ高效率方é¢çš„作用 [13]。机器å¦ä¹ 在金èžé¢†åŸŸå¾—到了广泛的应用,从检测日记账分录异常到识别医疗ä¿å¥å’Œé“¶è¡Œä¸šåŠ¡ä¸çš„欺诈交易 [29, 38]ã€‚è™½ç„¶æ¡ˆä¾‹ç ”ç©¶è¯å®žäº†å®ƒä»¬çš„有效性,但也指出了实际应用ä¸çš„挑战 [7]。
由于欺诈手法ä¸æ–å˜åŒ–和财务数æ®çš„å¤æ‚性,在财务欺诈检测ä¸åº”用机器å¦ä¹ é¢ä¸´ç€æŒ‘战 [11]。准确的建模ä¾èµ–于高质é‡çš„æ ‡å‡†åŒ–æ•°æ®ï¼Œè¿™ä¸€ç‚¹åœ¨ä¿¡ç”¨å¡è¡Œä¸šä¸ä¹Ÿæœ‰æ‰€è®¨è®º [31]。财务数æ®çš„éžå¹³ç¨³æ€§ã€éžçº¿æ€§æ€§å’Œä½Žä¿¡å™ªæ¯”使模型è®ç»ƒå’Œæ€§èƒ½å¤æ‚化 [40],需è¦å…ˆè¿›çš„方法æ¥é¢„处ç†å¤æ‚æ•°æ®ï¼Œæ高数æ®è´¨é‡å’Œæ¨¡åž‹æ€§èƒ½ã€‚增强数æ®è¡¨ç¤ºå’Œç®€åŒ–特å¾è¿˜å¯ä»¥æ高机器å¦ä¹ 模型的å¯è§£é‡Šæ€§ï¼Œæ»¡è¶³é‡‘èžé¢†åŸŸçš„法规和åˆè§„è¦æ±‚ [38]。æ¤å¤–,平衡计算å¤æ‚度和高检测精度至关é‡è¦ [27],这强调了需è¦å¢žå¼ºç‰¹å¾é›†çš„紧凑性和信æ¯ä¿ç•™èƒ½åŠ›ã€‚æœ‰å¸Œæœ›çš„ç ”ç©¶æ–¹å‘需è¦æŽ¢ç´¢å„ç§æœºå™¨å¦ä¹ 方法和混åˆåº”用,强调创新的数æ®é¢„处ç†å’Œé€‚应性强的机器å¦ä¹ 方法,以应对数æ®è´¨é‡å’Œæ¨¡åž‹é€‚应性挑战 [4]。
大型è¯è¨€æ¨¡åž‹çš„应用和能力
GPT-3ã€PaLM å’Œ LLaMA ç‰å¤§åž‹è¯è¨€æ¨¡åž‹æ ‡å¿—ç€è‡ªç„¶è¯è¨€å¤„ç† (NLP) 和人工智能 (AI) 的范å¼è½¬å˜ï¼Œä»ŽåŸºäºŽè§„则的框架å‘展到å¤æ‚çš„ Transformer ç‰ç¥žç»ç½‘络架构。这ç§æ¼”å˜ä½¿ LLM 能够将大é‡è¯è¨€æ•°æ®é›†ç¼–ç 为å‘é‡è¡¨ç¤ºï¼Œç”¨äºŽå„ç§åº”用 [41, 42]。BERT ç‰å¤§åž‹è¯è¨€æ¨¡åž‹æ“…é•¿æ•æ‰è¯è¨€çš„å¤æ‚è¯ä¹‰å’Œå¥æ³•ç»†å¾®å·®åˆ«ï¼Œä»Žè€Œäº§ç”Ÿå¯†é›†çš„嵌入。这些嵌入对于节点分类ç‰ä»»åŠ¡è‡³å…³é‡è¦ï¼Œä¾‹å¦‚文本图ä¸çš„节点分类 [14],è¯æ˜Žäº† LLM 能够从大é‡æ–‡æœ¬è¯æ–™åº“ä¸ç”Ÿæˆæœ‰æ„义的表示 [32]。LLM 最åˆæ˜¯ä¸ºè¯è¨€ä»»åŠ¡è€Œè®¾è®¡çš„,但它显示出éžå‡¡çš„多功能性,扩展到éžè¯è¨€é¢†åŸŸï¼Œæœ‰æ•ˆåœ°å°†å„ç§æ•°æ®ç±»åž‹ï¼ˆåŒ…括éžè¯ä¹‰å…ƒç´ )编ç 为顺åºæ ¼å¼ã€‚例如,Sentence-Transformers 对éžè¯è¨€æ•°æ®è¿›è¡ŒçŸ¢é‡åŒ–,将 LLM 的使用扩展到计算机视觉 [30]。LLM 在文本摘è¦å’Œå†…容推èç‰ä»»åŠ¡ä¸è¡¨çŽ°å‡ºè‰²ï¼Œä»Žè€Œè¯æ˜Žäº†å…¶å¹¿æ³›çš„适用性 [25, 41, 42]。LLM 通过有效地管ç†ç‰¹å¾å˜å¼‚性和稀ç–性,为数æ®åˆ†æžæ供了创新方法,从而增强了异常检测。它们å¯ä»¥è¶…è¶Šä¼ ç»Ÿçš„æœºå™¨å¦ä¹ ,处ç†å¤æ‚æ•°æ®ä»¥è¿›è¡Œé«˜çº§åˆ†æž [3, 20]。
在财务分æžä¸ï¼ŒLLM æž„æˆäº†ä¸€æ¬¡é‡å¤§çš„方法论飞跃。Sentence-Transformers 强调了 LLM 在处ç†å¼‚常检测ä¸çš„特å¾å¼‚质性和稀ç–性方é¢çš„èƒ½åŠ›ï¼Œå› ä¸ºå®ƒå¯ä»¥ç”Ÿæˆæœ‰æ„义的å‘é‡ [34, 39, 40]。Sentence-BERT (SBERT) 是 BERT 的改进版本,它å¯ä»¥ç”Ÿæˆè¯ä¹‰å¯†é›†çš„å¥å嵌入,从而æ高èšç±»å’Œè¯ä¹‰æœç´¢çš„性能 [34]。SBERT 利用暹罗网络和三元组网络æ¥å¢žå¼ºå¥åè¯ä¹‰åˆ†æžï¼Œç¡®ä¿ç›¸ä¼¼çš„å¥å在嵌入空间ä¸å½¼æ¤é 近。这ç§æ”¹è¿›å°†åµŒå…¥ç”Ÿæˆæ—¶é—´ä»Ž BERT çš„ 65 å°æ—¶ç¼©çŸåˆ°å¤§åž‹æ•°æ®é›†çš„å‡ ç§’é’Ÿã€‚SBERT 在å¥å对回归和è¯ä¹‰ç›¸ä¼¼æ€§ç‰å„ç§ä»»åŠ¡ä¸è¡¨çŽ°å‡ºè‰²ï¼Œè¯æ˜Žäº†å®ƒåœ¨ä¼ 统文本任务之外,快速ã€é«˜è´¨é‡åœ°åµŒå…¥è¯è¨€å’Œéžè¯è¨€æ•°æ®åº”用方é¢çš„潜力 [34]。
财务异常检测ä¸çš„ç ”ç©¶å·®è·
尽管机器å¦ä¹ 和深度å¦ä¹ 在财务异常检测方é¢å–得了进展,但这些方法往往由于财务数æ®çš„å¤šæ ·æ€§å’Œç¨€ç–性而失败,特别是在日记账分录ä¸ï¼Œè¿™ä¼šæŸå®³æ•°æ®ç¼–ç 和分类的有效性,进而影å“财务审计的精度和å¯é 性 [6]ã€‚ä¼ ç»Ÿçš„å¼‚å¸¸æ£€æµ‹æŠ€æœ¯ä¾èµ–于矢é‡åŒ–å’Œé™ç»´ï¼Œä½†è¿™äº›æŠ€æœ¯å¯èƒ½ä¸è¶³ä»¥åº”对现实世界ä¸çš„æ—¥è®°è´¦åˆ†å½•ï¼Œå› ä¸ºè¿™äº›åˆ†å½•åœ¨é•¿åº¦å’Œå¤æ‚性上差异很大。æ¤å¤–,财务交易的éžæ—¶é—´æ€§ç‰¹å¾é™åˆ¶äº†ä¸€äº›ç‰¹å¾ç¼–ç ç–略的使用。
先进的机器å¦ä¹ 技术在éžè¯ä¹‰ã€åˆ†ç±»è´¢åŠ¡æ•°æ®æ–¹é¢ä»æœªå¾—åˆ°å……åˆ†åˆ©ç”¨ï¼Œä¼ ç»Ÿçš„å¼‚å¸¸æ£€æµ‹æ–¹æ³•åœ¨è§£å†³éžæ—¶é—´æ€§å’Œå¼‚质性数æ®å¤æ‚性方é¢å˜åœ¨ä¸è¶³ã€‚Sentence-Transformer LLM 在财务数æ®åˆ†æžæ–¹é¢å°šæœªå¼€å‘的潜力,为处ç†ç‰¹å¾å˜å¼‚性和稀ç–性æ供了创新机会。通过将 LLM 嵌入与优化的机器å¦ä¹ 模型相结åˆï¼Œå¼¥åˆé‡è¦çš„ç ”ç©¶å·®è·ï¼Œå¯ä»¥æ˜¾è‘—æ高财务异常检测的分类精度和数æ®ç¼–ç 稳å¥æ€§ï¼Œè¶…è¶Šä¼ ç»Ÿæ–¹æ³•ã€‚
æ•°æ®æ述和伦ç†è€ƒé‡
在我们的工作ä¸ï¼Œæˆ‘们使用了æ¥è‡ªå„ç§åŒ¿åå…¬å¸çš„汇总的真实世界总账数æ®é›†ï¼Œå¦‚ Bakumenko ç‰äººæ‰€è¿° [6]。该数æ®é›†åŒ…å«åŒ¿å化的日记账分录,涵盖多个行业和时间段的系统特定账户计划。它最åˆç»è¿‡é¢„处ç†ï¼ŒæŽ’除了包å«è¶…过四个交易的分录,以管ç†å¼‚常值。它包å«ä¸€å°éƒ¨åˆ†å¸¦æ ‡ç¾çš„异常,其ä¸åŒ…å«å…«ç§ç±»åž‹çš„错误,这些错误由财务审计人员创建,以åæ˜ è´¢åŠ¡è®°å½•ä¸å¸¸è§çš„异常,表明现实世界异常检测ä¸çš„关键关注领域。该数æ®é›†ä¾§é‡äºŽå¯¹å¼‚常检测至关é‡è¦çš„属性,例如æºç³»ç»Ÿã€è´¦æˆ·ç±»åˆ«å’Œå€Ÿè´·æŒ‡ç¤ºå™¨ï¼Œç®€åŒ–了数æ®ä¸å¼‚常的识别。
在这项工作ä¸ï¼Œæˆ‘们对总账数æ®é›†åº”ç”¨äº†ä¸¥æ ¼çš„ä¼¦ç†å议,确ä¿å½»åº•çš„匿å化,以消除任何关于公å¸æˆ–个人的å¯è¯†åˆ«ä¿¡æ¯ã€‚该数æ®é›†ä¿æŒæœºå¯†ï¼Œä¸å¯å…±äº«ï¼Œé˜²æ¢æœªç»æŽˆæƒçš„访问。我们é¿å…使用云å˜å‚¨ï¼Œä»¥æœ€å¤§é™åº¦åœ°é™ä½Žæ•°æ®æ³„露风险,维护数æ®é›†çš„完整性。数æ®å¤„ç†å’Œåˆ†æžä¸¥æ ¼éµå®ˆæ³•å¾‹å’Œä¼¦ç†å‡†åˆ™ã€‚引入的异常ç»è¿‡ç²¾å¿ƒç®¡ç†ï¼Œä»¥ç»´æŠ¤ç ”究目的的伦ç†æ•°æ®æ“纵实践。
方法
æ•°æ®é¢„处ç†
该数æ®é›†åŒ…å« 32,100 个日记账分录ä¸çš„交易级数æ®ç‚¹ï¼ŒåŒ…括 148 个旨在åæ˜ å¼‚å¸¸æ¨¡å¼è€Œæ²¡æœ‰ä¸ªä½“å差的异常。为了在日记账分录ä¸è¿›è¡Œå¼‚常检测,将交易汇总æˆé›†åˆ ï¼Œå…¶ä¸ è¡¨ç¤ºåŒ…å« ä¸ªäº¤æ˜“çš„æ—¥è®°è´¦åˆ†å½•ã€‚æ±‡æ€»é›†åˆ æ˜¯é€šè¿‡å¯¹æ¯ä¸ª 应用汇总函数 å½¢æˆçš„,表示为
A = {A(J. | J ∈ J}✅
在 Bakumenko ç‰äººçš„å·¥ä½œä¸ [6]ï¼Œå¡«å……å°†äº¤æ˜“é•¿åº¦æ ‡å‡†åŒ–ä¸ºç»Ÿä¸€çš„ç‰¹å¾å‘é‡ ï¼Œå‡†å¤‡æœºå™¨å¦ä¹ 模型输入。交易由 ERP 属性定义,例如账户编å·å’Œå€Ÿè´·æ ‡å¿—,åˆå¹¶åˆ° 特å¾ä¸ã€‚æ¤ç¼–ç 特å¾åœ¨ç¨€ç–矩阵ä¸çš„维度éµå¾ªä»¥ä¸‹å…¬å¼ï¼š
feature_count = max(transaction_amount) * (|unique_values(feature1)| + |unique_values(feature2)|)
å…¶ä¸ æ˜¯æ‰€æœ‰æ—¥è®°è´¦åˆ†å½•ä¸æœ€å¤§äº¤æ˜“金é¢çš„乘积,表示为 ï¼Œä»¥åŠ å’Œ 特å¾å‘é‡ä¸å”¯ä¸€å…ƒç´ 的组åˆè®¡æ•°ï¼ˆ å’Œ ï¼‰ã€‚å› æ¤ï¼Œå¯¹äºŽå˜åœ¨ 577 个唯一 值和 特å¾å‘é‡ä¸ 4 个唯一值的独çƒç¼–ç 方法,将导致 2336 个编ç 特å¾ã€‚æ¤ç‰¹å¾ç©ºé—´ç»è¿‡ PCA é™ç»´ã€‚
相å,为了将 SBERT 模型应用于æ¯ä¸ª JE ä¸çš„交易数æ®ç¼–ç ,我们首先基于 JE æ ‡è¯†ç¬¦ï¼Œé€šè¿‡ group-by æ“作将交易分类特å¾è¿žæŽ¥èµ·æ¥ã€‚å°†æ¯ä¸ªäº¤æ˜“çš„ å’Œ 属性以åŠäº¤æ˜“本身组åˆåœ¨ä¸€èµ·çš„过程如下:
text_8 = "Source: " + feature1_8 + " Account_DC: " + feature2_8 + " " + transaction_8
å…¶ä¸ æ˜¯ç»„ 的连接文本, 是组 ä¸çš„交易数é‡ã€‚ 是连接æ“作,使用逗å·å’Œç©ºæ ¼ä½œä¸ºäº¤æ˜“的分隔符。 是组 ä¸ç¬¬ 个交易的 属性, 是组 ä¸ç¬¬ 个交易的 属性。
…
æ¯ä¸ª JE 的连接文本 ( ) 被处ç†ä¸ºå•ä¸ªå¥å结构。SBERT 模型的 encode 方法首先将æ¯ä¸ªå—ç¬¦ä¸²æ ‡è®°åŒ–ä¸ºä¸€ç³»åˆ—æ ‡è®°ã€‚SBERT 然åŽä½¿ç”¨å…¶åŸºäºŽ BERT 的架构为æ¯ä¸ªæ ‡è®°ç”Ÿæˆä¸Šä¸‹æ–‡åµŒå…¥ï¼Œè¿™æ¶‰åŠå¤šä¸ª Transformer 层和自注æ„力机制。平å‡æ± 化æ¥éª¤å°†è¿™äº›æ ‡è®°åµŒå…¥èšåˆä¸ºå›ºå®šå¤§å°çš„å¥å嵌入。PCA ç‰é™ç»´æ²¡æœ‰ç”¨äºŽä¿æŒåµŒå…¥çš„原始维度,确ä¿ç²¾ç¡®çš„评估 [6]。我们将嵌入归一化为零å‡å€¼å’Œå•ä½æ–¹å·®ï¼Œä»¥ä¾¿åœ¨æœºå™¨å¦ä¹ 任务ä¸æé«˜ä¸€è‡´æ€§å¹¶åŠ å¿«æ”¶æ•›é€Ÿåº¦ï¼Œè¿™å¯¹äºŽåŸºäºŽè·ç¦»æˆ–梯度下é™çš„算法至关é‡è¦ï¼Œå¯ä»¥æ高跨模型的性能。SBERT 嵌入为æ¯ä¸ªæ—¥è®°è´¦åˆ†å½•åˆ›å»ºå›ºå®šå¤§å°çš„密集å‘é‡ï¼Œæ•èŽ·äº¤æ˜“详细信æ¯ï¼Œé€šè¿‡æ€»ç»“å¤æ‚çš„æ•°æ®äº¤äº’,帮助进行异常检测和模å¼è¯†åˆ«ã€‚
æ•°æ®å¹³è¡¡å’Œæ¨¡åž‹æ€§èƒ½éªŒè¯
在机器å¦ä¹ ä¸ï¼Œç±»åˆ†å¸ƒä¸å¹³è¡¡çš„å斜数æ®é›†ä¼šé˜»ç¢æ¨¡åž‹è®ç»ƒä¸çš„åˆ†ç±»ä»»åŠ¡ï¼Œå› ä¸ºå®ƒä¼šåå‘多数类,并影å“异常检测。éµå¾ª [18] ä¸çš„指å—,我们使用 80/20 分层分割,以确ä¿è®ç»ƒé›†å’Œæµ‹è¯•é›†ä¸åŒ…å«æ¯”例异常表示,从而å‡å°‘åå·®ã€‚æˆ‘ä»¬é€šè¿‡å¯¹å°‘æ•°ç±»è¿›è¡ŒåŠ æƒæ¥è°ƒæ•´ä¸å¹³è¡¡ï¼Œä»¥æ高模型阶段的æ•æ„Ÿæ€§ï¼Œå¹¶ç¡®ä¿ç»“果一致性和与æ’定éšæœºçŠ¶æ€çš„公平比较。在è®ç»ƒå’Œä¼˜åŒ–ä¸ï¼Œæˆ‘们é¿å…了交å‰éªŒè¯ï¼Œè®¤è¯†åˆ°å®ƒåœ¨ä¸å¹³è¡¡æ•°æ®é›†å’Œå¤§åž‹ç‰¹å¾é›†ä¸å˜åœ¨çš„缺点,这一点由 Rao ç‰äººæŒ‡å‡º [33]。交å‰éªŒè¯ä¼šå¢žåŠ 过拟åˆé£Žé™©ï¼Œå°¤å…¶æ˜¯åœ¨ä½¿ç”¨è®¸å¤šæ¨¡åž‹å’Œå¹¿æ³›çš„超å‚数调整时。éšç€æ•°æ®ç»´åº¦çš„å¢žåŠ ï¼Œå®ƒçš„æœ‰æ•ˆæ€§ä¼šä¸‹é™ï¼Œå¯¼è‡´æ¨¡åž‹æ–¹å·®æ›´é«˜ï¼Œéš¾ä»¥ä»Žå¤æ‚的特å¾äº¤äº’ä¸èŽ·å¾—å¯é 的评估。ä¸å¹³è¡¡æ•°æ®é›†ä¼šåŠ 剧这一挑战,导致交å‰éªŒè¯æŠ˜å å差,并导致性能评估å差。
我们选择一致的 80/20 分层分割,以ä¿æŒè·¨æ¨¡åž‹çš„测试集一致性,这对于准确比较算法性能至关é‡è¦ï¼Œè€Œäº¤å‰éªŒè¯çš„å¯å˜æ•°æ®å集å¯èƒ½ä¼šæŸå®³è¿™ä¸€ç‚¹ã€‚虽然这ç§ç–ç•¥å¯ä»¥ç¼“解一些挑战,但它å¯èƒ½ä¼šå½±å“æ¨¡åž‹çš„æ³›åŒ–èƒ½åŠ›ã€‚ä¸ºäº†æŠµæ¶ˆè¿™ä¸€ç‚¹ï¼Œæˆ‘ä»¬é‡‡ç”¨äº†ä»”ç»†çš„æŒ‡æ ‡é€‰æ‹©å’Œè®ç»ƒåŽäº¤å‰éªŒè¯è¯„估,尽管由于数æ®é›†çš„å¤æ‚æ€§ï¼Œç›´æŽ¥å¯¹å°‘æ•°ç±»è¿›è¡Œè¿‡é‡‡æ ·æŠ€æœ¯ä¸å¯è¡Œã€‚
模型选择
在这项工作ä¸ï¼Œæˆ‘ä»¬è¯„ä¼°äº†ä¸‰ç§ Sentence-BERT 模型用于嵌入生æˆï¼šall-mpnet-base-v2ã€all-distilroberta-v1 å’Œ all-MiniLM-L6-v2ï¼Œè¿™äº›æ¨¡åž‹å› å…¶æµè¡Œåº¦å’Œæ€§èƒ½è€Œè¢«é€‰ä¸ï¼Œè¿™ä¸€ç‚¹å¯ä»¥é€šè¿‡å®ƒä»¬åœ¨ HuggingFace 模型ä¸å¿ƒçš„高下载率æ¥è¯æ˜Ž [16]。æ¯ä¸ªæ¨¡åž‹éƒ½åœ¨è¶…过 10 亿对数æ®ä¸Šè¿›è¡Œè®ç»ƒï¼Œå…·æœ‰ä¸åŒçš„优势:all-mpnet-base-v2 在质é‡æ–¹é¢è¡¨çŽ°å‡ºè‰²ï¼Œæ€§èƒ½å¾—分为 63.30 [35],all-distilroberta-v1 在效率和性能之间å–得平衡,大å°ä¸º 290 MB,all-MiniLM-L6-v2 速度快,大å°ä¸º 80 MB,适åˆå®žæ—¶åº”用 [35]ã€‚æœ‰å…³æ¨¡åž‹è§„æ ¼çš„è¯¦ç»†ä¿¡æ¯ï¼Œè¯·å‚阅表 1ã€‚é€‰æ‹©è¿™äº›æ¨¡åž‹æ˜¯å› ä¸ºå®ƒä»¬åœ¨è´¨é‡ã€æ•ˆçŽ‡å’Œé€Ÿåº¦æ–¹é¢çš„äº’è¡¥ä¼˜åŠ¿ï¼Œæœ‰åŠ©äºŽè¿™é¡¹ç ”ç©¶ä¸çš„å…¨é¢è¯„估。
我们还使用了五ç§æœºå™¨å¦ä¹ 分类器:éšæœºæ£®æž— (RF)ã€ä½¿ç”¨ XGBoost (XGB) 的梯度æå‡æœº (GBM)ã€æ”¯æŒå‘é‡æœº (SVM)ã€é€»è¾‘回归 (LR) 和使用 Keras TensorFlow 实现的神ç»ç½‘络 (NN)。RF 以其通过集æˆå†³ç–æ ‘æ¥å‡å°‘过拟åˆçš„能力而闻å,GBM 以其通过优化弱å¦ä¹ 器æ¥è§£å†³æ•°æ®ä¸å¹³è¡¡é—®é¢˜çš„能力而闻å,SVM 以其在高维空间ä¸çš„有效性而闻å,LR 是一ç§å¿«é€Ÿé«˜æ•ˆçš„基线,而 NN 则用于对å¤æ‚关系进行建模,需è¦ä»”细调整架构 [10, 12, 15, 17, 19, 23]。
实验设计
我们的工作使用了一个包å«å®žé™…异常和人工æ’入异常的财务数æ®é›†ï¼Œæ—¨åœ¨æ£€æµ‹åŽè€…,åŒæ—¶æœ€å¤§é™åº¦åœ°å‡å°‘å‰è€…ä¸çš„误报。该数æ®é›†åæ˜ äº†çŽ°å®žä¸–ç•Œæ¡ä»¶ï¼Œå…·æœ‰æ˜¾è‘—çš„ç±»ä¸å¹³è¡¡ï¼Œä¸Ž Bakumenko ç‰äººçš„工作 [6] ä¸çš„æ•°æ®é›†ç›¸åŒï¼Œç»è¿‡åŒ¿å化和细化,åªåŒ…å«å¿…è¦çš„分类特å¾ã€‚我们将 8 ç§ç±»åž‹çš„异常视为å•ä¸ªå¼‚常类,从而将其构建为二元分类挑战,确ä¿æˆ‘们的è®ç»ƒ/测试分割ä¸å¼‚常类型的å‡åŒ€åˆ†å¸ƒã€‚
为了有效地识别财务日记账分录ä¸çš„异常,这些分录构æˆä¸€ä¸ªé«˜ç»´æ•°æ®é›†ï¼Œæˆ‘们通过使用 SBERT LLM 对éžè¯ä¹‰åˆ†ç±»æ•°æ®è¿›è¡Œç¼–ç æ¥è¿›è¡Œåˆ›æ–°ï¼Œç‰¹åˆ«æ˜¯ä½¿ç”¨ 3 个 Sentence-Transformers 模型将å¯å˜é•¿åº¦çš„åˆ†å½•æ ‡å‡†åŒ–ä¸ºä¸€è‡´çš„ç‰¹å¾ç©ºé—´ï¼Œè§£å†³åŽŸå§‹å·¥ä½œ [6] ä¸ä¼ 统编ç 方法的局é™æ€§ã€‚
实验结果
ç¼–ç 特å¾é›†åˆ†æž
我们对æ¥è‡ªä¸‰ä¸ª SBERT 模型嵌入的特å¾é›†è¿›è¡Œäº†ä¸»æˆåˆ†åˆ†æž (PCA)(图 3)。PCA 展示了嵌入在数æ®é›†ä¸çš„维度和信æ¯ä¿ç•™èƒ½åŠ›ï¼Œå°½ç®¡è¿›è¡Œäº†é™ç»´ï¼Œä½†ä»ç„¶ä¿ç•™äº†æ˜¾è‘—的方差。æ¥è‡ª all-MiniLM-L6-v2 模型 (LLM1) çš„åµŒå…¥éœ€è¦ 63 个æˆåˆ†æ‰èƒ½ä¿ç•™ 99% çš„æ–¹å·®ï¼Œéœ€è¦ 150 个æˆåˆ†æ‰èƒ½ä¿ç•™ 99.9% 的方差,而 all-distilroberta-v1 (LLM2) å’Œ all-mpnet-base-v2 (LLM3) 模型,尽管å‘é‡æ›´å¤§ï¼ˆ770),但对于相åŒçš„方差水平,需è¦çš„æˆåˆ†æ›´å°‘(LLM2 为 57 个,LLM3 为 52 个)。
进一æ¥åˆ†æžè¡¨æ˜Žï¼Œæœ€ç»ˆ 0.9% 的方差信æ¯é‡è¾ƒå°‘,这表明它å¯èƒ½åŒ…å«å™ªå£°æˆ–æ•°æ®é›†ç‰¹å®šçš„特å¾ã€‚ä¸€é¡¹æ¯”è¾ƒç ”ç©¶ï¼ˆå›¾ 4)表明,LLM 嵌入在é™ç»´æ–¹é¢ä¼˜äºŽç‹¬çƒç¼–ç 。LLM 嵌入在维度更少的情况下ä¿æŒäº†é«˜æ–¹å·®ï¼Œè¿™ä¸Žæ¥è‡ªç‹¬çƒç¼–ç 的稀ç–ã€é«˜ç»´å‘é‡å½¢æˆå¯¹æ¯”。独çƒç¼–ç æ•°æ®æœ€åˆæœ‰ 2336 个维度,é™ç»´åˆ° 419 个æ‰èƒ½è¾¾åˆ° 99% 的方差,这ä»ç„¶é«˜äºŽ LLM 嵌入。
é‡è¦çš„是è¦è®¤è¯†åˆ° PCA 的线性性质é™åˆ¶äº†å®ƒæ•æ‰éžçº¿æ€§å¤æ‚性的能力。虽然 PCA 有助于ç†è§£ç»“构属性和é™ç»´çš„潜力,但它ä¸èƒ½é¢„测下游任务ä¸çš„性能。我们的扩展分æžåŒ…括对这些任务ä¸åµŒå…¥çš„ç»éªŒè¯„估。
总之,LLM 嵌入比独çƒç¼–ç æ供更有效的数æ®è¡¨ç¤ºï¼Œå¯¹äºŽç±»ä¼¼çš„方差水平,需è¦æ›´å°‘的维度,这使得 LLM 嵌入更适åˆå¤æ‚任务。
下游模型è®ç»ƒå’Œä¼˜åŒ–
我们使用了å„ç§æœºå™¨å¦ä¹ 分类器,如第 4.3 节所述,包括 SVMã€RFã€XGBoostã€LRã€ANN å’Œ DNNã€‚å¯¹äºŽéž ANN/DNN 模型,使用 Hyperopt åº“å’Œæ ‘å½¢ Parzen 估计器 (TPE) 算法进行è´å¶æ–¯ä¼˜åŒ–,在 100 次è¿ä»£ä¸è¿›è¡Œè¶…å‚æ•°è°ƒæ•´ã€‚è®¡ç®—æ ·æœ¬æƒé‡ä»¥è§£å†³ä¸å¹³è¡¡æ•°æ®é›†é—®é¢˜ï¼Œå¹¶é€šè¿‡è½¬æ¢å¤šç±»åˆ«æ ‡ç¾æ¥å®žçŽ°äºŒå…ƒåˆ†ç±»ã€‚模型è®ç»ƒä½¿ç”¨ Python ä»¥åŠ Scikit-learn å’Œ TensorFlow 库。我们设计了三ç§å…·æœ‰ä¸åŒå¤æ‚度的神ç»ç½‘络架构,并在 50 个 epoch 上进行è®ç»ƒï¼Œå¹¶ä½¿ç”¨æ—©æœŸåœæ¢æ¥è¿›è¡Œæ³›åŒ–,如表 2 所示。
通过在 NumPy å’Œ TensorFlow ä¸å›ºå®šç§åæ¥ç¡®ä¿å¯é‡å¤æ€§ï¼Œå¹¶é€šè¿‡è‡ªå®šä¹‰å›žè°ƒæ¥ç›‘控平å‡å¬å›žå®ã€‚ANN 模型包å«å•ä¸ªéšè—层,用于快速è®ç»ƒï¼ŒDNN1 包å«å¤šä¸ªéšè—层,用于å¤æ‚模å¼è¯†åˆ«ï¼ŒDNN2 åŒ…å« dropout 层,以防æ¢è¿‡æ‹Ÿåˆï¼ŒåŒæ—¶ä¿æŒç±»ä¼¼ DNN1 的深度架构。
è¯„ä¼°æŒ‡æ ‡å’Œæ¯”è¾ƒåˆ†æž
在这项工作ä¸ï¼Œæˆ‘们之å‰è®¨è®ºäº†å°† LR 作为基线模型的好处。对于三个 SBERT 模型嵌入ä¸çš„æ¯ä¸€ä¸ªï¼Œæˆ‘们è®ç»ƒäº†ä¸¤ä¸ªä¸‹æ¸¸ LR 模型:一个使用默认å‚数的模型和一个ç»è¿‡ Hyperopt 优化的模型。未ç»ä¼˜åŒ–的模型在平å‡å¬å›žå®æ–¹é¢è¡¨çŽ°å‡ºé«˜æ€§èƒ½ï¼Œåˆ†åˆ«ä¸º all-MiniLM-L6-v2 为 0.9516,all-distilroberta-v1 为 0.9040,all-mpnet-base-v2 为 0.9520。图 5 显示了ç»è¿‡ä¼˜åŒ–çš„ LR 模型的å¦ä¹ 曲线,使用 函数进行交å‰éªŒè¯ï¼Œä»¥æ£€æŸ¥æ³›åŒ–和过拟åˆã€‚它在ä¸æ–å¢žåŠ çš„æ•°æ®å集上è®ç»ƒæ¨¡åž‹ï¼Œå¹¶åœ¨è®ç»ƒé›†å’ŒéªŒè¯é›†ä¸Šè¿›è¡Œè¯„估,使用 5 折交å‰éªŒè¯ã€‚我们计算了跨折å çš„è®ç»ƒå’ŒéªŒè¯åˆ†æ•°çš„å‡å€¼å’Œæ ‡å‡†å·®ï¼Œä»¥è¯„ä¼°å¹³å‡æ€§èƒ½å’Œå˜å¼‚性,åŒæ—¶è€ƒè™‘ç±»ä¸å¹³è¡¡ã€‚è®ç»ƒåˆ†æ•°çº¿ï¼ˆçº¢è‰²ï¼‰è¡¨ç¤ºè®ç»ƒå集的性能,交å‰éªŒè¯åˆ†æ•°çº¿ï¼ˆç»¿è‰²ï¼‰è¡¨ç¤ºæœªè§è¿‡çš„验è¯é›†çš„性能,æ供了一个å¯é 的估计,用于评估跨数æ®å集的模型性能以åŠé€šè¿‡æ›´å¤šæ•°æ®è¿›è¡Œæ”¹è¿›çš„å¯èƒ½æ€§ã€‚
在图 5 ä¸ï¼Œæ‰€æœ‰ä¸‰ä¸ªæ¨¡åž‹éƒ½å±•ç¤ºäº†ç§¯æžçš„å¦ä¹ 特å¾ã€‚E3 模型在å¦ä¹ 和泛化方é¢è¡¨çŽ°å‡ºè‰²ï¼Œå±•ç¤ºäº†å¼ºå¤§çš„æ•°æ®å¦ä¹ 能力。E1 模型虽然性能尚å¯ï¼Œä½†æ˜¾ç¤ºå‡ºè¾¾åˆ°å¦ä¹ 能力æžé™çš„迹象。E2 模型æ£åœ¨æ”¹è¿›ï¼Œä½†éœ€è¦æ›´å¥½çš„æ£åˆ™åŒ–ç–略。Hyperopt 优化的分æžæ˜¾ç¤ºï¼ŒE1 çš„ C 值为 0.07677,表明æ£åˆ™åŒ–程度适ä¸ã€‚E2 çš„æ£åˆ™åŒ–更强,C 值为 0.01702,并使用 ‘newton-cg’ 求解器。E3 çš„ C 值最å°ï¼Œä¸º 0.01358,使用 ‘liblinear’ 求解器,显示出最强的æ£åˆ™åŒ–。所有模型都使用统一的类æƒé‡æ¥æé«˜å°‘æ•°ç±»é¢„æµ‹ç²¾åº¦ï¼Œå¹¶æ ¹æ®å…¶å¦ä¹ 需求调整特定的æ£åˆ™åŒ–强度和求解器选择。
图 6 评估了 LRã€RFã€XGBã€SVM å’Œ NN 分类器的性能,这些分类器ç»è¿‡ä¼˜åŒ–并与æ¥è‡ªä¸‰ä¸ªè¯è¨€æ¨¡åž‹çš„嵌入相集æˆã€‚æ€§èƒ½æŒ‡æ ‡åŸºäºŽå¹³å‡å¬å›žå®ã€‚所有嵌入都显示出ä¸åŒç¨‹åº¦çš„æœ‰æ•ˆæ€§ï¼Œå…¶ä¸ all-mpnet-base-v2 在å„ç§åˆ†ç±»å™¨ä¸è¡¨çŽ°å‡ºç¨³å®šæ€§å’Œæ€§èƒ½ã€‚all-MiniLM-L6-v2 也表现良好,尤其是在 LR å’Œ NN ä¸ï¼Œè€Œ all-distilroberta-v1 也很稳固,但没有在 NN ä¸è¶…过 all-MiniLM-L6-v2。这些差异表明,æŸäº›åµŒå…¥åœ¨ä¸‹æ¸¸ä»»åŠ¡ä¸ä¸Žç‰¹å®šåˆ†ç±»å™¨æ›´å…¼å®¹ï¼Œè¿™æŒ‡å¯¼äº†å®žé™…模型选择。
使用ä¸åŒåµŒå…¥çš„优化模型的混淆矩阵值如表 3 所示。all-MiniLM-L6-v2 嵌入与 LRï¼Œä»¥åŠ NN(如果 FP å‡å°‘),å¯èƒ½æ供最平衡的性能,而 all-mpnet-base-v2 嵌入在跨模型的 TP 率方é¢è¡¨çŽ°å‡ºæ›´é«˜çš„性能。图 7 对比了 LLM åµŒå…¥ä¸Žä¼ ç»Ÿå¡«å……ç‹¬çƒç¼–ç 在 LRã€RFã€SVM å’Œ NN 模型ä¸çš„å¬å›žå®åˆ†æ•°å·®å¼‚。æ¯ä¸ªæ¡å½¢å›¾æ˜¾ç¤ºäº† LLM 嵌入的å¬å›žåˆ†æ•°å·®å¼‚,方框图总结了æ¯ä¸ªæ¨¡åž‹çš„分布和å‡å€¼ï¼ˆè±å½¢ï¼‰ã€‚
对于 LR,LLM 嵌入将å¬å›žåˆ†æ•°æ高了 +0.056ã€+0.030 å’Œ +0.032,分布紧凑,表明在跨嵌入方é¢çš„一致增强。相å,RF 模型在使用 LLM 嵌入时表现出下é™ï¼Œå·®å¼‚分别为 -0.066ã€-0.044 å’Œ -0.021,å˜å¼‚范围适ä¸ã€‚SVM 模型在使用 LLM 嵌入时性能下é™ï¼Œå·®å¼‚分别为 -0.085ã€-0.108 å’Œ -0.015,显示出å‘更低性能的显著å˜å¼‚。NN 模型å—益于 LLM åµŒå…¥ï¼Œåˆ†åˆ«å¢žåŠ äº† +0.064ã€+0.050 å’Œ +0.062,å˜å¼‚性最å°ï¼Œè¡¨æ˜Žå¯é 的积æžå½±å“。LLM 嵌入改进的 LR å’Œ NN æ¨¡åž‹æ€§èƒ½ä¼˜äºŽä¼ ç»Ÿçš„å¡«å……ç‹¬çƒç¼–ç ,但通常会é™ä½Ž RF å’Œ SVM 模型的有效性。虽然æŸäº›æ¨¡åž‹å¯èƒ½å§‹ç»ˆå—益于 LLM 嵌入,但这çªå‡ºäº†åœ¨å°† LLM 嵌入应用于数æ®ç¼–ç 时性能的模型特定å˜å¼‚性。
图 8 ä¸çš„ Bland-Altman 图比较了两个分数集,评估了使用嵌入(all-MiniLM-L6-v2 (E1)ã€all-distilroberta-v1 (E2) å’Œ all-mpnet-base-v2 (E3))的机器å¦ä¹ æ¨¡åž‹æ€§èƒ½ä¸Žä¼ ç»Ÿæ–¹æ³•çš„å¯¹æ¯”ã€‚çº¢çº¿æ˜¾ç¤ºäº†æ‰€æœ‰æ¨¡åž‹çš„å¹³å‡å¬å›žå®åˆ†æ•°å·®å¼‚。è“线设置在平å‡å·®å¼‚ ± 1.96 SD,定义了一致性é™åº¦ï¼Œè¡¨æ˜Žå¤§å¤šæ•°åˆ†æ•°å·®å¼‚的预期范围。è“线周围的点分散表明,æŸäº›æ¨¡åž‹çš„æ–°åµŒå…¥ä¸Žä¼ ç»Ÿæ–¹æ³•ç›¸æ¯”ï¼Œä¸Žé¢„æœŸæ€§èƒ½èŒƒå›´ä¸€è‡´ã€‚æ€§èƒ½åœ¨è·¨æœºå™¨å¦ä¹ 模型和嵌入方é¢æœ‰æ‰€ä¸åŒã€‚例如,NN 模型通常表现出改进的结果,这一点由红线上方的æ£å差所示,而 SVM 模型显示出有效性é™ä½Žï¼Œè¿™ä¸€ç‚¹ç”±è´Ÿå差所示。总体而言,使用 LLM 嵌入的机器å¦ä¹ æ¨¡åž‹å¾€å¾€ä¸Žä¼ ç»Ÿæ–¹æ³•çš„é¢„æœŸæ€§èƒ½èŒƒå›´ç›¸åŒ¹é…,表明平å‡ç»“果相当。
å‡è®¾é‡è¿°
对 Sentence-Transformer 嵌入进行的 PCA 分æžè¡¨æ˜Žï¼Œä¸Žä¼ 统方法相比,财务数æ®ç¼–ç 的紧凑性和信æ¯ä¿ç•™èƒ½åŠ›æœ‰æ‰€æ高,从而è¯å®žäº†å‡è®¾ 1。这çªå‡ºäº†åµŒå…¥åœ¨æ ‡å‡†åŒ–特å¾å˜å¼‚性和有效压缩信æ¯æ–¹é¢çš„优越能力。
对于å‡è®¾ 2,将 Sentence-Transformer 嵌入与优化的 LR å’Œ NN 模型相结åˆï¼Œæ˜¾ç¤ºå‡ºæ”¹è¿›çš„异常检测性能,这è¯å®žäº† LLM åµŒå…¥è¶…è¶Šä¼ ç»Ÿæ–¹æ³•çš„æ½œåŠ›ã€‚è™½ç„¶è§‚å¯Ÿåˆ°ä¸€äº›æ€§èƒ½å·®å¼‚ï¼Œä¾‹å¦‚åœ¨ SVM 模型ä¸ï¼Œä½†è¿™äº›å·®å¼‚都在预期的范围内。结果强调了这ç§åˆ›æ–°æ–¹æ³•çš„有效性,强调了战略性模型选择的é‡è¦æ€§ï¼Œä»¥æœ€å¤§é™åº¦åœ°å‘挥其优势。
讨论
这项工作利用 Sentence-Transformer LLM 对财务数æ®è¿›è¡Œç¼–ç ,展示了一ç§å¢žå¼ºå¼‚常检测的新方法。
结果解读
对æ¥è‡ªä¸‰ä¸ª SBERT 模型(MiniLM-L6-v2ã€all-distilroberta-v1 å’Œ all-mpnet-base-v2)的嵌入进行的 PCA 分æžè¡¨æ˜Žï¼Œä¸Žä¼ 统编ç 方法相比,财务数æ®é›†çš„é™ç»´å’Œä¿¡æ¯ä¿ç•™èƒ½åŠ›æœ‰äº†æ˜¾è‘—æ高。例如,考虑到下游机器å¦ä¹ 性能,all-mpnet-base-v2 模型åªéœ€è¦ 52 个 PCA æˆåˆ†å°±èƒ½ä¿ç•™ 99% 的方差,而填充独çƒç¼–ç åˆ™éœ€è¦ 419 个。所有 3 个 SBERT 模型的嵌入特å¾ç»´åº¦åœ¨ç›¸åŒæ¯”较ä¸æ˜Žæ˜¾æ›´ä½Žã€‚è¿™ç§è¿›æ¥è§£å†³äº†è´¢åŠ¡éžè¯ä¹‰éžæ—¶é—´æ€§åˆ†ç±»ç‰¹å¾é›†ä¸ç‰¹å¾å¼‚质性和稀ç–æ€§çš„å…³é”®æŒ‘æˆ˜ï¼Œè¿™æ¯”ä¼ ç»Ÿæ–¹æ³•æœ‰äº†æ˜¾è‘—æ”¹è¿›ã€‚ä¸‹æ¸¸æœºå™¨å¦ä¹ 模型的性能è¯å®žäº† LLM 嵌入在异常检测ä¸çš„有效性。å„ç§æœºå™¨å¦ä¹ 分类器的使用,包括ç»è¿‡è´å¶æ–¯ä¼˜åŒ–çš„ LRã€RFã€XGBã€SVM å’Œ NN,以åŠå¤šç§æž¶æž„和调整的å‚数,çªå‡ºäº†åµŒå…¥çš„多功能性和æ高模型性能的潜力。使用所有 3 个 SBERT 嵌入的 LR å’Œ NN æ¨¡åž‹çš„ä¼˜è¶Šè¯„ä¼°æŒ‡æ ‡å¼ºè°ƒäº†è¿™äº›åµŒå…¥åœ¨å¢žå¼ºå¼‚å¸¸æ£€æµ‹æ–¹é¢çš„潜力。SVM 的表现ä¸ä½³ï¼Œå³ä½¿åœ¨é¢„期的范围内,也çªå‡ºäº†åœ¨æœªæ¥çš„应用ä¸éœ€è¦è¯„估模型嵌入兼容性。
对财务异常检测的影å“
å°† Sentence-Transformer LLM æ•´åˆåˆ°è´¢åŠ¡å¼‚常检测ä¸ï¼Œä»£è¡¨ç€ä»Žä¼ 统方法的飞跃,增强了数æ®è¡¨ç¤ºå’Œç®—法对异常的æ•æ„Ÿæ€§ã€‚è¿™ç§æ–¹æ³•åœ¨å®žé™…应用ä¸æ‰¿è¯ºé€šè¿‡æ高准确性和最大é™åº¦åœ°å‡å°‘误报æ¥æ高欺诈检测效率,从而简化财务æ“作。这ç§æ–°æ–¹æ³•åœ¨æŸäº›æƒ…况下将æˆåˆ†æ•°é‡å‡å°‘了八å€ï¼ŒåŒæ—¶æé«˜äº†ä¸‹æ¸¸æ¨¡åž‹æ€§èƒ½ï¼Œæœ‰æ•ˆåœ°æ ‡å‡†åŒ–äº†ç‰¹å¾å˜å¼‚性。它è¯æ˜Žäº†å…¶æœ‰æ•ˆæ€§ï¼Œå¹¶ä¸ºè´¢åŠ¡æ•°æ®ç¼–ç è®¾å®šäº†æ–°çš„æ ‡å‡†ã€‚éšç€è¿™ç§æ–¹æ³•è®ºå˜å¾—越æ¥è¶Šæ™®é,它å¯èƒ½ä¼šåœ¨è´¢åŠ¡åˆ†æžä¸å»ºç«‹æ–°çš„基准,推动该行业机器å¦ä¹ 应用的进æ¥ã€‚进一æ¥çš„实è¯ç ”究和现实世界应用å¯ä»¥å·©å›ºå…¶åœ°ä½å¹¶é‡åŒ–其影å“。
å±€é™æ€§å’Œåå·®
æˆ‘ä»¬çš„ç ”ç©¶ä½¿ç”¨äº†æ¥è‡ªå„ç§ ERP 的真实世界数æ®é›†ï¼Œå¹¶ç”±è´¢åŠ¡å®¡è®¡äººå‘˜æ·»åŠ 了八ç§ä¸åŒçš„有æ„å¼•å…¥å’Œæ ‡è®°çš„å¼‚å¸¸ã€‚è¿™äº›å¼‚å¸¸åæ˜ äº†å®¡è®¡äººå‘˜å¯¹å®žé™…å¼‚å¸¸æ£€æµ‹çš„å…´è¶£ï¼Œå…·æœ‰åˆæˆæ€§è´¨ï¼Œå¯èƒ½ä¼šé™åˆ¶æ³›åŒ–能力。æ¤å¤–,分æžçŽ°å®žä¸–界财务数æ®çš„挑战在于å¯èƒ½å˜åœ¨çš„æœªæ ‡è®°å¼‚å¸¸ï¼Œè¿™å¯èƒ½ä¼šä½¿æœºå™¨å¦ä¹ 模型验è¯äº§ç”Ÿåå·®ï¼Œå¹¶å¢žåŠ è¯¯æŠ¥çŽ‡ã€‚æ¤å¤–,PCA 分æžæ˜¯ä¸€ç§çº¿æ€§æ–¹æ³•ï¼Œå…¶èƒ½åŠ›æœ‰é™ï¼Œæ— 法表示特å¾é›†ä¸çš„éžçº¿æ€§å…³ç³»ã€‚æ¤å¤–,LLM 对æ示工程åšå‡ºå应,这æ„味ç€è¾“入特å¾è¿žæŽ¥çš„å˜åŒ–会改å˜åµŒå…¥ï¼Œè¿™ä¸€ç‚¹åœ¨æœ¬ç ”究ä¸æ²¡æœ‰æ¶‰åŠã€‚最åŽï¼Œæˆ‘们的方法侧é‡äºŽåˆ†ç±»ç‰¹å¾ï¼Œéœ€è¦åœ¨éœ€è¦ç²¾ç¡®æ•°å€¼åˆ†æžçš„情况下进行扩展。
结论与未æ¥å·¥ä½œ
贡献总结
æˆ‘ä»¬çš„ç ”ç©¶é€šè¿‡å°† LLM 嵌入与机器å¦ä¹ 分类器相结åˆï¼ŒæŽ¨åŠ¨äº†è´¢åŠ¡å¼‚常检测领域的å‘展,这是一ç§æ–°æ–¹æ³•ï¼Œæ˜¾è‘—缓解了特å¾å¼‚质性和稀ç–性问题。利用 Sentence-Transformer 模型对财务数æ®è¿›è¡Œç¼–ç ,我们的方法ä¸ä»…在é™ç»´å’Œä¿¡æ¯ä¿ç•™æ–¹é¢è¶…è¶Šäº†ä¼ ç»Ÿçš„ç¼–ç 技术,而且还展示了在选定的机器å¦ä¹ 分类器ä¸å¢žå¼ºçš„异常检测效果。这与特å¾è¡¨ç¤ºçš„既定原则相一致 [9],åæ˜ äº†å®ƒä»¬åœ¨è´¢åŠ¡æ•°æ®çŽ¯å¢ƒä¸çš„实际应用。在全é¢çš„实验设置和展示实际适用性的基础上,我们的工作为自然è¯è¨€å¤„ç†å’Œè´¢åŠ¡åˆ†æžäº¤å‰é¢†åŸŸæœªæ¥çš„ç ”ç©¶æ供了å®è´µçš„è§è§£ã€‚
更广泛的影å“å’Œæ„义
大型è¯è¨€æ¨¡åž‹ (LLM) 在éžè¯ä¹‰è´¢åŠ¡æ•°æ®ä¸Šçš„创新应用解决了高维性和稀ç–性问题,为 LLM åœ¨å…¶ä¼ ç»Ÿåº”ç”¨ä¹‹å¤–çš„é¢†åŸŸçš„ä½¿ç”¨å¼€åˆ›äº†å…ˆä¾‹ã€‚è¿™åæ˜ äº† LLM æˆåŠŸåœ°å¯¹è§†è§‰æ ‡è®°è¿›è¡Œç¼–ç çš„å‘现 [30]ã€‚é€šè¿‡è¶…è¶Šä¼ ç»Ÿæ–¹æ³•ï¼ŒLLM 嵌入展示了其在è¯è¨€ä»»åŠ¡ä¹‹å¤–的潜力,特别是对于缺ä¹å›ºæœ‰è¯ä¹‰çš„æ•°æ®ç±»åž‹ã€‚è¿™ç§æ–¹æ³•è®ºçš„è¿›æ¥å¯ä»¥å¸®åŠ©å„ç§å…·æœ‰ç±»ä¼¼æŒ‘战的行业,特别是医疗ä¿å¥å’Œé›¶å”®è¡Œä¸šï¼Œå…¶ä¸å¤æ‚çš„æ•°æ®é›†å¯ä»¥ä»Ž LLM 增强的数æ®è¡¨ç¤ºèƒ½åŠ›ä¸èŽ·ç›Šã€‚在医疗ä¿å¥é¢†åŸŸï¼ŒLLM 嵌入å¯ä»¥é€šè¿‡æ£€æµ‹ä¸»è¦ä¸ºæ•°å€¼ã€ç¼ºä¹æ–‡æœ¬æ¸…晰度或包å«ç»“构化数æ®ï¼ˆå¦‚ MRIã€CT 扫æã€ICD 代ç 和实验室值)的数æ®é›†ä¸çš„模å¼æ¥å¢žå¼ºæ‚£è€…æ•°æ®åˆ†æžï¼Œè¿™äº›æ•°æ®éœ€è¦é¢†åŸŸçŸ¥è¯†æ‰èƒ½è¿›è¡Œè§£é‡Šã€‚在零售领域,LLM å¯ä»¥ä»Žé«˜ç»´äº¤æ˜“æ•°æ®ä¸æ供详细的è§è§£ï¼Œæ示å¤æ‚的产å“-消费者交互。这å¯ä»¥å¢žå¼ºæœºå™¨å¦ä¹ 模型预测行为ã€ç»†åˆ†å¸‚场和推è产å“的能力,从而促进市场分æžã€‚
LLM 在éžè¯ä¹‰æ•°æ®ä¸Šçš„使用扩展了它们的应用范围,并促使人们é‡æ–°æ€è€ƒæ•°æ®åˆ†æžæ–¹æ³•ï¼Œä»Žè€ŒæŽ¨åŠ¨è·¨å¦ç§‘ç ”ç©¶ï¼ŒæŽ¢ç´¢å…¶åœ¨å¤æ‚æ•°æ®é›†ä¸çš„潜力。
未æ¥ç ”究方å‘
未æ¥çš„ç ”ç©¶åº”è¯¥å°† LLM 嵌入方法扩展到更广泛的财务数æ®é›†ï¼Œè¯„ä¼°å…¶å¯æ‰©å±•æ€§ã€å¯¹å¼‚常检测精度的影å“以åŠå“应ä¸æ–å˜åŒ–的财务欺诈模å¼çš„计算效率。将这ç§æ–¹æ³•æ‰©å±•åˆ°è·¨å¤šä¸ªé¢†åŸŸçš„å„ç§éžè¯ä¹‰æ•°æ®ç±»åž‹ï¼Œè¿™äº›æ•°æ®ç±»åž‹å…·æœ‰é«˜ç»´å’Œç¨€ç–æ•°æ®é›†ï¼Œå¹¶ä¸Žå…¶ä»–先进的机器å¦ä¹ 和深度å¦ä¹ 模型相集æˆï¼Œå°†æµ‹è¯• LLM åµŒå…¥çš„é€‚åº”æ€§å’Œæœ‰æ•ˆæ€§ã€‚åº”è¯¥æŽ¢ç´¢æ— ç›‘ç£ç–ç•¥æ¥è§£å†³é›¶æ—¥å¼‚常问题,改进我们的方法,以更好地检测新模å¼ã€‚未æ¥çš„ç ”ç©¶åº”è¯¥è°ƒæŸ¥å„ç§æ•°æ®é¢„处ç†ç–略(包括èšåˆæ–¹æ³•å’Œæ示工程)如何æ高 LLM ç¼–ç 效率。对éžçº¿æ€§é™ç»´æŠ€æœ¯çš„é‡ç‚¹æŽ¢ç´¢å¯ä»¥è¡¥å…… PCA,旨在更有效地æ•æ‰ LLM 嵌入ä¸çš„å¤æ‚关系。调查åˆæˆå¼‚常与现实世界异常对模型性能的影å“,将æ供对å‘现的实际适用性的è§è§£ã€‚最åŽï¼Œé€šè¿‡æµ‹è¯•å„ç§æœ€å…ˆè¿›çš„ LLM 架构æ¥æŽ¢ç´¢æ¨¡åž‹åµŒå…¥å…¼å®¹æ€§ï¼Œå¯èƒ½ä¼šäº§ç”Ÿæ›´é‡èº«å®šåˆ¶çš„异常检测解决方案。
å‚考文献
[1] Yara Alghofaili, Albatul Albattah, and Murad A Rassam. 2020. A. ¿¿nancial fraud✅
detection model based on LSTM deep learning technique. Journal of Applied
Security Research 15, 4 (2020), 498–516.
[2] A. Alhashedi. 2021. Financial Fraud Detection Applying Data Mining Techniques:✅
A Comprehensive Review from 2009 to 2019. Computer Science Review 40 (2021),
- https://doi.org/10.1016/j.cosrev.2021.100402
[3] Abhijit Anand, Jurek Leonhardt, Jaspreet Singh, Koustav Rudra, and Avishek
Anand. 2023. Data augmentation for sample eï¿¿cient and robust document
ranking. ACM Transactions on Information Systems (2023).
[4] Matin N Ashtiani and Bijan Raahemi. 2021. Intelligent fraud detection in ï¿¿nancial
statements using machine learning and data mining: a systematic literature
review. IEEE Access 10 (2021), 72504–72525.
[5] V. Vlasselaer B. Baesens and W. Verbeke. 2015. Fraud analytics using descriptive,✅
predictive, and social network techniques : a guide to data science for fraud detection.
Wiley, New York.
[6] Alexander Bakumenko and Ahmed Elragal. 2022. Detecting anomalies in ï¿¿nancial
data using machine learning algorithms. Systems 10, 5 (2022), 130.
[7] Seila Becirovic, Emir Zunic, and Dzenana Donko. 2020. A Case Study of Cluster-
based and Histogram-based Multivariate Anomaly Detection Approach in Gen-
eral Ledgers. In 2020 19th International Symposium Infoteh-Jahorina (INFOTEH).
IEEE, 1–6.
[8] F Belfo and A Trigo. 2013. Accounting Information Systems: Tradition and Future
Directions. Procedia Technology 9 (2013), 536–546.
[9] Yoshua Bengio, Aaron Courville, and Pascal Vincent. 2013. Representation
learning: A review and new perspectives. IEEE transactions on pattern analysis
and machine intelligence 35, 8 (2013), 1798–1828.
[10] Leo Breiman. 2001. Random forests. Machine learning 45 (2001), 5–32.
[11] Longbing Cao. 2022. Ai in ï¿¿nance: challenges, techniques, and opportunities.
ACM Computing Surveys (CSUR) 55, 3 (2022), 1–38.
[12] Tianqi Chen and Carlos Guestrin. 2016. Xgboost: A scalable tree boosting system.
In Proceedings of the 22nd acm sigkdd international conference on knowledge
discovery and data mining. 785–794.