🧠 解密人格：大型语言模型如何从用户对话中推断个性特征 New

引言

在当今这个信息爆炸的时代，心理健康问题日益受到关注。个性特征作为心理健康的重要组成部分，影响着我们的情绪、行为和人际关系。随着人工智能技术的飞速发展，尤其是大型语言模型（LLMs）的崛起，研究者们开始探索如何利用这些模型来推断个性特征。本文将深入探讨一项研究，分析其算法实现的细节，揭示大型语言模型如何从用户对话中推断出五大人格特征。

🌟 大型语言模型的崛起

大型语言模型（如GPT-4o和GPT-4o mini）在自然语言处理领域展现出了惊人的能力。这些模型不仅能够生成连贯的文本，还能够理解和分析复杂的语言结构。研究表明，LLMs能够通过分析文本数据来推断个性特征，提供一种替代传统自我报告问卷的新方法。

🔍 研究目标与方法

本研究的主要目标是评估LLMs在推断五大人格特征（外向性、宜人性、尽责性、神经质和开放性）方面的有效性。研究采用了两种不同的方法：

直接推断：直接提示LLM从用户生成的文本中推断个性特征。
间接推断：首先生成BFI-10（Big Five Inventory-10）项目分数，然后利用这些分数计算个性特征。

数据集

研究使用了102名参与者的对话数据，这些参与者在半结构化访谈中回答了五个标准化问题。每位参与者的回答与其抑郁症状标签和BFI-10个性特征分数相结合，形成了一个丰富的数据集。

⚙️ 算法实现细节

1. 数据预处理

在分析之前，研究团队对文本数据进行了预处理，包括：

将所有文本转换为小写。
移除常见的英语停用词。
过滤掉标点符号。

这些步骤确保了数据的一致性和分析的可靠性。

2. 个性特征的推断

2.1 直接推断

在直接推断中，研究团队设计了以下提示，指导LLM评估个体的回答：

你是一名心理学专家，专门从事个性分析。根据五大人格特征模型，你将评估个体对五个问题的回答。请为每个特征分配一个1到5的分数。

LLM根据参与者的回答，针对每个特征（外向性、宜人性、尽责性、神经质和开放性）生成分数。这些分数反映了参与者在每个特征上的表现。

2.2 间接推断

在间接推断中，研究团队使用了BFI-10项目，首先生成每个项目的分数，然后计算五大特征的分数。提示如下：

你是一名心理学家，专门分析个性特征。请根据参与者的回答，为每个BFI-10问题打分，范围从1（强烈不同意）到5（强烈同意）。

生成的BFI-10分数随后用于计算五大人格特征的分数，采用以下公式：

$$\text{Trait Score} = \frac{\sum \text{BFI Scores}}{n}$$

其中，$n$是BFI项目的数量。

3. 模型性能评估

研究通过相关性和均值差异两个指标评估模型的性能。相关性用于衡量模型捕捉个性特征结构关系的能力，而均值差异则量化预测的绝对准确性。研究主要关注均值差异，以反映模型在复制真实个性特征分数方面的准确性。

📊 结果分析

研究结果显示，GPT-4o和GPT-4o mini在推断个性特征方面的表现各有千秋。以下是主要发现：

外向性：两种模型均表现出较弱的正相关性，且均低估了外向性。
宜人性：GPT-4o在宜人性上表现更好，相关性为0.184，均值差异为-0.147。
尽责性：两种模型的相关性均为负值，表明在这一特征上表现不佳。
神经质：GPT-4o的相关性接近零，均值差异为-0.985，显示出较大的偏差。
开放性：GPT-4o mini在开放性上表现稍好，相关性为0.185。

BFI-10项目分数的预测

在BFI-10项目分数的预测中，GPT-4o mini在多个项目上表现优于GPT-4o，尤其是在需要细致解读的项目上。

💡 讨论与未来研究方向

本研究表明，LLMs在推断个性特征方面具有潜力，尤其是在结合结构化心理测量工具时。然而，模型在某些特征上的表现仍有待提高。未来的研究可以集中在以下几个方面：

算法优化：改进模型算法，提高对个性特征的预测准确性。
多样化数据集：扩大样本量，涵盖不同文化和背景的参与者，以提高模型的普适性。
伦理考量：在使用LLMs进行心理评估时，需谨慎处理隐私和伦理问题，确保用户数据的安全。

结论

大型语言模型在推断个性特征方面展现出巨大的潜力，尤其是在结合结构化心理测量工具时。尽管当前的模型在某些特征上存在不足，但随着技术的进步和研究的深入，LLMs有望在心理健康评估和干预中发挥更大的作用。

参考文献

Zhu, J. , Jin, R., & Coifman, K. G. (2024). Investigating Large Language Models in Inferring Personality Traits from User Conversations. Kent State University.✅
Costa, P. T., & McCrae, R. R. (2010). The five-factor model, five-factor theory, and interpersonal psychology.✅
Yan, Y. , Ma, L., Li, A., Ma, J., & Lan, Z. (2024). Predicting the Big Five Personality Traits in Chinese Counselling Dialogues Using Large Language Models. arXiv preprint arXiv:2406.17287.✅
Rosenman, G. , Wolf, L., & Hendler, T. (2024). LLM Questionnaire Completion for Automatic Psychiatric Assessment. arXiv preprint arXiv:2406.06636.✅
Pérez, A. , Fernández-Pichel, M., Parapar, J., & Losada, D. E. (2023). DepreSym: A Depression Symptom Annotated Corpus and the Role of LLMs as Assessors of Psychological Markers. arXiv preprint arXiv:2308.10758.✅

通过以上分析，我们可以看到大型语言模型在心理学领域的应用前景广阔，期待未来更多的研究成果能够推动这一领域的发展。

引言