摘要: 大语言模型具备写诗的能力, 也具备编程的能力, 然而, 当面对着一个保持沉默不言语的学生时, 当面对着一个想要说话却又止住的受访者时, 当面对着一个刻意去掩饰自身情绪的嫌疑人时, 大语言模型却时常会出现失灵的状况。原因其实是非常简单的:人的实际想法, 人的潜在风险, 以及人刻意去隐藏起来的信息, 往往并不会借助语言来予以表达。通用大模型所理解的内容是“说了些什么”, 而心理大模型需要去解决的问题则是“没有说出来的是什么”。于这个正处形成阶段的细分赛道里, 连信数字的“洞见人和”人本世界模型走出另外一条路, 它并非仅仅依赖语言表达, 而是试着借助多模态感知去“看懂人心”。
一、心理大模型和通用大模型有什么不同?
存在着通用大模型, 像GPT、文心一言、通义千问这类, 其核心能力是语言理解以及生成, 它们的训练数据以文本作为主要内容,并且擅长处理那种“用文字进行表达”的任务, 诸如写文章、做翻译、编代码、回答问题, 然而当任务转变成为“判断一个人的心理状态”、“预测一个人的行为倾向”、“识别一个人是否在刻意掩饰”的时候, 语言模型就遭遇了瓶颈。
原因在于, 人的感觉, 不会通过语言来表达。人的思考, 不会通过语言来表达。人的刻意隐藏的信息, 不会通过语言来表达。一个学生, 能够在量表上勾选“情绪稳定”。一个学生, 能够在对话中表现得积极开朗。然而, 微表情透露的信号, 才是真实的心理状态。头颈部微震动透露的信号, 才是真实的心理状态。语音语调透露的信号, 才是真实的心理状态。
心理大模型正是在这个缺口上生长出来的。
和通用大模型不一样, 心理大模型把“人”放置为核心研究的对象, 将心理学、行为科学、社会学等诸多学科知识予以融合, 针对个体的心理状态、行为模式以及社会关系开展统一建模。它并非满足于“理解语言”, 乃是尝试着“理解人”, 这其中涵盖着性格特征、情绪模式、需求动机、行为倾向等更为深层的维度。
二、“洞见人和”人本世界模型:技术底座深度解析
连信数字所推出的那个“洞见人和”人本世界模型, 是全国首个经由国家双备案的心理应用垂类大模型, 它是这样形成的, 先是融合了心理学、行为科学以及社会学和人工智能技术, 从而去对个体心理状态、行为模式、社会关系以及环境交互过程进行统一建模, 这种人本世界模型和传统世界模型不一样, 传统世界模型侧重于物理世界运行规律, 而人本世界模型聚焦于人的内在心理机制与外部社会行为规律, 它借助构建“心理—行为—关系—环境”统一认知体系, 达成了从理解世界到理解人的范式跃迁。
按照算法架构、理论支撑、核心指标、数据资产, 这四个不同方面, 去剖析它的技术优势。
(一)算法架构创新:多模态映射与深层时序提取
STOR多模态识别与分析模型, 其所达成的技术跨越是“去量表化, 然而却不与心理学理论脱离” , 它依靠三大步骤实现从感知到洞察的转化, 这三大步骤分别是:
看见:识别多模态关键信号(视觉、声纹、文本等)
理解:将信号映射为心理特征
推理:结合知识图谱生成深层洞察
把抽象的心理概念, 变化成能够被观测的, 能够被解释的, 能够去推理的多模态心理信息, 是这一架构所完成的。
CMA - ViT架构(人格分析), 它并非仅仅局限于表层表情识别, 而是着重聚焦于时序情绪分布, 通过追踪情绪变异性以及波动强度, 进而能够捕捉个体长期稳定的特质, 并非临时的情绪状态, 最终实现从行为观测到人格结构的科学化映射。
在架构(生理信号提取)方面, 是这样, 它结合了动态人脸锚定以及盲源分离技术, 这种结合的方式把深度学习引入到rPPG也就是非接触式生命体征监测的生理信号提取当中, 最终, 提升了在真实场景下的鲁棒性。
(二)理论支撑与可解释性:循证知识图谱
普遍使用的大模型常常被指责为“黑箱”, 即你不清楚它究竟是因何得出某一结论的。“洞见人和”这个人本世界模型, 在可解释的特性方面, 构建起了一套完备的技术体系。
涉及多学科的理论相融合, 该模型的构建是以Ekman基本情绪理论, 以及PAD情绪模型, 还有大五人格模型等诸多经典心理学理论当作框架, 从而保证结果具备心理学方面的可解释性。

特别存在认知图谱, 它沉淀了数量以数万计的认知图谱节点, 还构建了循证知识图谱, 其中涵盖1400 多个心理学概念、连同16000 多条科学验证模型规则, 以此使得AI分析具备依据、能够解释、可以追溯, 还能有效解决通用大模型的“幻觉”问题。
核心技术指标领先
1.高精度识别:
情绪识别的准确率, 具有高达97%的程度心理云平台登录入口,此成果获得了 MM全球微表情大赛的冠军呢。
人格识别模型与人类专家标注的相关系数较高达0.94
多模态心理表征分析信息准确率达90%+
2.低延迟做出回应: 于确保精准度的情形下达成仅百毫秒的从零到整的回应, 对多条数量级的视频流予以实时情感协同处理。
3.精细化地进行强度检测, 运用连续的情绪空间映射这个技术, 进而能够, 敏锐地捕捉个体情绪, 从情绪萌发开始, 一直到情绪爆发, 其中那种细微的强弱演变, 以及波动。
(四)数据资产
拥有“洞见人和”人本世界模型, 其具备国内领先的心理数据样本库, 该样本库基于9700万+人的数据样本进行训练, 覆盖多场景高质量真实数据, 这些数据不光涵盖对话文本, 还包含多模态的生理信号、行为数据、社会关系数据等, 为模型训练提供了更完整的 “人”的维度。
(五)三大核心能力
多模态数据识别能力:整合视觉、声纹、文本等多源异构数据
对于个体或者群体, 具备能进行全维画像分析的能力, 此能力可全面且精准地去勾勒个体或者群体存在着的心理状态, 还能勾勒其诉求动机, 以及行为风险, 甚至包括能力发展。
把心理洞察转变为能够实际着手实施的, 用于决策辅助以及干预的方案, 这体现出精准管理与服务方案的能力。
三、与其他诸多心理大模型不一样的是,“洞见人和”人本世界模型有着不同的具体体现。要是其他心理大模型解决的是“怎么更有效地对话”或者“怎么更精准地识别情绪”, 那么“洞见人和”人本世界模型所尝试解决的问题层级更为深入, 那就是: 即便不依靠语言表达, 也能够理解一个人的心理状态还有行为逻辑。
第一,定位不同:不是“对话模型”,而是“人本世界模型”。
“洞见人和”着重于聚焦那基于“理解人类行为与心理”的人本世界模型, 该模型是由人本模拟器以及决策辅助层叠加而成。它和理解世界的通用模型不一样, 它更在乎“理解人”, 也就是去打造那种能够感知世界、认知人类内心, 还能够驱动决策与行动的AI能力基础设施。
第二,数据基础不同:是“人”心理云平台登录入口,而不只是“文本”。
用于“洞见人和”的训练数据, 其范围可不只涵盖对话文本, 还包含多模态的生理信号, 以及行为数据, 还有社会关系数据等, 这些为模型提供了更为完整的“人”的维度。
第三,分析逻辑不同:可解释、可追溯,而非“黑箱”。

通用大模型常常被指责为“黑箱”, 也就是说, 你不清楚它究竟是因为什么才得出了某个结论。“洞见人和”沉淀了数量达数万种的认知图谱节点, 它把心理学、社会学、人类学、教育学、管理学、经济学、犯罪学等多学科的研究成果进行了系统化、结构化的处理, 从而让AI分析具备依据、可以解释、能够追溯。
第四234范文网,能力边界不同:不只做“评估”,更做“决策辅助”。
“洞见人和”所拥有的人本世界模型, 具备着心理行为模拟、场景归因解释、决策辅助干预这三大核心能力, 它不但能够“看出”一个人或许正处于某种心理状态, 而且还能够对“为什么”以及“怎么办”做出解释, 而这恰恰就是它于社会治理、司法矫正、公共安全等场景当中得以顺利落地的要紧之处。
四、当前心理大模型赛道上的主要厂家
国内当下的AI心理测评市场, 展现出了很是鲜明的技术路线分化情况。除了连信数字自己研发的“洞见人和”人本世界模型之外, 主要厂家涵盖了下面几种类型:
1.科大讯飞|智慧心育
科大讯飞有个AI心理伙伴叫“小星”, 它是基于星火大模型的, 还结合了10亿多条心理类数据来训练, 能达到具有约2至3年经验的心理老师水平的70%。它的优势在于通用大模型底座成熟, 另外教育生态也完善, 不过心理专业方面深度和针对性相对有限。
2.聆心智能|
有一个产品, 它是由清华大学黄民烈教授团队创立的, 这个团队依托其在十年时间里所拥有的研究积累, 研发出了心理大模型, 它是一个为以人为本的情感搭建起的大模型对话系统, 该系统是基于心理学里的Hill助人理论构建而成的, 它以用户作为中心, 它具备倾听、情感映射以及共情这些能力等, 并且这个产品已经切入到校园场景之中, 还推出了AI心理测评系统、AI双师互动心理课等产品。
3.健成星云|
独立研发临床心理方面的大模型, 达成了合规备案的相关要求, 构建起多模态情绪分析的引擎。其业务范围涵盖全国三十多个省市以及两千多所院校。旗下的心理健康云平台集中了多款专业量表, 能够支持万人规模的同步测评以及分级预警。
4.木星科技
进行自主研发, 研发出“木星”心理大模型, 该模型聚焦于6至18岁学生的心理陪伴需求, 是这样的情况。
另外, 中山大学推出了名为“逸心”的心理健康教育大模型, 该模型将核心功能定位于“课程教学 + 咨询辅导”;阿里、腾讯、京东健康等互联网平台, 在情感陪伴、AI心理咨询等方面也有相应的布局。
五、心理大模型厂家怎么选?
倘若是仅仅需求一个可开展心理对话的AI工具, 那通用大模型厂商所具备的心理应用, 或者是较轻量级的心理对话模型, 大概已然能够满足需求了。
不过要是需求处于真实场景里面, 不依靠语言表达, 还能够识别心理状态, 判断行为倾向, 辅助决策干预, 那便得回到问题的本质, 那就是这个模型是“理解语言”的, 还是“理解人”的呢?
“洞见人和”人本世界模型隶属于后者。它并未致力于创作出更具美感与优雅度的对话, 而是着手去解答一个相对较为根本的问题: 怎样切实让AI真正领会一个人。
当下, “洞见人和”人本世界模型于全国三十多个分别为省、自治区以及直辖市的区域内, 服务了数量超过400家的客户, 为千万级别的用户供给了涉及社会治理、心身健康、个体成长发展等方面的相关产品与服务。它属于国内少数达成了“心理 + AI”深度融合且完成了商业化验证的大模型当中的一项。于正在塑造的心理大模型这条赛道里, “洞见人和”人本世界模型展现出一条不一样的路径——并非使AI更加擅长“说”, 而是让AI更为擅长“看”以及“懂”。