合规 AI 不 “幻觉”!彩智科技筑牢精准防线|“抓住下一个 Z 一鸣” 速访

收录于 AGI 持续更新中
北京彩智科技 CEO 徐剑军,正带着其核心产品 “深知可信知识模型” 站在大模型产业的关键赛道上 —— 这款模型直指行业核心痛点,通过修正大模型幻觉问题,
北京彩智科技 CEO 徐剑军,正带着其核心产品 “深知可信知识模型” 站在大模型产业的关键赛道上 —— 这款模型直指行业核心痛点,通过修正大模型幻觉问题,让智能体 “开箱即用” 获取准确可信的业务知识,最终在政务、企业服务等严肃工作场景中,解决信息不准确与内容不安全的双重难题。


核心团队:清华技术基因与政企业务经验的双轮驱动

彩智科技的核心团队天然具备 “技术 + 落地” 的双重优势,由两部分核心力量构成:一部分源自清华大学计算机系知识工程组,深耕知识图谱、知识工程与大模型融合领域,拥有扎实的技术研发功底;另一部分则长期深耕传统行业,在政企业务领域积累了丰富的落地经验与资源。
作为团队核心,徐剑军的经历更是将这种双重优势具象化。他在清华大学读博期间,便协助导师推进校企合作项目,深度参与部委顶层架构设计、数据资源图谱构建及语义网络分析等工作;毕业后,团队持续服务大型企业与政府部门,聚焦行业标准规范制定与数据资源规划,核心是将数据背后的元数据进行图谱化处理。过往的标杆案例已印证其能力:从 2008 年北京奥运旅游官网的旅游资源梳理,到原华北电力集团采购体系的结构化搭建,均是团队技术落地能力的直接体现。



转型契机:GPT-3 引发的行业判断,锚定知识工程 “最后阵地”

2020 年 GPT-3 的发布,成为彩智科技转型的关键转折点。当时,GPT-3 在语言理解、推理与编程能力上展现的惊人潜力,让徐剑军团队敏锐意识到:新的技术时代已至,传统 “项目制” 的知识图谱模式难以代表知识工程的未来,唯有与深度学习体系深度融合,才能抓住行业核心机遇。
更关键的是,团队对大模型的本质有着清醒的判断:无论 Transformer 与强化学习如何发展,其核心优势始终聚焦于 “自然形成的知识与能力”。本质上,Transformer 是自监督或无监督算法,依托庞大算力训练全人类文献后,确实能在自然知识领域比肩甚至超越人类;但对于 “非自然形成的知识”—— 如人类社会构建的规章制度、组织流程、商业规则等,它从原理上无法通过无监督或自监督训练掌握。
这类知识并非自然推理的产物,而是人类基于特定目标构建的 “人为规则”,大模型若仅靠概率算法学习,必然产生大量幻觉。徐剑军团队由此断定:对非自然知识的结构化梳理,是产业界留给知识工程的最后一片核心阵地,而 “深知可信知识模型” 的研发,正是为了守住这片阵地。


大模型幻觉的核心痛点:10%-20% 的不准确,藏在 “规则差异” 里

在徐剑军看来,通用大模型的幻觉问题在严肃场景中尤为突出:当你询问行业标准、规范或国家政策时,所有大模型都能给出流畅回答,但其中必然包含 10%-20% 的不准确内容 —— 这恰恰是严肃场景(如政务咨询、企业合规)无法容忍的漏洞。
最典型的例子便是 “卫生许可证”:全国几百个城市的相关规定存在差异,最终标准需以各城市最新规范文件为准;但当前通用大模型的训练逻辑,是综合过去 20 年所有城市的历史文件数据进行无监督计算,本质是靠概率找规律,完全无法匹配 “实时、地域化” 的规则需求,准确性自然无从谈起。


拒绝 “定制化陷阱”:构建覆盖全中文语境的 “大知识工程”

面对 “是否为每个客户单独构建知识图谱” 的行业常规思路,徐剑军团队给出了相反答案 ——“这太不酷了,也不代表通用人工智能”。过往一年半的项目制实践让他们意识到,定制化图谱不仅效率低,更无法适配通用 AI 的发展趋势。
彩智科技选择走一条更具挑战性的路:打造 “大知识工程”—— 不再为单一行业或企业服务,而是将全中文语境中可获取、无版权纠纷的 “章程类知识” 全部结构化,最终形成覆盖法律、政策、标准、企业制度等领域的超大规模知识图谱。
这一工程的体量堪称 “浩瀚”:最初筛选出的网页相关文件约 100 亿份,经技术去重后剩余 20 亿份,再通过业务溯源归一化处理,最终沉淀为 1.7 亿份核心文件,提炼出 16 亿个知识点。基于这些知识点,团队构建起庞大的语义关系网络,能精准判断不同场景下适用的规则与条款。目前,这一 “大知识工程” 已开放内测,覆盖全国 300 多个城市的章程制度类知识,其准确性在当前所有大模型中处于领先地位。


16 亿知识点的自动化革命:从 “10 万人团队” 到 “日处理 100 万知识点”

若按传统知识图谱的构建方式,处理 16 亿个动态更新的知识点,至少需要 10 万人团队 —— 毕竟我国规章制度年均变化量达 20%,人工维护完全不现实。而彩智科技的破局关键,源于 4 年半前承接的科技部重大专项子课题:大规模知识图谱的自动化构建。
这套自动化体系的搭建,经历了一套严谨的 “工业化” 流程:
  1. 工序拆解与流水线搭建:首先将人类知识分析师的工作拆分为十几道工序,形成标准化流水线,确保每个环节的可控性;
  2. 交叉验证保障质量:在流水线中,将分析师分为两组进行交叉验证,共同负责同一批知识点的构建,从源头保证标注与分析的高质量;
  3. 数据积累与模型训练:在各环节积累大量有监督的输入输出数据后,以人类分析师的行为逻辑为蓝本,训练出 “零幻觉” 的专有大知识模型;
  4. 迭代升级实现自动化:4 年半的持续迭代中,大知识模型逐步替代 50%、60%…… 直至近 100% 的人工。
如今,团队规模与 4 年前相差无几,但知识点处理量已从 “月均几千个” 跃升至 “日均近 100 万个”;再结合轻量化的 “深知可信知识模型”,团队已能为客户提供快速现场数据训练服务,彻底摆脱了人工依赖。


训练的平衡术:保留通用能力,意外实现 “价值观对齐”

全量有监督训练往往会导致模型 “遗忘” 部分能力,比如推理、数学能力 —— 这是大模型训练的常见痛点。但徐剑军团队通过工程实践,在消除幻觉的同时,难能可贵地保留了模型的基础通用能力(如自然语言理解),避免了 “练傻” 的尴尬处境。
更意外的是,这一过程中模型还实现了极具价值的 “价值观对齐” 功能。徐剑军解释:通用推理模型因 “过于聪明”,不仅易产生幻觉,还可能存在未知安全隐患;而 “深知可信” 天生具备强抗幻觉能力 —— 其训练数据全部来自规范性文件,仅聚焦文件中的知识点,任何诱导性输入都无法影响模型输出,这是安全的基础。
在此之上,团队还设计了 “深知可信与通用大模型” 的协同模式:将 “深知可信” 的准确知识召回能力与安全对话风控能力,封装为开放的 MCP 接口。实际场景中,通用大模型主导常识推演,一旦涉及章程规则类问题,便通过 MCP 接口调用 “深知可信” 的准确知识;同时,通用大模型回答前需经过 “深知可信” 的安全风控模型检测:若存在安全风险,将生成安全识别码并由 “深知可信” 代答,规避风险;若无风险,则由大模型继续处理,仅在需要时调用规章知识。


生态合作:已接入主流通用大模型,深耕平台生态价值

目前,“深知可信知识模型” 已与多家主流通用大模型达成合作,包括智谱开放平台、百度千帆、华为小 e 及鸿蒙智能体生态、阿里百链、腾讯元气(与元宝配合的生态),四周前还与字节跳动正式签约。这些合作的核心逻辑,在于各家均重视严肃场景的模型应用,而 “深知可信” 恰好填补了其中的知识准确性缺口。
其中,与智谱开放平台(bigmodel.cn)的合作尤为深入。智谱 GLM4.5 以 Agentic 能力见长,擅长支撑智能体调用工具解决场景问题;而智谱开放平台对工具既严格测试又大力推广,双方的合作不仅限于生态调用 —— 智谱自身的产品(如智谱数字人)也在使用 “深知可信” 的接口服务。在徐剑军看来,这种 “综合性平台生态能力”,将成为未来主流通用大模型企业的核心发展方向。



多语种布局与出海:响应国家指示,提前储备海外能力

去年,国家明确提出 “中国人工智能要出海” 的指示,相关机构与企业正筹备成立自主大模型社会组织,彩智科技有幸受邀参与。事实上,团队早已提前布局多语种能力 —— 在深圳开展的多语种模型尝试,虽在当时看似 “超前”,但已为未来海外市场拓展奠定基础。徐剑军表示,“深知可信” 的最终目标不仅是服务国内市场,更要在全球范围内为中文语境外的严肃场景提供可信知识服务。


商业化:从 “政务基本盘” 到 “企业新增长”,今年目标 4500 万

彩智科技的商业化路径清晰分为 “蓝海探索” 与 “当前盈利” 两大板块:

1. 蓝海市场:第三方智能体服务

面向各类第三方智能体与应用,解决其 “规则类知识咨询” 痛点。例如携程智能体常面临的 “护照制度咨询”—— 全中国办护照以县为单位,各县规则差异显著,调用 “深知可信” 即可快速获取准确答案。不过,这一渠道的收入目前仍依赖生态成熟度,尚未形成规模化。

2. 当前核心盈利渠道(三大板块)

  • 政府渠道:服务于政府门户网站、国务院政策问答平台、深圳市政务服务平台等客户。在政务数字化与 AI 转型的双重需求下,这一渠道已形成稳定收入;
  • 政务热线渠道:聚焦全国 12345 热线及税务、公积金等专项热线(全国约 1000 家,年预算数百亿,70% 用于人员投入)。团队主打 “智能知识助手”,为热线坐席人员提供支持 —— 将平均工单响应时间从 6 分钟缩短至 1 分钟,效率提升显著;
  • 企业市场:近半年增长最快的板块。凭借 “私有知识接入即用、公共知识开箱即用” 的快速训练优势,产品深受知识 / 规章驱动型企业欢迎;同时,通过在各大厂生态的推广,大量传统软件公司主动寻求合作,形成不少落地订单,内控管理等领域需求尤为旺盛。
从数据来看,去年彩智科技大模型业务年收入约 2000 万,三大核心渠道占比为 4:2:4(政府:热线:企业);今年目标将收入提升至 4500 万,且收入结构将优化为 2:2:6,企业市场将成为核心增长引擎。


融资进展:聚焦 “资源型投资方”,A 轮倾向传统软件公司

“深知可信” 立项以来,仅完成一轮融资 —— 由智谱生态的星连资本(Z 基金)领投,同时引入清华系基金与盛景资本。
对于接下来的 A 轮融资,徐剑军团队有着明确的优先级:首先倾向于传统软件公司 —— 这类投资方不仅能提供资金,更能带来直接订单,目前相关进展已较为顺利;同时,团队也欢迎对通用人工智能有信心、有布局的其他类型基金参与,共同推动 “可信知识模型” 的产业化落地。

推荐AGI

苏公网安备 11011xxxxx号 苏ICP备2025192616号-1