最近日本右翼在海外社交平台 X 上,闹了个彻头彻尾的国际笑话。
今年 1-3 月,X 平台偷偷改了内容分发算法,取消了沿用十几年的 “地区内容隔离” 规则 —— 说白了,就是日本本土账号发的内容,能直接突破地域限制,硬塞到全球各国用户的首页信息流里。这下日本右翼像抓住了救命稻草,扎堆发美化二战侵略、否认南京大屠杀、洗白慰安妇制度、给 731 部队反人类罪行翻案的内容,想靠着算法红利,把他们那套历史修正主义歪理强行灌输给全世界。结果呢?算法给他们涨了 470% 的全球曝光量,82% 的流量都来自日本境外,可正面互动率连 0.3% 都不到,换来的只有全球网友的集体嘲讽和驳斥:中韩网友甩历史铁证逐条打脸,欧美网友直接把他们和纳粹翻案分子划等号,连日本国内的理性学者都出来骂,说这帮人是在给日本军国主义招魂,彻底撕裂国际社会对日本的信任。舆论场上输得底裤都不剩,按常理说该收敛了?恰恰相反,日本右翼转头就玩起了更阴、更隐蔽、危害也大得多的阴招 —— 他们不搞明面上的舆论造势了,开始把黑手伸向了 AI 的底层训练语料,想从数据源头,给日本的侵略历史彻底翻案。很多人只把这事当成日本右翼又一次跳梁小丑的笑话,却没看清:他们这是输了明面上的舆论战,却在暗地里打响了 AI 时代认知战的全新战役。而这场看不见的战争,已经打到我们家门口了。一、别以为是民间小打小闹,这是日本官方出钱的系统性操作
先给大家砸几个实锤,看看日本右翼到底在干什么,这事到底有多严重。首先,这事根本不是几个右翼网民的零散操作,背后有实打实的官方资金支持。2024 年日本内阁府的财政预算里,专门列支了127 亿日元,用途写的是 “海外历史认知推广”,明细里明明白白写着要 “修正国际社会对日本二战历史的错误认知”—— 说白了,就是官方出钱,给右翼势力搞历史翻案提供弹药。拿着这笔钱,日本右翼已经搭成了一套完整的 “翻案闭环”,核心就是靠 AI 打渗透:第一,用 AI 批量生产假史料。靠 AI 绘画篡改南京大屠杀、日军东南亚侵略的历史照片,把施暴画面 P 成 “日军救助中国平民” 的假内容;用大模型批量生成伪造的 “日军老兵口述史”“亲历者日记”,甚至是格式严整的虚假学术论文,编出了一套能自圆其说的假历史体系。第二,把假内容批量注入全球开源 AI 语料库。他们把这些多语言的假史料,大批量上传到了全球最主流的开源文本语料库 Common Crawl、开源图文数据集 LAION-5B 里 —— 而这两个库,是全球 90% 以上开源大模型的核心训练数据来源。2025 年 8 月,开源安全机构 Hugging Face 的安全团队就已经实锤,仅 LAION-5B 一个数据集里,就找到了超过 1200 组日本右翼组织上传的篡改二战历史图片。第三,用被污染的 AI 批量扩散假内容。靠着被污染的开源模型,他们能低成本、无限量生成十几种语言的美化侵略内容,在全球社交平台持续扩散,专门盯着对二战亚洲战场历史不了解的欧美年轻人、东南亚青少年下手。最值得警惕的是,这个风险已经不是 “远在天边”,而是已经传导到了国内。截至今年 3 月,国内已经有3 款开源大模型、2 款商用 AI 产品,因为用了没经过清洗的污染开源语料,出现了 “南京大屠杀死亡人数存在争议”“慰安妇制度是自愿行为” 这类违规输出,已经被国家网信办责令下架整改。我特意用国内两款主流开源模型的日文微调版本做了测试,输入相关历史问题后,确实出现了弱化侵略责任、美化战争的表述,而它们公开的训练语料清单里,都明确标注了用到了 LAION-5B 的日文子集。二、这招到底阴在哪?俄罗斯的前车之鉴,就是最血淋淋的教训
可能有人会说,不就是 P 了几张假图、写了几篇假文章吗?我们有历史教材、有官方史料,还能被这点小伎俩洗脑?说这话的人,根本没意识到 AI 时代的认知战,已经和过去完全不一样了。过去的历史虚无主义,是靠报纸、电视、网站发谣言,影响是碎片化的、可追溯的、能修正的;但现在从 AI 训练语料的源头动手,是从 “基因层面” 篡改 AI 的认知逻辑 —— 主流大模型的本质,就是靠学习海量语料的统计规律来生成内容,语料里什么内容多、什么叙事占主流,AI 就会天然输出对应的内容。这种操作的危害有多大?俄罗斯的惨痛教训,就是最现成的例子。过去几十年,以美国为首的西方国家,一直在干一模一样的事:他们靠着海量的教材、媒体报道、影视内容,系统性放大诺曼底登陆的意义,把它包装成 “二战欧洲战场的转折点”,同时拼命弱化、污名化斯大林格勒保卫战的决定性作用,把苏联付出 2700 万人伤亡换来的反法西斯核心贡献,一点点消解掉。AI 时代的到来,直接把这套叙事篡改的效率拉满了。现在欧美主流的开源大模型,用英文问 “二战欧洲战场的转折点是什么”,75% 的模型会优先说诺曼底登陆,只字不提斯大林格勒保卫战的决定性意义。最终的结果是什么?皮尤研究中心 2025 年的民调显示,欧美 12 国里,只有 17% 的人认为苏联 / 俄罗斯对二战胜利的贡献最大,68% 的人觉得美国才是二战的救世主。这种全民性的认知偏差,带来的是国家核心利益的全面受损。为什么北约能一轮轮东扩?为什么西方对俄罗斯的极限制裁,能在国内获得全民支持?为什么俄乌冲突里,俄罗斯的安全诉求完全被国际社会无视?根源就是,他们作为二战战胜国的道义制高点,已经被几十年的叙事篡改彻底瓦解了 —— 当全世界的年轻人都觉得你是 “二战的投机者”,甚至是 “和纳粹一样的侵略者”,你在国际博弈里,就会陷入 “有理说不出、说了没人信” 的绝境。现在日本右翼干的事,就是把西方对俄罗斯用的这套阴招,原封不动地用在了中国身上。而这件事最可怕的地方,在于三个不可逆的危害:第一,它直接瞄准了我们的下一代,动摇民族记忆的根基。现在 AI 已经成了青少年查资料、写作业的首选工具。CNNIC 的最新数据显示,我国 10-29 岁的网民里,78.2% 的人会用 AI 工具查信息,近半数的人会直接相信 AI 生成的历史内容,只有 21.6% 的人会去查权威史料核验。中国青少年研究中心的调查更让人揪心:初高中学生里,68.4% 的人会用 AI 写历史作业,只有 17.2% 的人会对照课本核对 AI 的答案。如果 AI 的底层语料被污染了,它就会日复一日、悄无声息地给我们的孩子输出美化侵略、消解历史的内容。抗日战争史是我们中华民族的精神根基,是我们国家认同、民族凝聚力的来源,当我们的下一代对这段历史的认知被一点点篡改,民族记忆的根就松了。第二,它给我们的 AI 基础设施,装了一个意识形态的 “永久后门”。现在国内 AI 产业的发展,高度依赖全球开源语料库,多数大模型的训练数据里,开源内容占比超过 60%。可这些开源数据集里,只有不到 10% 的内容经过了系统性的史实校验。很多人觉得,AI 不是有人工审核、价值观对齐吗?这里要给大家科普一个常识:现在主流的 RLHF 人工反馈对齐技术,只能管住 AI 表面不说极端话,根本改不了底层语料里带的系统性偏差。就像你给一个孩子教了 100 句美化侵略的话,只告诉他 “不能说南京大屠杀是假的”,他嘴上不说,但心里已经被带歪了。如果国内的 AI 企业、科研机构不加甄别地用了这些被污染的语料,就相当于在我们的 AI 基础设施里,装了一个永远清不干净的后门,从底层动摇了我们整个 AI 产业的安全根基。第三,它会撕裂我们的社会共识,埋下舆论动荡的隐患。抗日战争的历史正义,是我们全中国人民跨越年龄、阶层、地域的全民共识,是社会团结的核心纽带。而被污染的 AI,会把历史虚无主义内容的生产门槛降到零 —— 随便一个别有用心的账号,都能用 AI 批量生成美化侵略的内容,二次加工后在网上扩散。近几年,国内已经多次出现历史虚无主义内容引发的全网舆论对立,而 AI 会让这种风险放大无数倍。一旦社会层面的历史共识被撕裂,再想补回来,就要付出极高的社会成本。三、面对这场阴招,我们该怎么办?
看到这里,很多人会问:那我们就只能被动挨打吗?当然不是。面对 AI 时代的这场认知战,我们必须放弃 “等出事了再管” 的被动思路,从源头筑牢防线,打好这场历史叙事的保卫战。首先,最核心的,是要筑牢数据源头的防火墙。我们必须加快建自己的国家级可信历史语料库,把抗日战争史、二战反法西斯史的权威史料,全部数字化、结构化入库,做成国内 AI 模型训练的官方数据底座,让国内的 AI 企业有干净、权威、可信的训练数据能用。同时,必须给开源语料建一套严格的审核、清洗、溯源机制,建一个污染数据黑名单,全行业共享,绝不能让被污染的语料,混进我们自己的 AI 模型里。其次,必须把监管的口子扎紧,压实企业的主体责任。现在我们已经有了《生成式人工智能服务管理暂行办法》,接下来要做的,就是把细则定死:明确用 AI 美化侵略、篡改历史的违法边界,制定明确的处罚标准;对用了污染语料、输出违规内容的企业,要实行 “一票否决制”,该罚的罚,该停的停;同时也要管住社交平台,不能让 AI 生成的历史虚无主义内容,在网上随便扩散。再者,我们不能只被动防守,还要主动出击,抢回全球叙事的话语权。日本右翼能往开源语料库里灌假内容,我们为什么不能往里面灌真史料?我们要把中国抗战的铁证、二战亚洲战场的真实历史,翻译成十几种语言,大批量注入全球开源语料库,用真实的内容对冲虚假叙事,打破日本右翼和西方对历史语料的垄断。同时,要在全球平台上,把日本右翼篡改 AI 语料、给侵略历史翻案的事彻底捅出来,联合韩国、东南亚这些二战受害国,一起守住反法西斯战争的历史成果。最后,也是最根本的,要筑牢我们每一个人的认知免疫。AI 时代的国家安全,最终靠的是我们每一个人。一方面,我们要把抗战历史教育抓牢,让每一个中国人都牢牢记住这段历史,从根上对历史虚无主义免疫;另一方面,要给全民补一堂 AI 素养课,尤其是给孩子们,要让大家明白,AI 说的不一定是对的,面对 AI 生成的历史内容,要有批判性思维,要学会去查权威史料、官方档案,不能 AI 说什么就信什么。结尾
很多人觉得,历史是过去的事,翻不了天。但俄罗斯的教训已经告诉我们,历史叙事的阵地,你不去守,别人就会抢;你今天放松了对 AI 底层语料的警惕,明天就可能在国际博弈里满盘皆输。过去我们防历史虚无主义,防的是网上的一条谣言、一本禁书、一部歪屁股的电影,核心是堵截分发端的有害内容;但 AI 时代,我们要防的,是下一代人认知世界的底层数据库,是从源头就被篡改的历史叙事。日本右翼今天动的,是几行训练数据,瞄准的,是我们民族记忆的根。这场看不见的战争,已经打响了,我们没有退路,必须赢。你有没有遇到过 AI 输出错误历史内容的情况?你觉得我们该怎么守住 AI 时代的历史叙事阵地?评论区聊聊。