葡萄新京 千百度收购本原智数: 3亿买下中国AI数据的「隐形冠军」


一家闷头盈利、业绩了泰半个中国大模子圈确实切数据玩家并入上市公司,第一次走到台前。
据IPO早知说念音书,6月5日晚间,千百度(1028.HK)发布公告称,拟通过上海千度收购上海本原智数已刊行股本总数约83.33%,总代价为东说念主民币1.5亿元;同期,上海本原智数拟进取海千度刊行认购股权,止境于经刊行认购股权扩大后已刊行股本总数约45.45%,总代价为东说念主民币1.5亿元。
博亚体育2026世界杯中国官方入口;
紧随收购事项及认购事项完成后,公司将透过上海千度领贪图公司已刊行股本总数约90.91%。
;
这意味着,交往完成后,千百度将以3亿对价获得国内逾越AI数据业绩商本原智数的控股职权,并纳入合并报表,隆重酿成“鞋履;+ 东说念主工智能数据”双主业。
;
一家鞋履港股上市公司,收购一家AI数据公司,乍看略显“违和”。
;
但若放进往常几年中国AI产业极速滋长的那条暗线里,这桩交往正值精确落在了一个正被民众成本重估的赛说念上,以及这条赛说念中一块始终被低估的硬拼图——当模子与算力日趋同质化,高质地、可考据的数据,正成为通往更高阶智能的关节瓶颈。
;
对以鞋履零卖为主业、比年抓续寻找第二增长弧线的千百度而言,这更是一次从“讲故事”到“真转型”的关节落子——阛阓此前对其AI转型的预期,被这一笔实打实、且已盈利的并购稳稳接住。
;
一条正在被民众重估的赛说念
;
东说念主工智能的竞争,正在发生一次底层窜改。往常十年,输赢主要由算力和模子架构决定;但当公开数据被大模子渐渐消化、当算力与算法日益普及,下一阶段的关节瓶颈已不再是「谁的模子更大」,而是「谁能抓续为模子提供新的、更难的、来自确切世界的高质地教会」。
;
在民众,成本已用真金白银为此投票。2025年6月,Meta以约143亿好意思元投资数据标注龙头Scale AI,对应估值约290亿好意思元,一举将「AI数据业绩」从往常的「成本项」,重新界说为AI时间的「政策钞票」。
;
逻辑很朴素:算力不错采购,算法不错复现,唯有把东说念主类人人的专科判断、把确切物理世界的交互响应,范围化且可考据地退换为模子可学习的数据——这件事又难、又慢、难以靠成本速成。它是整条产业链里最难、也最难替代的范例。
;
业界已将2026年视为具身智能的「数据范围化元年」。当一个赛说念启动被民众重新订价,阛阓终究会回头去寻找阿谁最塌实、最靠谱的起源供给者。
;
把「最难的活」作念成壁垒
;
公告称,打算集团(本原智数)为国内逾越的东说念主工智能数据业绩供应商,亦是国内少数同期具备大模子、世界模子及具身智能无缺数据业绩智力的供应商之一,处于东说念主工智能产业链上游,中枢业务在于将东说念主类的专科与领路教会,退换为东说念主工智能模子可供西宾及考据的高质地数据。
;
回望十一年前,通盘行业的重想法简直齐压在算力和模子架构上。而本原智数赌的是另一件事:当算力终将充裕、架构终将拘谨,确切决定模子上限的,是数据——不是数据的若干,而是数据的难度、质地与可考据性。
;
这个判断在当年并不性感。而本原智数偏巧又选了最难走的那条路——不作念范围大、门槛低的通用标注,而是扎进价值链里时刻门槛最高、最难圭臬化的高难度、专科级数据业绩,专接那些别东说念主不肯作念、也作念不好的任务:组织数学、代码、法律、医疗等范围的专科东说念主员完成人人级标注,构建估计模子确切智力的评测数据集,为世界模子重构编造环境数据,为具身智能集合确切物理世界的交互数据。
;
十年下来,本原智数把这条最苦的路,走成了最深的壁垒。如今它业绩着国内逾越的大模子厂商、一线互联网与内容平台,以及逾越的具身智能企业,始终联贯他们时刻难度最高、条件最严苛的数据任务,并在多个高价值数据品类上成为关系客户的独家供应商。
;
守旧这一切的,葡萄新京2026最新中国官方网站是一张舒适的“请托底盘”:世界十大请托中心、数十万行业人人组成的众包融合网罗,以及自研的标注、质检与众包平台、一整套数据安全与合规天资——这正是范围化、高安全地请托高难度数据的中枢门槛,亦然难以被速成复制的护城河。
;
更难受的是它的盈利智力。公告露出,2024及2025年,本原智数收入分裂约1.465亿元及1.562亿元,税后净利分裂为710万元及1,110万元;2026年前五个月,收入增长刚劲。
;
在一级阛阓动辄“融资数亿、烧钱换增长”的AI创业潮里,一家靠确切订单与谋略现款流把范围作念起来、还能相识盈利的数据公司,自己即是极稀缺的方向。
;
同期站在AI数据爆发的两条干线上
;
确切世界,才是一切前沿AI数据的起源。
;
一个常被外界忽略的产业学问是:在具身智能的内容请托中,确切数据在数据采购中的占比高达95%以上;而通盘仿真数据,最终齐要回到确切世界的数据去校准与考据。因此,当行业越来越聚焦“物理世界的数据为什么这样稀缺”时,作念起源确切数据集合与请托的玩家,注定将在改日站稳“基座”的位置。
而本原智数,恰好同期押中了驱动这一轮需求爆发的两条干线:
;
其一,是模子从“效法东说念主”走向“自我磨练、自我提高”,对高难度、可考据数据的需求激增;其二,是AI走出屏幕、参加物理世界,催生了对真机集合数据的全新需求。
;
行为数据被用于世界模子西宾、并为多家头部「具身大脑」公司提供具身数采的供应商,本原智数是国内少数同期站在这两条干线上的玩家。这意味着,岂论改日需求向哪一侧歪斜,它齐站在受益的一端。
;
「违和」之处,正是护城河
;
这桩交往着手要过的,是“违和感”这一关。一家AI公司并入一家鞋企,关节梗概不在“谋略”,而在“结构”。
;
凭证公告,收购完成后,本原智数将继续保抓孤苦品牌与孤苦运营,并扩展数据进犯;千百度则以鞋履主业产生的相识现款流,为其提供资金与上市平台守旧。这意味着,本原智数毋庸再靠一轮轮融资续命,能够心无旁骛地作念始终、难而正确的事。
;
更高明的,是中立性这一层。数据公司最怕“站队”——一朝被某家模子大厂控股,竞争敌手经常出于追到而转投他处。这样的故事,在行业里并不有数。
;
而这桩并购的“违和感”,在这里正值翻转成了上风。由于千百度自己不作念AI模子、不与本原智数的任何客户组成竞争,互为敌手的“巨头”们,便仍能宽心性把数据交给褪色家供应商。一个“看似无关”的成本母体,反而成了看护中立性的最好东说念主选。
;
这亦然本原智数创举东说念主在公开信中反复强调的极少:中立不是一种短期策略,而是对通盘客户的始终容许。
;
水面之下的「起源」,启动浮出
;
跟着通用大模子向多模态、世界模子与具身智能抓续演进,数据需求迎来爆发,本原智数有望成为这轮上行海潮中的抓续受益者。
;
把时辰拉长,这桩交往确切的看点,梗概不在「跨界」,而在它揭开的一个产业事实——在喧嚣的AI海潮里,着手被成本与媒体追赶的,经常是离模子最近、最会讲故事的那批公司;而像本原智数这样离数据起源最近、闷头把最苦的活作念成壁垒、还把买卖作念成了正向盈利的玩家,反而始终千里在水面之下。
;
这次并入上市公司、就此“浮出水面”,给了本原智数一个迟来的“扩音器”。当一个赛说念启动被民众重新订价,成本与产业终究会回头去寻找阿谁最塌实、最靠谱的起源供给者。
;
而这个位置,本原智数一经坐了十年。
本文为IPO早知说念原创
作家|苏打葡萄新京