硬核拆解:Midjourney Medical Scanner 是医学影像革命还是硅谷新骗局?

2026年6月18日,这件听起来像科幻小说情节的事情真实发生了。Midjourney,这家据第三方估算在2023年年度经常性收入(ARR)已达约2亿美元、且公开强调从未接受外部风险投资的AI图像生成巨头 ,正式宣布成立"Midjourney Medical"部门,并公布了他们的首款硬件原型:Midjourney Scanner。

硬核拆解:Midjourney Medical Scanner 是医学影像革命还是硅谷新骗局?

如果有一天,一家以生成漂亮动漫女孩和赛博朋克风景画闻名的AI公司,突然宣布他们造出了一台能把人"看透"的医疗设备,你会作何感想?

2026年6月18日,这件听起来像科幻小说情节的事情真实发生了。Midjourney,这家据第三方估算在2023年年度经常性收入(ARR)已达约2亿美元、且公开强调从未接受外部风险投资的AI图像生成巨头 ,正式宣布成立"Midjourney Medical"部门,并公布了他们的首款硬件原型:Midjourney Scanner。

这台被称为"全身超声波CT"(Ultrasonic CT)的设备,号称能在60秒内,在无辐射、无强磁场的情况下,通过声波和水,生成人体内部器官、脂肪、肌肉和骨骼的亚毫米级3D高分辨率图像。他们展示了宏大的商业化路线图:首个Spa体验中心计划于2027年底开放,甚至提出了未来每月进行10亿次扫描的远景目标 。

在X平台上,这一消息立刻引发了海啸般的讨论。有人(如Owen Lewis)将其惊呼为"22世纪的超声波技术"和"星际迷航级别的医疗基础设施";也有医学专家(如Eric Topol)和怀疑论者对其脑部成像能力和潜在的过度诊断风险提出了严谨的质询。

作为一名在软硬件交叉领域摸爬滚打多年的工程师,面对这种"跨界打劫"的戏码,我的第一反应通常是:Show me the code(或者在这个语境下,Show me the specs)。在仔细研读了Midjourney的官方博客、加州理工学院(Caltech)发表在《Nature Biomedical Engineering》上的相关核心技术论文、Butterfly Network的超声芯片声明以及各方专家的辩论后,我决定剥开这层"Spa式医疗"的外衣,从纯技术的视角,来扒一扒这台机器的技术内核。

Midjourney Medical 不是假新闻,也不是纯概念图;它背后有坚实的学术研究和成熟的硬件模块支撑。但目前它更接近一个"高调发布的早期医疗影像平台",而不是已被广泛临床验证、可立即替代MRI或CT的成熟医疗产品。让我们用工程的逻辑,一步步拆解它的技术可行性与现实挑战。

拨开迷雾:Midjourney Scanner到底是个什么东西?

要评判一个硬件原型,首先得搞清楚它的技术本质。抛开Midjourney官方那些诸如"金色的光芒"、"像海豚一样"的浪漫修辞,从工程角度来看,Midjourney Scanner的核心架构可以概括为:水浸式超声断层扫描(Ultrasound Tomography, UST)+ 超大规模CMOS声学传感器阵列 + 专用计算声学与重建算法。

图2:Midjourney Spa体验中心的概念设计,展示了用户在水浸式环境中接受扫描的场景

技术溯源:并非无中生有的"黑科技"

很多人第一眼看到Midjourney做医疗硬件,觉得不可思议。但实际上,这项技术并非Midjourney凭空捏造。它的核心技术基石,主要来源于两方面成熟的研究与工程积累:第一,加州理工学院(Caltech)的超声断层扫描研究。根据多方信息,Midjourney Medical的关键技术源于Caltech Lihong Wang教授团队的研究成果。该团队在2026年4月24日的《Nature Biomedical Engineering》上发表了一篇题为"Whole cross-sectional human ultrasound tomography"的重量级论文 。在这项研究中,他们展示了一个由512个传感器组成的环形阵列,通过让患者半身浸入水箱中,在5名健康志愿者身上实现了对腹部和腿部的高分辨率二维截面成像 。这篇论文验证了水浸式超声CT在评估腹部脂肪分布等方面的潜力。Midjourney显然是将这项实验室原型进行了大规模的工程化放大。第二,Butterfly Network的"超声芯片"(Ultrasound-on-Chip)技术。传统的超声波探头使用的是压电晶体(Piezoelectric crystals),制造工艺复杂且成本高昂。而Butterfly Network成功将超声波换能器集成到了标准的CMOS硅芯片上。Midjourney Scanner声称使用了40个模块化阵列和约50万个传感器,Butterfly Network官方也随后确认了他们为该项目提供了40个Ultrasound-on-Chip模块 。如果没有这种半导体级别的集成能力,在单台设备上部署50万个传统传感器在成本、体积和散热上都是无法想象的。

硬件架构拆解:大规模集成的工程挑战

从公布的参数和原理来看,Midjourney Scanner的硬件设计是一项极具挑战的系统工程。下表对比了不同医学成像技术的关键指标:

技术指标
传统B超
MRI
CT
Midjourney Scanner
扫描时间
10-30分钟
30-60分钟
5-10分钟
60秒
电离辐射
强磁场
操作员依赖
极低
分辨率
毫米级
亚毫米级
亚毫米级
亚毫米级
成本/次
$100-300
$1000-3000
$500-1500
未知
图3:AuntMinnie报道的Midjourney Scanner技术架构与传感器阵列设计

工作原理简述:当用户站在平台上缓慢下降进入水中时,这数十万个传感器会交替发射超声波脉冲并监听回波和透射波。声波在穿过水、皮肤、脂肪、肌肉和骨骼时,由于不同组织的声阻抗不同,声波的形状、速度和衰减程度会发生改变。系统捕捉这些微弱的信号变化,然后将海量数据流式传输到计算集群进行物理重建。

软件算法:计算声学重于图像生成

超声CT(USCT)在学术界研究了多年,迟迟未能大规模临床应用的一个重要原因,就是逆散射问题(Inverse Scattering Problem)的计算复杂度极高。传统的超声(B超)假设声波是直线传播的(基于反射),这在遇到骨骼或气体时会产生严重的伪影。而超声CT不仅利用反射波,还利用透射波和散射波,需要解算极其复杂的波动方程,才能重建出高分辨率的图像。Midjourney官方展示了"原始重建"和"AI分割"的交叉显示效果。这表明目前的短期核心更像是计算声学、硬件系统集成和底层物理重建算法。AI在其中的作用可能体现在后期的语义分割(如识别特定肌肉群、器官轮廓)、降噪和可视化增强上。虽然Midjourney拥有顶级的图像生成技术,但目前尚不能断言其生成式大模型就是这台医疗硬件的核心护城河,这更像是一个跨学科的工程融合问题 。

工程师视角的红与黑:需要追问的现实问题

任何抛开工程限制谈颠覆的言论都需要被审视。Midjourney Scanner在系统集成上确实有其惊艳之处,但在真正走向大规模应用前,仍有几个核心的物理和工程问题需要追问。

图4:Business Insider对Midjourney Medical Spa概念的报道

令人期待的创新点

1. 消除操作员依赖性

传统超声的图像质量和诊断结果高度依赖于医生的手法和探头按压角度。Midjourney Scanner的环形水浸式扫描,实现了全自动、标准化的360度数据采集。对于建立大规模、可对比的个人纵向健康基线数据来说,这种标准化具有重要意义。

2. 无电离辐射的监测潜力

CT有电离辐射,MRI虽然无辐射但成本高昂且耗时较长。超声波是目前已知最安全的医学成像方式之一。如果扫描过程真能缩短至60秒内完成,它确实具备了作为常规健康监测工具的潜力。

3. 多参数定量成像

传统的B超主要依赖组织的"回声"。而全环超声CT,正如Caltech论文中所展示的,不仅能测量反射,还能测量声速和声衰减。这种多维度的物理参数定量数据,对于发现组织的微小物理特性变化具有学术和临床价值。

需要正视的物理与工程边界

"全身"扫描的物理边界"全身"

这个词在医学语境下容易引起误解。知名医学专家Eric Topol指出,超声波无法对大脑进行有效成像 。这是因为高频超声波会被成人的坚硬颅骨严重阻挡。同样,超声波也难以穿透充满气体的肺部和胃肠道。因此,现阶段我们不应将这种"全身扫描"理解为对脑、肺等所有区域都具有与MRI/CT相当的诊断能力。它目前更擅长的是评估四肢和腹部的肌肉、脂肪分布以及部分实质性脏器。尽管Caltech团队提到未来可能探索脑部成像,但这在物理上仍是一个巨大的挑战。下表展示了不同组织对超声波的穿透性:

组织类型
穿透性
成像质量
临床应用
肌肉、脂肪
已验证
肝脏、肾脏
已验证
腹部脏器
良好
良好
已验证
颅骨后脑部
极差
无法成像
不可行
充气肺部
极差
无法成像
不可行
含气肠道
极差
无法成像
不可行
图5:The Verge对Midjourney Medical技术与临床应用的分析

数据治理的ZB级噩梦

官方提出了未来每月进行10亿次扫描的宏大愿景。无论我们按发布会转述的17GB/s压缩数据流计算,还是按官方博客提到的"TB/s级"原始数据流量计算,10亿次扫描产生的数据量都将轻松突破Zettabyte (ZB) 级别。在当前的存储成本和网络带宽下,这意味着绝大部分原始声学数据必须在边缘节点(Spa馆的服务器)被实时处理并丢弃,只保留压缩后的三维模型或分割结果。这种"阅后即焚"的数据处理模式,在医疗数据的可追溯性和后续复查中将面临严峻考验。下表展示了数据规模与成本的现实困境:

指标
数值
说明
单次扫描原始数据
~1TB
按17GB/s × 60秒计算
月度扫描目标
10亿次
官方宣称
月度原始数据量
1 Zettabyte
1 × 10^21 字节
存储成本(@$0.02/GB)
$2000亿/月
极其不现实
网络传输成本(@$0.10/GB)
$10000亿/月
更加不现实
实际可行方案
本地压缩
丢弃原始数据,仅保留模型
医学风险
无法追溯,无法复查

运动伪影与系统标定

水浸式扫描要求患者在数十秒内保持相对静止。呼吸、心跳、甚至水流的微小波动,对于亚毫米级分辨率的系统来说,都会产生运动伪影。如何在非刚性的水环境中,实时补偿人体的微小运动,是对算法鲁棒性的极大考验。

商业路径与临床伦理:从Wellness切入的考量

Midjourney Medical的定位非常明确:他们首先主打的是"Spa"和"Wellness"(健康/保健)概念,计划于2027年在旧金山开设首个体验中心。

图6:Midjourney Medical发布会现场的技术演示(1600×900)

监管路径的选择

在医疗器械领域,直接宣称"疾病诊断"将面临FDA漫长且严苛的审批流程。Midjourney官方在博客中也坦承,诊断功能通常需要FDA的批准。因此,他们选择首先提供"身体成分图"(如肌肉、脂肪、骨骼的可视化),这属于"Wellness"范畴,其监管路径相对较轻。一种可能的商业演进路径是:先以健康监测设备的名义落地,在收集了足够多的真实世界数据后,再逐步针对特定的适应症(如某种器官的异常检测)向FDA提交临床证据,争取更多的诊断能力许可。当然,这仍取决于其具体的功能宣称和与监管机构的沟通结果。

偶发瘤(Incidentalomas)与过度诊断的隐忧

这是医学界对所有"无差别全身扫描"最普遍的担忧。当一台高分辨率机器扫描健康人群时,极易发现一些无症状的"异常",医学上称为"偶发瘤"。例如,《The Conversation》的一篇文章指出,在接受MRI扫描的人群中,有超过40%的人会发现脊柱血管瘤,但其中99%终生不会产生任何症状 。如果在Spa环境中向用户展示了这些未经专业医生解读的微小异常,极易引发用户的焦虑,进而导致不必要的后续检查(如带有辐射的CT或有创的穿刺活检),即所谓的"医疗级联反应"(Cascade of Care)。虽然我们可以借鉴全身MRI的过度诊断风险来警示,但Midjourney Scanner作为一种全新的成像模态,其自身的假阳性率和偶发发现率目前尚未有任何公开的临床研究数据来验证。如何在提供数据透明度的同时,避免引发群体性的健康焦虑,是Midjourney在开设Spa馆前必须回答的伦理问题。下表展示了常见的偶发发现及其临床意义:

发现类型
健康人群发生率
需要治疗比例
终身症状风险
建议处理
脊柱血管瘤
40%
<1%
99%无症状
定期监测
脑部微小血管畸形
1.6%
<0.1%
大多无症状
定期监测
肾脏良性结节
20-30%
极少
99%无症状
定期监测
肝脏囊肿
15-20%
极少
99%无症状
定期监测
甲状腺结节
20-40%
<5%
95%无症状
定期监测
图7:Reddit Radiology社区对Midjourney Medical的专业讨论

医疗级联反应的成本:

•单次不必要的CT检查:$500-1500 + 辐射风险

•单次穿刺活检:$1000-3000 + 出血/感染风险

•心理焦虑治疗:$200-500/次

•后续复查成本:$1000-5000/年

结语:让技术回归理性

回到最初的疑问:Midjourney Scanner是医学影像革命还是概念包装?客观地说,它既不是虚无缥缈的假新闻,也不是已经可以完全替代MRI/CT的成熟医疗产品。它是一个基于前沿计算声学和成熟半导体超声芯片技术、由顶尖AI团队进行高调系统集成的早期医疗影像平台。它在消除操作员依赖、提供无辐射的三维定量数据方面展现了诱人的潜力;但同时,它在物理穿透边界、海量数据治理、以及商业化过程中的过度诊断风险上,仍面临重重挑战。Midjourney将复杂的医疗设备包装成"Spa体验",确实展现了硅谷特有的产品定义能力和营销手腕。但医疗不同于生成一张赛博朋克风景画,容错率极低。真正决定这台机器历史地位的,不是发布会上的Petaflops算力或渲染精美的3D动画,而是未来几年内它能否交出经得起同行评审的临床数据、明确的适应症边界以及负责任的数据治理方案。作为工程师,我们乐见技术的跨界融合与突破;但面对生命科学,保持一份对物理定律和医学伦理的敬畏,或许比盲目欢呼"革命"更为重要。

参考文献

[1] Sacra. Midjourney revenue, funding & news. (2023).

[2] Midjourney. A New Era of Midjourney. (2026 ).

[3] Garrett, D.C., Xu, J., Oh, D. et al. Whole cross-sectional human ultrasound tomography. Nature Biomedical Engineering (2026 ).

[4] Caltech. Scanning the Body with Sound. (2026 ).

[5] Butterfly Network. Butterfly Network Provides Commentary on Midjourney Medical's Full-Body Ultrasound Scanner Announcement. (2026 ).

[6] The Verge. Midjourney goes from generating cat images to full-body ultrasound scanners. (2026 ).

[7] Topol, E. Post on X. (2026 ).

[8] Taylor, A. Full-body scans to look for hidden disease are a bad idea – here's why. The Conversation (2024 ).