齐思头条2026/05/29「Biohub 开源 ESMFold2/ESMC/ESM Atlas 蛋白质世界模型、SpaceX 推出 C 实现训练栈 V1.0 与 Grok 0.2.7、Hugging Face TRL 异步权重同步约100× 带宽节省」 - 齐思

## Twitter **Biohub（ESMFold2 / ESMC / ESM Atlas：蛋白质“世界模型”开源）** ：Biohub 发布一套面向蛋白质预测与设计的“世界模型”工具链，包括 ESMFold2、训练于 28 亿条蛋白序列的 ESMC 以及 ESM Atlas，团队将三者全部开源以加速生物学与药物发现工作流。该套件定位从序列到结构与功能的端到端建模与检索，面向科研与产业化下游的高通量筛选与设计场景。([LeCun 官方推文（发布说明）](https://news.miracleplus.com/share_link/133032)、[LeCun 官方推文（模型/训练细节）](https://news.miracleplus.com/share_link/133033)) **SpaceX（内部 C 实现 AI 训练栈 V1.0 + Grok Build 0.2.7 发布）** ：SpaceX 宣称接近完成一套用 C 实现的内部训练栈 V1.0，设计可精确映射到 220k 张 GB300s GPU 与 800G NIC 的集群规模，并大量采用流水线并行化，官方宣称在大规模训练上相较 JAX 有超过 10 倍的潜在加速。与此并行，Elon 发布 Grok Build 0.2.7，包含多模态输入改进（Windows 拖放截图、图像作为视觉 token）、子代理会话恢复以及 /login、/usage 等 TUI/UI 修复，显示公司在从训练基建到终端产品的双轨投入。([SpaceX 训练栈推文（公告）](https://news.miracleplus.com/share_link/132926)、[Grok Build 0.2.7 推文（发布说明）](https://news.miracleplus.com/share_link/132923)、[SpaceX 训练栈新闻摘要](https://news.miracleplus.com/share_link/132926)、[Grok Build 新闻摘要](https://news.miracleplus.com/share_link/132923)) **芯片与机器人资本化趋势（Cognition 融资、Figure 机器人进展、Nvidia 在台投资报道）** ：市场信号显示机器人、agent-as-engineer 与底层算力投入同步升温：报道称 Cognition AI 获超 10 亿美元融资、前估值约 $26B（pre‑money），公司声称收入从年化 $37M 跳升至约 $492M 并拥有 Goldman Sachs、Mercedes‑Benz 等客户，主推 Devin 作为“自治工程师”agent 层。Figure AI 表示目标在 2026 年底将机器人推向家庭并支持长时域任务。另有推特转发称 Nvidia 拟在台湾进行大规模投资（报道提及约 1500 亿美元/年级别），反映芯片与数据中心资本投入正在加速。此类资金与时间表对机器人落地、agent 工程产品化与本地算力供给有直接催化作用。([Cognition 融资与 Devin 描述推文](https://news.miracleplus.com/share_link/133034)、[Figure AI CEO 采访转发（机器人时间表）](https://news.miracleplus.com/share_link/133035)、[Nvidia/AMD 投资报道转发](https://news.miracleplus.com/share_link/133036)) **Unified Neural Scaling Law（新论文：多变量统一扩展规律）** ：一篇新论文提出“统一神经尺度律”函数形式，能够在包含模型大小、数据量与计算量等多变量条件下拟合并外推性能变化，文中引入类似 1/N 的项用于多变量组合拟合。作者声称该规律在多种设置下对训练资源规划与外推更可量化，为训练规模决策与投产估算提供新的理论工具。([论文推文/介绍（转发）](https://news.miracleplus.com/share_link/133037)、[论文新闻摘要](https://news.miracleplus.com/share_link/132900)) **Hugging Face（TRL 异步权重同步：带宽提升 ~100x）** ：Hugging Face 科学团队在 TRL（训练 + 强化学习）场景中提出异步权重同步方案：仅传输发生变化的权重片段，从而将每步权重传输量显著压缩。示例中 Qwen3‑0.6B 的每步 payload 从约 1.2 GB 降至 ~20–35 MB，实现接近 100× 的带宽节省，配合 Hub 的 Buckets 存储可在无共享集群下完成高效离线/离散化同步，显著降低跨机器训练带宽与成本。([官方推文（技术细节与示例）](https://news.miracleplus.com/share_link/133038)) **DiffusionBlocks（块式训练：显著降低训练内存峰值）** ：ICLR2026 提交的 DiffusionBlocks 提出将网络按块分割、以扩散过程视角为每块赋予“逐步逼近目标表征”的角色，从而只需单块内存即可训练。论文在 ViT、DiT、Masked Diffusion、AR Transformer、Recurrent‑depth Transformer 等五类架构上展示与端到端训练相当的性能，同时大幅降低内存峰值，适合内存受限的加速器与边缘训练场景。([官方推文（论文/博客）](https://news.miracleplus.com/share_link/133039)、[新闻摘要](https://news.miracleplus.com/share_link/132779)) **MiMo（推理架构优化与大幅降价：最高 99% 的成本削减）** ：MiMo 宣布 API 定价下调：Input（Cache Hit）最高降价达 99%，Input（Cache Miss）与 Output 降价 60%–80%。技术上通过分层 KV cache 将 token 缓存容量提高 5×，并采用 SWA（稀疏权重近似）推理框架的 1:7 Full:SWA 比例，使得 70 层 MiMo‑V2.5‑Pro 的 prefill 计算量相当于约 10 层 GQA，从而在吞吐与成本上实现显著优势并把节省回馈开发者。([官方推文（降价与技术说明）](https://news.miracleplus.com/share_link/132851)、[新闻摘要](https://news.miracleplus.com/share_link/132851)) **LlamaIndex（LiteParse v2：Rust 重写的超快文档解析器）** ：LlamaIndex 发布 LiteParse v2，将解析器用 Rust 重写并提供原生 Python 与 Node 包，宣称支持 50+ 文档格式、在速度上超越现有开源无模型解析器（如 pymupdf、pypdf）且准确度更高。该库可嵌入到 AI 代理中触发解析，提升文档理解与检索型应用的吞吐与准确性。([官方推文（发布与博客/仓库）](https://news.miracleplus.com/share_link/132856)、[LiteParse v2 新闻摘要](https://news.miracleplus.com/share_link/132856)) **Qwen 系列（阿里 Qwen3.7‑Max 基准成绩与 Qwen3.5 推理吞吐）** ：阿里公布 Qwen3.7‑Max 在新 ITBench‑AA（针对企业 IT/ SRE agent 能力）中排名第三，显示在 agentic 企业场景的竞争力；此前 Qwen3.5 在推理上宣称达到每秒 580 tokens 的吞吐峰值，表明 Qwen 系列在企业级推理吞吐与 agent 优化方向持续推进。([官方推文（ITBench‑AA 成绩）](https://news.miracleplus.com/share_link/132935)、[性能报道（Qwen3.5 推理速度）](https://news.miracleplus.com/share_link/132798)) **AgingBench（代理长期可靠性基准：提出“衰老”机制分类）** ：AgingBench 提出将部署后代理的长期可靠性视为“寿命”属性，给出四类衰老机制（包括 compression aging 与 interference aging），并通过数月级基准量化代理随交互历史出现的性能漂移与降级形式。论文强调即便基础模型权重冻结，代理系统的状态也会因历史压缩、检索变化与事实更新而漂移，提出新的运维指标与修复目标。([AgingBench 论文/推文（介绍与下载）](https://news.miracleplus.com/share_link/132931)) **Vitalik Buterin（Interfold 隐私投票协议与本地 AI 生态更新）** ：Vitalik 推荐 Interfold，一种面向投票与秘密竞价的隐私协议，方案包含阈值加密密钥、链上提交带 ZK 资格证明的密文投票、在同态加密（FHE）上执行聚合并阈值解密，文档称可实现选民匿名性、以太坊审查抗性与 ZK over FHE 的结果正确性证明。Vitalik 同时汇总本地/私有 LLM 生态进展：Deepseek v4 的 2‑bit 量化可在 ~90GB 环境运行（Apple 机约 35 tok/s、AMD 约 7 tok/s）、Leanstral 在 AMD 上约 38 tok/s 并能在 <70GB 内运行，另提到 VoxTerm（本地录音）与面向以太坊的 ZK 支付/私有 RPC 思路，强调 CROPS AI 与以太坊接入层的交叉价值。([Interfold 推荐推文（Vitalik 说明）](https://news.miracleplus.com/share_link/132973)、[Vitalik 本地 AI 生态更新（合集）](https://news.miracleplus.com/share_link/132873)、[Interfold 新闻摘要](https://news.miracleplus.com/share_link/132973)) **Reactor（完成 $59M 融资并推出“World Model”开发平台）** ：Reactor 宣布从 Seed 至 A 轮共筹得 5,900 万美元（Lightspeed 领投），同时推出定位“World Model 时代”的开发平台，宣称可在不到 10 行代码下将前沿世界模型流式接入应用以驱动像素、音频與动作等交互式场景。团队成员来自 Apple、Meta、Google、Luma AI、Netflix、Replicate，产品聚焦把复杂生成/仿真模型变成易接入的实时服务。([官方宣布推文（融资与产品说明）](https://news.miracleplus.com/share_link/132995)、[新闻摘要](https://news.miracleplus.com/share_link/132995)) **NEAR Protocol（隐私执行与 ZECFi：noir 钱包内建 Zcash 功能与私有推理声明）** ：NEAR 宣传链抽象与隐私执行能力，宣布 $VVV 已在 NEAR Intents 与 near.com 上线，并称 @near_ai 为 AskVenice 提供私有推理服务。另推出 ZECFi，在 noir 钱包内测 Zcash 原生金融功能：支持一键将 $ZEC 用作抵押、内置原子兑换无需跨链桥，合作伙伴包括 rhea_finance 与 near_intents，noir wallet connect 功能也在推进中。([现金到 Zcash 示范推文（体验演示）](https://news.miracleplus.com/share_link/133040)、[$VVV 上线与私有推理声明](https://news.miracleplus.com/share_link/133041)、[ZECFi / noir 钱包说明](https://news.miracleplus.com/share_link/133042)) --- ## HackerNews **[I'm Getting Into Mesh Networks... (Meshtastic, MeshCore, and Reticulum)](https://news.miracleplus.com/share_link/132924)** ：作者实践 Meshtastic / MeshCore / Reticulum，评估 LoRa/mesh 在可用性与规模化上的利弊。 - **规模瓶颈** ：LoRa/现有 mesh 协议在多跳场景下吞吐急剧下降，城市级别要投入数千节点和数十万美元仍可能仅获得极低数据率，容易在节点密集处饱和。 - **抗摧毁与易攻破并存** ：mesh 在断网或无基础设施情形下能提供局部自治，但易被射频干扰、定位追踪或恶意节点破坏，真实应急部署需配套物理与管理对策。 - **实用场景差异** ：适合局域传感、野外离线消息、家庭/小区 IoT；作为大规模、延迟敏感或高带宽替代互联网（视频/流媒体/大流量应用）目前不现实，Reticulum 被多次提及为比 Meshtastic 更严肃的底层实现。 **[Beyond Benchmarks: Frontier LLM Disagreement on Fact-Checks](https://news.miracleplus.com/share_link/132984)** ：Lenz 对 1,000 条真实用户待核实声明用五款前沿 LLM 给出判定，研究模型间一致性与分歧。 - **核心结论** ：在 1,000 条声明中有 67% 出现至少一款模型与多数派不同意的判定，34% 存在模型间跨两级标签的实质分歧，Krippendorff’s α(序数)≈0.639，说明“边缘/中间”标签是主要分歧点。 - **方法学影响** ：研究刻意去掉“放弃/不确定”选项以强制给判决，导致模型被迫猜测或规避，放弃/不确定机制会显著影响判定分布与实际可用性。 - **工程启示** ：模型间不一致可作为上报人工审核或并行审查的触发条件；要求模型输出链式论证或证据来源可提高可解释性并帮助定位差异根源，但标签设计（True/Mostly True/Misleading/False）本身存在歧义亦会放大噪声。 **[AMD Pulls a Bait-and-Switch on Linux Users with Vivado Licensing Changes](https://news.miracleplus.com/share_link/133029)** ：AMD 将 Vivado 免费层改为仅限 Windows，Linux 支持移至需付费的 Core 级别，影响 FPGA 开发者生态。 - **门槛提升** ：免费 Basic 版不再支持 Linux，开发高端/付费器件或在 Linux 环境下工作需要每年数千美元许可，直接抬高了爱好者与小型开发团队的上手成本。 - **生态与商业后果** ：FPGA 厂商通过对开发工具收费收回支持成本，短期可增加收入但长期可能削弱社区驱动的上游生态与硬件入门渠道，导致原型与创新门槛上升。 - **技术支持成本现实** ：Linux 发行版碎片化与驱动/工具链兼容性复杂性确实增加维护负担，厂商选择将 Linux 支持作为付费项目在商业上可理解，但缺乏开源替代与工具质量问题使这一策略对研究/教育社区冲击显著。 --- ## Reddit **[Using depth maps and weight noising to get better character LoRAs](https://news.miracleplus.com/share_link/133030)** ：作者在LoRA训练中引入“权重噪声”和深度锚定以改善少样本角色一致性。 - **权重噪声（weight noising）= 正则化层级干预** ：直接在LoRA权重上注入高斯扰动可以抑制记忆化、偏向平坦损失极小值，实测使LoRA稳定秩约提升20%。 - **极少量样本也能显著提升肖像一致性** ：在仅8张图、相同训练步数（最佳检查点约750步）、配置（Batch4、LR5e‑5、LoKr factor8、AdamW8bit、1200步上限）下，加入权重噪声与深度锚定的跑次在人物 likeness 上明显优于标准流程。 - **可调实验维度建议** ：权重噪声与输入扰动在正则机理上不同，可尝试噪声调度（训练早期较大、后期减小）以平衡探索与收敛。 --- **[用多块Tesla显卡搭建的简易本地AI服务器](https://news.miracleplus.com/share_link/132834)** ：多用户展示了用二手/拼装显卡与自制配件搭建本地AI训练/推理平台的实战经验与坑点。 - **拼装多卡机可低成本承载嵌入与本地训练任务** ：用回收Tesla/RTX卡与创意固定件组机能胜任大规模嵌入构建、微调与离线推理，成本效益高于整机采购。 - **主板、供电与散热是关键工程问题** ：稳定运行多卡需选用企业级主板（如Supermicro）并保证足够并稳定的供电，常见解决方案包含3D打印导流罩与定向风扇以改善散热，但要注意噪音与温控。 - **零部件回收与创意改造能降本但增运维成本** ：使用SODIMM、改装风扇、手工支架等可显著节省费用，但会增加兼容性、稳定性和长期维护风险。 --- **[This guy built an offline survival AI](https://news.miracleplus.com/share_link/133031)** ：宣称将生存技能库与LLM整合到便携离线设备中并提供离线参考与短程文本通信的产品介绍与社区质疑并存。 - **离线运行LLM在小型设备上是可行的但有资源要求** ：作者给出的门槛是约8GB可用内存与20GB磁盘，模型与本地技能库可实现离线问答并返回具体来源页与置信度。 - **硬件与可靠性疑虑显著** ：设备标价与展示疑似基于RK3588类单板＋LoRa方案，外壳存在排线暴露等非mil‑spec细节，电池续航、抗冲击/EMP能力与长期坚固性被视为主要隐患。 - **离线通信与地图功能受限于协议与本地数据** ：所谓“离线文本”与“全球离线地图”通常依赖LoRa/网状网络或庞大本地数据缓存，实现范围、精度与能源消耗均存在明显折衷。 --- ## 国内信息源 - **[百川M4医疗增强模型](https://news.miracleplus.com/share_link/132881)** ：百川在清华论坛发布面向家庭的AI医生“百小医”与医疗大模型M4，主张通用模型在医疗场景存三大缺陷（幻觉被确定化、缺乏循证推理、不主动追问），M4通过1000+原子化临床路径（SKILL）、深度问诊与超长记忆等工程手段在HealthBench系列基准上位列第一，宣称幻觉率降至3.3%，并通过调度/记忆/自进化把模型演进为“医疗智能体”以降低临床风险。 - **[ForgeTrain全AI训练框架](https://news.miracleplus.com/share_link/132893)** ：面壁智能发布号称“全由AI编写”的训练框架ForgeTrain，采用三阶段闭环法让AI生成训练框架与算子，已在华为昇腾与英伟达GPU上完成MiniCPM系列验证（多机多卡下较Megatron提升约10%训练速率），团队已内部验证到8B规模，当前仍保留人工在超参等环节，Harness用于约束与评测。 - **[AI自进化与长期记忆的竞争壁垒](https://news.miracleplus.com/share_link/132886)** ：盛大EverMind提出Agent时代关键从模型能力迁移到长期记忆与数据中间层，竞争在于能否自动沉淀/匹配/复用Skill实现“越用越聪明”，强调构建可沉淀Skill的生态、用户数据与记忆所有权回归及跨平台同步，提示行业把注意力从纯模型参数转向记忆与流程工程。 - **[Cursor Composer 2.5 的产品化RL路径](https://news.miracleplus.com/share_link/132832)** ：Cursor用在Kimi 2.5基座上做大规模mid-training和强化学习，把模型权重专门化到产品相关的编程与长时任务，通过“把有限权重用于产品任务”策略实现更小模型在质量-速度-成本上的优异trade-off，体现应用公司从原型向自训练演进的实践路线。 - **[从语言到视觉推理的多模态路线](https://news.miracleplus.com/share_link/132883)** ：Andrew Dai离开Google创立ElorianAI，提出“Jagged Frontier”观点：大模型能力呈锯齿状发展，尽管部分任务超越人类，但在视觉推理、空间关系与物理常识等基础世界理解上仍脆弱，因而转向视觉推理与多模态研究以弥补真实世界理解短板，并探讨其对AGI与产品化的影响。 - **[从数据驱动到词元驱动的智能编排](https://news.miracleplus.com/share_link/132867)** ：行业观察认为Agentic AI使生产逻辑由“数据驱动”向“词元（Token）驱动”迁移——词元成为连接算力、模型与应用的核心计量单元，推动对词元生产、编码标准、计费与基础设施优化的技术与商业关注，催生“词元经济”与新的智能编排挑战。 --- ## GitHub & HuggingFace - **[NVIDIA 推出 LocateAnything-3B 视觉-语言定位模型，支持快速精准多任务应用](https://news.miracleplus.com/share_link/132895)** ：引入并行边界框解码（PBD）一次性并行预测完整坐标，在保持几何一致性的同时将推理吞吐率提升约2.5×并在大规模多领域数据上训练，适配多场景视觉-语言定位（科研/非商业许可）。 - **[pyannote 推出纯 PyTorch 的说话人分离管道，提升部署与推理性能](https://news.miracleplus.com/share_link/132833)** ：将说话人分割与嵌入完全迁移至纯 PyTorch，去除 onnxruntime 依赖以简化部署并提升推理可移植性与 GPU 加速效率（需在 Hugging Face 同意使用条款并提供访问令牌）。 - **[从想法到论文生成，aiming-lab 推出 AutoResearchClaw](https://news.miracleplus.com/share_link/132862)** ：构建端到端“自我强化的自主研究”流水线，集成可加载技能库、Human‑in‑the‑Loop 协作、多领域执行代理与在 Hugging Face 发布的 ARC‑Bench 基准，加速从想法到实验与论文草拟的自动化研究流程。 - **[微软推出AI代理治理工具包，覆盖OWASP Agentic十大安全风险](https://news.miracleplus.com/share_link/132972)** ：提供在应用层对每次工具调用与代理委派进行策略强制、身份归因与可审计记录的包装接口（如 govern(my_tool, policy="policy.yaml")），以提升自治代理在生产环境中的安全与可观测性。 - **[754 项 AI 代理网络安全技能集发布，覆盖 5 大安全框架](https://news.miracleplus.com/share_link/132825)** ：以 agentskills.io 标准结构化 754 条网络安全技能，并统一映射到 MITRE/NIST 等五大框架，便于将高级安全能力直接下发给各类 AI 代理并实现合规对齐。 - **[GitHub 开源工具：去除散文中 AI 痕迹的技能文件](https://news.miracleplus.com/share_link/132824)** ：提供一套可直接加入系统提示的“反劣化”规则库（SKILL.md、phrases/structures/examples 等）与评分量表，用于教导 LLM 识别并去除机器写作痕迹（MIT 许可证，便于自由复用）。 --- ## Discord ### Codeium (Windsurf) **Cascade 编辑器产生无法应用的补丁，影响核心编辑流程** ：用户报告 Cascade 在将模型生成的改动应用到文件时出现“补丁无法应用/格式异常”的问题，跨不同模型与新会话复现，已经阻断常见编辑工作流并在部分 Windows 机器上伴随异常的配额消耗。 - 问题表现为模型生成的改动被拒绝（内容/空白层面的差异导致无法合并），因此自动编辑流程经常失败。 - 因为跨多款模型和会话均出现，社区担忧这是系统性问题；部分用户因此尝试切换客户端或临时避开 Cascade。 **Devin CLI/Next 与 Windsurf 的集成与稳定性问题** ：社区讨论 CLI 工具从 Windsurf 启动子进程时无法使用预期的项目/权限配置、对子进程是否消耗配额存在疑问；另有稳定复现的内存耗尽并反复崩溃的恢复循环，导致项目“卡死”，简单的清理与重装并不总能解决。 - 关键痛点是子进程的权限/计额行为不明确，用户担心无意中消耗配额或无法访问必要资源。 - 一个可复现的 OOM/恢复循环会把本地会话卡死，已超出常规清缓存能解决的范围，社区希望开发方尽快跟进深层修复。

评论