齐思头条2025/04/03「Gemini 2.5 Pro在MathArena USAMO评估中取得24.4%分数，展示AI能力进步；Sherjil Ozair发布实时计算机自动驾驶仪Ace；亚马逊竞标收购TikTok扩展数字足迹；AI效率提升或创造更多就业机会；自设计AI系统标志AI架构重大转变。」 - 齐思

## Twitter: **Orchid Inc的全基因组胚胎筛查** ：Orchid Inc开发了一项全基因组胚胎筛查技术，旨在预防失明和数百种遗传疾病，目前已在IVF中心投入使用，详细信息由[New York Times](https://news.miracleplus.com/share_link/65867)报道。 **Gemini 2.5 Pro在MathArena USAMO评估中取得里程碑** ：Gemini 2.5 Pro模型在MathArena USAMO评估中首次取得24.4%的非平凡分数，展示了AI能力的快速进步，详细信息由[mbalunovic](https://news.miracleplus.com/share_link/65868)报道。 **实时计算机自动驾驶仪'Ace'发布** ：Sherjil Ozair宣布推出Ace，这是首个实时计算机自动驾驶仪，能够以超人速度使用鼠标和键盘执行任务，与聊天机器人区别开来，详细信息在[Twitter](https://news.miracleplus.com/share_link/65846)上分享。 **亚马逊收购TikTok的竞标** ：据报道，亚马逊提交了最后一刻的竞标以收购TikTok，旨在扩大其数字足迹并在社交媒体领域竞争，详细信息见[TechCrunch报告](https://news.miracleplus.com/share_link/65849)。 **AI效率与就业创造悖论** ：Aaron Levie讨论了AI背景下的Jevons悖论，AI提高服务部门效率导致需求增加，可能创造更多就业机会，详细信息见[详细文章](https://news.miracleplus.com/share_link/65851)。 **自设计AI系统的兴起** ：Carlos E. Perez强调了由GPT等基础模型驱动的自设计AI系统的出现，这标志着AI架构向更复杂方向的重大转变，详细信息见[综合研究](https://news.miracleplus.com/share_link/65820)。 **Gradio在AI民主化中的里程碑** ：Gradio达到了每月超过一百万开发者的里程碑，成为AI民主化的重要工具，详细信息见[Clement Delangue的推文](https://news.miracleplus.com/share_link/65781)。 **AI扩展限制与美国领导力担忧** ：Elon Musk指出AI扩展限制从芯片转向电压变压器和发电，提出对美国AI领导力的长期影响的担忧，详细信息见[Elon Musk的推文](https://news.miracleplus.com/share_link/65809)。 **AnthropicAI的Claude教育计划** ：AnthropicAI与大学合作，通过其新产品Claude for Education将AI整合到高等教育中，详细信息见[AnthropicAI的推文](https://news.miracleplus.com/share_link/65852)。 **Google AI的ECLeKTic基准** ：Google AI推出了ECLeKTic基准，用于评估大型语言模型中的跨语言知识转移，详细信息见[Google AI的推文](https://news.miracleplus.com/share_link/65869)。 **AI利用WiFi透视墙壁** ：AI技术已发展到可以利用WiFi路由器的环境无线电波来透视墙壁，详细信息见[Brian Roemmele的推文](https://news.miracleplus.com/share_link/65870)。 **AI影响者构建器发布** ：一款新AI工具允许用户通过设计角色、编写故事和放置在各种环境中来创建虚拟影响者，详细信息见[BrivaelLp的推文](https://news.miracleplus.com/share_link/65871)。 **AI代理系统和自设计智能** ：自动化代理系统设计（ADAS）研究领域探索AI系统设计其他AI代理的概念，详细信息见[IntuitMachine的推文](https://news.miracleplus.com/share_link/65820)。 **AI在医疗保健中的应用** ：一篇关于医疗保健AI代理的论文已发表，提供了AI在医疗应用中的整合见解，详细信息见[Eric Topol的推文](https://news.miracleplus.com/share_link/65872)。 **AI模型Gemini 2.5 Pro评估** ：Google DeepMind的新旗舰模型Gemini 2.5 Pro在GPQA Diamond基准上取得了84%的分数，详细信息见[EpochAIResearch的推文](https://news.miracleplus.com/share_link/65861)。 **AI生成短片的预测** ：Elon Musk预测到2025年底，AI将能够生成短片，详细信息见[Tucker Carlson的采访](https://news.miracleplus.com/share_link/65873)。 **混合奖励系统在AI研究中的应用** ：ByteDance的研究人员引入了一种混合奖励系统，结合推理任务验证器（RTV）和生成奖励模型（GenRM），详细信息见[Twitter帖子](https://news.miracleplus.com/share_link/65874)。 **Arrakis：AI代理的开源沙盒** ：Arrakis是一个新的开源和自托管的沙盒服务，允许AI代理安全地执行代码和操作GUI，详细信息见[GitHub](https://news.miracleplus.com/share_link/65883)。 **大规模代码库的增强代理** ：增强代理为大规模代码库设计，具有200K上下文令牌、持久内存和深度工具集成，详细信息见[Twitter](https://news.miracleplus.com/share_link/65875)。 **DreamerV3在Nature上发表** ：DreamerV3是一种能够通过想象未来结果来解决控制任务的AI代理，详细信息见[Google DeepMind的推文](https://news.miracleplus.com/share_link/65876)。 **Sparrow-0：轮流模型** ：Sparrow-0是一种新的轮流模型，解决了对话中断的问题，详细信息见[Twitter](https://news.miracleplus.com/share_link/65863)。 **Neuralink全球患者注册启动** ：Neuralink已在全球开放其患者注册，邀请四肢瘫痪者探索通过思维控制计算机的新方法，详细信息见[公告](https://news.miracleplus.com/share_link/65877)。 **Nomic Embed Multimodal 7B发布** ：Nomic AI推出了Nomic Embed Multimodal 7B，一种用于嵌入文本、图像、PDF和图表的开源模型，详细信息见[Twitter](https://news.miracleplus.com/share_link/65878)。 **Axolotl v0.8.0发布** ：Axolotl的最新版本引入了序列并行和Muon优化器，详细信息见[Winglian的推文](https://news.miracleplus.com/share_link/65879)。 **PaperBench开源发布** ：PaperBench是一种用于评估AI研究能力的新工具，详细信息见[Tejal Patwardhan的推文](https://news.miracleplus.com/share_link/65865)。 **AI驱动的编码与ChatGPT** ："vibe coding"时代的到来，个人利用ChatGPT和其他AI工具协助编写代码，详细信息见[New Scientist](https://news.miracleplus.com/share_link/65880)。 **Google的NotebookLM增强研究** ：Google在NotebookLM中引入了一项新功能Discover Sources，详细信息见[Google的推文](https://news.miracleplus.com/share_link/65882)。 ## HackerNews: **GitHub - nizarmah/igatha: 战争和灾难中的SOS信号和恢复应用程序（iOS和Android）。** [链接](https://news.miracleplus.com/share_link/65788): 该项目旨在开发一款用于灾难情况下的SOS信号应用程序，重点解决在废墟下的通信挑战。讨论重点： - **信号穿透挑战：** 蓝牙（UHF）在废墟下无效，信号强度损失显著。ELF-VLF频段理想用于穿透，但由于天线尺寸要求而不切实际。 - **声波作为替代方案：** 声波在废墟中的传播可能比射频波更远，但噪声干扰和移动设备检测是关注点。 - **人类因素和设备可用性：** 应用程序应能在人们通常携带的设备上使用，但当前技术可能不足以在废墟下进行有效信号传递。 - **潜在市场和货币化：** 应用程序可以通过瞄准采矿和建筑等行业进行货币化，工人可以预先安装该应用程序以确保安全。 - **无基础设施消息传递：** 有兴趣转向无基础设施的短消息传递，但用户采用和分发仍面临挑战。 **停止同步一切** [链接](https://news.miracleplus.com/share_link/65793): 这篇文章介绍了Graft，一个开源的事务性存储引擎，旨在通过启用惰性、部分和强一致性复制来解决边缘的数据同步挑战。讨论重点： - **一致性模型的困惑：** Graft的模型允许本地提交可以在以后失效，这与传统的“提交”概念不同，后者保证事务有效。这导致了关于客户端如何处理提交的异步传播失败的困惑。 - **处理本地写入的灵活性：** Graft提供了多种处理本地写入的选项，例如拒绝离线写入、基于最新快照重新基准、合并更改、分叉卷或丢弃本地更改。这种灵活性旨在支持边缘的各种应用需求。 - **与Git和SQL的比较：** Graft的提交操作更像是Git的模型而不是SQL的，强调分布式、无主的特性。这种比较突出了在分布式系统中维护严格可序列化性的挑战。 - **CRDTs和冲突解决：** 虽然CRDTs提供自动冲突解决，但它们并不适用于所有数据类型。Graft的方法意味着开发人员可能需要实现自定义的冲突解决逻辑，这可能复杂且容易出错。 **一种被遗忘的豆子如何拯救咖啡免于灭绝** [链接](https://news.miracleplus.com/share_link/65881): 这篇文章讨论了植物学家通过发现新的咖啡品种来防止咖啡因气候变化和疾病而灭绝的努力。讨论重点： - **美洲冬青作为咖啡因来源：** 美洲冬青，原产于美国东南部，被建议作为潜在的咖啡因来源。它能在各种条件下生长，包括干旱和洪水，并含有可防止咖啡因崩溃的可可碱。然而，其咖啡因含量低于咖啡。 - **文化和口味偏好：** 咖啡的复杂口味，由多达1200种挥发性化合物影响，是饮用者关注的一个重要因素，超越了咖啡因含量。咖啡的文化意义和口味复杂性使得像美洲冬青这样的替代品难以取代它。 - **植物名称的重新命名：** 像美洲冬青（Ilex vomitoria）这样的植物的历史命名受到经济利益的影响，例如保护英国茶叶贸易。重新命名的努力在其他产品上取得了成功，表明美洲冬青也有潜力。 - **Eugenioides咖啡品种：** Eugenioides，阿拉比卡咖啡的亲本品种，以其天然的甜味和较低的咖啡因含量而闻名，提供了与传统咖啡不同的独特口味。 ## Discord: **大型语言模型的存储与复杂性挑战** ：@aartbluestoke指出在**大型语言模型（LLMs）** 中高效嵌入事实知识的挑战，估计定义30,000个单词及其关系可能需要数十亿个数字。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **上下文窗口限制问题** ：@genewitch观察到模型如**Mistral-Nemo** 、**Gemini 3** 和**Neural Chat v3** 在超过**4096个tokens** 时变得不可靠，尽管声称支持**32k** 和**128k** 上下文窗口。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **VACE模型的实现** ：@kijai正在实现支持深度、姿态和视频扩展的**VACE** 模型，基础模型使用**fp32** ，而VACE模型使用**bf16** ，需要几乎是1.3B模型两倍的VRAM。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AccVideo与视频蒸馏的复杂性** ：@neonninjaastro_63946指出**AccVideo** 不如其他工具精细，视频蒸馏复杂。一个闭源论文使用256个H100 GPU取得显著成果，但对开源项目不切实际。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **OpenAI的开源策略** ：OpenAI计划发布一个新的开源权重模型，可能会重塑其业务和行业，影响取决于模型是否是较小的版本或类似**ChatGPT 4.5** 。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **自我改进的LLM代理** ：@cakecrusher分享了一个关于使用遥测和评估开发自我改进LLM代理的[草稿视频](https://youtu.be/jgzSq5YGK_Q)，该方法涉及通过**强化学习** 概念优化LLM调用。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AI代理课程发布** ：Hugging Face推出了AI代理课程的新单元，比较了**LlamaIndex** 、**smolagents** 和**LangGraph** 等框架，用于开发Agentic RAG应用。[source](https://huggingface.co/learn/agents-course/) **形状相关错误与Triton GPU内核** ：@achal寻找用于编译时形状检查的静态分析器，@samginzburg建议使用`tl.static assert`和`static print`来断言和打印静态已知的形状。[source](https://news.miracleplus.com/share_link/65886) **量化与HQQ和vLLM** ：@mobicham强调需要`AutoHQQHFModel.save_quantized` / `AutoHQQHFModel.from_quantized`来兼容vLLM的预量化模型。[source](https://news.miracleplus.com/share_link/65888) **OpenRouter的财务模型与令牌限制** ：OpenRouter通过存款费用和可能的供应商折扣获利，用户限制在30,000个令牌，需更多信用以请求更高的令牌数。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **图像生成模型竞争** ：@anaheim0727建议一个新的图像生成模型被匆忙推向市场以与Google的Gemini 2.5竞争，指出其高运营成本和缺乏彻底的红队测试。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **Mojo数量别名** ：@eggsquad和@darkmatter__在Mojo中创建物理量的别名，如**Velocity** 和**Acceleration** ，使用`Quantity[Velocity]`，并在实现中遇到挑战。[source](https://news.miracleplus.com/share_link/65889) **神经网络与表示** ：神经网络没有“表示”，而是**嵌入** 或有意义的神经元激活模式，提供特定功能而非复制或反映世界。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **LoRA配方探索** ：@honolouloute正在开发一个[PR](https://news.miracleplus.com/share_link/65890)以引入新的配置和单设备SFT的LoRA配方，在2个epoch后在训练集上达到约45%。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **扩散模型与自回归模型** ：Sander Dieleman建议**扩散模型** 在频域中执行近似自回归，详细信息在他的[博客文章和Python笔记本](https://news.miracleplus.com/share_link/39580)中。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **实时计算机自动驾驶Ace** ：@swyxio宣布[Ace](https://news.miracleplus.com/share_link/65884)由@GeneralAgentsCo推出，旨在以超人速度使用鼠标和键盘执行计算机任务。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **动态基准生成框架** ：Huggingface发布了一个[动态基准生成框架](https://news.miracleplus.com/share_link/65885)称为**yourbench** ，允许从任何文档生成自定义基准和合成数据。[source](https://t.co/TEGGIqEwH6) **OIV2集成与路线图** ：@notnaton计划将**OIV2** 集成到**Open Interpreter** 开发分支，并将创建未来几个月的新路线图。[source](https://news.miracleplus.com/share_link/65891) **推理模型的挑战** ：@etrotta强调在非数学领域评估模型性能的困难，由于缺乏明确的正确答案，使用LLMs评估其他LLMs时可能导致测量误差。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AI工具与社区活动** ：@eurotypo观察到服务器活动下降，仅剩核心群体。@ymchoi提到对**廉价工具** 的偏好，并指出视频社区的适应速度较慢。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AI速度与功能** ：@ymchoi强调**Klingai** 、**Pika** 和**Luma** 的快速进展，而**Wan** 显示出令人印象深刻的速度但缺乏完整开发。[source](https://news.miracleplus.com/share_link/65887) ## HuggingFace & Github: ### 人工智能与技术创新 - [Gamzekocc_Fluxx模型](https://news.miracleplus.com/share_link/65769) 是一款先进的模型，使用 **Replicate** 进行训练，通过文本提示生成图像，展示了人工智能在视觉创造力方面的强大能力。该模型使用触发词 **"TOK"** 来触发图像生成，利用 **AutoPipelineForText2Image** 和 **torch** 库来生成图像，并加载了 **codermert/gamzekocc_fluxx** 模型的权重。更多关于加载 **LoRAs** 的细节可以参考 **diffusers** 文档。 ## Reddit: **在经济衰退期间，你的法律领域表现如何？** [链接](https://news.miracleplus.com/share_link/65892): 这次讨论探讨了不同法律实践如何受到经济衰退的影响。 - **离婚和破产法** ：这些领域在经济衰退期间活动增加。离婚被描述为不可阻挡，而随着人们变得绝望，破产申请增加。 - **人身伤害（PI）和保险辩护** ：人身伤害在金融不安全中蓬勃发展，而保险辩护保持稳定，除非保险公司面临财务问题。 - **移民和刑法** ：移民辩护很忙，刑法也迎来繁荣，尽管客户可能难以支付费用。 - **房地产和医疗保健** ：房地产受损，但医疗保健通常对经济衰退免疫，尽管当前情况感觉有所不同。 - **就业和民权** ：在裁员期间，就业案件，尤其是年龄歧视案件增加，而民权法保持稳定。 **特朗普启动23亿美元Truth Social股份的出售** [链接](https://news.miracleplus.com/share_link/65893): 文章讨论了与唐纳德·特朗普相关的社交媒体平台Truth Social的一大笔股份出售，估值为23亿美元。 - **估值问题** ：Truth Social的估值受到质疑，与Facebook的用户基础和估值进行比较，突显出用户价值的差异——Truth Social每用户1150美元，而Facebook每用户478美元。 - **SPAC策略** ：使用**特殊目的收购公司（SPAC）** 被认为是一种绕过严格IPO流程的方法，使像特朗普媒体这样的公司可以在没有传统审查的情况下上市。 - **市场反应** ：尽管存在质疑，特朗普宣布不出售其股份导致股票价值暂时上涨，表明市场波动性和投资者兴趣，尽管存在潜在问题。

评论