## Twitter: **Orchid Inc的全基因组胚胎筛查** :Orchid Inc开发了一项全基因组胚胎筛查技术,旨在预防失明和数百种遗传疾病,目前已在IVF中心投入使用,详细信息由[New York Times](https://news.miracleplus.com/share_link/65867)报道。 **Gemini 2.5 Pro在MathArena USAMO评估中取得里程碑** :Gemini 2.5 Pro模型在MathArena USAMO评估中首次取得24.4%的非平凡分数,展示了AI能力的快速进步,详细信息由[mbalunovic](https://news.miracleplus.com/share_link/65868)报道。 **实时计算机自动驾驶仪'Ace'发布** :Sherjil Ozair宣布推出Ace,这是首个实时计算机自动驾驶仪,能够以超人速度使用鼠标和键盘执行任务,与聊天机器人区别开来,详细信息在[Twitter](https://news.miracleplus.com/share_link/65846)上分享。 **亚马逊收购TikTok的竞标** :据报道,亚马逊提交了最后一刻的竞标以收购TikTok,旨在扩大其数字足迹并在社交媒体领域竞争,详细信息见[TechCrunch报告](https://news.miracleplus.com/share_link/65849)。 **AI效率与就业创造悖论** :Aaron Levie讨论了AI背景下的Jevons悖论,AI提高服务部门效率导致需求增加,可能创造更多就业机会,详细信息见[详细文章](https://news.miracleplus.com/share_link/65851)。 **自设计AI系统的兴起** :Carlos E. Perez强调了由GPT等基础模型驱动的自设计AI系统的出现,这标志着AI架构向更复杂方向的重大转变,详细信息见[综合研究](https://news.miracleplus.com/share_link/65820)。 **Gradio在AI民主化中的里程碑** :Gradio达到了每月超过一百万开发者的里程碑,成为AI民主化的重要工具,详细信息见[Clement Delangue的推文](https://news.miracleplus.com/share_link/65781)。 **AI扩展限制与美国领导力担忧** :Elon Musk指出AI扩展限制从芯片转向电压变压器和发电,提出对美国AI领导力的长期影响的担忧,详细信息见[Elon Musk的推文](https://news.miracleplus.com/share_link/65809)。 **AnthropicAI的Claude教育计划** :AnthropicAI与大学合作,通过其新产品Claude for Education将AI整合到高等教育中,详细信息见[AnthropicAI的推文](https://news.miracleplus.com/share_link/65852)。 **Google AI的ECLeKTic基准** :Google AI推出了ECLeKTic基准,用于评估大型语言模型中的跨语言知识转移,详细信息见[Google AI的推文](https://news.miracleplus.com/share_link/65869)。 **AI利用WiFi透视墙壁** :AI技术已发展到可以利用WiFi路由器的环境无线电波来透视墙壁,详细信息见[Brian Roemmele的推文](https://news.miracleplus.com/share_link/65870)。 **AI影响者构建器发布** :一款新AI工具允许用户通过设计角色、编写故事和放置在各种环境中来创建虚拟影响者,详细信息见[BrivaelLp的推文](https://news.miracleplus.com/share_link/65871)。 **AI代理系统和自设计智能** :自动化代理系统设计(ADAS)研究领域探索AI系统设计其他AI代理的概念,详细信息见[IntuitMachine的推文](https://news.miracleplus.com/share_link/65820)。 **AI在医疗保健中的应用** :一篇关于医疗保健AI代理的论文已发表,提供了AI在医疗应用中的整合见解,详细信息见[Eric Topol的推文](https://news.miracleplus.com/share_link/65872)。 **AI模型Gemini 2.5 Pro评估** :Google DeepMind的新旗舰模型Gemini 2.5 Pro在GPQA Diamond基准上取得了84%的分数,详细信息见[EpochAIResearch的推文](https://news.miracleplus.com/share_link/65861)。 **AI生成短片的预测** :Elon Musk预测到2025年底,AI将能够生成短片,详细信息见[Tucker Carlson的采访](https://news.miracleplus.com/share_link/65873)。 **混合奖励系统在AI研究中的应用** :ByteDance的研究人员引入了一种混合奖励系统,结合推理任务验证器(RTV)和生成奖励模型(GenRM),详细信息见[Twitter帖子](https://news.miracleplus.com/share_link/65874)。 **Arrakis:AI代理的开源沙盒** :Arrakis是一个新的开源和自托管的沙盒服务,允许AI代理安全地执行代码和操作GUI,详细信息见[GitHub](https://news.miracleplus.com/share_link/65883)。 **大规模代码库的增强代理** :增强代理为大规模代码库设计,具有200K上下文令牌、持久内存和深度工具集成,详细信息见[Twitter](https://news.miracleplus.com/share_link/65875)。 **DreamerV3在Nature上发表** :DreamerV3是一种能够通过想象未来结果来解决控制任务的AI代理,详细信息见[Google DeepMind的推文](https://news.miracleplus.com/share_link/65876)。 **Sparrow-0:轮流模型** :Sparrow-0是一种新的轮流模型,解决了对话中断的问题,详细信息见[Twitter](https://news.miracleplus.com/share_link/65863)。 **Neuralink全球患者注册启动** :Neuralink已在全球开放其患者注册,邀请四肢瘫痪者探索通过思维控制计算机的新方法,详细信息见[公告](https://news.miracleplus.com/share_link/65877)。 **Nomic Embed Multimodal 7B发布** :Nomic AI推出了Nomic Embed Multimodal 7B,一种用于嵌入文本、图像、PDF和图表的开源模型,详细信息见[Twitter](https://news.miracleplus.com/share_link/65878)。 **Axolotl v0.8.0发布** :Axolotl的最新版本引入了序列并行和Muon优化器,详细信息见[Winglian的推文](https://news.miracleplus.com/share_link/65879)。 **PaperBench开源发布** :PaperBench是一种用于评估AI研究能力的新工具,详细信息见[Tejal Patwardhan的推文](https://news.miracleplus.com/share_link/65865)。 **AI驱动的编码与ChatGPT** :"vibe coding"时代的到来,个人利用ChatGPT和其他AI工具协助编写代码,详细信息见[New Scientist](https://news.miracleplus.com/share_link/65880)。 **Google的NotebookLM增强研究** :Google在NotebookLM中引入了一项新功能Discover Sources,详细信息见[Google的推文](https://news.miracleplus.com/share_link/65882)。 ## HackerNews: **GitHub - nizarmah/igatha: 战争和灾难中的SOS信号和恢复应用程序(iOS和Android)。** [链接](https://news.miracleplus.com/share_link/65788): 该项目旨在开发一款用于灾难情况下的SOS信号应用程序,重点解决在废墟下的通信挑战。讨论重点: - **信号穿透挑战:** 蓝牙(UHF)在废墟下无效,信号强度损失显著。ELF-VLF频段理想用于穿透,但由于天线尺寸要求而不切实际。 - **声波作为替代方案:** 声波在废墟中的传播可能比射频波更远,但噪声干扰和移动设备检测是关注点。 - **人类因素和设备可用性:** 应用程序应能在人们通常携带的设备上使用,但当前技术可能不足以在废墟下进行有效信号传递。 - **潜在市场和货币化:** 应用程序可以通过瞄准采矿和建筑等行业进行货币化,工人可以预先安装该应用程序以确保安全。 - **无基础设施消息传递:** 有兴趣转向无基础设施的短消息传递,但用户采用和分发仍面临挑战。 **停止同步一切** [链接](https://news.miracleplus.com/share_link/65793): 这篇文章介绍了Graft,一个开源的事务性存储引擎,旨在通过启用惰性、部分和强一致性复制来解决边缘的数据同步挑战。讨论重点: - **一致性模型的困惑:** Graft的模型允许本地提交可以在以后失效,这与传统的“提交”概念不同,后者保证事务有效。这导致了关于客户端如何处理提交的异步传播失败的困惑。 - **处理本地写入的灵活性:** Graft提供了多种处理本地写入的选项,例如拒绝离线写入、基于最新快照重新基准、合并更改、分叉卷或丢弃本地更改。这种灵活性旨在支持边缘的各种应用需求。 - **与Git和SQL的比较:** Graft的提交操作更像是Git的模型而不是SQL的,强调分布式、无主的特性。这种比较突出了在分布式系统中维护严格可序列化性的挑战。 - **CRDTs和冲突解决:** 虽然CRDTs提供自动冲突解决,但它们并不适用于所有数据类型。Graft的方法意味着开发人员可能需要实现自定义的冲突解决逻辑,这可能复杂且容易出错。 **一种被遗忘的豆子如何拯救咖啡免于灭绝** [链接](https://news.miracleplus.com/share_link/65881): 这篇文章讨论了植物学家通过发现新的咖啡品种来防止咖啡因气候变化和疾病而灭绝的努力。讨论重点: - **美洲冬青作为咖啡因来源:** 美洲冬青,原产于美国东南部,被建议作为潜在的咖啡因来源。它能在各种条件下生长,包括干旱和洪水,并含有可防止咖啡因崩溃的可可碱。然而,其咖啡因含量低于咖啡。 - **文化和口味偏好:** 咖啡的复杂口味,由多达1200种挥发性化合物影响,是饮用者关注的一个重要因素,超越了咖啡因含量。咖啡的文化意义和口味复杂性使得像美洲冬青这样的替代品难以取代它。 - **植物名称的重新命名:** 像美洲冬青(Ilex vomitoria)这样的植物的历史命名受到经济利益的影响,例如保护英国茶叶贸易。重新命名的努力在其他产品上取得了成功,表明美洲冬青也有潜力。 - **Eugenioides咖啡品种:** Eugenioides,阿拉比卡咖啡的亲本品种,以其天然的甜味和较低的咖啡因含量而闻名,提供了与传统咖啡不同的独特口味。 ## Discord: **大型语言模型的存储与复杂性挑战** :@aartbluestoke指出在**大型语言模型(LLMs)** 中高效嵌入事实知识的挑战,估计定义30,000个单词及其关系可能需要数十亿个数字。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **上下文窗口限制问题** :@genewitch观察到模型如**Mistral-Nemo** 、**Gemini 3** 和**Neural Chat v3** 在超过**4096个tokens** 时变得不可靠,尽管声称支持**32k** 和**128k** 上下文窗口。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **VACE模型的实现** :@kijai正在实现支持深度、姿态和视频扩展的**VACE** 模型,基础模型使用**fp32** ,而VACE模型使用**bf16** ,需要几乎是1.3B模型两倍的VRAM。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AccVideo与视频蒸馏的复杂性** :@neonninjaastro_63946指出**AccVideo** 不如其他工具精细,视频蒸馏复杂。一个闭源论文使用256个H100 GPU取得显著成果,但对开源项目不切实际。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **OpenAI的开源策略** :OpenAI计划发布一个新的开源权重模型,可能会重塑其业务和行业,影响取决于模型是否是较小的版本或类似**ChatGPT 4.5** 。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **自我改进的LLM代理** :@cakecrusher分享了一个关于使用遥测和评估开发自我改进LLM代理的[草稿视频](https://youtu.be/jgzSq5YGK_Q),该方法涉及通过**强化学习** 概念优化LLM调用。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AI代理课程发布** :Hugging Face推出了AI代理课程的新单元,比较了**LlamaIndex** 、**smolagents** 和**LangGraph** 等框架,用于开发Agentic RAG应用。[source](https://huggingface.co/learn/agents-course/) **形状相关错误与Triton GPU内核** :@achal寻找用于编译时形状检查的静态分析器,@samginzburg建议使用`tl.static assert`和`static print`来断言和打印静态已知的形状。[source](https://news.miracleplus.com/share_link/65886) **量化与HQQ和vLLM** :@mobicham强调需要`AutoHQQHFModel.save_quantized` / `AutoHQQHFModel.from_quantized`来兼容vLLM的预量化模型。[source](https://news.miracleplus.com/share_link/65888) **OpenRouter的财务模型与令牌限制** :OpenRouter通过存款费用和可能的供应商折扣获利,用户限制在30,000个令牌,需更多信用以请求更高的令牌数。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **图像生成模型竞争** :@anaheim0727建议一个新的图像生成模型被匆忙推向市场以与Google的Gemini 2.5竞争,指出其高运营成本和缺乏彻底的红队测试。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **Mojo数量别名** :@eggsquad和@darkmatter__在Mojo中创建物理量的别名,如**Velocity** 和**Acceleration** ,使用`Quantity[Velocity]`,并在实现中遇到挑战。[source](https://news.miracleplus.com/share_link/65889) **神经网络与表示** :神经网络没有“表示”,而是**嵌入** 或有意义的神经元激活模式,提供特定功能而非复制或反映世界。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **LoRA配方探索** :@honolouloute正在开发一个[PR](https://news.miracleplus.com/share_link/65890)以引入新的配置和单设备SFT的LoRA配方,在2个epoch后在训练集上达到约45%。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **扩散模型与自回归模型** :Sander Dieleman建议**扩散模型** 在频域中执行近似自回归,详细信息在他的[博客文章和Python笔记本](https://news.miracleplus.com/share_link/39580)中。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **实时计算机自动驾驶Ace** :@swyxio宣布[Ace](https://news.miracleplus.com/share_link/65884)由@GeneralAgentsCo推出,旨在以超人速度使用鼠标和键盘执行计算机任务。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **动态基准生成框架** :Huggingface发布了一个[动态基准生成框架](https://news.miracleplus.com/share_link/65885)称为**yourbench** ,允许从任何文档生成自定义基准和合成数据。[source](https://t.co/TEGGIqEwH6) **OIV2集成与路线图** :@notnaton计划将**OIV2** 集成到**Open Interpreter** 开发分支,并将创建未来几个月的新路线图。[source](https://news.miracleplus.com/share_link/65891) **推理模型的挑战** :@etrotta强调在非数学领域评估模型性能的困难,由于缺乏明确的正确答案,使用LLMs评估其他LLMs时可能导致测量误差。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AI工具与社区活动** :@eurotypo观察到服务器活动下降,仅剩核心群体。@ymchoi提到对**廉价工具** 的偏好,并指出视频社区的适应速度较慢。[source](https://discord.com/channels/1091220969173028894/1248367924574556171/1248378856285540383) **AI速度与功能** :@ymchoi强调**Klingai** 、**Pika** 和**Luma** 的快速进展,而**Wan** 显示出令人印象深刻的速度但缺乏完整开发。[source](https://news.miracleplus.com/share_link/65887) ## HuggingFace & Github: ### 人工智能与技术创新 - [Gamzekocc_Fluxx模型](https://news.miracleplus.com/share_link/65769) 是一款先进的模型,使用 **Replicate** 进行训练,通过文本提示生成图像,展示了人工智能在视觉创造力方面的强大能力。该模型使用触发词 **"TOK"** 来触发图像生成,利用 **AutoPipelineForText2Image** 和 **torch** 库来生成图像,并加载了 **codermert/gamzekocc_fluxx** 模型的权重。更多关于加载 **LoRAs** 的细节可以参考 **diffusers** 文档。 ## Reddit: **在经济衰退期间,你的法律领域表现如何?** [链接](https://news.miracleplus.com/share_link/65892): 这次讨论探讨了不同法律实践如何受到经济衰退的影响。 - **离婚和破产法** :这些领域在经济衰退期间活动增加。离婚被描述为不可阻挡,而随着人们变得绝望,破产申请增加。 - **人身伤害(PI)和保险辩护** :人身伤害在金融不安全中蓬勃发展,而保险辩护保持稳定,除非保险公司面临财务问题。 - **移民和刑法** :移民辩护很忙,刑法也迎来繁荣,尽管客户可能难以支付费用。 - **房地产和医疗保健** :房地产受损,但医疗保健通常对经济衰退免疫,尽管当前情况感觉有所不同。 - **就业和民权** :在裁员期间,就业案件,尤其是年龄歧视案件增加,而民权法保持稳定。 **特朗普启动23亿美元Truth Social股份的出售** [链接](https://news.miracleplus.com/share_link/65893): 文章讨论了与唐纳德·特朗普相关的社交媒体平台Truth Social的一大笔股份出售,估值为23亿美元。 - **估值问题** :Truth Social的估值受到质疑,与Facebook的用户基础和估值进行比较,突显出用户价值的差异——Truth Social每用户1150美元,而Facebook每用户478美元。 - **SPAC策略** :使用**特殊目的收购公司(SPAC)** 被认为是一种绕过严格IPO流程的方法,使像特朗普媒体这样的公司可以在没有传统审查的情况下上市。 - **市场反应** :尽管存在质疑,特朗普宣布不出售其股份导致股票价值暂时上涨,表明市场波动性和投资者兴趣,尽管存在潜在问题。
2025-04-03 08:07:34 +0800
奇绩新的面向科研人员的计划,欢迎大家申请
- 奇绩算力提供免费高性能算力,价值100万人民币。 - 支持对象包括科研项目、开源项目、数据项目和其他项目。 - 提供200 Petaflops GPU算力资源和24小时技术支持。 - 提供等值100万算力,相当于8张H800持续使用15个月。 - 提供全面的奇绩生态资源支持,包括Office Hour、大咖闭门分享等。 - 申请流程与奇绩创业营申请流程一致。 - 算力申请项目需回答关键问题,包括技术、观点和算力需求。 - 申请通道长期开放,全年滚动录取。 - 奇绩算力提供NVIDIA H800高性能GPU资源。 - 算力支持完全免费,包含奇绩创坛生态资源支持。 - 算力使用期限限定于2025年内,可申请额外支持或延长使用期限。 - 奇绩不参与项目成果的体现,但希望参与项目加速和落地。 - 项目未达预期目标不影响后续合作。 - 申请过程中可通过微信或邮件联系奇绩团队。
奇绩算力计划为研究人员和创业者提供了价值100万元人民币的高性能计算资源免费使用。该计划广泛包容,欢迎各领域和地区的申请者,包括国际团队。提供的资源包括超过200 Petaflops的GPU计算能力,特别是NVIDIA H800 GPU,并且有全天候技术支持。该计划没有KPI或回报要求,申请截止日期持续,采用基于项目的支持方式,对科学和创业社区中寻求计算资源以推进项目的人来说,这是一个特别有吸引力的机会。
2025-01-21 18:25:29 +0800
- Arrakis是一个可定制和自托管的沙盒解决方案,用于执行AI代理代码和计算机使用。 - 它支持回溯,具有简单的REST API和Python SDK,自动端口转发和安全的MicroVM隔离。 - 每个沙盒在MicroVM中运行,包含一个代码执行服务和一个在启动时运行的VNC服务器。 - 它提供了REST API、Python SDK和MCP服务器,允许客户以编程方式生成沙盒、上传文件和执行代码。 - 它支持快照和恢复,适用于基于蒙特卡洛树搜索的代理或详细解释复杂的代理执行流程。 - Arrakis还提供了MCP服务器,允许MCP客户端生成和管理沙盒。 - 每个沙盒都配有一个在启动时运行的VNC服务器,并通过端口转发公开VNC服务器。 - Arrakis还提供了一个CLI客户端,用于生成和管理虚拟机。 - 安全性方面,每个沙盒在MicroVM中运行,使用overlayfs保护根文件系统。 - 可以通过自定义Dockerfile来定制沙盒的根文件系统,还可以自定义网络设置和使用自定义内核。 - Arrakis使用GNU Affero通用公共许可证v3.0进行许可。
2025-04-03 08:03:00 +0800
- Google DeepMind发布了新的旗舰模型Gemini 2.5 Pro。 - 他们在GPQA Diamond上对其进行了评估,并获得了一个分数。
在最近的推特中,Google的CEO Sundar Pichai分享了EpochAI Research关于Google DeepMind最新成就的更新。推文宣布了DeepMind的新旗舰模型Gemini 2.5 Pro的发布,该模型已在一个名为GPQA Diamond的基准上进行了评估。该模型在这一基准上的表现引人注目,表明在人工智能领域取得了重大进展。对于那些对人工智能进展和Google DeepMind创新感兴趣的人来说,这篇内容提供了对最新发展和模型在GPQA Diamond上得分所反映的能力的一瞥。
2025-04-03 08:00:31 +0800
- Age LAN Server是一个允许玩家在没有互联网连接的情况下进行多人局域网游戏的Web服务器。 - 支持的游戏包括《帝国时代:终极版》、《帝国时代II:终极版》和《帝国时代III:终极版》。 - 服务器可以在官方服务器维护或关闭的情况下仍然提供游戏的局域网功能。 - 服务器具有多种功能,包括场景、地图传输、游戏恢复、数据修改、聊天和跨平台游戏。 - 服务器有一些限制,如无法进行排名、观战和快速游戏等。 - 安装服务器和启动游戏的步骤相对简单。 - 使用该软件需要拥有合法的游戏许可证,并遵守游戏的服务条款。
Age LAN Server 是一款独特的工具,专为《帝国时代》系列的粉丝设计,特别是支持《帝国时代》一二三终极版的玩家,他们希望在局域网上享受多人游戏,而无需互联网连接。这个服务器的独特之处在于它不仅支持离线游戏,还支持诸如场景、地图传输和大厅聊天等通常与在线游戏相关的功能。此外,它还促进了Steam和Xbox用户之间的跨平台游戏,打破了平台障碍。然而,需要注意的是,该服务器不支持排名游戏或观战模式,用户必须遵守使用条款,包括拥有合法的游戏许可证。对于那些希望重现局域网派对体验或在网络接入有限的环境中游玩的玩家来说,Age LAN Server 可能是一个宝贵的资源。
2025-04-03 13:31:49 +0800
- 字节跳动引入了一种混合奖励系统,结合了Reasoning Task Verifiers (RTV)和Generative Adversarial Network (GAN)。 - 该系统旨在通过提供更准确和多样化的奖励来提高AI模型的性能。 - RTV组件验证模型的推理任务的正确性,而GAN组件根据模型的表现生成奖励。 - 这种混合方法解决了传统奖励系统的局限性,并增强了AI模型的训练过程。
字节跳动,即热门应用TikTok背后的公司,已经涉足人工智能领域,并发表了一篇新的研究论文。这篇论文具有重要意义,因为它引入了一种新颖的人工智能混合奖励系统,将推理任务验证器(RTV)与生成模型相结合。这种方法有可能通过整合验证推理过程的机制,提升人工智能系统学习和决策的方式。对于那些对最新人工智能进展感兴趣,并希望了解如何改进机器学习模型的人来说,这篇论文可能为开发更复杂和可靠的人工智能系统提供宝贵的见解。
2025-04-03 08:02:28 +0800
- PaperBench是一个开源的评估工具 - 用于衡量人工智能研究能力 - 包含超过8,000个研究任务 - 目的是评估人工智能研究的能力
Aleksander Madry,人工智能研究领域的知名人物,宣布发布了PaperBench,这是一款创新的开源工具,旨在评估人工智能研究能力。该工具以其超过8,000个研究任务的庞大数据库脱颖而出,为评估人工智能系统的性能和进展提供了全面的平台。对于人工智能领域的研究人员和爱好者来说,PaperBench代表着一项重要贡献,有助于基准测试和推动人工智能研究。这一消息对于那些对人工智能技术的度量和评估感兴趣的人来说尤为令人兴奋。
2025-04-03 08:00:40 +0800
## Twitter: **OpenAI的重大进展** : OpenAI成功筹集了400亿美元,估值达到3000亿美元,成为历史上最大规模的私募融资之一,由软银领投,显示出AI技术在全球市场的重要性和潜力。OpenAI还推出了新的图像生成工具,向所有用户开放,旨在增强用户创造力。此外,ChatGPT的图像生成功能现已向所有免费用户开放,标志着AI创意工具的普及化。OpenAI还引入了ChatGPT的新语音功能,提升用户互动体验。[TechCrunch](https://news.miracleplus.com/share_link/65580), [TechCrunch](https://news.miracleplus.com/share_link/65628), [Sama](https://news.miracleplus.com/share_link/65629), [Sama](https://news.miracleplus.com/share_link/65658), [OpenAI](https://news.miracleplus.com/share_link/65752). **ChatGPT的病毒式传播** : ChatGPT在26个月前经历了一次显著的病毒式传播,在发布五天内获得了一百万用户,被描述为最强烈的病毒传播之一。[Sama](https://news.miracleplus.com/share_link/65659), [Matt Krisiloff](https://news.miracleplus.com/share_link/65581). **AI通过WiFi透视墙壁** : AI技术已发展到可以利用WiFi路由器的环境无线电波来可视化和检测墙后的人,展示了监控和监测能力的重大飞跃。[Brian Roemmele](https://news.miracleplus.com/share_link/65753). **开放源代码AI合作的复兴** : AI社区正在见证开放源代码合作的潜在回归,讨论共享开放权重以促进科学进步,旨在重燃AI发展的黄金时代。[Clement Delangue](https://news.miracleplus.com/share_link/65754). **AI代理用于创意故事讲述** : A16z呼吁初创公司开发AI代理,协助创意故事讲述,旨在创建类似Wattpad或Roblox的平台,AI帮助用户创作跨媒体故事。[A16z](https://news.miracleplus.com/share_link/65727). **Unitree Dex5灵巧手发布** : Unitree Robotics推出了Dex5灵巧手,具有20个自由度和94个触点,提供先进的操作能力,预计将加速机器人操作的进展。[Unitree Robotics](https://news.miracleplus.com/share_link/65664). **El Salvador的AI和机器人教育创新** : El Salvador正在开创一种新的教育模式,专注于比特币、AI和机器人技术,定位为未来功能性教育的领导者。[Brian Roemmele](https://news.miracleplus.com/share_link/65755). ## HackerNews: **GitHub - koreader/koreader: 电子书阅读器应用程序** [链接](https://news.miracleplus.com/share_link/65625): KOReader 是一个多功能的电子书阅读器应用程序,支持多种格式和设备,以其用户界面改进和丰富的功能体验而受到赞誉。讨论亮点: - **用户界面和功能:** KOReader 显著改善了其用户界面,使其在功能丰富的同时更加有条理。它提供了独特的功能,如跟踪阅读习惯和为小屏幕配置 PDF 阅读。 - **设备兼容性:** 它因与 Linux 平板电脑和旧款 Kindle 型号的兼容性而受到关注,提供了比 Kobo 和 Kindle 等设备上的默认阅读器更好的阅读体验。 - **自定义和可修改性:** 该应用程序高度可定制和可修改,其大部分代码用 Lua 编写,允许用户添加功能,如支持 Kobo 自然光。 - **社区和开发:** 有一个活跃的社区为其开发做出贡献,正在进行的项目包括为 KOReader Sync 支持的 Kavita 集成。 **Charlie Javice 因在金融援助初创公司以 1.75 亿美元出售给摩根大通期间欺诈被定罪** [链接](https://news.miracleplus.com/share_link/65631): Frank 的创始人 Charlie Javice 因在公司收购期间伪造用户数据以抬高公司价值而被判欺诈罪。 - **工程伦理:** 该案例被作为工程伦理的一个例子,强调拒绝雇主非法请求的重要性,正如 Frank 的首席软件工程师 Patrick Vovor 所示,他拒绝生成合成数据。 - **摩根大通的兴趣:** 摩根大通主要对 Frank 所谓的大量用户群感兴趣,这些用户群是伪造的,目的是将他们转化为终身银行客户。 - **法律辩护费用:** Javice 与摩根大通的雇佣合同中包含一项条款,要求银行支付与她的官方职责相关的法律辩护费用,法院维持了这一条款,要求摩根大通支付她的民事和刑事辩护费用。 - **欺诈检测:** 欺诈是通过创建一个虚假的用户数据库来实现的,这可以通过手动验证用户账户来检测,而摩根大通在收购前未能进行此步骤。 - **估值实践:** 该案例揭示了初创公司通常是如何根据客户获取成本进行估值的,有时在没有彻底验证用户数据真实性的情况下接受估值。 ## Discord: **ComfyUI与Google Gemini集成** :新扩展将**Google's Gemini API** 、**OpenAI** 、**Anthropic's Claude** 、**Ollama** 和**Alibaba Qwen** 集成到**ComfyUI** 中,提供**Gemini图像生成** 、**背景移除** 和**SVG转换** 等功能,详情见[GitHub](https://news.miracleplus.com/share_link/65756)和[LinkedIn](https://news.miracleplus.com/share_link/65757)。 **LM Studio SDK发布** :**LM Studio SDK** 现已支持**Python** 和**TypeScript** ,提供**Chat** 、**Text Completions** 、**Embeddings** 和**Agentic Tool Use** 的API,支持多GPU和自动软件依赖管理,更多信息在[LM Studio SDK博客](https://news.miracleplus.com/share_link/65758)。 **Mojo语言用于异构计算** :**Mojo** 被引入为首个设计用于异构计算的语言,简化了跨**CPU** 、**GPU** 和其他加速器的编程,提供了一个统一的生态系统以增强AI和HPC的性能和可用性,更多信息在[YouTube](https://news.miracleplus.com/share_link/65761)。 **OpenAI开放权重模型发布计划** :**OpenAI** 计划发布自**GPT-2** 以来的首个开放权重语言模型,以满足开发者对支持自定义微调、可调延迟和本地部署模型的需求,详情见[Substack](https://news.miracleplus.com/share_link/65763)。 **OpenAI实时转录API** :**OpenAI** 的新API支持**WebRTC** 连接,允许与**MediaStream** 或`<audio>`元素集成,展示此功能的演示可在[此处](https://news.miracleplus.com/share_link/65759)查看。 **CUDA线程管理** :**CUDA** 开发者解释了GPU上最大并发线程数的计算方法,A100 GPU支持每个SM 2048个线程,总共96 * 2048个线程并发,更多细节在[论坛帖子](https://news.miracleplus.com/share_link/61526)。 **WebAssembly书籍** :**Mariano Guerra** 撰写了一本关于**WebAssembly** 的书,提供了对其能力和应用的见解,书籍可在[wasmgroundup.com](https://wasmgroundup.com/)获取。 **OpenRouter模型路由选项** :**OpenRouter** 提供**Auto Router** 以根据提示选择高质量模型,并提供**models参数** 作为备用模型,更多信息在[OpenRouter文档](https://openrouter.ai/docs/features/model-routing)。 **自动化支付和奖励** :**Mozilla AI** 宣布自动化支付的推出,生产将于周三开始,Moz Finance每周五将收到赏金发票,简化财务交易。 **图像生成与向量数据库** :**LlamaIndex** 提出从向量数据库数据生成图像的功能,以响应查询,如“提供图像中的股票分析”,表明对视觉数据表示能力的需求。 **多代理工作流与不同LLM** :**LlamaIndex** 探索在多代理工作流中为每个代理集成不同的语言模型,建议利用多样化的模型能力来处理复杂任务。 **动态元数据过滤** :**LlamaIndex** 强调实现动态元数据过滤的重要性,强调需要适应性的数据处理解决方案。 **PEFT实现文档** :**OpenAccess AI Collective** 指出**Huggingface** 的**PEFT** 功能缺乏文档,计划更新文档或接受PR,`use_peft_lora`函数使用有限,见[GitHub](https://github.com/axolotl-ai-cloud/axolotl/blob/328d59811488cf30f7e2ecf92afdf380246ee05f/src/axolotl/utils/models.py#L1479-L1480)。 **CUDA并行与并发执行** :**CUDA** 开发者区分了并行与并发执行,硬件限制决定最大并发线程数,实际执行受寄存器空间和共享内存等资源限制影响。 **模型训练与Triton内核** :**CUDA MODE** 分享了在**GPUMODE** 内核数据集上训练0.5B参数模型的挑战,建议结合**SFT** 和**GRPO** 以改善结果。 **OpenAI的模式重置技术** :**OpenAI** 介绍了一种重置模型响应格式的方法,涉及识别问题、分析更好的格式,并重新思考方法而不依赖于模板。 **OpenAI的提示工程与模型个性化** :**OpenAI** 分享了通过提供特定指令来定制AI模型的见解,强调清晰沟通以使模型性能与个人偏好一致,示例见[Snapshot 1](https://chatgpt.com/share/67eb2cb0-b41c-8011-abee-88bfe2abc478)、[Snapshot 2](https://chatgpt.com/share/67eb2da4-6978-8011-89d0-fa3fbcece93d)、[Snapshot 3](https://chatgpt.com/share/67eb2e1d-3f04-8011-b00a-0d4c562c1abf)。 **CUDA内核执行与调度** :**CUDA** 开发者强调启动的线程数高于并发运行的线程数,因排队和调度所致,建议使用32的倍数作为块大小以控制每个SM的warp数。 ## HuggingFace & Github: ### 人工智能与技术创新 - [Llama 3.2的PyTorch实现](https://news.miracleplus.com/share_link/65636):由Hugging Face社区贡献者编写的**从零开始的、用于教育的PyTorch实现** ,**优化了可读性** ,旨在用于**学习和研究** 目的。包含了来自Meta的**官方模型权重的转换版本** ,只需**最少的代码依赖** ,让用户能够轻松尝试先进的语言模型。 - [OpenHands LM开放编码模型](https://news.miracleplus.com/share_link/65635):基于**Qwen Coder 2.5 Instruct 32B** 构建,通过**专门的微调过程** ,利用开源代码库的OpenHands生成数据。该模型在**SWE-Bench Verified** 基准测试中取得了**37.2%的解决率** ,性能接近**参数量大20倍** 的模型,如Deepseek V3 0324。可从**Hugging Face** 下载并**本地运行** 。 - [FastMCP快速构建MCP服务器](https://news.miracleplus.com/share_link/65686):提供了一种**快速、Pythonic** 的方式来构建**Model Context Protocol(MCP)服务器** 。通过**高层接口** ,**减少代码量** ,**加快开发速度** 。支持**图像结果** 和**自定义部署配置** ,正在积极开发中,核心功能已可用。 - [微软推出KBLaM](https://news.miracleplus.com/share_link/65685):**知识库增强语言模型** 的官方实现,**无需单独的检索模块** ,通过训练适配器,将**知识库转换为特殊的知识标记** 供LLM使用。该方法与**知识库大小高效扩展** ,避免了上下文学习中的**计算开销** 。代码在**GitHub开源** ,支持**Hugging Face hub** 的流行模型。 ### 开源项目与工具 - [Shakker-Labs发布AWPortraitCN2模型](https://news.miracleplus.com/share_link/65650):AWPortraitCoN的升级版,**探索更广泛的东方美学** ,包含**全年龄段的面部数据** ,在生成与**美食、建筑、环境、传统民族服饰** 相关的主题上表现出色。**无需触发词** ,由DynamicWang开发,基于**非商业许可** 发布。 - [kubernetes/ingress-nginx](https://news.miracleplus.com/share_link/65684):为Kubernetes设计的**Ingress控制器** ,利用**NGINX进行反向代理和负载均衡** 。与各种**Kubernetes版本全面兼容** ,提供了**Helm图表** 以简化部署过程。包括**故障排除指南** ,并遵守**Kubernetes社区行为准则** 。 ## Reddit: **beNullMyFriend** [链接](https://news.miracleplus.com/share_link/65762): 这篇内容幽默地探讨了软件开发中提交代码的文化和实践。讨论重点包括: - **微提交(Micro-commits)** :一些开发者更喜欢微提交,因为他们发现这样比处理复杂的合并更容易。这种做法与涉及数千个文件的大型单次提交形成对比。 - **提交信息实践** :开发者通常使用非正式或幽默的提交信息,特别是在使用拉取请求和压缩合并策略时,这些策略将这些信息合并为一个单一的提交。 - **提交历史问题** :糟糕的提交信息可能会使追踪回归变得复杂,尤其是在之前的开发者已经离开项目的情况下。 - **对传统提交的恐惧** :有一种幽默的恐惧是针对那些不遵循传统提交实践的开发者,因为这可能导致混乱的代码历史。
2025-04-02 08:08:02 +0800
- DreamerV3在《自然》杂志上发表 - Dreamer通过想象未来结果来解决控制任务
DreamerV3在人工智能领域取得了重大进展,特别是在解决控制任务方面。这种创新性解决方案通过模拟未来结果来运行,因其独特的问题解决方法而引起了关注。其在著名科学期刊《自然》上的发表突显了研究的重要性和可信度。@danijarh在Twitter上的公告,可能是项目的贡献者之一,表明了科学界对这一突破的兴奋。对于那些对最新人工智能技术及其应用感兴趣的人来说,DreamerV3在《自然》上的报道是值得进一步探索的发展。
2025-04-03 08:02:37 +0800
- 亚马逊提交了最后一刻的收购TikTok的报价。 - 亚马逊希望收购TikTok。 - 这是一份关于亚马逊收购TikTok的报价的报道。
在一次令人意外的举动中,据报道亚马逊已经提出了最后一刻的收购热门社交媒体平台TikTok的报价。这一消息由领先的科技媒体机构TechCrunch分享,可能对科技和社交媒体领域产生重大影响。像亚马逊这样的科技巨头潜在的收购意味着战略转变,可能暗示着亚马逊深入社交媒体和数字内容的意图。这一发展对那些关注主要科技公司商业战略和社交媒体所有权持续演变的人尤为值得关注。
2025-04-03 04:00:44 +0800