齐思头条2025/04/02「OpenAI估值3000亿美元，推出图像生成工具和语音功能；ChatGPT病毒式传播；AI利用WiFi透视墙壁；开放源代码AI合作回归；A16z推动AI创意故事讲述平台。」 - 齐思

## Twitter: **OpenAI的重大进展** : OpenAI成功筹集了400亿美元，估值达到3000亿美元，成为历史上最大规模的私募融资之一，由软银领投，显示出AI技术在全球市场的重要性和潜力。OpenAI还推出了新的图像生成工具，向所有用户开放，旨在增强用户创造力。此外，ChatGPT的图像生成功能现已向所有免费用户开放，标志着AI创意工具的普及化。OpenAI还引入了ChatGPT的新语音功能，提升用户互动体验。[TechCrunch](https://news.miracleplus.com/share_link/65580), [TechCrunch](https://news.miracleplus.com/share_link/65628), [Sama](https://news.miracleplus.com/share_link/65629), [Sama](https://news.miracleplus.com/share_link/65658), [OpenAI](https://news.miracleplus.com/share_link/65752). **ChatGPT的病毒式传播** : ChatGPT在26个月前经历了一次显著的病毒式传播，在发布五天内获得了一百万用户，被描述为最强烈的病毒传播之一。[Sama](https://news.miracleplus.com/share_link/65659), [Matt Krisiloff](https://news.miracleplus.com/share_link/65581). **AI通过WiFi透视墙壁** : AI技术已发展到可以利用WiFi路由器的环境无线电波来可视化和检测墙后的人，展示了监控和监测能力的重大飞跃。[Brian Roemmele](https://news.miracleplus.com/share_link/65753). **开放源代码AI合作的复兴** : AI社区正在见证开放源代码合作的潜在回归，讨论共享开放权重以促进科学进步，旨在重燃AI发展的黄金时代。[Clement Delangue](https://news.miracleplus.com/share_link/65754). **AI代理用于创意故事讲述** : A16z呼吁初创公司开发AI代理，协助创意故事讲述，旨在创建类似Wattpad或Roblox的平台，AI帮助用户创作跨媒体故事。[A16z](https://news.miracleplus.com/share_link/65727). **Unitree Dex5灵巧手发布** : Unitree Robotics推出了Dex5灵巧手，具有20个自由度和94个触点，提供先进的操作能力，预计将加速机器人操作的进展。[Unitree Robotics](https://news.miracleplus.com/share_link/65664). **El Salvador的AI和机器人教育创新** : El Salvador正在开创一种新的教育模式，专注于比特币、AI和机器人技术，定位为未来功能性教育的领导者。[Brian Roemmele](https://news.miracleplus.com/share_link/65755). ## HackerNews: **GitHub - koreader/koreader: 电子书阅读器应用程序** [链接](https://news.miracleplus.com/share_link/65625): KOReader 是一个多功能的电子书阅读器应用程序，支持多种格式和设备，以其用户界面改进和丰富的功能体验而受到赞誉。讨论亮点： - **用户界面和功能：** KOReader 显著改善了其用户界面，使其在功能丰富的同时更加有条理。它提供了独特的功能，如跟踪阅读习惯和为小屏幕配置 PDF 阅读。 - **设备兼容性：** 它因与 Linux 平板电脑和旧款 Kindle 型号的兼容性而受到关注，提供了比 Kobo 和 Kindle 等设备上的默认阅读器更好的阅读体验。 - **自定义和可修改性：** 该应用程序高度可定制和可修改，其大部分代码用 Lua 编写，允许用户添加功能，如支持 Kobo 自然光。 - **社区和开发：** 有一个活跃的社区为其开发做出贡献，正在进行的项目包括为 KOReader Sync 支持的 Kavita 集成。 **Charlie Javice 因在金融援助初创公司以 1.75 亿美元出售给摩根大通期间欺诈被定罪** [链接](https://news.miracleplus.com/share_link/65631): Frank 的创始人 Charlie Javice 因在公司收购期间伪造用户数据以抬高公司价值而被判欺诈罪。 - **工程伦理：** 该案例被作为工程伦理的一个例子，强调拒绝雇主非法请求的重要性，正如 Frank 的首席软件工程师 Patrick Vovor 所示，他拒绝生成合成数据。 - **摩根大通的兴趣：** 摩根大通主要对 Frank 所谓的大量用户群感兴趣，这些用户群是伪造的，目的是将他们转化为终身银行客户。 - **法律辩护费用：** Javice 与摩根大通的雇佣合同中包含一项条款，要求银行支付与她的官方职责相关的法律辩护费用，法院维持了这一条款，要求摩根大通支付她的民事和刑事辩护费用。 - **欺诈检测：** 欺诈是通过创建一个虚假的用户数据库来实现的，这可以通过手动验证用户账户来检测，而摩根大通在收购前未能进行此步骤。 - **估值实践：** 该案例揭示了初创公司通常是如何根据客户获取成本进行估值的，有时在没有彻底验证用户数据真实性的情况下接受估值。 ## Discord: **ComfyUI与Google Gemini集成** ：新扩展将**Google's Gemini API** 、**OpenAI** 、**Anthropic's Claude** 、**Ollama** 和**Alibaba Qwen** 集成到**ComfyUI** 中，提供**Gemini图像生成** 、**背景移除** 和**SVG转换** 等功能，详情见[GitHub](https://news.miracleplus.com/share_link/65756)和[LinkedIn](https://news.miracleplus.com/share_link/65757)。 **LM Studio SDK发布** ：**LM Studio SDK** 现已支持**Python** 和**TypeScript** ，提供**Chat** 、**Text Completions** 、**Embeddings** 和**Agentic Tool Use** 的API，支持多GPU和自动软件依赖管理，更多信息在[LM Studio SDK博客](https://news.miracleplus.com/share_link/65758)。 **Mojo语言用于异构计算** ：**Mojo** 被引入为首个设计用于异构计算的语言，简化了跨**CPU** 、**GPU** 和其他加速器的编程，提供了一个统一的生态系统以增强AI和HPC的性能和可用性，更多信息在[YouTube](https://news.miracleplus.com/share_link/65761)。 **OpenAI开放权重模型发布计划** ：**OpenAI** 计划发布自**GPT-2** 以来的首个开放权重语言模型，以满足开发者对支持自定义微调、可调延迟和本地部署模型的需求，详情见[Substack](https://news.miracleplus.com/share_link/65763)。 **OpenAI实时转录API** ：**OpenAI** 的新API支持**WebRTC** 连接，允许与**MediaStream** 或`<audio>`元素集成，展示此功能的演示可在[此处](https://news.miracleplus.com/share_link/65759)查看。 **CUDA线程管理** ：**CUDA** 开发者解释了GPU上最大并发线程数的计算方法，A100 GPU支持每个SM 2048个线程，总共96 * 2048个线程并发，更多细节在[论坛帖子](https://news.miracleplus.com/share_link/61526)。 **WebAssembly书籍** ：**Mariano Guerra** 撰写了一本关于**WebAssembly** 的书，提供了对其能力和应用的见解，书籍可在[wasmgroundup.com](https://wasmgroundup.com/)获取。 **OpenRouter模型路由选项** ：**OpenRouter** 提供**Auto Router** 以根据提示选择高质量模型，并提供**models参数** 作为备用模型，更多信息在[OpenRouter文档](https://openrouter.ai/docs/features/model-routing)。 **自动化支付和奖励** ：**Mozilla AI** 宣布自动化支付的推出，生产将于周三开始，Moz Finance每周五将收到赏金发票，简化财务交易。 **图像生成与向量数据库** ：**LlamaIndex** 提出从向量数据库数据生成图像的功能，以响应查询，如“提供图像中的股票分析”，表明对视觉数据表示能力的需求。 **多代理工作流与不同LLM** ：**LlamaIndex** 探索在多代理工作流中为每个代理集成不同的语言模型，建议利用多样化的模型能力来处理复杂任务。 **动态元数据过滤** ：**LlamaIndex** 强调实现动态元数据过滤的重要性，强调需要适应性的数据处理解决方案。 **PEFT实现文档** ：**OpenAccess AI Collective** 指出**Huggingface** 的**PEFT** 功能缺乏文档，计划更新文档或接受PR，`use_peft_lora`函数使用有限，见[GitHub](https://github.com/axolotl-ai-cloud/axolotl/blob/328d59811488cf30f7e2ecf92afdf380246ee05f/src/axolotl/utils/models.py#L1479-L1480)。 **CUDA并行与并发执行** ：**CUDA** 开发者区分了并行与并发执行，硬件限制决定最大并发线程数，实际执行受寄存器空间和共享内存等资源限制影响。 **模型训练与Triton内核** ：**CUDA MODE** 分享了在**GPUMODE** 内核数据集上训练0.5B参数模型的挑战，建议结合**SFT** 和**GRPO** 以改善结果。 **OpenAI的模式重置技术** ：**OpenAI** 介绍了一种重置模型响应格式的方法，涉及识别问题、分析更好的格式，并重新思考方法而不依赖于模板。 **OpenAI的提示工程与模型个性化** ：**OpenAI** 分享了通过提供特定指令来定制AI模型的见解，强调清晰沟通以使模型性能与个人偏好一致，示例见[Snapshot 1](https://chatgpt.com/share/67eb2cb0-b41c-8011-abee-88bfe2abc478)、[Snapshot 2](https://chatgpt.com/share/67eb2da4-6978-8011-89d0-fa3fbcece93d)、[Snapshot 3](https://chatgpt.com/share/67eb2e1d-3f04-8011-b00a-0d4c562c1abf)。 **CUDA内核执行与调度** ：**CUDA** 开发者强调启动的线程数高于并发运行的线程数，因排队和调度所致，建议使用32的倍数作为块大小以控制每个SM的warp数。 ## HuggingFace & Github: ### 人工智能与技术创新 - [Llama 3.2的PyTorch实现](https://news.miracleplus.com/share_link/65636)：由Hugging Face社区贡献者编写的**从零开始的、用于教育的PyTorch实现** ，**优化了可读性** ，旨在用于**学习和研究** 目的。包含了来自Meta的**官方模型权重的转换版本** ，只需**最少的代码依赖** ，让用户能够轻松尝试先进的语言模型。 - [OpenHands LM开放编码模型](https://news.miracleplus.com/share_link/65635)：基于**Qwen Coder 2.5 Instruct 32B** 构建，通过**专门的微调过程** ，利用开源代码库的OpenHands生成数据。该模型在**SWE-Bench Verified** 基准测试中取得了**37.2%的解决率** ，性能接近**参数量大20倍** 的模型，如Deepseek V3 0324。可从**Hugging Face** 下载并**本地运行** 。 - [FastMCP快速构建MCP服务器](https://news.miracleplus.com/share_link/65686)：提供了一种**快速、Pythonic** 的方式来构建**Model Context Protocol（MCP）服务器** 。通过**高层接口** ，**减少代码量** ，**加快开发速度** 。支持**图像结果** 和**自定义部署配置** ，正在积极开发中，核心功能已可用。 - [微软推出KBLaM](https://news.miracleplus.com/share_link/65685)：**知识库增强语言模型** 的官方实现，**无需单独的检索模块** ，通过训练适配器，将**知识库转换为特殊的知识标记** 供LLM使用。该方法与**知识库大小高效扩展** ，避免了上下文学习中的**计算开销** 。代码在**GitHub开源** ，支持**Hugging Face hub** 的流行模型。 ### 开源项目与工具 - [Shakker-Labs发布AWPortraitCN2模型](https://news.miracleplus.com/share_link/65650)：AWPortraitCoN的升级版，**探索更广泛的东方美学** ，包含**全年龄段的面部数据** ，在生成与**美食、建筑、环境、传统民族服饰** 相关的主题上表现出色。**无需触发词** ，由DynamicWang开发，基于**非商业许可** 发布。 - [kubernetes/ingress-nginx](https://news.miracleplus.com/share_link/65684)：为Kubernetes设计的**Ingress控制器** ，利用**NGINX进行反向代理和负载均衡** 。与各种**Kubernetes版本全面兼容** ，提供了**Helm图表** 以简化部署过程。包括**故障排除指南** ，并遵守**Kubernetes社区行为准则** 。 ## Reddit: **beNullMyFriend** [链接](https://news.miracleplus.com/share_link/65762): 这篇内容幽默地探讨了软件开发中提交代码的文化和实践。讨论重点包括： - **微提交（Micro-commits）** ：一些开发者更喜欢微提交，因为他们发现这样比处理复杂的合并更容易。这种做法与涉及数千个文件的大型单次提交形成对比。 - **提交信息实践** ：开发者通常使用非正式或幽默的提交信息，特别是在使用拉取请求和压缩合并策略时，这些策略将这些信息合并为一个单一的提交。 - **提交历史问题** ：糟糕的提交信息可能会使追踪回归变得复杂，尤其是在之前的开发者已经离开项目的情况下。 - **对传统提交的恐惧** ：有一种幽默的恐惧是针对那些不遵循传统提交实践的开发者，因为这可能导致混乱的代码历史。

评论