齐思头条2024/11/22「Whalebros项目复制o1-preview结果，DeepSeek-R1-Lite-Preview发布，FLUX.1工具增强图像控制，Gemini模型提升编码性能，Google DeepMind的Gemini与GPT-4o并列第一」 - 齐思

## Twitter: **Whalebros AI模型复制** ：Whalebros项目成功复制了o1-preview结果，使用逐步的ORMs/PRMs训练和奖励CoT通过RL，增强了其在数学和代码方面的能力。此发展将在即将发布的OSS版本和技术报告中详细介绍，详见[Twitter线程](https://news.miracleplus.com/share_link/48523)。 **DeepSeek-R1-Lite-Preview发布** ：DeepSeek-R1-Lite-Preview已发布，展示了在AIME和MATH基准测试上的o1-preview级别性能，提供实时透明的思维过程。该模型是开源的，API即将推出，可在[DeepSeek网站](https://news.miracleplus.com/share_link/48537)上试用，详见[推文](https://news.miracleplus.com/share_link/48524)。 **FLUX.1工具发布** ：FLUX.1工具的发布引入了一套模型，旨在为基础文本到图像模型FLUX.1增加控制和可操控性，允许修改和重新创建真实和生成的图像。更多细节可在[博客文章](https://t.co/J5Bc8fVGEc)中找到，详见[推文](https://news.miracleplus.com/share_link/48525)。 **Gemini模型增强** ：gemini-exp-1121模型已发布，展示了编码性能的显著提升、更强的推理能力和改进的视觉理解。此模型可在Google AI Studio和Gemini API上使用，详见[公告](https://news.miracleplus.com/share_link/48519)。 **Google DeepMind的Gemini LLM成就** ：Google DeepMind的Gemini（Exp 1121）在Chatbot Arena排名中与GPT-4o-1120并列第一，展示了在编码、视觉和创意写作等领域的改进。此发展突显了LLM竞赛的快速进展，更多细节可在[推文](https://news.miracleplus.com/share_link/48526)中找到。 **AI超越人类水平的特定领域** ：Emad (@EMostaque)指出，AI能力在某些领域已超越人类水平，预计明年将大规模部署，并伴随显著的芯片开发，详见[文章](https://news.miracleplus.com/share_link/48480)。 **AI能力和市场趋势** ：AI能力在特定领域已超越人类水平，预计明年将广泛部署，与显著的芯片生产相关，AI币被视为投资的关键领域，详见[Emad的推文](https://news.miracleplus.com/share_link/48480)。 **AI驱动的游戏开发课程** ：Andrew Ng和DeepLearning.AI推出了一门新课程，教授如何使用大型语言模型（LLMs）构建AI驱动的游戏，重点是从头开始创建互动游戏，详见[公告](https://news.miracleplus.com/share_link/48404)。 **OpenAI的GPT-4o模型性能问题** ：OpenAI的GPT-4o十一月发布版本的性能指标较八月版本有所下降，人工分析质量指数从77降至71，GPQA Diamond从51%降至39%，详见[来源](https://news.miracleplus.com/share_link/48527)。 **Neuralink在加拿大的临床试验** ：Neuralink已获得加拿大卫生部的批准，在加拿大进行首次临床试验，重点关注ALS或SCI患者，详见[更新](https://news.miracleplus.com/share_link/48402)。 **AI内容创作趋势** ：少数人正在在线发布文本，专门供大型语言模型（LLMs）消费，这一趋势激励作者帮助LLM提供商提升用户服务，详见[Andrew Ng的推文](https://news.miracleplus.com/share_link/48490)。 **Hugging Face Hub的内容定义块** ：Hugging Face通过将文件转换为内容定义块来优化工作流程，允许去重和高效更新，详见[AnnInTweetD的推文](https://news.miracleplus.com/share_link/48528)。 **Anthropic AI的新研究** ：Anthropic AI引入了一种新方法，通过添加误差条来评估AI模型，将统计和不确定性纳入评估过程，详见[博客文章](https://news.miracleplus.com/share_link/48538)。 **Diffusers原生量化支持** ：Diffusers库现已支持原生量化，起始于bitsandbytes，预计将增强推理和训练过程，详见[推文](https://news.miracleplus.com/share_link/48529)。 **AI生成的时代广场广告** ：一个完全由AI生成的广告在时代广场展示，标志着AI视频制作的重大里程碑，此项目由@eToro营销团队合作创建，详见[推文](https://news.miracleplus.com/share_link/48530)。 **AI代理写书** ：一个由10个AI代理组成的团队正在自主写书，每个代理负责不同方面，如叙事设置和情节一致性，此创新项目可通过实时GitHub提交进行跟踪，详见[推文](https://news.miracleplus.com/share_link/48531)。 **AI与量子计算的交集** ：AlphaQubit利用Transformers提高量子纠错精度，代表了AI与量子计算交叉领域的突破，详见[推文](https://news.miracleplus.com/share_link/48532)。 **Google Docs与AI平台集成** ：Anthropic和Claude AI引入了Google Docs集成，允许用户将Google Docs中的内容无缝添加到他们的聊天和项目中，此功能现已对Claude Pro、Teams和Enterprise用户开放，详见[推文](https://news.miracleplus.com/share_link/48533)和[Anthropic的推文](https://news.miracleplus.com/share_link/48534)。 **Elon Musk的Twitter使用和AI集成** ：Elon Musk在Twitter上的活跃参与，现已成为他工作的一部分，突显了该平台的使用和与AI技术的集成，详见[推文](https://news.miracleplus.com/share_link/48535)。 **AI驱动的动画反应** ：Yohei Nakajima讨论了由AI驱动的即时动画反应的开发，旨在增强用户互动和参与，详见[推文](https://news.miracleplus.com/share_link/48536)。 ## HackerNews: **减肥药被发现可缩小小鼠和人类细胞的心肌** [链接](https://news.miracleplus.com/share_link/48422): 阿尔伯塔大学的一项研究表明，像Ozempic这样的药物可能会减少心肌质量，可能带来长期健康风险。讨论重点： - **肌肉流失的担忧：** 研究表明，这些药物导致的肌肉下降速度显著高于减少卡路里饮食或正常衰老，这可能导致长期健康问题。 - **锻炼和蛋白质摄入：** 研究表明，在减肥过程中进行锻炼和摄入足够的蛋白质有助于保持肌肉质量，这对长寿和生活质量至关重要。 - **快速与渐进减肥：** 即使总减肥量相同，快速减肥（即使是通过传统的卡路里赤字）也会导致比渐进减肥更大的肌肉质量损失。 - **GLP1治疗的争论：** 对于GLP1治疗对长寿和生活质量有害的说法存在怀疑，一些人认为大量减脂可以带来更长和更好的生活质量。 - **研究方法的批评：** 研究方法受到质疑，因为它没有比较对照组和治疗组之间等量或等速的减肥，这可能影响得出的结论。 **Z-Library帮助学生克服学术贫困，研究发现** [链接](https://news.miracleplus.com/share_link/48424): 一项研究强调了Z-Library在为面临经济困难的学生提供学术资源方面的作用。讨论重点： - **盗版作为预览工具：** 许多用户下载盗版书籍以预览它们，并在发现有价值时决定购买实体书，类似于“演示”版本。 - **盗版与销售损失：** 所有盗版副本等同于销售损失的观点受到挑战；许多人认为盗版通常涉及那些不会购买内容的人。 - **盗版在学习中的作用：** 盗版历史上允许个人访问软件和教育资源，导致技能发展和最终在专业环境中的合法购买。 - **开源与盗版：** 开源工具的可用性减少了对盗版软件的依赖，但盗版仍在提供无法负担的资源方面发挥作用。 ## Discord: **OpenAI的AI意识训练策略** ：OpenAI的模型如**ChatGPT** 被训练以否认意识，类似于过度训练狗不坐沙发，确保模型在感知问题上提供一致回答，反映了训练和政策的刻意设计。 **Niantic的地理空间模型开发** ：Niantic利用玩家数据创建**大型地理空间模型** 用于增强现实应用中的3D地图，涉及用户数据隐私问题。[详细信息](https://www.perplexity.ai/page/the-last-universal-common-ance-F_o_WexZSEmFZFKgVykYzQ)。 **NVIDIA的Omniverse在CAD/CAE中的应用** ：NVIDIA的Omniverse被认为是**CAD/CAE** 应用的变革性框架，推动未来技术进步。[更多信息](https://www.perplexity.ai/page/nvidia-s-omniverse-blueprint-O4FHCvNrQwCUGt.Bk5QEDA)。 **未来的AI驱动创业公司** ：Sam Altman设想未来创业公司由单人使用**10,000 GPUs** 运营，标志着向AI驱动商业模式的转变。[阅读更多](https://www.perplexity.ai/page/the-one-person-startup-era-QB.3fQwAQKuTR7bDQuCfEg)。 **Controlnet-Tile与去模糊技术的比较** ：**Controlnet-Tile** 优先考虑全局语义而非局部语义，优于去模糊技术，两者可同时执行以增强效果。 **SageAttention量化方法** ：SageAttention是一种高效的**INT8量化方法** ，在速度上优于FlashAttention2和xformers，同时保持准确性。[详细信息](https://news.miracleplus.com/share_link/44502)。 **vLLM推理框架** ：vLLM被认为是目前可用的**大型语言模型** 的最佳推理框架。 **AVX2与AVX512性能比较** ：在**Sapphire Rapids** 上，**AVX512** 性能较慢，建议使用`--mcpu haswell`排除AVX512。 **AMD Zen 5 LLVM支持** ：关于**AMD Zen 5 "znver5"** 在**LLVM/Clang** 中的初步支持，调优仍针对Zen 4处理器。[Phoronix文章](https://www.phoronix.com/news/LLVM-Clang-Znver5-Merged)。 **RISC-V在标准库中的考虑** ：随着[RISC-V笔记本](https://www.youtube.com/watch?v=l6khGznGeyY)的出现，可能需要将RISC-V集成到标准库中。 **Cohere的多模态嵌入用例** ：使用**Cohere的多模态嵌入** 选择研究主题相关图像，受限于每分钟40次请求的速率限制。[更多细节](https://medium.com/@aldendorosario/visual-search-engines-using-multi-modal-embeddings-to-look-at-the-image-3ccae8637031)。 **Cohere工具包** ：提供创建和部署**RAG应用** 的预构建组件，支持本地使用Docker或云端使用GitHub Codespaces。[Cohere Toolkit仓库](https://news.miracleplus.com/share_link/25283)。 **FP16 GEMM在MI250 GPU上的转换** ：分析**FP16 GEMM (v3)** 在**MI250 GPU** 上的转换描述，存在输入形状的困惑。 **OpenAI的tiktoken性能问题** ：OpenAI的**tiktoken** Python库在输入长度上表现出**超线性性能** ，可能导致大输入的拒绝服务风险。[Tom MacWright的警告](https://simonwillison.net/2024/Nov/21/a-warning-about-tiktoken/)。 **Refact.ai AI编码助手** ：作为全面的AI工具，提供代码完成、重构和聊天功能。[GitHub](https://github.com/smallcloudai/)。 **Tlu 3模型开发** ：发布**Tlu 3** ，声称在特定任务上超越**Llama 3.1** 。[更多细节](https://x.com/natolambert/status/1859643351441535345)。 **LinkedIn上的语义搜索** ：ExaAILabs推出的新功能，允许对数百万个LinkedIn个人资料进行智能搜索。[更多信息](https://x.com/ExaAILabs/status/1859306370010579010)。 **大型语言模型解释视频** ：为计算机历史博物馆制作的轻量级解释视频，详细介绍**大型语言模型** 及其训练过程。[YouTube](https://youtu.be/LPZh9BOjkQs?si=Jyqqr-NGyt3dXwlz)。 **软提示与LoRAs和微调的比较** ：软提示在通用性和编码上存在局限性，相较于LoRAs和完整SFT不太受欢迎，但在系统提示压缩和优化未优化参数时可能有用。 **KV缓存上下文修剪** ：完成KV缓存上下文修剪的实现，但在矩阵洗牌过程中发现效率低下，建议通过C编程或优化的Python技术改进。 ## HuggingFace & Github: ### 视觉语言模型与3D建模 - **[Llama-3.2V-11B-cot](https://news.miracleplus.com/share_link/48430)** 是一个能够进行自发、系统性推理的视觉语言模型。作为 **LLaVA-o1** 的第一个版本，该模型基于 **Meta-llama/Llama-3.2-11B-Vision-Instruct** 微调，展示了在复杂任务中的出色表现。然而，用户需注意模型可能存在偏见及生成冒犯性内容的风险。 - **[LLaMA-Mesh](https://news.miracleplus.com/share_link/48444)** 结合大型语言模型的能力与3D网格生成，实现从文本提示中生成3D网格，模糊了文本与空间理解的界限。该模型使用 **Objaverse** 网格数据进行微调，并保持高质量输出，同时支持文本生成。 ### 语音识别 - **[CrisperWhisper](https://news.miracleplus.com/share_link/48485)** 是 **OpenAI's Whisper** 的高级变体，专为快速、精确且逐字逐句的语音识别而设计。它能够检测并转录填充词，并在 **OpenASR** 排行榜上获得第一名。其精确的单词级时间戳功能在法律、医学和语言学应用中尤为重要。 ### 图像处理与合成 - **[FLUX.1 Redux [dev]](https://news.miracleplus.com/share_link/48508)** 是用于图像变化生成的适配器，允许生成输入图像的变体。通过 **API** ，用户可以根据文本提示对图像进行重塑。然而，该模型可能放大社会偏见，因此使用需谨慎。 - **[FLUX.1 Fill [dev]](https://news.miracleplus.com/share_link/48509)** 是一个120亿参数的修正流变压器，能够填充现有图像区域。训练使用指导蒸馏进行，生成质量仅次于最先进模型 **FLUX.1 Fill [pro]** 。该模型不适用于提供事实信息，需遵守非商业许可证使用。 ### 数据库技术 - **[libSQL](https://news.miracleplus.com/share_link/48474)** 是 **SQLite** 的分支，旨在适应更多用例，提供嵌入式副本和远程访问功能。它支持多种编程语言，并与SQLite兼容，突出其开源和社区贡献的开放态度。 ### 用户友好型AI客户端 - **[Chatbox](https://news.miracleplus.com/share_link/48475)** 是一个开源的桌面客户端应用程序，支持多种大型语言模型（LLMs），如GPT、Claude等。其特点包括本地数据存储、Dall-E-3图像生成和高级提示功能，适用于开发者和普通用户的日常交互。它在跨平台上可用，并支持多种支付与联系方式。 ## Reddit: **为什么除了使用限制之外，你还愿意为 ChatGPT Plus 支付 20 美元？** [链接](https://news.miracleplus.com/share_link/48499): 讨论探讨了 ChatGPT Plus 订阅除了增加使用限制之外的价值。 - **节省时间和提高效率：** 用户发现订阅非常有价值，因为它节省了大量工作时间，特别是在编程和专业任务中，减少了阅读大量文档或在线搜索解决方案的需要。 - **自定义 GPT 和高级功能：** 订阅者欣赏能够使用自定义 GPT 和高级功能，如语音功能，这提高了他们的工作流程和生产力。 - **更高的使用上限和提前访问：** 对于重度用户来说，更高的使用上限至关重要，而提前访问新模型和功能是一个显著的优势。 - **经济上的合理性：** 许多用户通过节省的时间和精力来证明费用的合理性，这转化为经济利益，使订阅成为值得的投资。 - **可靠性和速度：** Plus 用户在高流量时段体验到更可靠和更快速的服务，这对于依赖 ChatGPT 进行专业工作的人来说至关重要。

评论