三十六的人工智能周刊(第 1 期):别把 AI 信息当权威

三十六的人工智能周刊,本系列每周末更新,记录这周我看到的有价值的信息,主要人工智能 AI 领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。( hello@sanshiliu.com )

自言自语

最近,一条「有顶流明星在澳门输了 10 亿」的传闻火了,个中细节写得绘声绘色,最终由公安网安部门查明,此事是有人用了 AI 造谣。大家在使用 AI 的时候一定要明辨是非。

新闻看点

李彦宏:2025 年或成 AI 智能体爆发元年

百度创始人、董事长兼首席执行官李彦宏在人民网发表《紧抓 AI 智能体爆发元年机遇 推动新质生产力加快发展》署名文章。李彦宏表示,2025 年可能会成为 AI 智能体爆发的元年。推理大模型涌现出让人惊叹的深度思考能力,这将推动人工智能的一个重要应用方向,即“AI 智能体”的落地。同时,面对空前激烈的全球人工智能领域竞争,必须在人工智能芯片、数据中心、云基础设施上更大胆地投入,打造更好、更智能的下一代模型。

Manus 创始人透露:产品基于阿里千问大模型开发

3 月 10 日消息,Manus 创始人季逸超在社交平台透露,Manus 产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。Manus 是由创业公司 Monica 发布的首款 AI Agent 产品,最近在社交媒体火爆出圈。

OpenAI 发布最新研究成果,CoT 监控可阻止大模型恶意行为

3 月 11 日消息,OpenA I发布了最新研究,用 CoT(思维链)监控的方式,可以阻止大模型胡说八道、隐藏真实意图等恶意行为,同时也是监督超级模型的有效工具之一。据悉,OpenAI 使用了最新发布的前沿模型 o3-mini 作为被监控对象,并以较弱的 GPT-4o 模型作为监控器。测试环境为编码任务,要求AI在代码库中实现功能以通过单元测试。结果显示,CoT 监控器在检测系统性“奖励黑客”行为时表现卓越,召回率高达 95%,远超仅监控行为的 60%。

DeepSeek 官方辟谣:R2 发布为假消息

3 月 11 日,针对 DeepSeek 将在 3 月 17 日发布下一代 R2 模型的传闻,DeepSeek 官方企业咨询账号在用户群中回应称,“辟谣:R2 发布为假消息”。

百度上线 AI 陪伴产品“月匣”App

3 月 11 日消息,百度近期低调推出情感陪伴类 App“月匣”,主打高自由度 AI 对话与沉浸式剧本互动两大核心功能。这款产品通过构建虚拟角色生态,试图在泛娱乐社交领域开辟新赛道。与以往百度推出的 AI 社交产品不同的是,百度的这款全新 AI 社交产品,不仅搭载自研的文心一言大模型,还整合了 DeepSeek、豆包、MiniMax abab 三大外部的大模型,构建起“四核驱动”的 AI 社交引擎。

谷歌开源 Gemma-3:媲美 DeepSeek,算力暴降

3 月 12 日晚,谷歌首席执行官 Sundar Pichai 宣布,开源最新多模态大模型 Gemma-3,主打低成本高性能。Gemma-3 共有 10 亿、40 亿、120 亿和 270 亿四种参数。但即便最大的 270 亿参数,只需要一张 H100 就能高效推理,同类模型要达到这个效果最少要提升 10 倍算力,也是目前最强小参数模型。根据盲测 LMSYS ChatbotArena 数据显示,Gemma-3 仅次于 DeepSeek 的 R1-671B,高于 OpenAI 的 o3-mini,Llama3-405B 等知名模型。

阿里开源全模态模型 R1-Omni,情感识别能力更优

3 月 11 日,阿里通义实验室开源 R1-Omni 模型——业界首个将具有可验证奖励的强化学习(RLVR)应用于全能多模态大语言模型。研究人员利用 RLVR 对开源 Omni 模型 HumanOmni-0.5B 进行优化,在推理能力、情感识别准确性和泛化能力三个关键方面显著提高了其性能。R1-Omni 能够更清楚地理解视觉和听觉信息如何促进情绪识别,能够明确展示哪些模态信息对特定情绪的判断起到了关键作用。

阿里正式推出 AI 旗舰应用,新夸克发布“AI 超级框”

3 月 13 日,阿里巴巴宣布推出 AI 旗舰应用——新夸克。新夸克基于阿里通义的推理及多模态大模型,全面升级为一个无边界的“AI 超级框”。阿里巴巴表示,未来通义系列模型的最新成果都将第一时间接入夸克。新夸克将告别传统搜索,升级为一个 All in One 的“AI 超级框”,满足用户工作、学习、生活的各类 AI 需求。目前市场主流的AI产品形态是 Chatbot(聊天机器人),夸克则希望更进一步,将 AI 对话、深度思考、深度搜索、深度研究、深度执行整合到一起,以一个极简的“AI 超级框”,满足用户所有需求。

北京市新增 34 款已完成登记的生成式人工智能服务

截至 3 月 14 日,北京市新增34款已完成登记的生成式人工智能服务,其中,小米 AI 搜索、小米 AI 写作等产品在列。北京累计已完成 46 款生成式人工智能服务登记。


订阅我们

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注