三十六的人工智能周刊,本系列每周末更新,记录这周我看到的有价值的信息,主要人工智能 AI 领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。( hello@sanshiliu.com )
本周新闻
苹果 AI 国行版或随 iOS 18.6 上线
5 月 6 日消息,据知名科技记者马克·古尔曼透露,苹果 AI 有望在 iOS 18.6系 统中首次在中国大陆启用部分功能,背后由阿里和百度提供技术支持。具体来看,百度的文心一言大模型将作为国行版苹果AI的核心云端智能引擎。与此同时,为确保 AI 内容符合国内法规,苹果还将引入由阿里提供的审查机制,对 AI 生成内容进行本地合规审核。
AI 自我复制能力曝光
英国 AISI 研究机构发布 RepliBench 基准测试,揭示 AI 系统已具备部分自主复制能力。该测试将 AI 复制分解为获取权重、资源复制、资源获取和持久性四大核心能力,评估显示当前 AI 虽无法完全自主复制,但在获取资源等子任务上表现突出。研究表明,随着 AI 能力快速进化,突破技术瓶颈后可能实现完全复制,凸显 AI 安全监管的紧迫性。该成果为预警 AI 失控风险提供了重要评估工具。
马斯克呼吁用人工智能取代美国政府的低效职位
国科技亿万富翁埃隆·马斯克最近在米尔肯研究所全球会议上提出,人工智能可以取代一些政府工作人员,以提高美国政府的效率。据参加米尔肯研究所全球会议闭门会议的人士透露,马斯克批评美国政府效率低下,并表示应该用人工智能来取代目前由一些公共工作人员完成的职能。
谷歌发布 Gemini 2.5 Pro “I/O” 模型
当地时间 5 月 6 日,谷歌 DeepMind 人工智能研究团队发布了 Gemini 2.5 Pro “I/O” ,这是今年 3 月发布的多模态大语言模型 Gemini 2.5 Pro 的升级版本。在 AI 排行榜 LMArena 上,该模型在多个指标上登顶。目前该模型已向 Google AI Studio 的独立开发者、Vertex AI 云平台的企业用户以及 Gemini 应用的普通用户开放。
腾讯混元视频生成工具全新开源
腾讯混元宣布,5 月 9 日正式推出并开源全新的多模态定制化视频生成工具 Hunyuan Custom。该模型基于混元视频生成大模型(Hunyuan Video)打造,主体一致性效果超过现有的开源方案。Hunyuan Custom 融合了文本、图像、音频、视频等多模态输入生视频的能力,是一款具备高度控制力和生成质量的智能视频创作工具。
DeepSeek 公开致谢腾讯
DeepSeek 近日公开感谢腾讯技术团队对其开源通信框架 DeepEP 的优化,称这一贡献为“huge speedup”。此次优化专注于提升多种网络环境下的通信性能,测试结果显示,优化后的 DeepEP 在 RoCE 网络环境下性能提升高达 100%,在 InfiniBand 网络环境下提升约 30%。
字节跳动开源一款 Deep Research 项目
5 月 10 日,字节跳动技术团队宣布,基于 LangStack 的全新 Deep Research 开源项目——DeerFlow,正式在 ByteDance 的 GitHub 官方组织上开源。在演示视频中,该团队演示了包括深度研究、MCP 集成、报告 AI 增强编辑以及播客生成等功能。
发表回复