01-09-日报-AI资讯日报

AI资讯日报 2026/1/9

AI资讯 | 每日早读 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️ | 进群交流🤙

今日摘要

傅利叶GR-3亮相CES具备55自由度主打陪伴
小鹏二代VLA量产实现视觉驱动初阶L4能力
OpenAI推健康版连接Apple Health解读血检
MiniMax港股募资42亿国产大模型进入变现期
蚂蚁阿福月活破3000万打通咨询问诊全链路

产品与功能更新

  1. 傅利叶GR-3首秀CES。 CES2026上傅利叶带着🔥 人形机器人GR-3(AI资讯) 亮相,现场设置了互动区让观众零距离体验(✧∀✧)。GR-3能下棋聊天还会💡识别表情,55个全身自由度让它动作超灵活。这款机器人主打有温度的陪伴,用莫兰迪配色消解机械感。傅利叶还展出了桌面级玩偶机器人概念原型。

  2. 小鹏第二代VLA大模型上车。 何小鹏宣布🚀物理AI成为2026核心关键词, 第二代VLA模型(AI资讯) 一季度量产推送。这模型能从视觉直接驱动动作,号称初阶L4能力(厉害了)。2026款P7+和G7都搭载这技术,Robotaxi运营也要正式启动💡。小鹏还要量产人形机器人和飞行汽车。

  3. OpenAI推ChatGPT Health。 OpenAI正式发布 ChatGPT健康版(AI资讯) ,能连接Apple Health和电子病历🏥。上传血检报告它帮你用大白话解释指标,还能生成就诊提问清单(✧∀✧)。健康数据独立加密存储,不用于模型训练。目前仅向小范围用户💡开放测试。
    AI资讯:ChatGPT Health连接健康应用界面展示

  4. 谷歌课堂上线Gemini播客工具。 教师输入课程主题就能🎙️自动生成 播客风格音频课(AI资讯) ,专门为Z世代设计。支持主持人+嘉宾对话式呈现,还能加背景音乐💡。一位老师反馈学生完听率达92%(比读PDF高一倍)。多语言支持一键生成,碎片化学习神器(✧∀✧)。

  5. 腾讯开源HY-Motion1.0。 腾讯混元发布🔥 文生3D动作大模型(AI资讯)十亿参数基于DiT架构。能生成200多种动作类别,从日常走路到💪体育竞技都覆盖。输出直接接入Unreal和Unity,开箱即用(✧∀✧)。项目已在 HuggingFace(AI资讯) 开源。
    AI资讯:HY-Motion生成的3D角色动画效果展示


前沿研究

  1. V-Agent多模态视频搜索。 新论文提出🔍 V-Agent视频搜索系统(AI资讯) ,微调VLM就能同时理解画面和语音。三个Agent协作💡处理用户意图,在MultiVENT2.0测试集达到SOTA零样本性能。视频帧和语音转文字被嵌入同一空间(✧∀✧),模型已开源。

  2. PhysVideoGenerator物理感知视频生成。 这篇论文让视频生成模型🎬 学会物理规律(AI资讯) ,解决物体碰撞不自然的问题。用V-JEPA2提取物理特征注入生成过程💡,重力和时序一致性都变好了。目前是概念验证阶段,训练稳定性已验证(✧∀✧)。

  3. ThinkRL-Edit推理式图像编辑。 新框架让图像编辑模型🧠 先思考再动手(AI资讯) ,用思维链采样探索多种方案。传统方法只在去噪时随机,这个在语义层面就开始探索💡。用二元检查表替代模糊评分,效果显著超越之前工作(✧∀✧)。


行业展望与社会影响

  1. MiniMax港股暗盘涨15%。 继智谱AI后又一家🔥大模型公司上市, MiniMax(AI资讯) 募资41.89亿港元。暗盘最高199.8港元,市值逼近600亿💰。资金主要投入下一代多模态模型和自研芯片,国产大模型进入价值兑现阶段(✧∀✧)。盈利压力和国际竞争是未来挑战。

  2. 蚂蚁阿福月活飙至3000万。 一个月从1500万涨到🚀 3000万用户(AI资讯) ,OpenAI紧急跟进推ChatGPT Health。蚂蚁阿福打通了咨询-问诊-就医全链路💡,接入5000家医院和十大品牌设备。ChatGPT Health目前还停留在信息辅助阶段(;′⌒`)。中美AI健康路径分化明显。

  3. 谷歌急聘AI质检员。 谷歌正面临🔥 搜索质量信任危机(AI资讯) ,AI概述频繁出现幻觉。同一问题两次问出400万到7000万不等的错误答案(;′⌒`)。更严重的是医疗建议给出致命指导💡,招聘信息首次间接承认功能缺陷。

  4. 恶意Chrome扩展窃取AI对话。 两款伪装成AI工具的💀 恶意扩展(AI资讯) 下载量超90万次。专门针对ChatGPT和DeepSeek窃取聊天记录,其中一款还获得谷歌精选徽章(;′⌒`)。定期把浏览URL和敏感词发送到远程服务器,已被下架💡。
    AI资讯:恶意Chrome扩展伪装界面截图


开源TOP项目

  1. claude-mem自动会话记忆。 这个 Claude Code插件(AI资讯) ⭐12.3k,能自动捕获编程会话中所有操作🔥。用AI压缩后注入未来会话,上下文不再断片(✧∀✧)。基于Claude的agent-sdk开发💡,对长期项目特别友好。

  2. ComfyUI-LTXVideo视频生成。 Lightricks官方出的🎬 ComfyUI视频支持(AI资讯) ⭐2.5k,LTX-Video模型接入变得超简单。工作流拖拽就能用💡,生成质量不错(✧∀✧)。

  3. memU记忆基础设施。 面向LLM和🤖Agent的 记忆系统(AI资讯) ⭐3.6k,解决长期记忆管理问题。NevaMind团队开发💡,让AI真正记住你说过啥(✧∀✧)。

  4. VideoRAG视频对话。 港大出品的📹 视频检索增强生成(AI资讯) ⭐1.9k,KDD2026论文配套代码。能跟视频内容直接对话💡,理解画面还能回答问题(✧∀✧)。

  5. MiroThinker搜索智能体。 号称🔍 全球最强搜索Agent(AI资讯) ,30B模型跑出1T级性能。支持256K上下文和400次工具调用💡,在BrowseComp测试全球第一梯队(✧∀✧)。像科学家一样主动查证自我修正, 在线体验(AI资讯) 已开放。
    AI资讯:MiroThinker搜索智能体架构图


社媒分享

  1. MOSS语音识别能标说话人。 @Gorden_Sun分享🎤复旦团队的 MOSS Transcribe Diarize(AI资讯) ,不仅识别语音还能区分不同说话人💡。支持多语言最长90分钟音频,国内用不了Gemini的替代方案(✧∀✧)。 Demo已开放(AI资讯)

  2. Gemini CLI支持Agent Skills。 @Jimmy_JingLv说继Codex之后🎉 Gemini CLI也支持技能插件(AI资讯) 了,v0.23.0更新💡。http://AgentSkills.me今年全力押注agents(✧∀✧)。

  3. Claude Code画Canvas超好用。 @vista8分享用🎨Obsidian CEO写的 Canvas技能(AI资讯) ,让Claude搜索清朝皇帝然后画可视化图谱💡。画组织结构图产品架构图都行(✧∀✧)。
    AI资讯:Claude Code生成的清朝皇帝Canvas图谱

  4. 智谱上市z.ai出海经验。 @op7418转发🔔智谱敲钟日 子玄的出海总结(AI资讯) ,介绍z.ai如何在海外快速提升影响力💡。做出海没头绪的可以参考(✧∀✧)。

  5. Planning with Files复现Manus。 @shao__meng推荐📁用Markdown当AI外挂大脑的 Claude技能(AI资讯) ,解决记忆波动和目标漂移问题💡。三个文件管理任务清单研究笔记和最终产出(✧∀✧)。
    AI资讯:Planning with Files工作流程示意图

  6. 黄仁勋自嘲中美同时吊打。 @dotey转发🤣黄仁勋幽默发言: 我们是历史上第一家被中美同时吊打的公司(AI资讯) 💡。

  7. AI决定谁升职引争议。 Reddit热帖讨论🤔 AI自动决定升职加薪(AI资讯) ,调查显示60%经理已在用AI做这事💡。打字速度和邮件都被监控(;′⌒`)。


AI资讯日报语音版

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
Last updated on