12-11-日报-AI资讯日报
AI资讯日报 2025/12/11
AI资讯|每日早读|全网数据聚合|前沿科学探索|行业自由发声|开源创新力量|AI与人类未来| 访问网页版↗️ | 进群交流🤙
今日摘要
OpenAI泄露Olive Oil Cake等新模型代号疑为GPT-5.2真身12月11日或发布
微软Excel网页版启用AI智能体模式支持自然语言建模明年1月扩展桌面端
马斯克xAI推出Halftime工具可在电影中实时植入品牌广告引发版权争议
Qwen-Image-i2L仅需单张图片即可生成风格化LoRA文件四种版本开源
AutoGLM全面开源9B模型支持50+中文App操作定义AI手机安卓时刻产品与功能更新
OpenAI紧急端出「下午茶」,新模型泄露。 Notion平台意外曝光🍰神秘内部代号 Olive Oil Cake(AI资讯) ,疑为GPT-5.2真身。同时, Chestnut和Hazelnut(AI资讯) 两款下一代图像模型也浮出水面(✧∀✧),告别黄调滤镜,细节暴增。市场押注12月11日发布,旨在阻击🔥谷歌Gemini 3。
微软Excel网页版启用智能体模式。 Microsoft365商业用户现可体验🤖 AI智能体模式(来源:AI资讯日报) 。该模式支持自然语言指令,自主完成假设分析、预算建模。金融建模场景下,AI推理逻辑全程透明(✧∀✧)。明年1月将扩展至桌面端,个人版用户同步开放权限。
马斯克xAI推出Halftime工具,电影植入广告。 xAI新工具可在《律政英雄》等剧情中 实时植入品牌广告(AI资讯) ,角色突然举起🥤可口可乐。观众可通过"了解更多"按钮跳转产品页,查看完毕后广告消失🚀。该技术由滑铁卢大学学生开发,版权问题尚未明确,引发业界争议。
豆包手机助手技术揭秘,00后工程师深度测试。 大模型实习生在小红书发布 千字实测(AI资讯) ,拆解豆包的混合感知路由与OS级虚拟化。标准模式响应低于500ms⚡,Pro模式具备自我反思能力。测试证实,系统通过任务层级隔离(✧∀✧)物理保障隐私安全,未读取物理屏幕流。

前沿研究
Qwen-Image-i2L:单张图片即可生成LoRA模型。 DiffSynth-Studio团队发布 Qwen-Image-i2L(AI资讯) ,仅需一张图片🎨即可自动生成风格化LoRA文件。模型提供四种版本:Precise定位精准、Stylish强调画风、Realism还原真实、Balanced通用型。开源协议MIT+Apache-2.0,支持离线运行⚡,可直接集成至Stable Diffusion等模型。

具身思维树架构:融合物理仿真与VLM推理。 论文 Embodied Tree of Thoughts(AI资讯) 提出EToT框架,将操作规划建模为树搜索⚡。系统通过先验分支生成候选路径,反思分支利用VLM诊断失败并修正。物理仿真器充当具身世界模型🚀,确保计划符合刚体动力学与碰撞约束(✧∀✧)。长期任务中显著优于基线方法。
强化学习探究技能习得中的反馈角色。 研究 使用强化学习探索反馈机制(AI资讯) ,通过RL智能体控制水槽中旋转圆柱体的阻力🌊。实验发现:高维流场反馈可快速发现高性能策略⚡,但重放动作序列时无需反馈仍保持性能。无反馈训练在阻力最大化任务中失败,但阻力最小化仍成功(✧∀✧),揭示学习条件的复杂性。
单张图片生成完整3D场景,自我进化框架。 论文 EvoScene(AI资讯) 提出免训练框架,通过三阶段迭代重建🎨3D场景。系统结合3D生成模型的几何推理与视频生成模型的视觉知识,逐步改进结构与外观🚀。实验显示,EvoScene在几何稳定性、视图一致纹理方面优于基线,生成即用3D网格(✧∀✧)。
空中视觉语言导航统一框架,仅需单目RGB。 论文 Aerial VLN(AI资讯) 提出无人机导航框架,仅依赖自我中心单目RGB🚁与自然语言指令。模型通过提示引导多任务学习⚡,联合优化空间感知、轨迹推理与动作预测。关键帧选择策略减少视觉冗余,动作合并机制缓解长尾监督不平衡(✧∀✧)。基准测试中显著优于RGB-only基线。
行业展望与社会影响
欧盟正式调查谷歌AI摘要内容使用权。 欧盟委员会启动调查🔍,审查 谷歌AI概览功能(AI资讯) 是否未经许可使用网站内容。调查聚焦YouTube视频生成答案及网络出版商内容补偿问题⚡。欧盟指控谷歌凭借流量控制权施加不公平条款,限制竞争对手训练AI模型(✧∀✧)。谷歌回应称此举或扼杀创新。
春晚赞助战:宇树与智元竞价过亿。 2026年马年春晚成为🤖 具身智能公司竞逐高地(AI资讯) 。知情人士透露,智元机器人报价6000万元,宇树科技直接提至1亿元🔥。智元回应"不是真的",但业内人士称多家公司仍在争抢⚡。最终赞助商需综合考量品牌形象与发展因素(✧∀✧),竞争态势尤为激烈。
Beyond Vibe Coding指南:纠正AI辅助开发误区。 Google工程负责人Addy Osmani发布 新书(AI资讯) ,批判"Vibe Coding"🚀只完成70%工作,剩余30%需工程底蕴。核心方法论包括:先规划后编码、上下文工程替代提示词工程⚡、CLI智能体与多智能体编排。未来开发者需从编码者转型为决策人(✧∀✧),专注精准描述意图。

小米招聘AI教育岗位,进军K12市场。 小米集团发布多个 AI教育岗位(AI资讯) ,包括产品经理(26K-50K)与商务经理。岗位聚焦"人车家"生态,为手机、平板等终端提供🎓个性化学习体验。今年7月REDMI Pad2已预装教育中心,内置15万门同步课程与AI作业辅导功能🚀。

开源TOP项目
AutoGLM全面开源,AI原生手机标杆。 智谱 AutoGLM项目(AI资讯) 正式开源⭐4.9k🚀,包含Phone Agent框架与9B模型。系统采用ADB控制、VLM视觉理解、智能规划三大技术⚡,支持50+中文App操作。MIT协议开源,可离线运行,无隐私泄露风险(✧∀✧)。业界认为定义了AI手机"安卓时刻"。

AGENTS.md格式:编码智能体统一标准。 开源项目 AGENTS.md(AI资讯) ⭐9.3k发布,提供简单开放格式🚀指导AI编码智能体。该标准旨在统一智能体行为描述,降低开发门槛⚡。支持多种编程语言,社区贡献活跃(✧∀✧)。项目已集成至主流AI开发工具链。
Google ADK示例智能体集合,开发模板库。 Google发布 ADK-samples项目(AI资讯) ⭐7.2k🚀,包含多种智能体构建示例。涵盖任务规划、工具调用、多智能体协作等场景⚡。开发者可直接复用模板,加速AI应用落地(✧∀✧)。项目持续更新,支持最新ADK特性。
微软ML-For-Beginners:经典机器学习课程。 微软开源 ML-For-Beginners(AI资讯) ⭐81.1k项目🚀,提供12周26课52测验系统化学习路径。课程覆盖监督学习、无监督学习、强化学习等经典算法⚡。支持多语言文档,适合零基础入门(✧∀✧)。社区活跃,全球学习者广泛使用。
社媒分享
Reddit热议:麦当劳AI广告翻车启示录。 荷兰麦当劳推出全AI制作圣诞广告🎄,主题为"最糟糕的圣诞季",遭大规模抵制后下架。 来源:(AI资讯) 显示,代理商TBWA承认失败🔥。网友引用《星球大战》台词讽刺:“会说话≠聪明”⚡。事件印证技术只是放大人类天才或愚蠢的工具(✧∀✧)。

Reddit讨论:AI朋友为何总显得生硬。 用户在 Reddit(AI资讯) 分享开发经验🚀,认为多数AI伴侣要么过于情绪化要么太临床。作者尝试构建"不修复你"的AI朋友⚡,能自然处理玩笑、讽刺、深夜胡思乱想。征集社区意见:音调、记忆、不完美性哪个最重要(✧∀✧)?
OpenAI聘请Slack CEO担任首席营收官。 Wired报道(AI资讯) 🚀,OpenAI任命Slack CEO为新任CRO。此举被视为加强商业化能力的关键信号⚡,Slack在企业协作市场经验丰富。社区猜测OpenAI将强化B端产品策略(✧∀✧),与Gemini等竞品争夺企业客户。
即刻分享:Gemini制作历史事件海报新玩法。 用户在 即刻(AI资讯) 展示🎨Nano Banana Pro生成能力,制作SpaceX猎鹰重型助推器着陆、梅西夺冠等历史瞬间海报🚀。提示词要求博物馆级别3D微缩场景⚡,背景使用淡水墨纹理,底部自动检索事件金句。网友赞叹"可将偶像高光时刻画出来"(✧∀✧)。

Reddit工程实践:保持LLM上下文质量的编辑技巧。 Reddit帖子(AI资讯) 分享🚀“时间旅行对话"技巧:长对话出现不良回复时⚡,编辑原始提示词避免错误传播。作者称此法特别适用图像生成(✧∀✧),防止错误缩进等问题污染上下文。提醒:编辑选项有时不可用,原因未明。
AI资讯日报语音版
| 🎙️ 小宇宙 | 📹 抖音 |
|---|---|
| 来生小酒馆 | 自媒体账号 |
![]() | ![]() |

