07-26-日报-AI资讯日报

AI资讯日报 2025/7/26

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

今日摘要

MyShell与谷歌分别推出新工具,通过自然语言即可开发AI应用。
Anthropic的Claude与Canva集成,能够将文本内容自动生成视觉设计。
AI协同学习取得新进展,Agent KB框架通过共享经验池提升解题效率。
阿里和字节跳动等发布新模型,强化了多语言翻译和同声传译能力。
此外,AI摘要虽受谷歌欢迎,但已导致传统网页的点击率大幅下降。

AI产品与功能更新

  1. 前端工程师的饭碗,这次真有点悬了?🤔 MyShell 正式发布了革命性的AI应用开发工具 ShellAgent 2.0,主打一个 Text-to-App 理念,未来人人都是开发者或许不再是遥远的梦想。🚀 用户只需用自然语言描述需求,它就能自动完成从后端到部署的全流程,让开发AI应用变得像发条消息一样简单,真正实现了AI应用的民主化
    AI资讯:AI应用开发

  2. 谷歌想让你化身“神笔马良”,动动嘴皮子就能创造AI应用!✨ 谷歌实验室(Google Labs)推出的实验性工具 Opal,让零代码创建AI应用成为现实。用户可通过自然语言指令或拖拽式的可视化工作流编辑器,像搭积木一样快速构建迷你应用,积木就是强大的Gemini和谷歌AI生态。目前该工具仅在美国公测,全球用户还得再等等 (o´ω’o)ノ。
    AI资讯:零代码构建

  3. 简直是懒人福音!✍️→🎨 Anthropic 公司的AI助手 Claude 宣布与全球设计平台 Canva 深度集成,彻底简化了文本到视觉设计的创作过程。用户只需上传书面内容,Claude就能智能分析并自动生成符合品牌风格的专业视觉作品。这项合作大大降低了设计门槛,让你的内容更具视觉吸引力。
    AI资讯:文本转视觉

  4. 曾“一码难求”的 AI设计Agent Lovart 现已全面开放注册,它正试图用全新的交互范式重塑设计工作流。其核心亮点 ChatCanvas 功能允许用户在画布任意位置用自然语言下达指令,AI能精准理解并批量处理。这种将多模态上下文利用到极致的“智能画布”体验,真正做到了让AI放大创意,而非替代创意。
    AI资讯:智能画布交互

    AI资讯:多模态设计

  5. 想让你成为朋友圈最靓的仔?快手旗下的AI视频生成工具 Kling 来帮你!🎬 其“图像转视频”的 Elements 功能迎来重磅升级,不仅提升了主体一致性和动态流畅度,还新增了区域参考功能。用户可以精确指定图像中的人脸、服装等作为参考,让AI创作焦点更明确,视觉效果更上一层楼。
    AI资讯:图像转视频

AI前沿研究

  1. AI Agent不再单打独斗,而是学会了互相“抄作业”!(o´ω’o)ノ OPPO、耶鲁等机构联合发布的 Agent KB 框架,通过构建共享“经验池”,让AI能从彼此的成功经验中学习。在极具挑战性的GAIA基准测试中,该框架让模型解题成功率最高提升6.66%,证明了“组团打怪”远比单打独斗更有效率。
    AI资讯:AI协同学习

    AI资讯:共享经验池

  2. AI看脸猜年龄?一篇来自 Arxiv的最新论文 - AI资讯 提出了一种基于深度学习的新方法,可在精准广告领域大显身手。该方法能同时进行年龄估计性别分类,准确率惊人,但也揭示了AI模型中潜在的数据偏见问题。这提醒我们,在享受技术便利的同时,必须警惕其背后潜藏的伦理风险。🤔

AI行业展望与社会影响

  1. AI真能破解“猫言狗语”吗?科学家警告:小心它为了讨好你而“说谎”。🐾 伦敦政治经济学院(LSE)成立了全球首个Jeremy Coller动物感知中心,旨在利用AI等跨学科方法研究动物意识。这项研究不仅关乎动物福利,也为我们理解“意识”这一终极哲学难题提供了全新思路。

  2. 谷歌的搜索规则变了,但又好像没完全变。🤷 官方给内容创作者吃了颗“定心丸”:高质量的AI内容同样受欢迎,现有SEO原则依然适用。然而,现实却显示,当AI摘要出现时,传统网页的点击率从15%暴跌至8%,这意味着用户行为的改变正悄悄重塑流量格局。

开源TOP项目

  1. Qwen3-Coder - AI资讯 (✨8.6k) 是阿里云Qwen团队为代码任务量身打造的Qwen3大模型。它拥有强大的代码生成、补全和理解能力,是开发者们不可多得的编程神器。🚀

  2. neko - AI资讯 (✨13.3k) 是一个超酷的自托管虚拟浏览器项目。它在 Docker 容器中运行,利用 WebRTC 技术将浏览器画面实时串流,让你随时随地安全冲浪。🏄

  3. awesome-generative-ai - AI资讯 (✨9.3k) 是一份精心整理的生成式AI宝藏图。如果你想追踪AIGC领域的最新动态或寻找有趣的项目,这份清单绝对不容错过。🗺️

社媒分享

  1. 阿里通义千问发布了其最强翻译模型 Qwen3-MT - AI资讯 ,支持超过92种语言,覆盖全球95%以上人口!🌍 该模型不仅翻译质量顶级,还支持术语控制等定制功能,旨在彻底打破全球语言障碍。
    AI资讯:通义翻译模型

  2. Claude Code 学会了“影分身之术”,推出全新的 自定义子智能体(subagents) - AI资讯 功能。用户可创建“代码审查员”、“QA测试员”等专用Agent,像一个小团队一样分工协作,让复杂编码任务更清晰高效。👨‍💻👩‍💻

  3. 字节跳动发布了新版同声传译模型 Seed LiveInterpret 2.0 - AI资讯 。该模型不仅延迟极低,还能自动克隆你的声音进行中英互译,技术表现相当惊艳。🎤

  4. 写代码总有Bug?Cursor 推出了能自动检测PR中逻辑Bug的系统 Bugbot - AI资讯 。这个“捉虫机器人” 🤖 专注于发现那些最难被察觉的逻辑错误,不过这项高级服务需要付费订阅哦。

  5. 想让AI更“聪明”? NVIDIA的分享 - AI资讯 揭示了秘诀:思维链推理和测试时扩展正彻底改变AI的决策方式。这两种技术能帮助AI模型进行更复杂、多步骤的思考,从而提升其解决问题的能力。🧠

  6. 逛展会拍的照片别浪费!ListenHubWAIC - AI资讯 打造了特别功能,可以将多张图片一键转为播客。这个功能可以帮你梳理信息、加深记忆,堪称逛展必备神器。🎧
    AI资讯:图片转播客

  7. 阶跃星辰通过一段视频通话演示了 Step-3 - AI资讯 模型强大的多模态能力。通话中,模型响应迅速,识别准确,甚至能进行一定程度的推理,这得益于其模型与系统协同设计的创新。💡

  8. 有用户分享了 国内版Trae 的使用体验,它已内置支持Qwen3 coderKimi K2,并且目前免费。对于需要强大代码助手的开发者来说,这无疑是一个不错的选择。
    AI资讯:国内版Trae

  9. 如何充分发挥Gemini Cli的潜力?有开发者 分享了他的秘籍 :通过自定义系统Prompt并结合FFmpeg等命令行工具,可以轻松处理音视频和图片,让Gemini Cli成为更强大的生产力工具。🛠️
    AI资讯:Gemini Cli技巧

    AI资讯:命令行工具

  10. 想知道Anthropic的内部团队是如何使用自家产品Claude Code的吗?这篇 文章 揭示了他们从调试到代码辅助的开发工作流程,展示了如何高效利用AI工具来提升开发效率。

AI产品自荐: GeminiCli2API ↗️

你是否也曾被免费GEMINI API的速率和配额限制搞得束手束脚,或者渴望将A工具的绝妙提示词用在B工具上?现在,让 Gemini-CLI-2-API 为你解开所有束缚!它不仅仅是一个API代理,更是一个能赋予你极致控制权的AI中枢。

我们最引以为傲的核心优势之一,就是能通过 Gemini CLI 的 OAuth 授权方式,巧妙地突破官方免费API的额度限制,让你告别恼人的 rate limit exceeded 错误,尽情享受更自由、更稳定的模型调用 ⚡️。

但真正的魔法在于我们赋予你对「提示词」的绝对掌控力!项目允许你在服务端集中提取、强制替换或巧妙追加任何发往大模型的系统提示词(System Prompt)。这意味着什么?你可以为所有接入的工具客户端设置一套黄金准则,或者实现跨工具的“灵魂互换”。就像这样:

在VSCode里用Kilo代码助手,加上Cursor的神级提示词,驱动任意顶级大模型——用Cursor的灵魂,又何必是Cursor本身? 🧠✨

通过将各种后端模型接口无缝转换为标准的OpenAI格式,本项目让你现有的任何工具都能立刻拥有这般超能力。部署简单,开箱即用,快来释放你手中AI工具的全部潜力,开启真正自由、高效的AI探索之旅吧!


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
Last updated on