06-26-Daily

Flash Actu IA 2025/6/26

Quotidien IA | Màj 8h du mat' | Aggreg de données web | Recherche de pointe | L'industrie donne de la voix | Force de l'open-source | IA et notre futur | Accéder à la version web ↗️

Récap’ IA

Les produits IA se mettent à jour à gogo, Google lance une IA embarquée pour la robotique. Le grand modèle médical de iFlytek atteint le niveau expert.
Le service d'orientation pour le Gaokao de Quark cartonne et renforce sa puissance de calcul. Les lunettes Rokid sont en production de masse, avec plein de commandes en poche.
Des avancées en recherche IA dans le multimodale et la reconstruction 3D. Zhou Hongyi dit que l'IA ne peut pas remplacer l'émotion et la créativité humaine.

Actus produits & fonctionnalités IA

  1. Google DeepMind a dévoilé Gemini Robotics On-Device, un modèle d’IA à exécution locale conçu spécialement pour les robots 🤖. Basé sur le modèle Gemini 2.0 et son raisonnement multimodal, il permet aux robots d’apprendre rapidement de nouvelles tâches, de travailler de manière stable, et même de faire des opérations fines comme plier du linge, et ce, même sans connexion ! ✨ Ça pose clairement les bases d’un futur prometteur pour l’IA incarnée et ouvre un nouveau chapitre !
    机器人操作演示

  2. La sélection des vœux pour le Gaokao bat son plein, et le service de rapport d’orientation intelligent de Quark a créé des files d’attente à cause du trop grand nombre d’utilisateurs, avec plus de 3 millions de rapports déjà générés 📈. C’est la preuve que les étudiants font confiance à ses capacités d’IA. Face à ce “doux problème”, Wu Jia, vice-président d’Alibaba Group, a répondu avec audace, déclarant que l’équipe a d’urgence augmenté sa puissance de calcul, promettant que chaque élève obtiendra sans problème ce guide essentiel pour les études supérieures ! 💪
    夸克志愿报告页面

  3. Les Rokid Glasses, ces lunettes grand public AI+RA développées conjointement par Lingban Technology (Rokid) et Lens Technology, sont officiellement passées en production de masse ! 👓✨ Grâce à leur design léger et à l’intégration de diverses capacités de grands modèles d’IA comme le téléprompteur intelligent, la traduction en temps réel et la reconnaissance d’objets par IA, elles ont déjà raflé 250 000 précommandes mondiales ! Cela annonce une explosion commerciale imminente pour le marché chinois des lunettes IA, l’avenir s’annonce radieux ! 🚀
    Rokid Glasses眼镜

  4. Lors de la conférence Cloud Next 2025, Google a présenté la prochaine génération d’assistant intelligent pour le service client 🤖, basé sur le modèle Gemini. Cet assistant est super balèze : il peut non seulement faire de l’interaction multimodale, mais aussi demander des réductions de lui-même, et il est profondément intégré au système CRM de Salesforce ! Cela annonce un énorme bouleversement intelligent pour le service client 💥. Par contre, concernant sa précision et la protection de la vie privée, il va falloir attendre pour voir hein~ 😉
    Google智能助手

  5. iFlytek a lancé en grande pompe la version internationale 2.5 du grand modèle médical Spark 🚀, entraîné sur des capacités de calcul entièrement nationales ! Ce modèle trône en tête sur la plateforme de référence MedBench avec un score de 98,4 points. Ses capacités de diagnostic et de traitement globales ont déjà atteint le niveau d’un médecin-chef d’hôpital de niveau 3 (les plus hauts), et il surpasse même les médecins humains en termes d’exhaustivité, de praticité et de lisibilité ! 👨‍⚕️🩺 Il prend aussi en charge plusieurs langues, et pourrait bien briller de mille feux sur le marché médical mondial, stimulant les échanges et la coopération technologique internationale ! 🌍✨
    科大讯飞星火模型

  6. ElevenLabs a ENFIN lancé son application mobile de synthèse vocale autonome ! 📱✨ Que vous soyez utilisateur iOS ou Android, vous pouvez désormais générer des extraits vocaux n’importe quand, n’importe où. Même les utilisateurs gratuits peuvent profiter d’environ 10 minutes de génération audio ! Cette appli utilise non seulement le tout dernier modèle v3alpha, mais elle prend aussi en charge le contrôle de l’expression émotionnelle, et à l’avenir, elle intégrera également des outils de transcription vocale et d’IA conversationnelle, c’est vraiment trop pratique ! 🗣️
    ElevenLabs手机应用

Recherche IA de pointe

  1. SuperDec, lancé en partenariat par l’ETH Zurich, l’Université de Stanford et l’équipe de Microsoft, est en train de bousculer les limites de la reconstruction 3D traditionnelle 🤯 ! Cette technologie utilise le principe innovant des supertétraèdres pour des représentations de scènes 3D compactes et vivantes. Non seulement elle gère efficacement les données complexes de nuages de points, mais elle montre aussi un potentiel énorme pour la préhension précise, la planification de trajectoire en robotique, et la génération de contenu visuel contrôlable, ouvrant de nouvelles perspectives pour le monde numérique ! 👀 项目地址

  2. 4D-LRM est un modèle de reconstruction spatio-temporelle à grande échelle super stylé et innovant 🤩. Il peut reconstruire entièrement la représentation 4D (espace 3D plus la dimension temporelle) d’objets dynamiques à partir de seulement quelques vues d’entrée, permettant de générer des scènes de haute qualité à n’importe quel moment et depuis n’importe quelle perspective ! À l’avenir, il a de bonnes chances de faire des étincelles dans des domaines comme la réalité virtuelle, la production cinématographique et télévisuelle, et la simulation industrielle ! 🌟 论文地址

  3. ByteDance et l’Université Jiao Tong de Shanghai ont conjointement dévoilé le framework ProtoReasoning 👏. Il utilise astucieusement des représentations prototypiques structurées comme Prolog et PDDL, ce qui a considérablement amélioré les capacités de raisonnement logique des grands modèles linguistiques ainsi que l’efficacité du transfert de connaissances inter-domaines 🚀. Cette recherche pose des bases solides pour l’exploration théorique des prototypes de raisonnement futurs, c’est juste génial ! 论文地址

  4. Le framework GoT-R1, développé en collaboration par le MMLab de l’Université de Hong Kong, le MMLab de l’Université Chinoise de Hong Kong et SenseTime, est une recherche révolutionnaire qui, en introduisant le Deep Reinforcement Learning, a considérablement amélioré les capacités de raisonnement sémantique-spatial des grands modèles multimodaux dans les tâches de génération visuelle 🚀, permettant au modèle d’apprendre de manière autonome de meilleures stratégies de raisonnement ! Il se débarrasse non seulement de la dépendance aux templates du framework GoT, mais atteint en plus des performances SOTA (State-Of-The-Art) dans la génération de scènes complexes, c’est incroyable ! ✨ 论文地址

Perspectives de l’industrie IA et impact social

  1. Zhou Hongyi a récemment parlé de l’avenir de l’IA dans une vidéo. Il pense que même si l’IA devient super puissante, elle ne pourra jamais entièrement remplacer les capacités uniques des humains dans ces trois domaines clés : la compréhension émotionnelle 💖, la résolution de problèmes complexes 🧠 et la pensée créative 🎨. Il souligne que le travail de demain consistera davantage à gérer et entraîner l’IA, et il a même cité l’exemple d’un service client IA raté d’une entreprise suédoise pour prouver que l’IA a toujours ses limites quand il s’agit de gérer des demandes clients complexes. 🧐
    周鸿祎演讲

  2. Le juge fédéral William Alsup a rendu une décision inédite : statuant que l’utilisation de livres sous droits d’auteur par la société Anthropic pour entraîner son modèle d’IA, sans permission, était considérée comme un usage loyal ! 😮 Cela crée un précédent important pour les litiges de droits d’auteur dans l’industrie de l’IA. Cependant, Anthropic fait toujours face à des accusations de vol pour avoir obtenu ses matériaux d’entraînement à partir de sites pirates, c’est vraiment un mélange de bonnes et de mauvaises nouvelles, quoi~ 🤔
    法官在法庭上

Projets Open Source TOP

  1. Dioxus est un framework d’applications full-stack hyper populaire avec 28310 étoiles ⭐ ! C’est un peu la boîte à outils tout-en-un, conçue pour offrir aux développeurs une solution unifiée afin de gérer en toute simplicité le développement d’applications pour le web, le desktop et le mobile, simplifiant énormément la complexité du développement multiplateforme ! 💻📱 项目地址

  2. jsoncrack.com est un projet vedette avec 38020 étoiles ⭐ ! C’est une application de visualisation open-source innovante, capable de transformer instantanément divers formats de données comme le JSON, YAML, XML, CSV en graphiques interactifs 📊, ce qui améliore considérablement la lisibilité et l’efficacité d’analyse des données, c’est juste une bénédiction pour les passionnés de données ! 😍 项目地址

  3. free-for-dev est LE trésor des développeurs DevOps et d’infrastructure ! ✨ Avec ses impressionnantes 100044 étoiles, c’est un projet open-source super pratique qui recense et propose une liste de plans gratuits pour les services SaaS, PaaS et IaaS. C’est juste l’outil magique sur mesure pour les développeurs qui veulent économiser du temps et de l’argent ! 💰⏰ 项目地址

Partages sur les réseaux sociaux

  1. Yang Yi a partagé avec enthousiasme le Gemini CLI lancé par les développeurs Google AI, c’est carrément un “Bodhisattva cybernétique” ! 🤩 Cet agent IA open-source peut directement amener Gemini 2.5 Pro sur votre terminal, il supporte l’utilisation gratuite à haute fréquence, pour gérer peinard la rédaction de code, le débogage et l’automatisation des tâches ! Il trouve que c’est une solution “au top” pour pallier le manque d’outils actuels, surtout en ce qui concerne le déploiement MCP et la recherche GitHub, le potentiel est illimité ! 🚀 Plus de détails :‘Plus de détails’

  2. Xiaohu a hurlé de joie en découvrant un site de design IA “de ouf” ! C’est carrément la bénédiction pour les designers ! 🎨✨ Il peut générer des interfaces super jolies et directement utilisables, et a carrément simplifié les exigences de prompt de design. Ce qui est encore plus fort, c’est qu’il peut non seulement proposer des solutions de design détaillées à partir de descriptions simples, mais aussi générer des pages à plusieurs niveaux en se basant sur la logique du contexte, et même prendre en charge l’édition précise des éléments, augmentant considérablement l’efficacité et la liberté de design ! 😍 Plus de détails :‘Plus de détails’

  3. Yang Yi pense que la chanteuse IA Yuri est la première véritable influenceuse IA à “casser les codes” ! 🎤🔥 Cette chanteuse IA du label Surreal a non seulement réussi à collaborer avec The North Face, mais ses morceaux ont aussi dépassé les 7 millions de vues ! Cela démontre pleinement l’influence et le potentiel commercial croissants de l’IA dans le domaine des idoles virtuelles, annonçant l’arrivée d’une nouvelle ère excitante ! 🎉 Plus de détails :‘Plus de détails’

  4. Alipay est vraiment à la pointe ! ✨ Ils ont lancé le tout premier service de pourboires IA, qui permet aux développeurs d’intégrer cette fonctionnalité dans leurs agents intelligents, comme ça les utilisateurs peuvent “offrir des fleurs” à leurs agents intelligents préférés ! 💰💖 ‘Plus de détails’

  5. Google a sorti le grand jeu ! 🎉 Ils ont ouvert gratuitement leurs puissants modèles d’image Imagen 4 et Imagen 4 Ultra dans AI Studio ! 🤩 Désormais, les utilisateurs peuvent tester gratuitement ces modèles de génération d’images incroyables via l’API Gemini et AI Studio, allez-y vite ! 🎨 ‘Plus de détails’
    Imagen模型界面

    Imagen模型生成图像

  6. Les Claude Artifacts d’Anthropic vont être mis à jour ! 🥳 Les utilisateurs pourront désormais parcourir et partager des idées de pages web populaires dans la Galerie d’Artifacts, et même créer directement des applications front-end IA via l’API Claude, c’est juste trop stylé quand on y pense ! 💻✨ ‘Plus de détails’
    Claude Artifacts界面

  7. Zero Jun a parlé d’une vidéo IA qui a explosé les 50 millions de vues en 24 heures. Il a souligné avec pertinence que le secret des vidéos IA virales actuelles tient en un mot : “dingue” ! 😂 Et non pas la recherche de l’anthropomorphisme. Les thèmes viraux courants incluent l’ASMR, les Jeux olympiques des animaux et les catastrophes naturelles par IA, entre autres. Envie de voir plus de vidéos “dingues” ? Cliquez ‘ici’ pour en savoir plus !

  8. Tom Huang a partagé 20 astuces super pratiques pour les Prompts de programmation 💡. Il a aussi révélé que Warp est à fond sur le développement d’un agent terminal similaire à Claude Code. Même si cet Agent est payant à l’utilisation, on dit que vous rentabilisez votre investissement dès la première fois ! 😱 C’est carrément le graal de l’efficacité pour les programmeurs ! 🚀 Pour plus de détails, cliquez vite ‘ici’ pour jeter un œil !
    编程Prompt技巧


Écoutez la version audio

🎙️ Xiaoyuzhou📹 Douyin
Le Pub des Vies FuturesLa Station d’Info des Vies Futures
小酒馆情报站
Dernière modification