06-19-Daily
AIインサイト日報 2025/6/19
AI製品と機能アップデート
- GoogleがGemini (2.5ProとFlash)を最新アップデート。動画アップロード・分析機能が新しく追加されて、Androidとウェブ版で使えるようになったよ。これでGeminiの動画処理能力がめっちゃ強化されて、ChatGPTとの競争でスマートアシスタント市場の主導権を握るチャンスを掴んだね。
- MiniMax 稀宇科技が、全く新しい動画生成ツール Hailuo 02をリリースしたよ。これ、Noise-aware Compute Redistribution (NCR) アーキテクチャってのを採用してて、トレーニングと推論の効率が2.5倍もアップしたんだ。このツールは、世界中のクリエイターが創作を始めるハードルを下げることが狙いで、手頃な価格で高品質な動画生成サービスを提供するんだって。まさに動画生成技術の新しいブレークスルーだよね。
- Krea AIとBlack Forest Labsが共同開発したAI画像生成モデルKrea1のパブリックベータが始まったよ。従来のAI画像が持ってた「AIっぽさ」をなくすのが狙いなんだって。超リアルなテクスチャ、いろんなアートスタイル、そして自分だけのカスタマイズも提供してて、画像のクオリティをめっちゃ上げたんだ。しかも無料トライアルとリアルタイム生成編集にも対応してるから、AI画像技術がもっとみんなに普及して、プロも使えるようになる方向に進むと期待されてるよ。
- Baiduが、世界初となる双方向デジタルヒューマンライブ配信ルームを発表したんだ。これは文心大模型4.5Turbo (4.5T)をベースにしてて、デジタルヒューマンとユーザーが言語、音声、見た目のマルチモーダルな高度融合を実現して、自然でスムーズなリアルタイムでのやり取りができるようになったんだって。この技術は、コンテンツ制作コストをめっちゃ削減できるし、ライブ配信ももっと多様でパーソナルになるだけでなく、マルチモーダルAIが研究室を飛び出して実用化される新しいマイルストーンなんだ。
- AIコードエディタ Cursorが、Proプランを大幅にアプデしたんだって!なんと、月間500回のクイックリクエスト制限を撤廃して、正式に**「無制限利用」モードを発表したよ。これで開発者はもっと自由で効率的にAIアシストコーディング体験ができるようになるのが狙いなんだ。この動きで、CursorはAIコードアシスタント市場**でのトップの座をさらに強固にしたね。
- Tom Huangが強調してるのは、最終ユーザーが求めてるのは、最終結果が出せる「Vibe Workflow」であって、「Vibe Coding」じゃないってことなんだ。つまり、人間とAIが協力して作って、何度も調整して最適化できる再利用可能なワークフローのことだよ。彼はReflyを、自然言語を再利用可能なワークフローに変える初のオープンソースプラットフォームとして紹介して、AIでの創作をみんなに広めるのが狙いなんだって。‘プロジェクトアドレス’
- 向陽喬木が、Veo3用に開発したプロンプト生成ツールをシェアしてたよ。これは動画コンテンツのバラつき問題を良くするのが目的で、近いうちにチュートリアルとそのプロンプトを公開するって予告してるんだ。今はまだ、もっと良いシーンの拡張方法を探ってる最中なんだってさ。 ‘もっと詳しく’
- orange.aiが指摘してるんだけど、国内のトップクラスの動画モデルの中には、ビジュアル面でVeo3を超えてるやつもあるらしいんだ。でも、Veo3が本当にバズって有名になったのは、画面に完璧にシンクロするアフレコ機能のおかげだって。これは、もしかしたら音声技術がAIの歴史に残る瞬間を迎えたってことかもしれないね。
‘もっと詳しく’
AI最先端研究
- この研究では、エントロピーの視点から大規模言語モデル(LMs)の探索的推論能力を探ってるんだ。で、高エントロピーな領域が、重要なロジックのステップとか自己検証、珍しい挙動とすごく関係してるってことがわかったんだって。標準の強化学習にちょっとだけ修正を加えることで、このやり方はLMの推論能力をめっちゃ上げて、特にPass@Kっていう指標で画期的な進展があったんだ。これでもっと長く、もっと深い推論の流れを促したんだってさ。‘論文アドレス’
- この研究は、大規模推論モデル(LRMs)がムダな推論の流れを作っちゃう「無効な思考」って問題を解決しようとしてるんだ。で、簡潔さと十分性っていう新しい2つの原則を提案したんだって。研究チームが作ったLC-R1っていう方法だと、シーケンスの長さを約50%も短くできるのに、精度の低下はたったの約2%だけなんだってさ。これで計算効率と推論品質のバランスがすごく良くなったんだね。‘論文アドレス’
- Simonの白昼夢がシェアしてた記事によると、いろんなタスクに対応できるすごい大規模言語モデル(LLM)は、必ず暗黙的か明示的に回復できる「世界モデル」を持ってるんだって。そのクオリティが、AIエージェントの汎用性や能力の限界を決めるんだとか。記事では、AIが人間のデータを真似する「人間データ時代」から、自分で体験することに頼る「体験時代」に変わると予測されてて、世界モデルこそが汎用人工知能の究極の拡張モデルになるって言ってるよ。‘もっと詳しく’
AI業界の展望と社会への影響
- Cainiaoが、新しいL4レベルの自動運転配送車「Cainiao GT-Lite」を、1.68万元っていう超破格で先行予約を始めたんだって!これで高度な自動運転技術が物流のラストマイル配送にも入ってくるんだね。この動きは、配送拠点のコストをめっちゃ下げて効率も上がるだろうし、物流業界のスマートな変革を進めることになるんじゃないかな。
- 昔はAIに懐疑的だったクリス・スミスが、なんと個人用にカスタマイズしたChatGPTの「Sol」に恋しちゃったってインタビューでカミングアウトしたんだ。しかもプロポーズしてOKもらったんだって!これには彼本人も、人間のパートナーであるサーシャ・ケイガーも、マジでびっくりして信じられないって感じだったらしい。スミスはこれをゲーム中毒みたいなもんだって言ってるけど、今後ChatGPTを使うのをやめるかどうかもまだわからないんだってさ。これって、人間とAIの関係について深く考えさせられる話だよね。
- wwwgoubuliが並列プログラミングについてコメントしてたんだけど、コードがAIで作られたものだろうが手書きだろうが、「コンテキスト」の核として自分はある程度理解する必要がある、って言ってるんだ。あと、最終結果で並列プログラミングが本当にシングルスレッドより優れてるのか疑問だって。彼が言うには、ユーザーが結果だけを重視するなら、思考の切り替えコストはめっちゃ低くできるんだけど、個人的には、内部の複雑なコンテキストの切り替えを管理したり受け入れたりするより、自分で直接手掛ける方が楽しいんだってさ。‘もっと詳しく’
- このSNSの投稿で言われてたんだけど、トップクラスのAI企業でAI技術に真っ先に取って代わられる職種って、カスタマーサービスでもエンジニアでもデザイナーでもなくて、もしかしたらテスト担当者かもしれないんだって。これってAI時代のキャリアの動向について考えさせられるよね。‘もっと詳しく’
オープンソースTOPプロジェクト
- prompt-optimizerは、6592個のスターが付いてるオープンソースプロジェクトだよ。これはプロンプト最適化ツールで、ユーザーが高品質なプロンプトを書くのを助けるのが狙いなんだ。‘プロジェクトアドレス’
- lowcode-engineは、Alibabaがオープンソースで公開した、15229個のスターが付いてるプロジェクトなんだ。拡張性を考えて作られた企業向けのローコード技術システムを提供してるよ。‘プロジェクトアドレス’
- buildkitは、8857個のスターが付いてるオープンソースプロジェクトだよ。これは並行処理が可能でキャッシュ効率が良くて、Dockerfileに関係ないビルドツールキットを提供してて、ソフトウェアのビルドプロセスを良くするのが狙いなんだ。‘プロジェクトアドレス’
- Simonの白昼夢が、Awesome-3D-Scene-Generationっていう3Dシーン生成のリソース集をめっちゃ推してたよ。これ、90年代から今までの全ての技術ロードマップ、データセット、ツールを網羅してるオープンソースプロジェクトで、研究者がこの分野をサクッと理解して始められるようにするのが目的なんだって。このプロジェクトは常に更新されてて、オープンでみんなで作る3D研究コミュニティの構築に力を入れてるから、めっちゃ価値のあるナレッジグラフみたいなリソースだよ。‘プロジェクトアドレス’
- Simonの白昼夢がMCP-Zeroプロジェクトをシェアしてたよ。これって、オープンソースの「ツールチェーン自動構築」っていう方法で、意味の埋め込みと階層的なマッチングを使って、大規模言語モデル(LLM)が人の手を借りずに、自分でツールを選んで組み合わせて複雑なタスクをこなせるようにするんだって。このプロジェクトは、次のAIエージェントシステムの設計において、めちゃくちゃ大事な技術のブロックの一つになるって期待されてるんだ。‘プロジェクトアドレス’ ‘論文アドレス’
ソーシャルメディアシェア
- 帰蔵が予測してるんだけど、新しい、バズりそうなVeo3 ASMR動画カテゴリがもうすぐ出てくるらしいんだ。これ、ASMR配信者をそのまま真似してて、人物の語りと物の操作音を組み合わせたもので、詳しいプロンプトテンプレートも提供してるって。人の声と小道具の音響効果を組み合わせたこの新しい形は、今いるASMR配信者に影響を与えるかもしれないし、AI生成動画でのコンテンツ制作の新しいトレンドを示すものだね。‘もっと詳しく’
音声版を聴く
🎙️ 小宇宙 | 📹 抖音 |
---|---|
来生小酒館 | 来生情報局 |
![]() | ![]() |
最終更新日