テキスト・画像・音声・動画を扱うオープンなオムニAIモデル5選 KDnuggets 1日前 複数モダリティを扱うオープンモデルを実務視点で紹介しています。視覚言語推論、音声、文書処理、ローカル配置が論点です。開発者がモデル候補を比較する入口になります。 周辺トピック 音声AI