美团发布原生多模态 LongCat-Next

36氪获悉，3月27日，美团发布并全面开源原生多模态大模型LongCat-Next及其核心组件——离散原生分辨率视觉分词器（dNaViT）。该模型打破了当前大模型以“语言为中心”的传统拼凑式架构，将图像、语音与文本统一映射为同源的离散Token。通过纯粹的“下一个Token预测”（Next Token Prediction，NTP）范式，LongCat-Next让视觉与语音成为AI的“原生母语”。

HK美团-W-4.72%...

36氪
2026年3月27日
行业新闻

36氪获悉，3月27日，美团发布并全面开源原生多模态大模型LongCat-Next及其核心组件——离散原生分辨率视觉分词器（dNaViT）。该模型打破了当前大模型以“语言为中心”的传统拼凑式架构，将图像、语音与文本统一映射为同源的离散Token。通过纯粹的“下一个Token预测”（Next Token Prediction，NTP）范式，LongCat-Next让视觉与语音成为AI的“原生母语”。 HK美团-W-4.72%

36氪

文章: 15181

36氪

相关文章

ST新华锦：资金占用未整改致股票停牌，后续仍存退市风险

欧盟12月纯电汽车销量首次超越汽油车

早报｜iPhone 17e售价曝光：维持4000元档/OpenAI首款硬件「Dime」曝光/全球首届机器人「春晚」，观众席也是机器人