亿正策略微软发布两款自制AI模型

亿正策略

微软AI（Microsoft AI，MAI）周四（8/28）发布两款自制AI模型，分别是语音生成模型MAI-Voice-1与基础模型MAI-1-preview。前者已集成至Copilot Daily、Podcasts与Copilot Labs，后者则于LMArena进行公开测试，并将逐步导入Copilot文本应用。

其中的MAI-Voice-1在单个GPU上不到1秒就能生成1分钟的语音，标榜拥有自然的声线，带有情感及抑扬顿跌亿正策略，同时支持单人或多人对话场景。外界认为MAI-Voice-1的问时代表微软想把文本助理进化成语音伙伴，让用户不只是看文本，而是能听到更自然的交流。

MAI-1-preview则是个基于混合专家（MoE）结构的模型，可于不同任务中调用专有模型，借由数据挑选及开源技术，它仅以1.5万颗的Nvidia H100 GPU进行训练，远低于采用10万颗以上GPU的xAI Grok。MAI-1-preview的专长为指令遵循，可用来回答日常问题。

MAI负责人Mustafa Suleyman在接受Semafor采访时解释，微软是全球最大的公司之一，需要内部能力来创建顶级模型，原因包括AI在未来数十年的战略重要性令微软不得缺席，且微软也想要更多的模型选择权。Suleyman表示，未来微软会持续强化与OpenAI的合作关系，这并不代表双方的关系会疏远或冷却。

此外亿正策略，MAI也已经着手开发下一代的MAI-2模型，它的规模更大，设置将有所调整，可能会利用微软正在创建的超大型GB200/GB300集群进行训练。

摩根证券提示：文章来自网络，不代表本站观点。